• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 183,  comments - 10,  trackbacks - 0

             

            //
            //    Email: goonyangxiaofang@163.com
            //    QQ: 591247876
            //
            //    Naive Bayes
            //
            //    輸入樣例
            //    序號    類別    屬性1.2.3
            //    1     1      0 0 0
            //    2     0      0 0 1
            //    3     1      0 1 0
            //
            //    測試樣例
            //    序號    類別    屬性1.2.3
            //    4     0      0 1 1
            //    5     1      1 0 0
            //    6     0      1 0 1
            //    7     1      1 1 0
            //    8     1      1 1 1
            //
            //
            // Wiki:http://en.wikipedia.org/wiki/Naive_Bayes_classifier
            // http://msdn.microsoft.com/zh-cn/library/ms174806.aspx
            //

            #include 
            <iostream>
            #include 
            <fstream>
            #include 
            <sstream>
            #include 
            <vector>
            #include 
            <string>
            #include 
            <algorithm>
            using namespace std;

            #define MYTRACE(t) cout << #t": " << t << endl;

            typedef vector
            <double> TypeV;
            typedef vector
            <vector<double> > TypeVV;
            typedef vector
            <vector<vector<double> > > TypeVVV;

            struct Pattern
            {
                
            long id;
                
            long type;
                
            long new_type;
                vector
            <double> data;
                
            bool operator<(const Pattern& p)
                
            {
                    
            return type < p.type;
                }

            }
            ;

            bool readData(vector<Pattern>& train_data, const string& file, long f);
            void prlongData(const vector<Pattern>& train_data, long f);
            void prlongVVV(const TypeVVV& vvv);
            void computerVVV(TypeVVV& vvv, const vector<Pattern>& train_data);
            void testTestData(vector<Pattern>& test_data, const TypeVVV& vvv);
            void estimateResult(const vector<Pattern>& test_data);

            long main(long argc, char* argv[])
            {
                vector
            <Pattern> train_data;
                
            if (!readData(train_data, "train.txt"1))
                
            {
                    cerr 
            << "Read train.txt error!" << endl;
                    
            return -1;
                }

                
            // prlongData(train_data, 1);
                const long D_1st = 2;
                
            const long D_2nd = train_data.size();
                
            const long D_3rd = 2;
                TypeV v(D_3rd, 
            0.0);
                TypeVV vv(D_2nd, v);
                TypeVVV vvv(D_1st, vv);
                computerVVV(vvv, train_data);
                
            // prlongVVV(vvv);

                vector
            <Pattern> test_data;
                
            if (!readData(test_data, "test.txt"1))
                
            {
                    cerr 
            << "Read test.txt error!" << endl;
                    
            return -2;
                }

                testTestData(test_data, vvv);
                prlongData(test_data, 
            1);
                prlongData(test_data, 
            2);
                estimateResult(test_data);
                
            return 0;
            }


            bool readData(vector<Pattern>& train_data, const string& file, long f)
            {
                ifstream fin(file.c_str());
                
            if (fin.fail())
                
            {
                    
            return false;
                }

                
            string s;
                
            while (getline(fin, s))
                
            {
                    istringstream sin(s);
                    
            double d;
                    Pattern pattern;
                    sin 
            >> pattern.id;
                    
            if (f == 1)
                    
            {
                        sin 
            >> pattern.type;
                    }

                    
            while (sin >> d)
                    
            {
                        pattern.data.push_back(d);
                    }

                    train_data.push_back(pattern);
                }

                fin.close();
                
            return true;
            }


            void prlongData(const vector<Pattern>& train_data, long f)
            {
                
            for (size_t i = 0; i < train_data.size(); ++i)
                
            {
                    cout 
            << train_data[i].id << '\t';
                    
            if (f == 1)
                    
            {
                        cout 
            << train_data[i].type << '\t';
                    }

                    
            else if (f == 2)
                    
            {
                        cout 
            << train_data[i].new_type << '\t';
                    }

                    
            for (size_t j = 0; j < train_data[i].data.size(); ++j)
                    
            {
                        cout 
            << train_data[i].data[j] << ' ';
                    }

                    cout 
            << endl;
                }

                cout 
            << endl;
            }


            void prlongVVV(const TypeVVV& vvv)
            {
                size_t i, j, k;
                
            for (i = 0; i < vvv.size(); ++i)
                
            {
                    
            for (j = 0; j < vvv[i].size(); ++j)
                    
            {
                        
            for (k = 0; k < vvv[i][j].size(); ++k)
                        
            {
                            cout 
            << vvv[i][j][k] << ' ';
                        }

                        cout 
            << endl;
                    }

                    cout 
            << endl;
                }

                cout 
            << endl;
                
            // cout << i << endl << j << endl << k << endl;
            }


            long computerTypeAmount(const vector<Pattern>& train_data, long type)
            {
                
            long ret = 0;
                
            for (size_t i = 0; i < train_data.size(); ++i)
                
            {
                    
            if (train_data[i].type == type)
                    
            {
                        
            ++ret;
                    }

                }

                
            return ret;
            }


            long computerAmountByValueAttributeType(const vector<Pattern>& train_data, long value, long attribute, long type)
            {
                
            long ret = 0;
                
            for (size_t i = 0; i < train_data.size(); ++i)
                
            {
                    
            if (train_data[i].type == type)
                    
            {
                        
            if (train_data[i].data[attribute] == value)
                        
            {
                            
            ++ret;
                        }

                    }

                }

                
            return ret;
            }


            void computerVVV(TypeVVV& vvv, const vector<Pattern>& train_data)
            {
                size_t i, j, k;
                
            for (i = 0; i < vvv.size(); ++i)
                
            {
                    
            long type_amount = computerTypeAmount(train_data, i);
                    
            for (j = 0; j < vvv[i].size(); ++j)
                    
            {
                        
            for (k = 0; k < vvv[i][j].size(); ++k)
                        
            {
                            vvv[i][j][k] 
            = 1.0 * computerAmountByValueAttributeType(train_data, k, j, i) / type_amount;
                        }

                    }

                }

            }


            double log2(double n)
            {
                
            return log(n) / log(2.0);
            }


            void testTestData(vector<Pattern>& test_data, const TypeVVV& vvv)
            {
                
            for (size_t t = 0; t < test_data.size(); ++t)
                
            {
                    
            double p = 0.0;
                    
            long typ = 0;
                    
            for (size_t i = 0; i < vvv.size(); ++i)
                    
            {
                        
            double q = 0.0;
                        
            for (size_t j = 0; j < vvv[i].size(); ++j)
                        
            {
                            q 
            = q + (-log2(vvv[i][j][static_cast<unsigned long>(test_data[t].data[j])] + 0.0001));
                        }

                        
            // cout << q << '\t';
                        if (q > p)
                        
            {
                            p 
            = q;
                            typ 
            = i;
                            
            // cout << "test" << endl;
                        }

                    }

                    
            // cout << endl;
                    
            // cout << typ << endl;
                    test_data[t].new_type = typ;
                }

            }


            void estimateResult(const vector<Pattern>& test_data)
            {
                
            const long D_1st = 2;
                vector
            <double> v(50.0);
                vector
            <vector<double> > vv(D_1st, v);

                
            for (long i = 0; i < D_1st; ++i)
                
            {
                    
            for (size_t j = 0; j < test_data.size(); ++j)
                    
            {
                        
            if (test_data[j].type == i)
                        
            {
                            
            ++vv[i][0];
                        }

                        
            if (test_data[j].new_type == i)
                        
            {
                            
            ++vv[i][1];
                        }

                        
            if (test_data[j].type == test_data[j].new_type && test_data[j].type == i)
                        
            {
                            
            ++vv[i][2];
                        }

                    }

                }

                
            double total_right = 0.0;
                
            double weighting_recall = 0.0;
                
            double weighting_precision = 0.0;
                
            for (long i = 0; i < D_1st; ++i)
                
            {
                    cout 
            << i << "" << endl;
                    
            // MYTRACE(vv[i][0]);
                    
            // MYTRACE(vv[i][1]);
                    
            // MYTRACE(vv[i][2]);
                    cout << "Recall: " << (vv[i][3= vv[i][2/ vv[i][0]) << endl;
                    cout 
            << "Precison: " << (vv[i][4= vv[i][2/ vv[i][1]) << endl;
                    cout 
            << endl;
                    weighting_recall 
            += vv[i][3* vv[i][0/ test_data.size();
                    weighting_precision 
            += vv[i][4* vv[i][0/ test_data.size();
                    total_right 
            += vv[i][3];
                }

                cout 
            << "right: " << total_right / test_data.size() << endl << endl;
                cout 
            << "Weight Recall: " << weighting_recall << endl;
                cout 
            << "Weight Precision: " << weighting_precision << endl;
                cout 
            << endl;
            }
            posted on 2011-03-06 19:13 unixfy 閱讀(2215) 評論(0)  編輯 收藏 引用
            久久天堂电影网| 精品综合久久久久久97| 色综合久久天天综合| 久久久青草久久久青草| 久久国产精品二国产精品| 99久久免费国产精品特黄| AV狠狠色丁香婷婷综合久久| 人人狠狠综合久久亚洲88| 欧美伊人久久大香线蕉综合| 国产精品99久久久久久人| 婷婷久久五月天| 久久久精品一区二区三区| 久久精品国产2020| 国产亚洲色婷婷久久99精品91| 色欲av伊人久久大香线蕉影院| 一本久久a久久精品综合夜夜| 久久亚洲精品人成综合网| 久久人搡人人玩人妻精品首页| 久久99精品综合国产首页| 精品久久久久久久国产潘金莲| 93精91精品国产综合久久香蕉| 亚洲av成人无码久久精品| 亚洲精品无码专区久久同性男| 亚洲精品高清国产一久久| 久久香蕉超碰97国产精品| 久久综合亚洲色一区二区三区| 久久人人爽人人爽人人片AV麻豆 | 97香蕉久久夜色精品国产| 久久伊人精品青青草原高清| 蜜臀久久99精品久久久久久小说| 色欲综合久久躁天天躁| 久久青青草原精品国产软件| segui久久国产精品| 久久久久夜夜夜精品国产| 久久久久国产一级毛片高清版| 国产91色综合久久免费分享| 好久久免费视频高清| 久久精品一区二区| 99久久精品免费观看国产| 久久国产午夜精品一区二区三区| 久久精品国产清自在天天线|