• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            清風(fēng)竹林

            ぷ雪飄絳梅映殘紅
               ぷ花舞霜飛映蒼松
                 ----- Do more,suffer less

            單詞統(tǒng)計(jì)

            要求:讀取一個(gè)文本,然后統(tǒng)計(jì)里面出現(xiàn)的單詞,打印每個(gè)單詞出現(xiàn)的次數(shù)。僅僅考慮英文單詞的情形,不考慮中文

            小乓練題:
            int main(int argc, char* argv[]) 
            {    
                
            using namespace std;

                ifstream infile(
            "c:\\a.txt",ios::binary );
                
            if(!infile)
                {
                    cout
            <<"Can not open sourse file!"<<endl;
                    
            return 0;
                }
                
            //ofstream outfile("out.txt");
                
            //if(!outfile)
                
            //{
                
            //    cout<<"Can not open destination file!"<<endl;
                
            //}
                
                
            int nLength = 0;
                
            char * pBuffer;

                
            // get length of file:
                infile.seekg (0, ios::end);
                nLength 
            = infile.tellg();
                infile.seekg (
            0, ios::beg);
                
                
                
            //read the file to the buffer
                pBuffer = new char[nLength];
                memset(pBuffer, 
            0, nLength);
                infile.read(pBuffer,nLength);
                infile.close();

                
            //copy the buffer to the string s
                string s = pBuffer;
                delete[] pBuffer;
                pBuffer 
            = NULL;


                
            string temp;

                vector
            <string> vecSubstr;
                vector
            <int> vecCount;

                
            int pre=0,next=0;

                
            while(next<nLength)
                {
                    pre
            =next;
                    
            //find the word
                    while((next<nLength)&&isalnum(s[next]))
                    {
                        next
            ++;
                    }
                    
            if(pre!=next)
                    {
                        
            //計(jì)算當(dāng)前的單詞個(gè)數(shù)
                        temp = s.substr(pre,next-pre);
                        cout
            <<temp<<endl;
                        
            //std::vector<std::string>::iterator iter = std::find(vecSubstr.begin(), vecSubstr.end(), temp);
                        
            //if (vecSubstr.end() != iter)
                        
            //{
                        
            //    std::cout<<temp<<std::endl;
                        
            //}else
                        
            //{
                        
            //    vecSubstr.push_back(temp);
                        
            //}

                        unsigned 
            int iPosition=0;
                        

                        
            while(iPosition<vecSubstr.size())
                        {
                            
                            
            if(vecSubstr[iPosition].compare(temp)==0)
                                
            break;
                                
                            iPosition
            ++;
                            
                        }
                        
                        
            if (iPosition==vecSubstr.size())
                        {
                            vecSubstr.push_back(temp);
                            vecCount.push_back(
            1);
                        }
                        
            else
                        {
                            vecCount[iPosition]
            ++;
                        }            
                        
                    }
                    next
            ++;
                }
                
            for (int j=0;j<vecSubstr.size();j++)
                {
                    cout
            <<vecSubstr[j]<<endl<<vecCount[j]<<endl;
                }

                
            //for(int i=0;i<substr.size();i++)
                
            //{
                
            //    cout<<substr[i]<<endl;
                
            //    cout<<count[i]<<endl;
                
            //}

                
            //delete[] pBuffer;
                
            //pBuffer = NULL;

                system(
            "pause");

                
            return 0;
            }

            C++代碼:

            int main(int argc, char* argv[])
            {
                
                
            // 文件路徑
                char* szPath = "C:\\text.txt";
                
                std::ifstream fin(szPath);
                
            if (!fin)
                {
                    std::cout
            <<"Can not open file"<<std::endl;
                    
            return -1;
                }
                
            // 通常我們這樣讀取一個(gè)文本文件的全文
                std::string strText = std::string(std::istreambuf_iterator<char>(fin), std::istreambuf_iterator<char>());

                typedef std::map
            <std::stringint> CountMap;
                CountMap counter;

                
            int nLength = strText.length();
                
            int nLeft = 0;
                
            int nRight = -1;

                
            while(nRight<nLength)
                {
                    nLeft 
            = nRight+1;
                    
            // 找到第一個(gè)是字母的位置
                    while (nLeft<nLength && !isalnum(strText[nLeft]))
                    {
                        
            ++nLeft;
                    }
                    nRight 
            = nLeft+1;
                    
            // 找到第一個(gè)非字母的位置
                    while (nRight<nLength && isalnum(strText[nRight]))
                    {
                        
            ++nRight;
                    }
                    
            // 取nRight-nLeft可以保證取到的是一個(gè)word,其中不會(huì)含有字符
                    if (nRight < nLength)
                    {
                        
            // 提取單詞
                        std::string strWord = strText.substr(nLeft, nRight - nLeft);
                        
            // 加入記數(shù)器
                        counter[strWord]+=1;    
                    }        
                }
                
                
            // 打印輸出
                for (CountMap::iterator iter = counter.begin(); counter.end()!=iter; ++iter)
                {
                    std::cout
            <<iter->first<<"\t\t"<<iter->second<<std::endl;
                }

                system(
            "pause");
                
            return 0;
            }

            python 代碼:

            import re

            filepath
            =r'c:/text.txt'
            with open(filepath) as file:
                text
            =file.read()
                text
            =re.split('\W+', text)
                d
            ={}
                
            for item in text:
                    d[item]
            =d.get(item, 0) +1 
                
            for key, value in d.items():
                    
            print('%s\t\t%s'%(key, value))

            小乓加油!














            posted on 2008-11-19 10:29 李現(xiàn)民 閱讀(870) 評(píng)論(0)  編輯 收藏 引用 所屬分類: 小乓練題

            亚洲精品无码久久毛片| 久久精品青青草原伊人| 岛国搬运www久久| 久久久久国产成人精品亚洲午夜| 欧美无乱码久久久免费午夜一区二区三区中文字幕 | 狠狠人妻久久久久久综合蜜桃| 久久精品人妻一区二区三区| 99精品国产综合久久久久五月天| 久久精品国产第一区二区三区| 国产高潮久久免费观看| 久久久亚洲裙底偷窥综合| 久久久久久久99精品免费观看| 一本综合久久国产二区| AV狠狠色丁香婷婷综合久久| 久久亚洲精品国产亚洲老地址| 成人综合伊人五月婷久久| 亚洲国产精品无码久久青草 | 欧美亚洲日本久久精品| 久久国产精品无码一区二区三区| 亚洲&#228;v永久无码精品天堂久久| 亚洲国产精品无码久久一线| 亚洲国产成人久久综合一区77| 国产精品毛片久久久久久久| 久久久精品人妻一区二区三区蜜桃| 日本道色综合久久影院| 久久久久亚洲AV无码网站| A级毛片无码久久精品免费| 欧美亚洲国产精品久久| 久久综合九色欧美综合狠狠| 久久综合久久久| 久久er国产精品免费观看8| 91精品国产91热久久久久福利| 久久精品无码专区免费东京热| 亚洲综合伊人久久大杳蕉| 久久人人爽人人爽人人片av麻烦 | 亚洲欧洲久久久精品| 久久伊人色| 精品久久久中文字幕人妻 | 久久偷看各类wc女厕嘘嘘| 久久久精品人妻一区二区三区蜜桃 | 欧美一区二区三区久久综|