• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            sunrise

            每天不斷學(xué)習(xí),才能不斷提升自己。

              C++博客 :: 首頁(yè) :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::
              64 隨筆 :: 0 文章 :: 92 評(píng)論 :: 0 Trackbacks
            額 閑得沒(méi)事,寫的文本預(yù)處理模板,很簡(jiǎn)單,但是為了以后處理文本時(shí),不再做重復(fù)的事,就整理了一下,隨著處理文本增多,會(huì)慢慢更新。。
            #!/usr/bin/enc python
            #-*-coding:UTF-8 -*-
            #
            #
            #Copyrigtht (c)
            #Laiseek Comany 2012
            #All rights reserved.
            #
            #Finename:nearsyn.py
            #Function:預(yù)處理工具
            #
            #Current version:1.0
            #author: Chen Yu
            #Date: 05/07/2012
            #
            import re
            class NearSyn:
              def init(self):
                self.syn = []
                self.det = []
              #加載數(shù)據(jù)
              def load(self,filename,detfile):
                sock = open(filename,'r')
                self.syn = sock.read().split('\n')
                sock.close()
                for i in range(len(self.syn)):
                  self.syn[i] = self.syn[i].split(' ')
                self.det = []
                sock = open(detfile,'r')
                self.det = sock.read().split('\n')
                sock.close()
              #去除讀入元素中的空l(shuí)ist
              def empty(self):
                for i in range(len(self.syn)):
                  #空元素移除后元素減少
                  flag = 0
                  for j in range(len(self.syn[i])):
                    if self.syn[i][j - flag] == " "or len(self.syn[i][j - flag]) == 0:
                      self.syn[i].remove(self.syn[i][j - flag])
                      flag += 1
              #從A中剔除D
              def dete(self):
                for i in range(len(self.syn)):
                  self.det[i] = self.det[i].split(' ')
                for i in range(len(self.syn)):
                  for j in range(len(self.det[i])):
                    if self.det[i][j]:
                      self.syn[i].remove(self.det[i][j])
              #合并A和B
              def merge(self,filename1,filename2):
                sock = open(filename1,'r')
                buf1 = sock.read().split('\n')
                sock.close()
                sock = open(filename2,'r')
                buf2 = sock.read().split('\n')
                sock.close()
                sock = open('app','w')
                print len(buf1)
                for i in range(len(buf1)):
                  sock.write(buf1[i] + ' '+ buf2[i]+ '\n')
                sock.close()
              #去除重復(fù)的元素
              def unrep(self,filename):
                sock = open(filename,'r')
                buf = sock.read().split('\n')
                sock.close()
                ls = list(set(buf))
                ls.sort(key = buf.index)
                sock = open('sims2','w')
                for i in range(len(ls)):
                  sock.write(ls[i] + '\n')
                sock.close()
              #去除html標(biāo)簽
              def offhtml(self,infile,outfile):
                rfile = open(infile,'r')
                buf = rfile.read()
                rfile.close()
                wfile = open(outfile,'w')
                buf = re.sub(r"<[^!>](?:[^>]|\n)*>", '',buf)
                wfile.write(buf)
              #輸出
              def output(self,filename):
                sock = open(filename,'w')
                for i in range(len(self.syn)):
                  #去掉單個(gè)詞
                  if len(self.syn[i]) > 1:
                    for j in range(len(self.syn[i])):
                      sock.write(self.syn[i][j] + '  ')
                    sock.write("\n")
                sock.close()
            if __name__ == '__main__':
              t = NearSyn()
            posted on 2012-05-07 14:32 SunRise_at 閱讀(1523) 評(píng)論(0)  編輯 收藏 引用 所屬分類: 可愛(ài)的python
            香蕉久久久久久狠狠色| 国产精品久久久99| 精品国产乱码久久久久软件| 99久久99久久精品国产片果冻| 精品久久无码中文字幕| 国产精品午夜久久| 一本一本久久a久久综合精品蜜桃 一本一道久久综合狠狠老 | 国产精品18久久久久久vr| 久久久久一级精品亚洲国产成人综合AV区| 久久艹国产| 国产精品无码久久综合| 久久影视综合亚洲| 一本久久久久久久| 色综合久久综合中文综合网| 国产一区二区精品久久岳| 性色欲网站人妻丰满中文久久不卡| 色综合久久最新中文字幕| 99久久国产精品免费一区二区| 久久久久成人精品无码| 72种姿势欧美久久久久大黄蕉 | 欧美黑人激情性久久| 麻豆久久| 久久久精品视频免费观看| 精品免费tv久久久久久久| 伊人久久大香线蕉综合影院首页 | 久久国产精品-久久精品| 亚洲综合精品香蕉久久网| 亚州日韩精品专区久久久| 久久天天日天天操综合伊人av| 久久国产精品99精品国产987| 无码人妻少妇久久中文字幕蜜桃| 一级a性色生活片久久无少妇一级婬片免费放| 久久精品国产免费一区| 精品国产91久久久久久久| 色综合久久久久无码专区| 久久亚洲中文字幕精品一区| 欧美大战日韩91综合一区婷婷久久青草 | 狠狠色婷婷久久综合频道日韩 | 久久精品国产亚洲av瑜伽| 国产福利电影一区二区三区,免费久久久久久久精 | 一级a性色生活片久久无少妇一级婬片免费放|