• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆 - 224  文章 - 41  trackbacks - 0
            <2010年6月>
            303112345
            6789101112
            13141516171819
            20212223242526
            27282930123
            45678910

            享受編程

            常用鏈接

            留言簿(11)

            隨筆分類(159)

            隨筆檔案(224)

            文章分類(2)

            文章檔案(4)

            經(jīng)典c++博客

            搜索

            •  

            最新評論

            閱讀排行榜

            評論排行榜


            coreseek為了擴展,增加了python數(shù)據(jù)源功能,從而得以無限擴展Coreseek/Sphinx的數(shù)據(jù)獲取功能。

            這樣做的話,coreseek就非常靈活,基本上可以對所有的數(shù)據(jù)建立搜索引擎,只要有自己的python數(shù)據(jù)源基類。

            這里配一下 Microsoft SQL Server 和 python基類的寫法:

            csft_python.conf


            python
            {
               path 
            = /to/coreseek-3.2.14/testpack/etc/pysource
               path 
            = /to/coreseek-3.2.14/testpack/etc/pysource/csft_demo_pymssql    #BSD、Linux環(huán)境下設(shè)置
            }


            source python_demo
            {
                type 
            = python
                name 
            = csft_demo_pymssql.MainSource
                #name 
            = MainSource
            }

            index python_demo
            {
                source            
            = python_demo             #對應(yīng)的source名稱
                path            
            = var/data/python_demo
                #docinfo            
            = extern
                mlock            
            = 0
                morphology        
            = none
                min_word_len        
            = 1
                html_strip                
            = 0
                #charset_dictpath 
            = /usr/local/mmseg3/etc/    #BSD、Linux環(huán)境下設(shè)置,/符號結(jié)尾
                #charset_dictpath 
            = etc/                        #Windows環(huán)境下設(shè)置,/符號結(jié)尾
                charset_type        
            = utf-8
            }

            indexer
            {
                mem_limit            
            = 128M
            }

            searchd
            {
                listen                  
            =   9353
                read_timeout        
            = 5
                max_children        
            = 30
                max_matches            
            = 1000
                seamless_rotate        
            = 0
                preopen_indexes        
            = 0
                unlink_old            
            = 1
                pid_file 
            = var/log/searchd_python.pid
                log 
            = var/log/searchd_python.log
                query_log 
            = var/log/query_python.log
            }




            /to/coreseek-3.2.14/testpack/etc/pysource/csft_demo_pymssql

            下的__init__.py

            -*- coding: UTF-8 -*-


            from os import path
            import os
            import sys
            import pymssql
            import datetime

            class MainSource(object):
                def __init__(self, conf):
                    self.conf 
            =  conf
                    self.idx 
            = 0
                    self.data 
            = []
                    self.conn 
            = None
                    self.cur 
            = None

                def GetScheme(self):  #獲取結(jié)構(gòu),docid、文本、整數(shù)
                    
            return [
                        (
            'id' , {'docid':True, } ),
                        (
            'xx', { 'type':'text'} ),
                        (
            'xx1', {'type':'integer'} ),
                    ]

                def GetFieldOrder(self): #字段的優(yōu)先順序
                    
            return [('name')]
                    
                def Connected(self):   #如果是數(shù)據(jù)庫,則在此處做數(shù)據(jù)庫連接
                    
            if self.conn==None:       
                        self.conn 
            = pymssql.connect(host='192.168.40.105', user='sa', password='987654321sa', database='xxx', as_dict=True,charset='cp936')
                        self.cur 
            = self.conn.cursor()
                        sql 
            = 'SELECT top 12 id,xx,xx1 FROM tbxx'
                        self.cur.execute(sql)
                        self.data 
            = [ row for row in self.cur]
                    pass

                def NextDocument(self):   #取得每一個文檔記錄的調(diào)用
                    
            if self.idx < len(self.data):
                        
            try:

                            item 
            = self.data[self.idx]
                            self.docid 
            = self.id = item[0] #'docid':True
                            self.xx 
            = item[1].encode('utf-8')
                            self.xx1 
            = 1
                            self.idx 
            += 1
                            
            return True
                        except:
                            
            return False
                    
            else:
                        
            return False

            if __name__ == "__main__":    #直接訪問演示部分
                conf 
            = {}
                source 
            = MainSource(conf)
                source.Connected()

                
            while source.NextDocument():
                    print 
            "id=%d, subject=%s" % (source.docid, source.xx)
                pass
            #eof







            參考地址:http://www.coreseek.cn/products-install/python/




            posted on 2013-03-14 17:38 漂漂 閱讀(1496) 評論(0)  編輯 收藏 引用

            只有注冊用戶登錄后才能發(fā)表評論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


            伊人色综合久久天天人守人婷| 久久久久久久97| 久久ww精品w免费人成| 久久精品中文字幕大胸| 久久er国产精品免费观看2| 午夜欧美精品久久久久久久| 久久亚洲精品国产精品婷婷| 思思久久99热免费精品6| 久久久久无码精品| 无码人妻少妇久久中文字幕| 午夜福利91久久福利| 日韩久久久久中文字幕人妻| 中文字幕精品久久| 亚洲精品无码久久久久去q| 色婷婷久久综合中文久久蜜桃av | 亚洲AV无码久久精品成人| 2021国产精品午夜久久| 亚洲中文久久精品无码ww16| 亚洲国产精品无码久久久不卡| 亚洲日韩中文无码久久| 久久久女人与动物群交毛片| 久久99国产精品99久久| 久久久久国产日韩精品网站| 久久综合亚洲鲁鲁五月天| 久久青青草原精品国产| 久久国产V一级毛多内射| 久久久噜噜噜久久中文字幕色伊伊| 亚洲精品无码专区久久同性男| 色婷婷综合久久久久中文一区二区 | 亚洲色欲久久久久综合网| 久久成人小视频| 2021久久国自产拍精品| 久久综合九色综合久99| 色欲久久久天天天综合网| 日韩精品久久久久久| 国产成人精品综合久久久| 久久精品国产亚洲精品2020| 久久久精品日本一区二区三区| 亚洲精品无码久久久久去q| 国产精品嫩草影院久久| 99久久久国产精品免费无卡顿|