• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            隨筆 - 224  文章 - 41  trackbacks - 0
            <2025年5月>
            27282930123
            45678910
            11121314151617
            18192021222324
            25262728293031
            1234567

            享受編程

            常用鏈接

            留言簿(11)

            隨筆分類(159)

            隨筆檔案(224)

            文章分類(2)

            文章檔案(4)

            經(jīng)典c++博客

            搜索

            •  

            最新評論

            閱讀排行榜

            評論排行榜


            coreseek為了擴展,增加了python數(shù)據(jù)源功能,從而得以無限擴展Coreseek/Sphinx的數(shù)據(jù)獲取功能。

            這樣做的話,coreseek就非常靈活,基本上可以對所有的數(shù)據(jù)建立搜索引擎,只要有自己的python數(shù)據(jù)源基類。

            這里配一下 Microsoft SQL Server 和 python基類的寫法:

            csft_python.conf


            python
            {
               path 
            = /to/coreseek-3.2.14/testpack/etc/pysource
               path 
            = /to/coreseek-3.2.14/testpack/etc/pysource/csft_demo_pymssql    #BSD、Linux環(huán)境下設(shè)置
            }


            source python_demo
            {
                type 
            = python
                name 
            = csft_demo_pymssql.MainSource
                #name 
            = MainSource
            }

            index python_demo
            {
                source            
            = python_demo             #對應(yīng)的source名稱
                path            
            = var/data/python_demo
                #docinfo            
            = extern
                mlock            
            = 0
                morphology        
            = none
                min_word_len        
            = 1
                html_strip                
            = 0
                #charset_dictpath 
            = /usr/local/mmseg3/etc/    #BSD、Linux環(huán)境下設(shè)置,/符號結(jié)尾
                #charset_dictpath 
            = etc/                        #Windows環(huán)境下設(shè)置,/符號結(jié)尾
                charset_type        
            = utf-8
            }

            indexer
            {
                mem_limit            
            = 128M
            }

            searchd
            {
                listen                  
            =   9353
                read_timeout        
            = 5
                max_children        
            = 30
                max_matches            
            = 1000
                seamless_rotate        
            = 0
                preopen_indexes        
            = 0
                unlink_old            
            = 1
                pid_file 
            = var/log/searchd_python.pid
                log 
            = var/log/searchd_python.log
                query_log 
            = var/log/query_python.log
            }




            /to/coreseek-3.2.14/testpack/etc/pysource/csft_demo_pymssql

            下的__init__.py

            -*- coding: UTF-8 -*-


            from os import path
            import os
            import sys
            import pymssql
            import datetime

            class MainSource(object):
                def __init__(self, conf):
                    self.conf 
            =  conf
                    self.idx 
            = 0
                    self.data 
            = []
                    self.conn 
            = None
                    self.cur 
            = None

                def GetScheme(self):  #獲取結(jié)構(gòu),docid、文本、整數(shù)
                    
            return [
                        (
            'id' , {'docid':True, } ),
                        (
            'xx', { 'type':'text'} ),
                        (
            'xx1', {'type':'integer'} ),
                    ]

                def GetFieldOrder(self): #字段的優(yōu)先順序
                    
            return [('name')]
                    
                def Connected(self):   #如果是數(shù)據(jù)庫,則在此處做數(shù)據(jù)庫連接
                    
            if self.conn==None:       
                        self.conn 
            = pymssql.connect(host='192.168.40.105', user='sa', password='987654321sa', database='xxx', as_dict=True,charset='cp936')
                        self.cur 
            = self.conn.cursor()
                        sql 
            = 'SELECT top 12 id,xx,xx1 FROM tbxx'
                        self.cur.execute(sql)
                        self.data 
            = [ row for row in self.cur]
                    pass

                def NextDocument(self):   #取得每一個文檔記錄的調(diào)用
                    
            if self.idx < len(self.data):
                        
            try:

                            item 
            = self.data[self.idx]
                            self.docid 
            = self.id = item[0] #'docid':True
                            self.xx 
            = item[1].encode('utf-8')
                            self.xx1 
            = 1
                            self.idx 
            += 1
                            
            return True
                        except:
                            
            return False
                    
            else:
                        
            return False

            if __name__ == "__main__":    #直接訪問演示部分
                conf 
            = {}
                source 
            = MainSource(conf)
                source.Connected()

                
            while source.NextDocument():
                    print 
            "id=%d, subject=%s" % (source.docid, source.xx)
                pass
            #eof







            參考地址:http://www.coreseek.cn/products-install/python/




            posted on 2013-03-14 17:38 漂漂 閱讀(1488) 評論(0)  編輯 收藏 引用

            只有注冊用戶登錄后才能發(fā)表評論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


            久久久久久青草大香综合精品| 久久久免费精品re6| 91精品无码久久久久久五月天| 久久精品免费观看| 97久久精品人人澡人人爽| 久久精品成人免费国产片小草 | 久久伊人五月丁香狠狠色| 狠狠色丁香婷婷久久综合| 麻豆一区二区99久久久久| 国产精品久久久久久福利漫画 | 久久久久人妻一区精品性色av| 久久ZYZ资源站无码中文动漫| 91麻精品国产91久久久久| 人妻无码精品久久亚瑟影视| 久久久久亚洲av无码专区| 日产久久强奸免费的看| 久久精品麻豆日日躁夜夜躁| 久久久久亚洲精品天堂久久久久久 | 欧美亚洲日本久久精品| 国产精品久久自在自线观看| 久久综合鬼色88久久精品综合自在自线噜噜| 亚洲精品乱码久久久久久中文字幕| 久久99精品久久久久久| 久久午夜夜伦鲁鲁片免费无码影视 | 久久久国产乱子伦精品作者| 中文字幕久久亚洲一区| 精品国产福利久久久| 精品人妻久久久久久888| 久久人人添人人爽添人人片牛牛| 2021国产成人精品久久| 久久99精品国产麻豆宅宅| www久久久天天com| 久久久亚洲欧洲日产国码aⅴ | 国产精品日韩深夜福利久久| 777米奇久久最新地址| 久久久久亚洲精品无码蜜桃| 97精品依人久久久大香线蕉97| 国产免费久久精品99re丫y| 久久影视国产亚洲| 思思久久99热只有频精品66| 一本大道久久东京热无码AV|