• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            sunrise

            每天不斷學(xué)習(xí),才能不斷提升自己。

              C++博客 :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::
              64 隨筆 :: 0 文章 :: 92 評論 :: 0 Trackbacks
                                                                                   第一章:python自然語言處理

            我們可以很容易的獲得成千上萬的文本。假設(shè)我們寫一些簡單的python程序,能用它做什么?在這個章節(jié)中,我們將提出以下問題:

            1.我們使用簡單的程序設(shè)計能對大量的文本做什么?

            2.怎樣才能自動的提取關(guān)鍵字和短語來確定一個文本的類型和內(nèi)容?

            3.python提供什么樣的工具和技術(shù)來完成像這樣的工作?

            4.自然語言處理面臨著什么有趣的挑戰(zhàn)?

            這一章將分成零碎的完全不相同風(fēng)格的兩部分。在"計算機(jī)語言"部分,我們將布置一些激發(fā)語言興趣的任務(wù),而不是解釋它們?nèi)绾喂ぷ鳎辉?#8220;親近python”部分,會有條理的講速python的重要概念。我們將會把題目分為兩個部分,但是稍后的章節(jié)則會混合不同的部分。希望這種介紹方式能讓你真正體會到語言學(xué)和計算學(xué)領(lǐng)域的味道。如果你在這兩個領(lǐng)域有良好的基礎(chǔ),可以跳過1.5節(jié)。在后面的章節(jié)中,我們將會重復(fù)一些重要的知識點,如果錯過了一些知識點可以在http://www.nltk.org/在線查閱一些資料。這些資料如果對你來說是完全陌生的,這個章節(jié)將會帶來更多的疑問,而這些問題的答案在本書中可以找到。

            1.1計算機(jī)語言:文本和文字

            因為我們每天都會對文本進(jìn)行讀和寫,對文本非常的熟悉。我們可以通過各種有趣的方式來操作和解釋這些文本數(shù)據(jù)。但是在做這些之前,我們不得不先開始了解python.

            開始進(jìn)入python

            Python使用友好的界面,能夠讓你直接進(jìn)入交互式編譯器來運(yùn)行你的程序。Python使用一種叫作IDLEInteractiveDeveLopmentEnvironment)的簡單圖形界面。在Unix系統(tǒng)下你可以直接用shell命令來打開IDLE(如果沒有安裝,現(xiàn)輸入python).這時候終端會打印出python的版本,在這里你可以簡單的核對一下你的python的版本(這里的是2.5.1):

            Python2.5.1 (r251:54863, Apr 15 2008, 22:57:26)

            [GCC4.0.1 (Apple Inc. build 5465)] on darwin

            Type"help", "copyright", "credits" or"license" for more information.

            >>>

            如果不能運(yùn)行python解釋器,python可能沒有被正確的安裝。可以訪http://python.org/,找到問題的所在。

            >>>”表示python編譯器等待輸入,書中的樣例中的該符號,不需要自己輸入。現(xiàn)在開始使用python就像使用計算器那樣就可以了:

            >>>1 + 5 * 2 - 3

            8

            >>>

            編譯器立刻完成了計算并先顯示了答案,并且再次顯示”>>>”,這就意味著python等待輸入另一個指令。

            你可以自己嘗試輸入一些表達(dá)式,可以使用*和/進(jìn)行乘法和除法運(yùn)算,并且可以輸入一些帶括號的復(fù)數(shù)表達(dá)式。除法運(yùn)算的行為可能并不是你意料之中的,當(dāng)進(jìn)行整數(shù)除法和浮點除法的時候會出現(xiàn)不同的結(jié)果,為了獲得意料之中的結(jié)果,可以輸入:from__future__ import division

            通過簡單你例子示范了怎樣在python解釋器中進(jìn)行工作并通過不同的表達(dá)式知道了這種語言能做什么。現(xiàn)在就讓我們嘗試一下輸入一個不完整的表達(dá)式,編譯器會怎么工作:

            >>>1 +

            File "<stdin>", line 1

            1+

            ^

            SyntaxError:invalid syntax

            >>>

            這引起了一個syntaxerror。在python中,指令的結(jié)尾是一個加號是沒有意義的。python編譯器會提示出現(xiàn)錯誤的行數(shù)。目前我們已經(jīng)可以使用python解釋器了,就已經(jīng)做好了用該語言處理數(shù)據(jù)工作的準(zhǔn)備工作。

            posted on 2012-03-15 14:14 SunRise_at 閱讀(1505) 評論(0)  編輯 收藏 引用 所屬分類: 邊學(xué)邊譯

            只有注冊用戶登錄后才能發(fā)表評論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


            婷婷综合久久中文字幕蜜桃三电影| 一级做a爱片久久毛片| 亚洲一区精品伊人久久伊人 | 久久93精品国产91久久综合| 久久久噜噜噜久久中文字幕色伊伊| 国内精品久久久久影院薰衣草| 精品免费久久久久久久| 久久精品国产福利国产琪琪| 色综合久久无码中文字幕| 9999国产精品欧美久久久久久| 伊人久久成人成综合网222| 国产精品免费看久久久| 一本久久综合亚洲鲁鲁五月天亚洲欧美一区二区 | 97久久超碰国产精品旧版| 久久精品18| 久久精品国产免费一区| 亚洲国产美女精品久久久久∴| 99久久精品费精品国产| 亚洲精品国产字幕久久不卡| 情人伊人久久综合亚洲| 久久精品国产亚洲AV蜜臀色欲| 久久精品国产国产精品四凭| 欧美伊香蕉久久综合类网站| 国产∨亚洲V天堂无码久久久| 精品一二三区久久aaa片| 亚洲国产高清精品线久久| 久久福利片| 精品久久久久久99人妻| 国内精品久久久久久久久| 超级碰碰碰碰97久久久久| 国产激情久久久久久熟女老人| 性做久久久久久久久| 久久国产综合精品五月天| 深夜久久AAAAA级毛片免费看 | 无码国内精品久久人妻麻豆按摩| 久久青青国产| 久久精品国产亚洲AV香蕉| 久久婷婷午色综合夜啪| 国产成人精品久久亚洲高清不卡 | 久久久久人妻一区二区三区| 国产成人久久精品一区二区三区|