自然語言處理(NLP)是人工智能和語言學(xué)領(lǐng)域的一個分支學(xué)科,同時也是機器學(xué)習(xí)中最熱的一個方向之一。試想想,機器可完全明白人類的語言,并且可以嫻熟地使用自然語言與人類溝通,這不就是人工智能的目標(biāo)?目前,我們處理的數(shù)據(jù),并不僅僅只有數(shù)值型數(shù)據(jù),還包含了大量的文本數(shù)據(jù)。對于傳統(tǒng)的分析技術(shù)來說,文本數(shù)據(jù)中的真正含義無法真正解析出來,是對文本信息的較大浪費。幸好,現(xiàn)在各種文本預(yù)處理、文本挖掘技術(shù)已日漸成熟,可以幫助我們從文本中提取出更多有意義的信息。
第一部分:算法軟件基礎(chǔ):介紹不同算法工具的基本使用語法
第一節(jié):語言模型SRILM——用SRILM訓(xùn)練語言模型
第二節(jié): 隱馬爾可夫模型HTK入門——HTK的安裝與使用
第三節(jié): 隱馬爾可夫模型HTK深入——HTK使用詳解
第四節(jié): 隱馬爾可夫模型HTK實例——簡單的語音撥號應(yīng)用程序
第五節(jié): 條件隨機場CRF++——CRF++的安裝與使用
第六節(jié): 較大熵模型OpenNLP——OpenNLP的安裝與基本功能
第七節(jié): 較大熵模型MALLET——MALLET的安裝與使用
第八節(jié):中文NLP工具包——FudanNLP入門
第九節(jié):中文NLP工具包——StanfordNLP各個模塊介紹
第二部分:實驗案例操作
第十節(jié):中文NLP基礎(chǔ),分詞處理與詞性標(biāo)注——對比常用的中文分詞工具的使用
第十一節(jié):命名實體識別的實現(xiàn)
第十二節(jié):文本分類與情感分析——商品評論傾向性分析
第十三節(jié):文本關(guān)鍵信息提取——關(guān)鍵詞提取與文本摘要
|