
在線民宿 UGC 數(shù)據(jù)挖掘培訓(xùn)
1 Pandas 數(shù)據(jù)聚合
2 TensorFlow 模型搭建
3 NLP 文本處理
4 Word2Vec 詞向量訓(xùn)練
5 Gensim 下的 LDA 主題自動聚類
6 Stacking 集成情感分析
7 深度 GRU 情感分析
8 Flask API 搭建情感分析接口
9 百度 LBS 地理位置信息采集
10 Scikit-learn 模型搭建
11 Pyecharts 可視化
12 KMeans 下的詞向量自動聚類
13 LDAvis 主題可視化
14 深度 CNN 情感分析
15 低代碼下的 LitNlp 深度情感分析
16 Python 使用 POST 和 GET 進行接口請求
1
快速實現(xiàn)民宿整體的意見挖掘
1.Pandas數(shù)據(jù)聚合
2.數(shù)據(jù)EDA
3.貝葉斯情感分析建模
4.模型評測
5.情感極性可視化
2
利用 pyecharts 進行可視化分析
1.數(shù)據(jù)清洗
2.數(shù)據(jù)特征處理
3.數(shù)據(jù)聚合
4.pyecharts可視化
3
民宿地理位置可視化分析
1.Requests接口請求
2.基于百度LBS接口解析地理位置信息
3.地理數(shù)據(jù)聚合
4.pyecharts地理信息可視化
4
基于字典的評論主題挖掘
1.詞性標(biāo)注
2.主題句切分
3.TFIDF關(guān)鍵詞挖掘
4.主題分布可視化
5
基于詞向量的主題聚類挖掘
1.名詞抽取
2.Word2Vec詞向量訓(xùn)練
3.佳聚類個數(shù)選取
4.KMeans主題聚類
6
基于 LDA 模型的評論主題挖掘
1.評價數(shù)據(jù)清洗
2.LDA主題建模
3.佳主題數(shù)選取
4.LDAvis主題分布可視化
7
文本自動化標(biāo)注和數(shù)據(jù)采樣
1.特征工程
2.數(shù)據(jù)自動化標(biāo)注
3.數(shù)據(jù)采樣
4.采樣結(jié)果評測
8
集成模型在情感分析中的應(yīng)用
1.特征工程
2.情感建模
3.Stacking集成建模
4.主題情感可視化
9
深度模型在情感分析中的應(yīng)用
1.數(shù)據(jù)預(yù)處理
2.詞級和字符級的文本分詞
3.深度情感分類模型
4.深度學(xué)習(xí)模型測試
10
部署深度情感推理模型
1.litNlp使用
2.FlaskAPI開發(fā)
3.模型部署
4.情感極性批量預(yù)測
基于 Pandas 和 pyecharts 的數(shù)據(jù)聚合和可視化分析。
主題建模實戰(zhàn),包括:詞頻排序模型下的主題詞云分析、基于 Word2Vec 詞向量下的 KMeans 名詞聚類、LDA 主題建模。
針對數(shù)據(jù)集標(biāo)簽失衡問題,實驗分析了不用數(shù)據(jù)采樣方式對情感分析模型性能的影響。
介紹了基于 Stacking 的集成模型和深度情感分析模型在用戶評論情感建模上的性能差異,
然后針對深度模型分別使用字符級和詞語級進行建模來比較差異,深度模型具體有 TextCNN 和 GRU。
主要實現(xiàn)模型的部署,使用 Flask 框架對 litNlp 深度情感分析模型進行 RESTful API 部署,實現(xiàn)情感極性預(yù)測通過網(wǎng)絡(luò)接口進行服務(wù)。
