
機(jī)器學(xué)習(xí)及Python應(yīng)用培訓(xùn)
機(jī)器學(xué)習(xí)及Python應(yīng)用
第1講 機(jī)器學(xué)習(xí)引論
(1) 什么是機(jī)器學(xué)習(xí)
(2) 機(jī)器學(xué)習(xí)的分類與術(shù)語
(3) 案例:垃圾郵件過濾;手寫體數(shù)字識(shí)別;圖像識(shí)別;自動(dòng)駕駛
第2講 Python語言快速入門
(1) Why Python?
(2) 安裝Python與Spyder
(3) Python的模塊(module)
(4) Python的對(duì)象(str, bool, list, tuple, dict, set)
(5) Python的函數(shù)(function)與方法(method)
(6) Numpy(ndarray), pandas(Series, DataFrame)
(7) sklearn(機(jī)器學(xué)習(xí))與keras(深度學(xué)習(xí))
(8) Python畫圖(Matplotlib, pandas, seaborn)
(9) Python面向?qū)ο缶幊?/p>
第3講 數(shù)學(xué)回顧
(1) 梯度向量
(2) 方向?qū)?shù)
(3) 梯度下降
(4) 向量微分
(5) 優(yōu)化
第4講 線性回歸
(1) OLS
(2) 過擬合與泛化能力
(3) 偏差與方差的權(quán)衡
(4) 交叉驗(yàn)證
(5) Python案例:多項(xiàng)式回歸的過擬合;波士頓房?jī)r(jià)
第5講 邏輯回歸
(1) Logit
(2) 幾率比
(3) 靈敏度與特異度
(4) ROC與AUC
(5) 科恩的kappa
(6) Python案例:泰坦尼克號(hào)旅客的存活
第6講 多項(xiàng)邏輯回歸
(1) 多項(xiàng)Logit
(2) Python案例:識(shí)別玻璃類別
第7講 判別分析
(1) 線性判別分析(Linear Discriminant Analysis)
(2) 二次判別分析(Quadratic Discriminant Analysis)
(3) 費(fèi)雪判別分析(Fisher Discriminant Analysis)
(4) Python案例:鳶尾花品種的歸類
第8講 樸素貝葉斯
(1) 樸素貝葉斯(Naive Bayes)
(2) 拉普拉斯修正(Laplacian Correction)
(3) Python案例:垃圾郵件的識(shí)別
第9講 懲罰回歸
(1) 高維回歸的挑戰(zhàn)
(2) 嶺回歸(Ridge Regression)
(3) 套索估計(jì)(Lasso)
(4) 彈性網(wǎng)估計(jì)(Elastic Net)
(5) Python案例:前列腺癌的影響因素
第10講 K近鄰法
(1) 回歸問題的K近鄰法
(2) 分類問題的K近鄰法
(3) Python案例:摩托車撞擊實(shí)驗(yàn)數(shù)據(jù);鳶尾花品種的歸類;威斯康辛乳腺癌的診斷
第11講 決策樹
(1) 分類樹(Classification Tree)
(2) 分裂準(zhǔn)則(錯(cuò)分率、基尼指數(shù)、信息熵)
(3) 成本復(fù)雜性修枝
(4) 回歸樹(Regression Tree)
(5) Python案例:波士頓房?jī)r(jià);葡萄牙銀行市場(chǎng)營(yíng)銷
第12講 隨機(jī)森林
(1) 集成學(xué)習(xí)(Ensemble Learning)
(2) 裝袋法(Bagging)
(3) 隨機(jī)森林(Random Forest)
(4) 變量重要性(Variable Importance)
(5) 偏依賴圖(Partial Dependence Plot)
(6) Python案例:波士頓房?jī)r(jià);聲吶信號(hào)的分類
第13講 提升法
(1) 自適應(yīng)提升法 (AdaBoost)
(2) AdaBoost的統(tǒng)計(jì)解釋
(3) 梯度提升法 (Gradient Boosting Machine)
(4) XGBoost算法
(5) Python案例:波士頓房?jī)r(jià);過濾垃圾郵件;識(shí)別玻璃類別
第14講 支持向量機(jī)
(1) 大間隔分類器(Maximal Margin Classifier)
(2) 軟間隔分類器(Soft Margin Classifier)
(3) 支持向量機(jī)(Support Vector Machine)
(4) 核技巧(Kernel Trick)
(5) 支持向量回歸(Support Vector Regression)
(6) Python案例:模擬數(shù)據(jù);過濾垃圾郵件;識(shí)別手寫數(shù)字;波士頓房?jī)r(jià)
第15講 人工神經(jīng)網(wǎng)絡(luò)
(1) 人工神經(jīng)網(wǎng)絡(luò)的思想
(2) 感知機(jī)(Perceptron)
(3) 前饋神經(jīng)網(wǎng)絡(luò)(Feedforward Neural Network)
(4) 激活函數(shù)(Activation Function)
(5) 反向傳播算法(Back-propagation Algorithm)
(6) 隨機(jī)梯度下降(Stochastic Gradient Descent)
(7) 神經(jīng)網(wǎng)絡(luò)的過擬合與正則化
(8) 卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network)
(9) 深度學(xué)習(xí)的發(fā)展
(10) Python案例(sklearn與Keras):
波士頓房?jī)r(jià);過濾垃圾郵件;模擬數(shù)據(jù);路透社新聞主題分類,手寫數(shù)字?jǐn)?shù)據(jù)集MNIST
第16講 非監(jiān)督學(xué)習(xí)之主成分分析
(1) 總體中的主成分分析
(2) 樣本中的主成分分析
(3) 方差分解與降維
(4) 主成分回歸(Principal Component Regression)
(5) Python案例:左右耳聽力;香港回歸的經(jīng)濟(jì)效應(yīng)
第17講 非監(jiān)督學(xué)習(xí)之聚類分析
(1) K-均值聚類(K-means Clustering)
(2) 分層聚類(Hierarchical Clustering)
(3) 樹狀圖
(4) 基于相關(guān)系數(shù)的距離
(5) Python案例:模擬數(shù)據(jù);鳶尾花品種的歸類
第18講 數(shù)據(jù)科學(xué)的Python語言
(1) 何為數(shù)據(jù)科學(xué)
(2) 讀寫文件
(3) 缺失與重復(fù)數(shù)據(jù)
(4) 合并數(shù)據(jù)
(5) sklearn的管線類(pipeline class)
(6) Python案例:Kaggle泰坦尼克數(shù)據(jù)的清理
第19講(Bonus Lecture) 機(jī)器學(xué)習(xí)在經(jīng)管社科的應(yīng)用