互聯(lián)網(wǎng)金融是新興涌現(xiàn)出來的金融創(chuàng)新模式。它結(jié)合了成熟的互聯(lián)網(wǎng)技術(shù)、電商消費(fèi)和人工智能等手段,打破了傳統(tǒng)線下銀行的壁壘,在橫向的廣度和縱向的深度上都為傳統(tǒng)金融機(jī)構(gòu)帶來了顛覆性的革新,為現(xiàn)代的融資、購物、支付等需求提供了強(qiáng)大的便利。同時(shí),也由于互金平臺(tái)中的實(shí)時(shí)性、快捷性和復(fù)雜性等特點(diǎn),該領(lǐng)域也爆發(fā)了大量的欺詐行為,給互金機(jī)構(gòu)帶來及其嚴(yán)重的損失。過去的反欺詐手段主要以專家經(jīng)驗(yàn)和規(guī)則為主。隨著大數(shù)據(jù)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)的發(fā)展,越來越多的互金平臺(tái)將量化模型引入到反欺詐工作中農(nóng)。本課程以消費(fèi)金融領(lǐng)域的交易反欺詐為例,介紹如何將機(jī)器學(xué)習(xí)模型應(yīng)用在反欺詐工作中,從而為互金平臺(tái)識(shí)別欺詐、降低損失。
第一部份:python的介紹和入門
1) python語法
2) pandas,numpy,statsmodels,sklearn等常用包
第二部份:數(shù)據(jù)分析建模的準(zhǔn)備工作
1) 業(yè)務(wù)背景
2) 數(shù)據(jù)清洗
3) 特征工程
4) 數(shù)據(jù)可視化
第三部份:建模的預(yù)備知識(shí)
1) 損失函數(shù)
2) 參數(shù)估計(jì)
3) 性能評(píng)價(jià)
第四部份:邏輯回歸模型的介紹
1) 邏輯回歸模型的簡介
2) 邏輯回歸模型的參數(shù)估計(jì)
第五部份:邏輯回歸模型在反欺詐中的應(yīng)用
1) 邏輯回歸模型的特征處理
2) 邏輯回歸模型的結(jié)果解讀
第六部份:支持向量機(jī)模型的介紹
1) 支持向量機(jī)模型的原理
第七部份:支持向量機(jī)模型在反欺詐中的應(yīng)用
1) 支持向量機(jī)模型的應(yīng)用
第八部份:機(jī)器學(xué)習(xí)中的集成模型
1) 元模型與集成模型
2) 集成的方式:bagging,boosting與stacking
第九部份:決策樹與隨機(jī)森林及其應(yīng)用
1) 決策樹模型
2) 隨機(jī)森林模型
3) 隨機(jī)森林的應(yīng)用
4) 特征重要性評(píng)估
第十部份:GBDT模型及其應(yīng)用
1) GBDT模型的原理
2) GBDT模型的應(yīng)用
3) 特征重要性評(píng)估
第十一部份:集成模型中的stacking方法
1) 多模型的stacking
第十二部份:反欺詐業(yè)務(wù)中的衍生問題
1) 無監(jiān)督模型與半監(jiān)督模型
2) 聚類模型
3) 非平衡樣本的處理方法
|