第一部份:Crowdflower Search Results Relevance
案例介紹:預(yù)測(cè)來自電子商務(wù)站點(diǎn)的搜索結(jié)果的準(zhǔn)確性,將搜索得到的網(wǎng)頁按相關(guān)性排序
獲獎(jiǎng)?wù)咚梅椒ǎ和ㄟ^ensemble learning整合多個(gè)模型的結(jié)果
涉及算法:Ensemble learning
第二部份:Santander Product Recommendation
案例介紹:根據(jù)銀行客戶1.5年內(nèi)的行為數(shù)據(jù),預(yù)測(cè)用戶會(huì)下一步會(huì)投資的新產(chǎn)品
獲獎(jiǎng)?wù)咚梅椒ǎ和ㄟ^XGBoost構(gòu)建了多個(gè)基本模型,然后將基本模型整合為一個(gè)總模型
涉及算法:XGBoost
第三部份:TalkingData Mobile User Demographics
案例介紹:根據(jù)用戶的手機(jī)應(yīng)用下載和使用行為來預(yù)測(cè)用戶的人口統(tǒng)計(jì)數(shù)據(jù)(年齡、性別等)
獲獎(jiǎng)?wù)咚梅椒ǎ?先預(yù)測(cè)性別的概率;使用性別的預(yù)測(cè)值作為額外的特征加入到模型中,預(yù)測(cè)年齡;通過條件概率得到兩個(gè)目標(biāo)變量的預(yù)測(cè)概率
涉及算法:兩段預(yù)測(cè),XGBoost
第四部份:Facebook V: Predicting Check Ins
案例介紹:預(yù)測(cè)用戶會(huì)在哪個(gè)地方登陸Facebook
獲獎(jiǎng)?wù)咚梅椒ǎ禾卣鬟x擇:數(shù)據(jù)塊的最近鄰計(jì)算;模型構(gòu)建:基于XGBoost的兩步模型
涉及算法:XGboost
第五部份:Avito Duplicate Ads Detection
案例介紹:為了避免賣家發(fā)布各種經(jīng)過少量改動(dòng)的廣告導(dǎo)致買家難以分辨,參賽者需要設(shè)計(jì)一個(gè)模型,自動(dòng)識(shí)別配對(duì)中的廣告是否同一個(gè)廣告
獲獎(jiǎng)?wù)咚梅椒ǎ禾卣鬟x擇:采用了FTIM方法測(cè)試特征的不穩(wěn)定性,提出過度擬合的特征。通過XGBoost和Keras構(gòu)建一層模型;然后通過底層模型構(gòu)建XGBoost 和隨機(jī)森林,最終綜合兩者結(jié)果得到最終結(jié)果
涉及算法:FTIM;元模型
第六部份:Outbrain Click Prediction
案例介紹:在一組針對(duì)用戶推薦內(nèi)容中,預(yù)測(cè)用戶點(diǎn)擊每個(gè)鏈接的可能,將這些推薦內(nèi)容按照點(diǎn)擊可能的大小排序
獲獎(jiǎng)?wù)咚梅椒ǎ簝刹皆P停和ㄟ^LibFFM構(gòu)建第一層模型,再使用XGBoost和Keras構(gòu)建第二層模型
涉及算法:LibFFM;XGBoost;Keras框架
第七部份:Click-Through Rate Prediction
案例介紹:預(yù)測(cè)某個(gè)廣告是否會(huì)被點(diǎn)擊
獲獎(jiǎng)?wù)咚梅椒ǎ簩?shù)據(jù)拆分成不同的子集,構(gòu)建不同的子模型,再整合
涉及算法:LIBFFM
第八部份:Avito Context Ad Clicks
案例介紹:預(yù)測(cè)俄羅斯較大的一般分類網(wǎng)站的用戶在瀏覽網(wǎng)站時(shí),是否點(diǎn)擊上下文廣告
獲獎(jiǎng)?wù)咚梅椒ǎ侯A(yù)處理:散列技巧和消極的抽樣。 學(xué)習(xí)方法:FFM、FM和XGBoost。
涉及算法:FFM;FM;XGboost
第九部份:Rossmann Store Sales
案例介紹:預(yù)測(cè)Rossmann公司各個(gè)門店的6周銷售量
獲獎(jiǎng)?wù)咚梅椒ǎ悍诸愄卣鞯奶幚恚簞?chuàng)建了一種 Entity Embedding(實(shí)體嵌入)的方法去代表在多維空間中的分類特征。
涉及算法:Entity Embedding;神經(jīng)網(wǎng)絡(luò)
第十部份:Amazon.com - Employee Access Challenge
案例介紹:根據(jù)員工的職業(yè)角色,預(yù)測(cè)員工的訪問需求
獲獎(jiǎng)?wù)咚梅椒ǎ?1個(gè)模型的線性組合:使用不同特征訓(xùn)練的GBM模型,GLNNET模型,隨機(jī)森林模型,logistic回歸模型
涉及算法:GBM模型,GLNNET模型,隨機(jī)森林模型,logistic回歸模型
|