你的广告能打几分?Kaggle需求预测挑战赛冠军方

教程 dede58.com 浏览

小编:在题目,形貌,题目+形貌,题目+形貌+param_1等上面,用了tfidf算法。保存全部xgb模子的稀少特性; 利用svd和oof ridge为全部lgb模子连结多样化。 5.实验用CNN或Attention等调解文本模子,发觉

  在题目,形貌,题目+形貌,题目+形貌+param_1等上面,用了tfidf算法。保存全部xgb模子的稀少特性; 利用svd和oof ridge为全部lgb模子连结多样化。

  5.实验用CNN或Attention等调解文本模子,发觉无效后利用2层LSTM,然后是dense层,这里大概有0.0003的改良。

  这场角逐在本年4月尾推出,6月尾停止,共有1873支步队参赛,冠军嘉奖12000美元,亚军嘉奖8000美元,季军嘉奖5000美元。

  网页上的卖货告白有好有坏,好的告白清楚明白的展现产物,恰如其分的形貌卖点,可以或许精准的让那些对此产物有需求的人发生爱好、点击检察。

  他们还发觉了一些基于自动练习+测试的特性,将最好的单个lgb提拔到213X,终极孝敬了0.0007的改进。

  以是,对同样的产物,好告白发生的需求高,烂告白发生的需求低。Kaggle的此次需求猜测挑衅,就是把“需求”用方差来界说:

  咱们天天在网页上看到的各类电商告白,到底够不敷吸惹人?4个月前Kaggle和“俄罗斯版58同城”Avito办了个需求猜测挑衅赛,猜测分歧的告白能吸援用户多大的采办需求。

  整个Dance with Ensemble团队四小我私家的部门归并时,他们模子的线。

  4.添加拥有均匀池化的VGG16顶层。这一步实在让分数变低了,在将文本,图像,分类,数字特性归并在一路之前做一些调解,分数约为0.219X。

  整个收集的第一层包罗一些lgb模子、一些NN模子和一些xgb模子,第二层包罗一些lgb模子、一些xgb模子和一些NN模子,一个NN作为末了一层。作者以为庞大的布局(3层)大概给供给了约莫0.0002-0.0004分的改良。

  9.若是你不停在保留模子,你能够在它们之上练习一个全毗连的NN,另有约莫0.008的改良。换句线名很轻易!

  7.起头做各类调解,发此刻文本和LSTM之间添加空间dropout有很大协助,大要孝敬了0.0007 - 0.001。精致调解的退出率总体上也有所协助,这里改良了约莫0.001 - 0.0015,以是此刻的分数约莫为0.2165 - 0.217。

  3.用亲身我练习fastText嵌入练习+测试,并自动练习、自动测试。现实证实,练习+测试的亲身我练习是最好的。得分到达0.220。

  6.实验了用分歧的CNN模子处置惩罚图像,牢固的ResNet50两头层大概另有0.0005分的提拔,分数酿成了0.218X。

  现在冠军已出炉,而且在交际收集上惹起了一波关心保藏,量子位在此分享一下。

当前网址:http://sxjxhb.net/tutorials/87.html

 
你可能喜欢的: