阿里大数据竞赛——穿越到甄嬛传,你有几分胜算? - 可打印的版本 +- 清水湾论坛 - 香港科技大学内地学生学者联谊会 MSSS (https://msss.hkust.edu.hk/forum) +-- 版块: 科大生活 (https://msss.hkust.edu.hk/forum/forumdisplay.php?fid=1) +--- 版块: 求职 & 留学 (https://msss.hkust.edu.hk/forum/forumdisplay.php?fid=13) +--- 主题: 阿里大数据竞赛——穿越到甄嬛传,你有几分胜算? (/showthread.php?tid=16642) |
阿里大数据竞赛——穿越到甄嬛传,你有几分胜算? - 51campus - 03-17-2014 穿越到甄嬛传,你有几分胜算? 又是一年选秀开始,于是宫里宫外又开始了明争暗斗。如何才能挑出合皇上口味的好秀女,当好主子的左膀右臂?可能还要花很多功夫。 你知道皇上喜欢聪明的嬛嬛,喜欢明艳的华妃,喜欢得体的皇后,那你怎么知道皇上喜不喜欢新来的秀女呢? (皇上,左边是不是别有一番风味?——你一定是在逗我(╯‵□′)╯︵┻━┻) 好吧,现代的审美在宫里估计是站不住脚,但如果运用现代技术,比如机器学习算法,也许可以帮上你一些忙。 要预测小主未来的受宠程度,自然是以宫中已有的主子们作为样本。各位娘娘千姿百态,你便首先要将大家的特点(attribute)加以归类,方便日后的总结。而对应的皇上的态度基本分为三类:朕喜欢,朕不喜欢,偶尔朕还觉得挺逗比的。 然后聪明的你会去找@留一手 给各位娘娘都打个单项分(方便谋划起见,请将他的分数调整为正数),然后与皇上的态度联系起来: 嫔妃 容貌 家世 脾气 人际关系 皇上态度 甄嬛 沈眉庄 安陵容 华妃 皇后 吃货淳贵人 像这样已经存在并被分类(皇上态度已经明确)的情报,我们称之为前车之鉴(training set)。 有了情报,你就可以用很多种办法来处理它们,比如将这些分数调整比重相加得出一个总评分,总评分越高对应皇上越喜欢。这样,你大概可以算出皇上喜欢温婉大方的白富美学霸,而且似乎美貌和温婉占的比重更大一些。为了验证这个评判法则,你可以选一些一开始尚未加入前车之鉴情报集、新发现的嫔妃(testing set)进行验证。 在验证的过程中,你才会知道神马叫做人算不如天算。总有一些姑娘虽然百般不符合你的预测,仍然得了皇上的宠幸。这就说明——皇上的眼瞎了?才不是呢!是你需要修改你的评判法则了!这时你可以再加入一个改进因子(learning rate),每次如果预测结果与实际不符,你就得做出一定的修正。 如此一来,你便可以将每年的选秀都当成你的八卦演练场了。当再有新人进宫的时候,你只需再分析一下新人的各个属性特征,就可以大概猜出这位小主的前途。随着新人的不断进入,你的这个评判法则也会越来越趋于准确。当然,前提是皇上的口味保持一致。如果皇上性情大便,啊不,大变,那有可能原有的模型都要推倒重来了。 好吧,我们的机器学习算法看起来还不错,也为你的宫斗进阶之路提供了指引。如果你是女人,请你按照主子的喜好去努力,也许哪一天你就是下一个容!嬷!嬷!(奴婢可是当年大明湖畔的夏雨荷!!!)如果你是一个#可爱的男孩子#,恭喜你,是一块苏培盛接班人的好材料……#注定孤独一生# 在21世纪的天猫,就有那么一群兢兢业业的可爱的男孩子,他们每时每刻都在寻找新的方式来揣测各位主子的意思,希望能给为屏幕前的皇上老佛爷们挑出最合各位口味的商品。这,就是我们[人见人爱花见花开妹子你们怎么还不到碗里来]的天猫算法团队。 除了并肩作战之外,这些算法达人之间还会展开各种激烈的厮杀啃咬……来比赛谁更懂主子的心意!就是传说中的”阿里巴巴大数据竞赛内部赛——天猫推荐算法大挑战”!那么高大上的名字想来你也还没听说过,不过随着天猫数据的开放,你也将有机会可以小试身手,看看面对看不见的主子们,你有几分胜算! 少年们,继续加油,多多提高姿势水平啊!当年宫里那些个公公嬷嬷,都不知道比你高到哪里去了! 阿里巴巴大数据竞赛——天猫推荐算法大挑战正式启动,给你真实的数据,解决真实的问题。百万大奖,等你挑战!快来参赛吧~~~ 参赛猛戳:http://102.alibaba.com/competition/addDiscovery/index.htm RE: 阿里大数据竞赛——穿越到甄嬛传,你有几分胜算? - 51campus - 03-20-2014 阿里巴巴大数据竞赛——天猫推荐算法大挑战正式启动,给你真实的数据,解决真实的问题。百万大奖,等你挑战!快来参赛吧~~~ 参赛猛戳:http://102.alibaba.com/competition/addDiscovery/index.htm |