
算法,系统,论坛,活动策划
3月6日,由淘宝网与ResysChina联合组办的2011推荐系统论坛在北京成功举办,CSDN受邀跟踪并全程报道了本次活动,超过200位领域内的爱好者来到现场,Netflix Prize冠军队成员Yehuda Koren、淘宝网数据产品部技术经理贾超、百度科学家张栋、淘宝网技术研发部广告算法组/一组经理项碧波(游龙)、前Google研究员王益、Hulu推荐团队负责人郑华为与会者带来了精彩演讲。
Netflix Prize冠军队成员Yehuda Koren
Yehuda Koren在《Web-Scale Recommendation Systems》的主题演讲中,谈到了以下七个话题。
Yehuda Koren谈了Netflix Prize中的常见思路与Model,不仅有非常专业的算法和模型探讨,还包括一些有意思的内容和观点:
在Netflix数据中,可以Model的,Bias占33%,个性化因素占10%,剩下的为不可解释因素。也即是模型无法解释的方差占了50%以上,测量误差和表述误差和自我选择等系统误差占30%以上,模型能解释的行为很少;
more user input > better algorithm,好的充分的数据比好的算法更重要;
用户的long-term效应实际上很难被捕获;
multi-channel融合推荐的两个问题:如何融合,如何加权;
淘宝网数据产品部技术经理 贾超 发表了主题为《淘宝数据力量》的演讲

百度科学家 张栋
百度科学家 张栋在演讲中比较了当前流行的推荐算法各自的特点,以及谈到了相关的优化技术:EM、gibbs sampling、gradient descent。
为什么推荐很难,张栋列了八个方面
张栋认为一个成功的resys推荐系统的影响权重:UI/UE 40%,data:30%, knowledge: 20, algorithm:10%。

algorithm:10%?? 算法只占推荐系统权重的10%,这引起了与会者的热议
此外,张栋觉得一个好的算法无法打败无数combine起来的算法。

淘宝网 项碧波(游龙)《推荐系统在电子商务环境中的应用》
前Google研究员王益《Recommendation Using Large Scale Click Through Data 》
随后,Hulu推荐团队负责人 郑华 在《Personalization in Hulu》谈到,Hulu算法团队有两大部分工作:视频推荐与广告投放。他认为商业上的因素对推荐策略有很重要的影响。Hulu的广告投放比较人性化,用户可以自己选择看哪种类型的广告。此外,在user feedback中,Hulu可用的显式的打分信息不多,只能更多的使用隐式的浏览信息。(子曰)
注:部分内容源自ResysChina,关于本次大会的更详实报道,请关注CSDN软件研发频道,稍晚些时候演讲嘉宾的PPT将会提供下载。此外,全球最大的中文IT社区CSDN&《程序员》杂志总编刘江对Yehuda Koren进行了独家专访,相关内容请关注CSDN和《程序员》杂志。