查看文章
 
TrueSkill,AdPredictor与MatchBox
2010-12-11 2:32

最近一两周有空,研究了一下TrueSkill相关的一些文章和代码,挺有收益。

TrueSkill是微软研究人员为Xbox发明的游戏玩家的评分算法。它的发明者又将他扩展成广告点击率预测方法AdPredictor,因为连续赢得微软内部的点击率预测竞赛,被Bing.com用作广告点击率预测算法。TrueSkill还进一步被扩展形成MatchBox协同过滤算法,和多数协同过滤方法不同的地方是它能够把协同过滤问题建模为一个Ranking问题,而不是更常见的回归问题或分类问题。像在另外的博文里讨论的那样,这样做的优点是显而易见的,用户关注的是你能否正确地找出他最感兴趣的那些商品,而不是去预测他对每本书感兴趣的程度。不难想象,TrueSkill的方法也可以用来解决搜索中的Learning to Rank问题。 

TrueSkill是基于Factor Graph模型的,一种细粒度的概率图模型,它采用Expectation Propagation算法做推理。Jeff Moser写了一篇TrueSkill的Tutorial,同时还提供了TrueSkill的算法的开源代码。他的代码的结构很漂亮,让我想起了豆瓣Probabilistic Graphical Model书评里说的一个问题,别的同类书看着怎么没PGM这本书那么复杂?我想看看Moser的代码或许能够帮助回答这个问题。PGM把图模型的表示和推理相分离,这样就可以做到:确定好图模型的数据结构之后,不管图模型结构怎么变,推理方法都仍然有效,不需要修改。而其他的书一般都是针对具体问题(换言之,固定的图模型结构)谈推理,缺乏这种软件设计上的易复用特性。当然,这种优点并不总是需要的,Moser的代码漂亮是漂亮,但可能消耗也比较大,不太适合大规模的数据。下面有空了自己实现个消耗小点的(还没实现完,实现好了会及时通知大家)。

 

 (欢迎转载 谢绝篡改 作者:chen_1st 微博:http://t.sina.com.cn/chen1st

 


类别:计算广告学||添加到搜藏 |分享到i贴吧|浏览(2635)|评论 (0)
 
网友评论:
发表评论:
姓 名:
网址或邮箱: (选填)
内 容:
     

   
帮助中心 | 空间客服 | 投诉中心 | 空间协议
©2012 Baidu