百度空间 | 百度首页 
 
查看文章
 
算法,产品经理的必修课
2007年06月11日 星期一 16:34
你知道IMBD的电影排行算法么?你有兴趣研究一下么?

加权平均分(WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C

在这里:
R = 该电影的平均分
v = 该电影的总投票数
m = 列入前250所需要的最少票数(目前是1300票)
C = 数据库中所有电影的总平均分(目前是6.7)


哈哈,厉害吧,投票数多的话,那么R,也就是每个人的电影评分就起到主要作用;
如果投票数少呢,也不能说电影不好,小众的东西还往往是精品呢,文化的东西,毕竟有可能因为语言等因素,或者曲高和寡变得在IMDB上变得小众,这样如果投票数少,那么也不能一棒子打死,就趋于平均水平。
如果票数相同呢,那么就看R了,平均分越高,那么自然排名就越靠前啦。

好玩吧,再看一个。

多网站在设计博客的排行时,在时间相关性上很困惑,为了满足 访问网站频率不同的用户需求,他们只好按日、周、月来做排行,非常明显的缺陷是,让每周或每月的开始时,周榜和月榜上的精彩文章精彩程度不够,而上周末或 月末的精彩文章可能被过早撤出用户视线。但是如果按七天排行或者三十天排行,算法又太复杂。
有没有兼顾的算法呢?答案是有的。

假定用户访问周期介于T1到TN,TN=N*T1,用户访问频率在T1到TN之间线性分布。
设文章在每个时间TX里获得的访问量为TXPV,设计系数A=(N-1)/N

使用计算式T1PV*A^(N-1)+T2PV*A^(N-2)+T3PV*A^(N-3)+……+TNPV=∑TXPV*A^(N-X)来计算随时间衰减的关注度。

太TMD牛了,佩服的五体投地。
如果算周排行榜,一篇文章在第一天的访问量跟第七天的访问量在权重上明显是不同的,到第七天还有人在访问,那就说明这篇文章更热。

通过这件事情我想,作为一个产品经理,其实应该有这样的基本功力。今天大家在研究热文的的出现和排序算法的时候,我为自己是个理科生感到非常惭愧,对于分析一种算法的改变对于效果的影响上,我表现得跟个文科生一样。倒也不是说文科生同学们就干不了这个事儿,只是说我这么多年的专业训练啊,都tmd练到哪儿去啦??!!

作为一个将致力于成为一个有创意的、脚踏实地的、有执行力的、成熟的、经验丰富的、牛B哄哄的产品经理作为毕生奋斗目标的人,我今天的体会是一定要严于律己,有意识的培养自己对于算法的感觉,积极参与工程师同志们的算法讨论,不断修炼,逐渐成仙。

类别:生活 | 添加到搜藏 | 浏览() | 评论 (19)
 
最近读者:
 
网友评论:
1
2007年06月11日 星期一 16:40 | 回复
“作为一个致力于成为一个有创意的、脚踏实地的、有执行力的、成熟的、经验丰富的、牛B哄哄的产品经理的人” PFPF,学习学习。
 
2
2007年06月11日 星期一 16:51 | 回复
完了 照此看来 我今生都无望做PM了:( 我就安分做个享受产品体验产品的人吧
 
3
2007年06月11日 星期一 18:37 | 回复
不得不踩的一篇好文。 再踩一脚
 
4
2007年06月11日 星期一 19:39 | 回复
我也没办法学算法 唉.想我考大学,全靠数学拖我点分才没能进好大学..........
 
5
2007年06月12日 星期二 01:20 | 回复
服了。。。算法不难。。。为什么?因为他肯定是一步一步这么推演过来的。。。而不是一上来就这么复杂,引入这么多维度的。 我们都是理科生,所以我们知道那些牛叉的公式都是怎么推演过来的。。一般不是一个人从头就搞定的。
 
6
2007年07月17日 星期二 10:01 | 回复
本文转载频率相当的高啊~~
 
7
2007年07月17日 星期二 12:36 | 回复
太牛了,无话可说,收藏至20ju.com
 
8
2007年07月18日 星期三 00:47 | 回复
奇怪,这篇文章写了一个多月了,怎么今天这么多人来看呀~~
 
9
2007年07月18日 星期三 11:57 | 回复
那是因为有牛人转了你的blog了哈哈
 
10
2007年07月18日 星期三 14:09 | 回复
哪个牛人呀?俺要去看看呀
 
11
2007年07月18日 星期三 14:26 | 回复
佩服了,我也要去恶补数学了
 
12
2007年07月19日 星期四 13:27 | 回复
看了两遍,啥也没看懂,只感觉主人,超兴奋的在表诉,汗``````实在对不住,像我这种高考一个月前数学还考个位数的人,估计再琢磨也琢磨不出啥了。。。
 
13
2007年07月19日 星期四 13:43 | 回复
如果票数相同呢,那么就看R了,平均分越高,那么自然排名就越靠前啦。这句话我很怀疑。因为我们只是靠一定数量的样本去估计整体,除了样本平均数还要看分值的分布情况,举个简单的例子,甲乙两名学生的几次数学考试成绩平均分都是80,甲:75,85,89,79,78,82 乙:60,62,100,65,98,95. 我们能说甲乙水平相当吗?相对于乙,甲显然更稳定一点
 
14
2007年07月19日 星期四 13:45 | 回复
补补统计学吧!一个文科生。
 
15
2007年07月19日 星期四 15:21 | 回复
我觉得看这篇文章的人多数也就是草草理解一下这个两个公式,关键是看PM和算法的关系,这也是我这篇文章的主要目的(且标题党了一下),这两个算法只是举例而已。匿名网友显然很仔细的看了这个算法,并试图质疑了一下,呵呵 不过,这位朋友质疑的地方,如果根据票数来看看权重的话就能看到,IMDB不太重视票数少的电影。我前边也说了,就趋于平均值。其实,所有点评或digg网站都有这个问题,因为票数不够多很容易作弊,所以人家算法也自然就设计进去了,再仔细看看就明白了。
 
16
2007年08月07日 星期二 12:02 | 回复
帅哥你这些内容是哪里得来的?? 很想多了解这个方面的东西,方便分享一下么?
 
17
2007年08月07日 星期二 16:21 | 回复
@Pan 加我IM吧~~ :)
 
18
2007年09月21日 星期五 13:44 | 回复
你的文章真是太好了!
 
19
2007年12月02日 星期日 13:20 | 回复
你的文章真是太好了!
 
发表评论:
姓 名:
网址或邮箱: (选填)
内 容:
验证码: 请点击后输入四位验证码,字母不区分大小写
      

     

©2009 Baidu