2010-12-17 11:18 A.M.
2010年9月9日,中国的各大媒体纷纷报道了一条来自大洋彼岸的新闻:9月8日,美国总统奥巴马宣布,在本周内提出为美国中产阶级的永久性减税计划,同时不再延长对富裕阶层的减税措施。根据奥巴马提出的计划,2011年税收中的80%,将由年收入逾100万美元的家庭负担。美国的税收政策是:占美国总人口约2%的,年收入逾100万美元的百万富翁们纳税,包括中产在内的98%的中低收入者免税,来缩小美国的贫富差别。
在2009年的全国两会上,便有众多的人大代表和政协委员要求调高个人所得税起征点至3000元,然而, |
2010-12-14 05:07 P.M.
(接上)
Reduce Related
提高Reduce的执行效率,除了在 |
2010-12-14 05:06 P.M.
Hadoop Job Tuning
Hadoop平台已经成为了大多数公司的分布式数据处理平台,随着数据规模的越来越大,对集群的压力也越来越大,集群的每个节点负担自然就会加重,而且集群内部的网络带宽有限,数据交换 |
2010-11-26 07:32 P.M.
就因为百度的编辑删了我的文章,我就不再这里写blog了吗?我是不是太小气了? 好吧,从今天开始,继续Blog之旅!!! |
2010-04-26 12:36 P.M.
喝过龙井,却没看过龙井,正好出差在杭州,宅着也是宅着,就借了个自行车卡,(杭州这方面还算不错),从浙大玉泉校区穿过,骑车大约30分钟左右,到了龙井村,话说沿途那个漂亮哎。。好多拍婚纱的就足以说明问题了。
到了龙井村,游人很多,漫山遍野的茶树,从小长这么大,第一次见到茶树,和茶农聊天,才知道,他们不是茶农,都是外地来的,帮助茶农采茶叶的,每天50块钱。这的茶农干三个月,顶东北的农民干几年吧!
了解了一下茶叶的制作过程、参观了茶叶博物馆、喝了两杯龙井、吃了农家饭!接触大自然就是好啊 |
2010-04-25 06:31 P.M.
Taste 是一个著名的开源框架,目前已经在Mahout项目下。Taste 实现了比较流行的个性化推荐算法: User-Based、Item-Based、Slope One
实现了 5 个著名的相似度计算算法:
*EuclideanDistance(欧氏距离)
*LogLikelihood(对数似然)
*PearsonCorrelation(皮尔逊相关系数)
*SpearmanCorrelation(和前一个类似,比较的不同而已)
*TanimotoCoefficient(有点类似于关联规则,当然也有很大的不同)
Taste在官方文档中自称: Taste is designed to be enterprise-ready; it's designed for p |
2010-04-25 06:27 P.M.
Slope One 推荐算法是 2005 年在香港的 WWW 会议上提出来的。可以Google检索会议论文集看原著,不过还是建议看原著之前,看完本文!
Slope One是一个基于Item的个性化推荐算法,股票上有个说法是平均值可以掩盖一切异常波动,所以股票上的各个技术指标都是不同时间段的平均值的曲线图或者柱状图等。同样的,Slope one算法也认为:平均值也可以代替某两个未知个体之间的打分差异。
Slope One算法的核心思想非常的简单,举例如下:
用户对商品的打分,或者从购买记录中,通过某些算法,折合成打分,得到矩阵 |
2010-04-25 06:23 P.M.
目前有多种个性化推荐技术,基本可以分为两类:基于规则的推荐、信息过滤推荐,其中信息过滤推荐可以分为 基于内容过滤(content-based filtering)、协同过滤(collaborative filtering)、混合过滤(hybrid filtering)
基于规则的过滤(rule based filtering)
规则可以由用户定制,也可以利用基于关联规则的挖掘技术来发现,利用规则来推荐信息依赖于规则的质量和数量,基于规则的技术其缺点是随着规则的数量增多,系统将变得越来越难以管理.
一个规则本质上是一个If-Then语句,规则可以利用用户静态 |
2009-02-19 05:38 P.M.
"Put simply, global economic and strategic weight is shifting to Asia. For the first time in the settled history of this continent, we find ourselves in a region that will be at the center of global affairs."
The Hon Kevin Rudd MP,
Prime Minister of Australia |
2009-02-16 02:38 P.M.
Happy 1234567890 Day!!
Once upon a time, way back in 1970, Unix computer clocks started ticking.
That was 39 years, or some 1.2 billion seconds, ago.
Yes, today is 1234567890 Day.
Let's celebrate! |
2009-01-14 06:02 P.M.
没有聚餐,没有节目表演!
把一干人弄到三里屯电影城,上午领导讲话,总结!
然后宣布午饭自己解决,心理咯噔一下,怎么会这样??
下午开始看电影,赤壁!对电影不做评论!
然后领取纪念品,一个钱包,纯革的,没有一点皮;一条腰带,我自己肯定不会买的那种,拿回来不知道怎么处理!!
我经历的最小气的年会!
|
2008-12-17 05:59 P.M.
到现在了,竟然不觉得累!
我这是怎么了!
工作狂? 不是啊!
好久没看算法了,blog的代码也一直没有新的贴上来!不行,得再看看!!
丁磊兄弟,你的代码我看不懂啊!一行注释都没有,呵呵!不过精神可嘉!继续努力!
看你的代码,让我想起了CTcoolL让我给他看代码,也是没啥注释! |
2008-11-06 06:34 P.M.
鉴于校园招聘笔试题,有个字符串模式匹配的问题,99+%都是暴力,偶尔一两个写KMP,但是明显是知其表不知其里。期待的 BM算法 或者 Sunday 没有出现!
鉴于网友的回复,特此声明:我的代码假定字符串中的字符都在ASCII范围内
想了解Sunday,可以查作者原著,不难找。
By the way,国内有好多 Paper 是对Sunday的改进,我本人是忽略不计, 国内的Paper擅长这个。
头文件定义:
/* Sunday.h */
class Sunday
{
public:
Sunday(); |
2008-10-22 05:50 P.M.
Man is driven to create; I know I really love to create things. And while I'm not good at painting, drawing, or music, I can write software.
说的倒是没错,不过也要注意把握方向,否则就把自己打造成了一个专业的码工! |
2008-10-18 04:40 P.M.
早上到办公室,发现有个法国发来的邮件,说的不是很清楚,就打电话过去问了,一时也忘记了时差,老法国人电话里没发飙!
第二天,他发邮件到manager那里,还以为电话是从印度打来的:
Someone phoned me this morning at 02:30am and woke me from my sleep, with regards to the associate logged into the batch last night. I believe the call was from India but I couldn’t quite catch the name. Woke my daughter up and everything………..not good:(
manger把邮件转给我,又回复:
|
|
|
Azuryy
男, 岁
北京 朝阳区
|