2009年12月12日 星期六 12:29
I've been worried for some years that the open source movement might fall prey to the problem that Kim Stanley Robinson so incisively captured in Green Mars: "History is a wave that moves through time slightly faster than we do." Innovators are left behind, as the world they've changed picks up on their ideas, runs with them, and takes them in unexpected directions.
In essays like The Open Source Paradigm Shift and What is Web 2.0?, I argued that the success of the intern |
2009年12月11日 星期五 11:17
2009年12月10日 星期四 19:09
世界上最受欢迎的五大网站之一维基百科,其创始人威尔斯写信寻捐助引发了大众对网站破产忧虑。面临经济危机的情况,维基百科寻求捐款由威尔斯亲自执笔请求用户捐款还属首次。登录中文界面的维基百科,你可以看到赫然写着:維基百科,令生活更便利,下面显示着目前捐款的数额,和目標捐款金额:6,000,000美元,到笔者登录该站的时候该站已经募集到资金:4,558,322美元。
面对维基百科网站的举动,周新宁感到好奇和震撼的不是他们通过募捐来养活网站的方式感到惊讶,而是这样的网站得到了全世界众多的人认可和志愿者的参与, |
2009年12月10日 星期四 19:03
对于云计算, 李开复(现任Google全球副总裁、中国区总裁)打了一个形象的比喻:钱庄。 最早人们只是把钱放在枕头底下,后来有了钱庄,很安全,不过兑现起来比较麻烦。现在发展到银行可以到任何一个网点取钱,甚至通过ATM,或者国外的渠道。就像用电不需要家家装备发电机,直接从电力公司购买一样。
“云计算”带来的就是这样一种变革——由谷歌、IBM这样的专业网络公司来搭建计算机存储、运算中心,用户通过一根网线借助浏览器就可以很方便的访问,把“云”做为资料存储以及应用服务的中 |
2009年12月10日 星期四 17:28
从Google在OSDI'04上发表了Map/Reduce这篇Paper;到Yahoo!在06年雇佣Doug Cotting,投入对Hadoop最大的关注,以期提高其计算能力对抗Google;再到CMU CS的系主任发表Tec h report提出DISC(Data-Intensive Super Computing,在最近一次的Hadoop summit上, 他演讲的slides将Super改成了Scalable)的概念,以及Intel、IBM与Stanford、CMU合作 基于Hadoop搞云计算。Map/Reduce引入的并行计算模型得到了前所未有的关注和应用。
究竟什么是Map/Reduce,为什么需要Map/Reduce,孟岩(此孟岩非彼孟岩,此孟岩是财帮 子的创始人 |
2009年12月10日 星期四 17:07
云计算不是“云雨”,也不是云山雾罩。那么,什么是云计算呢?“云计算”(Cloud Computing)是分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)的发展,或者说是这些计算机科学概念的商业实现。
狭义云计算是指IT基础设施的交付和使用模式,指通过网络以按需、易扩展的方式获得所需的资源(硬件、平台、软件)。提供资源的网络被称为“云”。“云”中的资源在使用者看来是可以无限扩展的,并且可以随时获取,按需使用,随时扩展 |
2009年04月12日 星期日 14:54
After the LinkedIn and Facebook phenomena, here comes Twitter. When the short process of account creation is done, you can start writing small “posts” of maximum 140 characters. Twitter is a kind of micro-blogging platform. It is s |
2009年04月12日 星期日 11:34
A Report of three NSF Workshops on Mining Large, Massive, and Distributed Data
Robert Grossman, Simon Kasif, Reagan Moore, David Rocke, and Jeff Ullman
January 21, 1998 (Draft 8.4.5)
1. Executive Summary
A group of researchers met in Chicago in July, 1997 and in La Jolla in March, 1997 and February, 1998 to discuss the current state of the art of data mining and data intensive computing and the opportunities and challenges for the future. The focus of the discussions was |
2009年04月08日 星期三 15:52
Once you've got analysis, reporting, and dashboards deployed, it's time to take your business intelligence (BI) to the next level by adding data mining and advanced analytics. This is a l |
2009年04月06日 星期一 18:17
3月9日消息,美国计算机科学家史蒂芬·沃尔弗拉姆(Stephen Wolfram)一直以来以推动计算机基础科学突破而闻名于世,也引发了很多的争议。1979年,他20岁的时候就在加州理工大学(Caltech)获得理论物理学博士学位。
自那以来,他一直把主要精力放在对计算机复杂系统的研究上。1988年的时候,他推出了强大的计算机软件Ma |
2009年03月05日 星期四 13:16
1、收缩:专注于一个尽可能小的可能存在的难题,而你又能够解决这个难题。不要想着什么都做,贪多嚼不烂,搞不好就成了模仿者。小可以变大,船小好调头,小可以带给你很多优势,缝隙市场可以变成一个大市场。不要试图把1亿上网用户都当成你的用户,没用,能真正解决一部分用户的一部分需求,就足够你玩儿的。
2、差异:要记住很多人都在做着跟你一样的事情,而其中一个是Google。在这个市场上,专才比通才有用。不一定要做多么领先的事情,寻常的事情你同样可以做得跟别人不一样,比如Google。起名字也不要用那些通用词汇 |
2009年02月12日 星期四 19:43
2009年02月07日 星期六 09:12
根据设计目的和使用用途的不同,文本信息检索系统可以分为两大类:一类是以技术研究为目的,供研究者使用的实验系统;另一类是供普通用户使用的实用系统,其中使用最广泛的就是WWW搜索引擎。
由于文本信息检索系统非常复杂,所涉及的技术很多,因此,如果每个研究者都自己开发一个完整的检索系统则是相当困难的,并且也没有必要。事实上,已经有不少很完善的实验系统出现,研究者可以利用它们进行研究,其中很多系统都可免费使用,有些甚至提供源代码和完善的文档,让使用者可以很方便地实现自己的算法。
1.Smart |
2009年02月05日 星期四 20:02

Carnegie Mellon University
1. What is Lemur? Lemur is a toolkit designed to facilitate research in language modeling and information retrieval (IR), where IR is broadly interpreted to include such technologies as ad hoc and distributed retrieval, with structured queries, cross-language IR, summarization, filtering, and categori
|
2009年02月03日 星期二 22:26
While Google has dominated the search space for the past few years, Yahoo has held its own as a respectable number two. But it's not content to remain there, and is in the midst of rolling out a whole new approach to search. While many of the details have not yet been discussed publicly, we do know that Yahoo is taking a task-based approach to its search strategy, improving results to focus on the user's task stage, according to Andrew Tomkins, chief scientist for search at Yahoo.
|
|
|
|