WEB2.0、互连网搜索、WEB数据挖掘
百度空间 | 百度首页 
               
 
文章列表
 
2009年04月14日 星期二 19:47

Web mining - is the application of data mining techniques to discover patterns from the Web. According to analysis targets, web mining can be divided into three different types, which are Web usage mining, Web content mining and Web structure mining.

Web content mining

Web content mining is the process to discover useful information from text, image, audio or video data in the web. Web content m

 
2009年04月12日 星期日 14:54
After the LinkedIn and Facebook phenomena, here comes Twitter. When the short process of account creation is done, you can start writing small “posts” of maximum 140 characters. Twitter is a kind of micro-blogging platform. It is s
 
2009年04月12日 星期日 11:34
A Report of three NSF Workshops on Mining Large, Massive, and Distributed Data
Robert Grossman, Simon Kasif, Reagan Moore, David Rocke, and Jeff Ullman
January 21, 1998 (Draft 8.4.5)

1. Executive Summary
A group of researchers met in Chicago in July, 1997 and in La Jolla in March, 1997 and February, 1998 to discuss the current state of the art of data mining and data intensive computing and the opportunities and challenges for the future. The focus of the discussions was
 
2009年04月08日 星期三 15:52

Once you've got analysis, reporting, and dashboards deployed, it's time to take your business intelligence (BI) to the next level by adding data mining and advanced analytics. This is a l

 
2009年04月06日 星期一 18:17
Wolfram|Alpha

      3月9日消息,美国计算机科学家史蒂芬·沃尔弗拉姆(Stephen Wolfram)一直以来以推动计算机基础科学突破而闻名于世,也引发了很多的争议。1979年,他20岁的时候就在加州理工大学(Caltech)获得理论物理学博士学位。
自那以来,他一直把主要精力放在对计算机复杂系统的研究上。1988年的时候,他推出了强大的计算机软

 
2009年03月05日 星期四 13:16

1、收缩:专注于一个尽可能小的可能存在的难题,而你又能够解决这个难题。不要想着什么都做,贪多嚼不烂,搞不好就成了模仿者。小可以变大,船小好调头,小可以带给你很多优势,缝隙市场可以变成一个大市场。不要试图把1亿上网用户都当成你的用户,没用,能真正解决一部分用户的一部分需求,就足够你玩儿的。

2、差异:要记住很多人都在做着跟你一样的事情,而其中一个是Google。在这个市场上,专才比通才有用。不一定要做多么领先的事情,寻常的事情你同样可以做得跟别人不一样,比如Google。起名字也不要用那些通用词汇

 
2009年02月12日 星期四 19:43

 
2009年02月07日 星期六 09:12

根据设计目的和使用用途的不同,文本信息检索系统可以分为两大类:一类是以技术研究为目的,供研究者使用的实验系统;另一类是供普通用户使用的实用系统,其中使用最广泛的就是WWW搜索引擎。

由于文本信息检索系统非常复杂,所涉及的技术很多,因此,如果每个研究者都自己开发一个完整的检索系统则是相当困难的,并且也没有必要。事实上,已经有不少很完善的实验系统出现,研究者可以利用它们进行研究,其中很多系统都可免费使用,有些甚至提供源代码和完善的文档,让使用者可以很方便地实现自己的算法。

1.Smart

 
2009年02月05日 星期四 20:02

CMU -
Carnegie Mellon University
1. What is Lemur? Lemur is a toolkit designed to facilitate research in language modeling and information retrieval (IR), where IR is broadly interpreted to include such technologies as ad hoc and distributed retrieval, with structured queries, cross-language IR, summarization, filtering, and categori

 
2009年02月03日 星期二 22:26

While Google has dominated the search space for the past few years, Yahoo has held its own as a respectable number two. But it's not content to remain there, and is in the midst of rolling out a whole new approach to search. While many of the details have not yet been discussed publicly, we do know that Yahoo is taking a task-based approach to its search strategy, improving results to focus on the user's task stage, according to Andrew Tomkins, chief scientist for search at Yahoo.

 
2009年02月03日 星期二 22:12
As I have written before, Voice of Customer techniques are your direct feedback mechanism from visitors to your web site. It provides invaluable qualitative data to your web design, development, marketing, PR and content creator teams. It compliments the quantitative data of web analytics by providing the “why” to the “what” and “when”. However it is often the case that this data remains in a separate silo within the organisation, never to be compared with t
 
2009年02月02日 星期一 18:13

[离散数学是当代数学的一个重要分支,也是计算机科学的数学基础。它包括数理逻辑、集合论、图论和近世代数四个分支。数理逻辑基于布尔运算,我们已经介绍过了。这里我们介绍图论和互联网自动下载工具网络爬虫 (Web Crawlers) 之间的关系。顺便提一句,我们用 Google Trends 来搜索一下“离散数学”这个词,可以发现不少有趣的现象。比如,武汉、哈尔滨、合肥和长沙市对这一数学题目最有兴趣的城市。]

我们上回谈到了如何建立搜索引擎的索引,那么如何自动下载互联网所有的网页呢,它要用到图论中的遍历(Traver

 
2008年12月14日 星期日 10:22

Everyone uses web crawlers—indirectly, at least! Every time you search the Internet using a service such as Alta Vista, Excite, or Lycos, you're making use of an index that's based on the output of a web crawler. Web crawlers—also known as spiders, robots, or wanderers—are software programs that automatically traverse the Web. Search engines use crawlers to find what's on the Web; then they construct an index of the pages that were found.

 
2008年12月13日 星期六 16:07

    应用互联网并非奥巴马取胜的决定因素。但毋庸置疑奥巴马的竞选成功,又确实因善用互联网而得到了巨大帮助。接下来OhMyMedia将简要分析奥巴马的互联网应用具体有哪些,及其意义何在。尽管麦凯恩也希望能从互联网上借力,但和奥巴马的精彩表现相比几乎处处逊色。一方面,这与支持奥巴马的选民群体总体上更热衷和习惯使用互联网有关;另一方面,则是因为奥巴马及其团队在使用互联网助选的过程中表现出的敏锐和创意。具体而言,奥巴马在大选中的互联网应用主要体现在三个方面:建立官方网站

 
2008年11月16日 星期日 12:53

This in-depth post covers a complex topic that might not apply to everyone, but it covers an area where companies have struggled to try to show return on the investments made in skills, technology and time. The post promises clarity and guidance that hopefully will result in you saving tons of aggravation and yes even a nice chunk of change.
Data Mining and Predictive Analytics have promised a the earth, the moon and the sun for sometime now, in all channels we do business in. My pe

 
     
 
 
个人档案
 
Goshawk2008

上次登录:
4月14日
加为好友
 
   
 
文章分类
 
 
 
 
 
 
 
 
 
     
 
最新评论
 
文章评论|照片评论


little Weka,nerver RapidMiner
 

呵呵,博客刚搬到百度来:)朋友多交流。。。
 
 
     
 
留言板
 

走过路过,千万不要错过,我空间里有好东西,欢迎各位来看!!
 

端午节快乐/很高兴来到你的家,真诚的祝福你开心快乐每一天/我来给你加人气了/可一定要...
 

文章不错,就是看着太费劲,能不能改个背景
 

to hugocx: my email: goshawk2008@yahoo.cn
 
 
     
 
其它
 
已有人次访问本空间
 
订阅RSS  什么是RSS?

您也想拥有这样的空间?请点此申请。
     


©2009 Baidu