百度首页 | 百度空间
 
查看文章
 
搜索引擎需求与博客搜索的讨论
2008年05月08日 星期四 下午 01:33
水木清华上关于“当前搜索引擎的需求与博客搜索”的讨论,个人觉得有些观点很有新意(已用蓝颜色标注出来了),遂贴出来给大家一起分析或讨论!

================================================

通过长时间地思考搜索引擎的需求,我得出了如下结论,请看分析

对于搜索这个动词来说,人和信息,必然是应有之意,加上建立这种联系的桥梁,关键词。
那么基本上搜索引擎就在建立这样的图关系。

其中主体是={人,信息,关键词}
关系是任意两个主体构成的一个pair.例如{关键词,关键词},{人,信息}

表面上看搜索引擎只是建立关键词和信息的关系,实际上,通过聚类,分类建立信息的关系,关键词间的关系等。

总体来说,我个人对一下关系逐一评价

{关键词,信息}的关系,5分,搜索引擎目前已经做到极致,目前只需要antispam和rank做好。

{信息,关键词}的关系,4.5分,抽取技术已达极致,各种先进方法.

{关键词,关键词}的关系,3.5分,聚类的技术已经很牛叉,但是关键词在上下文中反应不同的意思,目前效果还很一般,目前的相关搜索,推荐等都在这个领域内。

{人,关键词},{关键词,人}的关系,2分,主要是挖掘用户,和建立人的关系上的一些技术,例如google的关键词订阅,推送等,这个关系目前开发极为不够。

{信息,信息},4分,分类聚类的技术已经很成熟。

{人,信息},{信息,人}的关系,2分,如何能不显示或者不借助关键词来建立人和信息的关系,是不是可以不输入关键词或者其他方式找到信息,这方面的应用极少。

{人,人}的关系,0分,打通人和人的关系,就打通了一切,因此搜索引擎在这个意义上还刚上路。

我一直认为,当今的社会,人们找到信息已经不在是难事了,然而人和人的关系是那么的远离,有些问题不是技术上的,而是社会问题,我梦想未来的某个时刻,人们很容易找到自己的伙伴,找到知音,甚至是在午茶时间讨论一些共同感兴趣的话题了解彼此的观点。

================================================

我个人认为博客搜索很大程度上只是一条腿走路,产品需要更大程度的整合和完善。是否有意义,是否是噪音我想这并不重要,而且博客搜索的形式也绝不应该是普 通的信息搜索的方式,或者说不是导航类查询,也不是事务类查询,排序的展示方式并没有真正理解用户,只所以说雅虎做得好,是雅虎已经意识到精确率不再是博 客搜索的一个重要指标,召回率更加重要,仅这一点思路,我认为是走在了正确的道路上。那么最终一个能留住人的平台是什么?博客搜索扮演一个怎样的角色?还 需要整合哪些产品,是一个需要思考的问题啊。

================================================

用户使用博客搜索的目的

所以产品形态需要符合用户的需要啊。
我们来设想以下场景和用户
(1)需要搜索名人博客,比如有些名人在sina开博,有些在sohu开博。
(2)需要了解舆论的人,比如娱乐公司,比如歌手,比如作家,等等
(3)普通大众,找到一些志趣相投的人的博客。

分析一下:
(1)这是典型的导航类查询,答案唯一,但是查询的用户数量有限,如果你对某个明星感兴趣,或者是fans,很有可能直接收藏了,走搜索的渠道很有限。
(2)这是主要的价值点,我想也是需要recall的原因,做aggregation是很好的想法,这些人需要关注舆论,需要分析这些反馈。
(3)这是一个潜在的价值点,或者说不是博客搜索可以解决的,但是可以和更多的产品整合,形成一个人的平台,每个人都不希望自己是一个孤岛。

================================================

我觉得博客搜索本身不是重点的需求
博客搜索的需求在于搜索博客背后的人
当然,想查看某一类/某个话题的博客的需求确实存在,但是更偏于小众化
或者可以对博客搜索我们更加仔细的分析一下用户为什么要去用博客搜索?
这可能有多种情况,
(1)知道某个博客,但是不知道博客详细内容;
(2)想了解对于某一个事情,其他人是什么看法;
(3)想了解一个人,通过博客去查看

对于需求(1)来说,这个最容易解决,也非常常见,但是这种情况不能算作博客搜索,网页搜索一样能够解决;
对于需求(2)而言,会遇到两个主要问题,一是 这种需求是否能通过博客来满足,其次是噪声造成的结果无效性。需求(2)是一个很大的需求,但是从目前而言并不容易解决;
需求(3)实际上就是SNS网站 的做法。

整体来说,博客搜索的前景还是在于搜人

================================================

把博客和论坛加以区别就能够找到一些答案。
论坛是围绕一个话题展开讨论,每个话题可以看作是lz的一个临时blog,但是这个临时blog的访问人相当多。

博客更多的是围绕一个人来展开,博主发文后,能够来看和回复,并且参加讨论的都是博主的好友,这样的人相当有限,还有一些通过搜索找到这篇博文,并参与讨论,但一般都是几天甚至数月以后,很难形成讨论。

再 来看博客能干什么,博客是否就等同于个人空间,为什么很多人没有坚持写博客,大量不再更新的博客存在,这说明了什么问题。怎么才能让网民愿意写博客,愿意 持续的写博客,这并不仅是博客的设计者,也不仅是博客搜索需要考虑的问题,而是需要更大规模的去整合这样的产品。让博客像论坛或者近似论坛一样的效果,但 又保证了个人的控制权。成为一个火热的个人空间,让每个博客都不再成为信息的孤岛

类别:搜索引擎研究评测 | 添加到搜藏 | 浏览() | 评论 (8)
 
最近读者:
 
网友评论:
1
2008年05月08日 星期四 下午 03:46
有点不懂!
 
2
2008年05月08日 星期四 下午 03:54
我会坚持写博客的。
在这里我会获得快乐。
 
3
2008年05月08日 星期四 下午 04:22
呵呵 写博客确实需要坚持
 
4
2008年05月08日 星期四 下午 07:46
不错,有些启发。
 
5
2008年05月08日 星期四 下午 09:27
让博客像论坛或者近似论坛一样的效果,但 又保证了个人的控制权。成为一个火热的个人空间,让每个博客都不再成为信息的孤岛。

大多时候还是愿意写的
 
6
2008年05月09日 星期五 上午 00:41
没有过博客搜索
 
7
2008年05月09日 星期五 下午 12:30
博客搜索的结果比较有实用性。既使是转载的,也是对博主来说有用的才会转载。
 
8
2008年05月13日 星期二 下午 05:20
其实我觉得搜人引擎一直是很有意思的东西
可惜很多想法无法实施在项目上
 
发表评论:
姓 名:
网址或邮箱: (选填)
内 容:
验证码: 请输入下图中的四位验证码,字母不区分大小写。
看不清?
 

     

©2008 Baidu