百度空间 | 百度首页 
 
查看文章
 
新型搜索引擎畅想(二)
2007年12月23日 星期日 下午 03:31

6 学术趋势搜索引擎

了解所关注学科的最新进展,关注有关基金项目的情况简报,跟踪学术同行的学术动态,从而了解学术发展的最新趋向,这是每一位学者必须关注的内容之一。目前在这方面,一些搜索引擎进行了一些努力,如CNKI推出了学术趋势搜索[i]、Google推出了Google Scholar搜索[ii]等,但是,这样的举措目前仍然只是一些尝试,离真正的实用还有很大的距离。目前此类搜索引擎的功能仅仅找到专业的学术资料,比如各类期刊论文、课件等的使用情况,更多地基于计量学、统计学的成果,离自动聚类找出学术趋势,或者说提供有关学术趋势的内容还比较少见。将来这类引擎主要功能应该更多地着眼于综合或者归纳功能的应用,这种应用与传统文献中的综述有些类似,更多地具有人工智能的成份。

将来的发展可以从以下几个方面取得进展:1)对学术会议信息与相关会议文献的搜集与加工;2)利用文献计量学、网络计量学的理论对结果进行可视化呈现;3)按地区和时间等因素进行分析和研究某一学科或者领域的进展,提供最新学术研究动向;4)按行业、按系统、按行政区划进行研究,了解各系统、各地区、各行业的学术动向。

7 概念类比联想搜索引擎

在学术研究中概念的类比和联想往往带来科学研究的突破。如何分析和研究其中的机制和规律,也应该是未来搜索引擎的重要内容。同一概念在不同的学科中应用不同,其成熟度也不尽相同,了解其它领域的应用方式和方法往往会给我们很多启示。通过不同领域概念以及相关概念的对比,既可以及时发现不同领域的共同规律,也可以了解本领域的发展趋向。在科技史上,物质与能量守恒定律是由7个国家的10多位不同学科的科学家同时独立地发现,说明科学的共生性,也说明了科学的移植性和可借鉴性。所以,利用概念类比原理制作的搜索引擎无疑也会受到更多的关注。

初步设想如下:由用户指定学科,然后提出检索词,分别进行相关检索,返回检索结果后,再进行可视化显示,分别进行对照比较。至于分析对照的学科目前原则上不宜太多,最好控制在4个以内,这样能够保持较好的响应速度。当然随着计算机与网络技术的发展,学科数量可能适当增加。但是,考虑到单一用户所熟悉的学科领域终究有限,能够同时熟悉4个以上学科的专家亦为数不多,所以目前的建议仍然以4个以内的学科为主。

实际上,这种搜索引擎的设计并不困难,可以充分利用现有可视化搜索引擎的成果,比如VIVISIMO[iii]、CLUSTY[iv]等,只不过增加相应的学科范畴,使之更加细化、更加专业而已。如果这样的搜索引擎早日出现,则将极大地提高科学研究的主动性和针对性。

8 解疑答难型搜索引擎

解疑答难是日常生活中不可或缺的一部分内容,所以,对此类搜索引擎的需求也是与日剧增,比如百度知道[v]一面世就受到了世人的关注,该系统目前可以解决的问题总数已经达到14,201,196条,为常见问题的解答提供了一个新的解决途径。但是,这样的解决方案仍然完全是民间的,完全来源于网络。换句话说,现有的此类搜索系统,更多地依托网民,也就是答案的权威性如何还有待考证,专业性的学术研究人员对于利用这样的系统仍然心存疑虑。

而ABOUT.COM[vi]这样的网站则相对专业化,基本采用了学科组织体系,是一个百科全书,类似于《十万个为什么》。但是,这一网站因为没有充分利用互联网提供的巨大信息源,所以,有大量的问题(比如计算机故障等)又无法找到答案。如何实现专家型系统与业余型解疑答难系统的集成,应该成为未来几年解疑答难型搜索引擎重点关注的领域。

实际上,解疑答难型搜索引擎,现在还出现了一些新的变化,它不仅能够解答知识型问题,而且还对日常生活(比如找工作、找房子、旅游等)中各种问题进行解答。为了满足某种搜索需求,还出现了专家在线型的搜索引擎,实时解答用户问题。

目前的做法有两种:1)通过专家系统,也即知识库来解答用户的提问,类似于图书馆工作的FAQ系统;2)通过在线专家回答相关问题,角色和作用类似于图书馆的咨询馆员。一般来说,大众型的搜索引擎多采用第一种方式,实行免费服务,而专业学术型的解疑答难型搜索引擎则以采用第2种方式为主,实行有偿服务。

9 教学研究平台搜索引擎

目前的搜索引擎主要仍然以大众生活信息和学术研究信息为主要研究对象,而对于教学型信息的搜索、利用以及教学平台的建设则仍然付之阙如。此类信息目前主要集中在各种BBS之中,但是,还没有形成相对独立的体系,更没有形成以专门的学科体系来组织,所以,此类信息的搜索有相当的挖掘价值。

此类搜索引擎可以形成一个系列,比如课件搜索、案例搜索、教案搜索、学习工具搜索、常见参考书搜索等等。可以预见,未来几年这种搜索引擎会成为新的增长点。

搜索引擎与研究平台的集成系统的研制也应该成为重点。用户利用搜索引擎返回的结果,可以自动形成特定的参考文献格式,从而成为自己的专用数据库,换句话说,形成自己的个人学术研究搜索引擎,以备进一步的研究和学习。

EBSCO等数据库提供了参考文献的直接导出功能[vii],这样的功能应该来说是初级功能,高级功能应该是用户如果直接复制相关资料可以直接生成参考文献,作为脚注或者尾注附在用户研究论文之中。这种做法,既可以部分解决论文中的假注和伪注情形,也可以减少人工生成参考文献过程中可能出现的误差。

--------------------------------------------------------------------------------

【[i]】CNKI学术趋势[EB/OL].[2007-04-10].http://trend.cnki.net/

【[ii]】Google Scholar[EB/OL].[2007-04-10].http://www.lib.tju.edu.cn/resource/database/probation /200512200002.htm

【[iii]】VIVISIMO[EB/OL].[2007-04-10].http://www.vivisimo.com/

【[iv]】CLUSTY[EB/OL].[2007-04-10].http://www.clusty.com

【[v]】百度知道[EB/OL].[2007-04-10].http://zhidao.baidu.com/

【[vi]】ABOUT.COM[EB/OL].[2007-04-10].http://about.com/

【[vii]】直接导出[EB/OL].[2007-04-10].http://web.ebscohost.com/ehost/newfeatures?vid=4&hid=17&sid= aba596d0-a1f4-4bd6-99db-bbc632a095ba%40sessionmgr2

来源:年心博客


类别:搜索评测 | 添加到搜藏 | 浏览() | 评论 (0)
 
最近读者:
 
网友评论:
发表评论:
姓 名:
网址或邮箱: (选填)
内 容:
验证码: 请点击后输入四位验证码,字母不区分大小写
      

     

©2009 Baidu