<?xml version="1.0" encoding="gb2312"?>
<rss version="2.0">
<channel>
<title><![CDATA[OSSou-开源搜索引擎研究]]></title>
        <image>
        <title>http://hi.baidu.com</title>
        <link>http://hi.baidu.com</link>
        <url>http://img.baidu.com/img/logo-hi.gif</url>
        </image>
<description><![CDATA[聚集网络上追求自由,热爱搜索的朋友,一起来做开源的搜索引擎!]]></description>
<link>http://hi.baidu.com/ossou</link>
<language>zh-cn</language>
<generator>www.baidu.com</generator>
<ttl>5</ttl>


<item>
        <title><![CDATA[开源搜索引擎论坛]]></title>
        <link><![CDATA[http://hi.baidu.com/ossou/blog/item/257a4eed203282d4b21cb174.html]]></link>
        <description><![CDATA[
		
		<p >开源搜索引擎论坛</p ><p ><a href="http://groups.google.com/group/osse" >http://groups.google.com/group/osse</a ></p ><p >今天在网上找到的一个相关论坛,虽说现在没什么人气,但我相信会有更多的朋友加入进来的,发出来,希望有这方面兴趣的朋友,加入到这个行列中来!</p > 
		
		<br/><b>类别：</b><a href="http://hi.baidu.com/ossou/blog/category/%D5%BE%B5%E3%C8%D5%D6%BE">站点日志</a>&nbsp;<a href="http://hi.baidu.com/ossou/blog/item/257a4eed203282d4b21cb174.html#comment">查看评论</a>]]></description>
        <pubDate>2006-07-27  14:24</pubDate>
        <category><![CDATA[站点日志]]></category>
        <author><![CDATA[ossou]]></author>
		<guid>http://hi.baidu.com/ossou/blog/item/257a4eed203282d4b21cb174.html</guid>
</item>

<item>
        <title><![CDATA[我收集的不错的开源社区]]></title>
        <link><![CDATA[http://hi.baidu.com/ossou/blog/item/c6cf253fc43372ec55e72368.html]]></link>
        <description><![CDATA[
		
		<p >1.LUPA开源社区:&nbsp;<a href="http://www.lupaworld.com/index.html" >http://www.lupaworld.com/index.html</a ></p ><p >2.共创联盟:http://cosoft.org.cn/</p > 
		
		<br/><b>类别：</b><a href="http://hi.baidu.com/ossou/blog/category/%CB%D1%CB%F7%D4%D3%C2%D2">搜索杂乱</a>&nbsp;<a href="http://hi.baidu.com/ossou/blog/item/c6cf253fc43372ec55e72368.html#comment">查看评论</a>]]></description>
        <pubDate>2006-07-27  14:01</pubDate>
        <category><![CDATA[搜索杂乱]]></category>
        <author><![CDATA[ossou]]></author>
		<guid>http://hi.baidu.com/ossou/blog/item/c6cf253fc43372ec55e72368.html</guid>
</item>

<item>
        <title><![CDATA[基于P2P的分布式知识网络(ZT)]]></title>
        <link><![CDATA[http://hi.baidu.com/ossou/blog/item/b5232a7384efba1c8601b06e.html]]></link>
        <description><![CDATA[
		
		    <span class="bvTitle" >  </span >            <p >1、互联网2.0，并不止是“编辑方式改变”这么简单。</p ><p >2、网络媒体的特性在于信息易于大量生产、复制和传播。未来网络媒体特性还要加一条：大量冗余。这不光是前三条的附属品，它符合基于P2P的分布式知识网络的存储传播特性。</p ><p >3、基于P2P的知识网络，将对内容型网站实施沉重打击。无论原创式、拷贝式、精编式的内容站点，都会受其影响。</p ><p >4、Blog是“去中心化”过程中的一个阶段，但并非终极形式。从技术的角度来看，Blog内容本身将来可能也是分布式存储的。怎么删除？不知道，我只是提出一个预想。或者，到那时，就不用Blog了。</p ><p >5、每台电脑（或其他设备）上将有一个P2P终端。这个终端是分布式网络中的一个节点。它是搜索引擎、是浏览器、是IM、是SNS，或者也是其他一些应用。由所有节点加起来的整个分布式网络负责信息的存储和传递。</p ><p >6、信息将通过“漂流瓶”的模式传播。一种是主动式，一种是反馈式。主动式的例子：发表一篇文章、一条新闻；反馈式的例子：问一个问题。</p ><p >7、你的P2P节点将“主动抓住”流经本节点的、你可能关心的内容，例如，你朋友Blog的一篇新文章 <a href="http://hi.baidu.com/ossou/blog/item/b5232a7384efba1c8601b06e.html">阅读全文</a>
		
		<br/><b>类别：</b><a href="http://hi.baidu.com/ossou/blog/category/%BC%BC%CA%F5%D7%CA%C1%CF">技术资料</a>&nbsp;<a href="http://hi.baidu.com/ossou/blog/item/b5232a7384efba1c8601b06e.html#comment">查看评论</a>]]></description>
        <pubDate>2006-07-27  13:46</pubDate>
        <category><![CDATA[技术资料]]></category>
        <author><![CDATA[ossou]]></author>
		<guid>http://hi.baidu.com/ossou/blog/item/b5232a7384efba1c8601b06e.html</guid>
</item>

<item>
        <title><![CDATA[Nutch搜索引擎分析]]></title>
        <link><![CDATA[http://hi.baidu.com/ossou/blog/item/842250e749eb262eb838206d.html]]></link>
        <description><![CDATA[
		
		<span class="tpc_content" ><font size="2" >21世纪是信息的时代，也是网络的时代。不断通畅与进步的互联网在给人们带来浩如烟海的网络信息的同时，也容易使人在查询自己所需的有用的相关信息时陷入迷茫。搜索引擎正是为了满足人们网络信息搜索应运而生的网络工具，它是互联网信息查询的导航针。现在的商业搜索引擎不少，但都是保密的，不便研究。而Nutch 是一个开源Java 实现的搜索引擎，它提供了我们运行自己的搜索引擎所需的全部工具。<br /> &nbsp; &nbsp; Nutch是开放源代码的，因此任何人都可以查看他的排序算法是如何工作的。商业的搜索引擎排序算法都是保密的，我们无法知道为什么搜索出来的排序结果是如何算出来的。更进一步，一些搜索引擎允许竞价排名，比如百度，这样的索引结果并不是和站点内容相关的。因此 Nutch 对学术搜索和政府类站点的搜索来说，是个好选择。因为一个公平的排序结果是非常重要的。<br /> &nbsp; 了解一个大型分布式的搜索引擎如何工作是一件让人很受益的事情，但是我们并没有google的源代码，因此学习搜索引擎Nutch是个不错的选择。Nutch的核心部分目前已经被重新用 Map Reduce 实现，而Map Reduce 是一个分布式的处理模型，最先是从 Goog <a href="http://hi.baidu.com/ossou/blog/item/842250e749eb262eb838206d.html">阅读全文</a>
		
		<br/><b>类别：</b><a href="http://hi.baidu.com/ossou/blog/category/%BC%BC%CA%F5%D7%CA%C1%CF">技术资料</a>&nbsp;<a href="http://hi.baidu.com/ossou/blog/item/842250e749eb262eb838206d.html#comment">查看评论</a>]]></description>
        <pubDate>2006-07-27  13:42</pubDate>
        <category><![CDATA[技术资料]]></category>
        <author><![CDATA[ossou]]></author>
		<guid>http://hi.baidu.com/ossou/blog/item/842250e749eb262eb838206d.html</guid>
</item>

<item>
        <title><![CDATA[搜索引擎设计实用教程-以百度为例(ZT)]]></title>
        <link><![CDATA[http://hi.baidu.com/ossou/blog/item/09ea6f604b0a8e44eaf8f86c.html]]></link>
        <description><![CDATA[
		
		<p >搜索引擎设计实用教程-以百度为例 </p ><p >&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; 之一:查询处理以及分词技术 </p ><p >&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;中科院软件所 张俊林 </p ><p >&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp;2005年11月 </p ><p >&nbsp;随着搜索经济的崛起，人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作为企业，会根据搜索引擎的知名度以及日流量来选择是否要投放广告等；作为普通网民，会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料；作为技术人员，会把有代表性的搜索引擎作为研究对象. 搜索引擎经济的崛起，又一次向人们证明了网络所蕴藏的巨大商机。网络离开了搜索将只剩下空洞杂乱的数据，以及大量等待去费力挖掘的金矿。 </p ><p >但是,如何设计一个高效的搜索引擎?我们可以以百度所采取的技术手段来探讨如何设计一个实 <a href="http://hi.baidu.com/ossou/blog/item/09ea6f604b0a8e44eaf8f86c.html">阅读全文</a>
		
		<br/><b>类别：</b><a href="http://hi.baidu.com/ossou/blog/category/%BC%BC%CA%F5%D7%CA%C1%CF">技术资料</a>&nbsp;<a href="http://hi.baidu.com/ossou/blog/item/09ea6f604b0a8e44eaf8f86c.html#comment">查看评论</a>]]></description>
        <pubDate>2006-07-27  13:34</pubDate>
        <category><![CDATA[技术资料]]></category>
        <author><![CDATA[ossou]]></author>
		<guid>http://hi.baidu.com/ossou/blog/item/09ea6f604b0a8e44eaf8f86c.html</guid>
</item>


</channel>
</rss>