百度首页 | 百度空间
 
查看文章
 
(2008-3-13)Lucene2.3的新特点
2008-03-13 19:46
Lucene2.3.1于2008-2-2号正式推出,它的特点有:
参考:http://svn.apache.org/repos/asf/lucene/java/tags/lucene_2_3_0/CHANGES.txt

1)索引构建:
     Lucene这次的修改好像由一位对性能要求特别高的人进行,这点可从改进的大部分都是性能方面的问题看到。
    在索引构建方面,一个大的改进就是段合并的策略,使用了根据文件大小来合并,虽然这个策略比不上中科院的开源搜索的策略(Huffman树),但比2.2版本之前根据文档个数来合并要好了很多。
    另外,它在后台线程进行索引合并。据说构建速度比2.2版本提高了很多。

2)IndexReader:
    这次Lucene提供了IndexReader的update功能,可以不用关闭IndexReader而刷新它。这样应该比直接关闭后再打开要快速。

3)部分优化策略:
    Lucene支持对索引段的部分优化,即Optimize的时候,不是吧所有的段都合并为一个,而是可以设置为合并成多少个。这样的话,就支持了小规模增量处理。当小规模增量的时候,新增加的数据会比较小,不应该和之前的大索引段合并为一个(耗时太多)。

根据这些特性可以看到,Lucene已经开始慢慢支持实时应用了,因为索引构建在另外的线程进行,而索引刷新可以直接刷新。

类别:天天日记 | 添加到搜藏 | 浏览() | 评论 (0)
 
最近读者:
 
网友评论:
发表评论:
姓 名:
网址或邮箱: (选填)
内 容:
验证码:
 

     

©2008 Baidu