查看文章 |
(2008-3-13)Lucene2.3的新特点
2008-03-13 19:46
Lucene2.3.1于2008-2-2号正式推出,它的特点有: 参考:http://svn.apache.org/repos/asf/lucene/java/tags/lucene_2_3_0/CHANGES.txt 1)索引构建: Lucene这次的修改好像由一位对性能要求特别高的人进行,这点可从改进的大部分都是性能方面的问题看到。 在索引构建方面,一个大的改进就是段合并的策略,使用了根据文件大小来合并,虽然这个策略比不上中科院的开源搜索的策略(Huffman树),但比2.2版本之前根据文档个数来合并要好了很多。 另外,它在后台线程进行索引合并。据说构建速度比2.2版本提高了很多。 2)IndexReader: 这次Lucene提供了IndexReader的update功能,可以不用关闭IndexReader而刷新它。这样应该比直接关闭后再打开要快速。 3)部分优化策略: Lucene支持对索引段的部分优化,即Optimize的时候,不是吧所有的段都合并为一个,而是可以设置为合并成多少个。这样的话,就支持了小规模增量处理。当小规模增量的时候,新增加的数据会比较小,不应该和之前的大索引段合并为一个(耗时太多)。 根据这些特性可以看到,Lucene已经开始慢慢支持实时应用了,因为索引构建在另外的线程进行,而索引刷新可以直接刷新。 |
最近读者: