您正在查看 "Lucene" 分类下的文章
2007-06-26 15:06
这几天一直在仔细研究Lucene的源码,开始进展比较顺利,因为涉及的仅是一些外围的功能,最近开始看Lucene的index机理,感觉仅看源码非常难懂,后来发现作者专门为Lucene的索引文件格式写了一篇文档,在docs/fileformats.html里,看了它之后再来读源码就好懂多了。现在明白了Lucene索引的高明之处有几下几点:
1。全部采用random-access文件方式保存索引;
2。采用自定义的“变长数据类型”减少索引的存储空间;
3。把一部分index放入内存,进行二级索引 |
2007-06-23 20:20
连续几天自己在家养病,每天要打点滴,加上天气炎热难当,自己用在线文档温习了JAVA之后,今天开始阅读Lucene源码,它的核心部分由这样几个package组成:
org.apache.lucene.analysis
org.apache.lucene.document
org.apache.lucene.index
org.apache.lucene.search
org.apache.lucene.store
org.apache.lucene.queryParser
org.apache.lucene.util
今天大致读完了analysis、document、store这3个pack |
|
|