百度首页 | 百度空间
 
文章列表
 
您正在查看 "Lucene" 分类下的文章

2007-06-26 15:06
        这几天一直在仔细研究Lucene的源码,开始进展比较顺利,因为涉及的仅是一些外围的功能,最近开始看Lucene的index机理,感觉仅看源码非常难懂,后来发现作者专门为Lucene的索引文件格式写了一篇文档,在docs/fileformats.html里,看了它之后再来读源码就好懂多了。现在明白了Lucene索引的高明之处有几下几点:

1。全部采用random-access文件方式保存索引;
2。采用自定义的“变长数据类型”减少索引的存储空间;
3。把一部分index放入内存,进行二级索引
类别:Lucene | 评论(3) | 浏览()
 
2007-06-23 20:20
        连续几天自己在家养病,每天要打点滴,加上天气炎热难当,自己用在线文档温习了JAVA之后,今天开始阅读Lucene源码,它的核心部分由这样几个package组成:

org.apache.lucene.analysis
org.apache.lucene.document
org.apache.lucene.index
org.apache.lucene.search
org.apache.lucene.store
org.apache.lucene.queryParser
org.apache.lucene.util

        今天大致读完了analysis、document、store这3个pack
类别:Lucene | 评论(3) | 浏览()
 
     
 
 
文章分类
 
 
随想(14)
 
 
 
Blog(2)
 
 
 
 
 
 
 
 
 
 
 
 
 
 
     
 
文章存档
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
     
 
最新文章评论
   

听说google的爬虫主要用python实现。
一直想学python.
我也是研究web mining的,入...
 

学习!窗口不可见情况下,可以取得坐标吗?
 
 
 

 
     


©2008 Baidu