查看文章 |
ftp搜索引擎的设计和实现:4.9 建立倒排索引模块代码结构
2007-04-02 20:29
欢迎转载,但请注明出处,并给活力链接。谢谢 在这一部分的最后一节,来介绍一下W-cyclone ftp搜索引擎的“建立倒排索引模块”的代码结构。
calcdirsize.cpp:计算各个文件夹大小的类的实现。(参见4.6节) fileinforindex.cpp:负责扫描attr文件的类的实现。按顺序逐行扫描各attr文件,每一行对应生成一个Fileinformation结构,以二进制写入到inforindex文件中。 filenameindex.cpp:负责扫描path文件的类的实现。按顺序逐一扫描path文件,生成双字母倒排索引,写入到对应的索引文件中。 需要说明的是,按上文介绍的双字母倒排来建立索引,程序并不支持插入、更新和删除索引。要想更新索引,只有重建所有索引。好在该搜索引擎是用于搜索文件名的ftp搜索引擎,索引的大小以及建索引的时间在可以接受的范围之内。 最后介绍一个脚本dir.sh。该脚本用于在一个指定目录内生成256个文件夹,文件夹名为0-255.或者在一个指定目录内删除文件夹名为0-255的所有目录。也许你已经想到了,它用于在重建索引时删除整个索引目录和创建整个索引目录。 |
最近读者: