百度空间 | 百度首页 
 
查看文章
 
FTP搜索引擎的安装配置--Parker (2)
2007-10-15 18:31

src/:

   Makefile      make定义文件

   config.h       目录,文件、目录的定义, make时由conf.head和conf.end生成

   conf.head

   conf.end

   parker.h       头文件,各个程序的定义,

   collect.c       搜集ftp站点数据的C代码源程序

   collect.h       头文件

   listfilter.c     能够比较自动的一些ftp站点列表文件中抽取从ip, 例如文件oldlist.txt如下:

         ---------------------------------------

         南大FTP: 202.119.32.32

         交大FTP: xxx.xxx.xxx.xx      "good"

         202.119.46.57

         清华 166.111.19.56

             ..........

             ........

         ---------------------------------------

        使用命令"listfilter oldlist", 可以得到

        -----------------------------------

        202.119.32.101

        xxx.xxx.xxx.xx

        166.111.19.56

        ..........

        .....

        -----------------------------------

   getdnsname.c ->bin/getdnsname        取得IP的DNS域名

   convertmask.c     把从http://www.nic.edu.cn/RS/ipstat/internalip/

                 取得的免费IP定义列表更新到$parker/HostData/Edu.mask     

  

   common.c    得到ftp的域名等信息等一些共同的函数

   log.c            纪录搜索的历史, 放在 log/, 由search.c 调用

   search.c       搜索用的cgi        -<LZOData/*

   statist.c        显示统计信息的cgi   -<Statist/*

   submit.c       提交新ftp站点的cgi    ->etc/CollectList

  

   minilzo.h     miniLZO压缩函数库的头文件

   minilzo.c     miniLZO压缩函数库的主文件

   lzoconf.h

  

   lzo_comp.c 调用miniLZO压缩函数库的目录数据压缩器

   lzo_fun.c     调用miniLZO压缩函数库的解压缩函数,供search.c调用

etc/:

   CollectList   FTP服务器列表文件

LZOData/:

   只存放搜集到的目录数据, 以ip为文件名, 以压缩格式存放.

HostData/:

   存放站点的信息, ip.info为相应的域名,

   $IP.stat        各个FTP的统计数据,最后集合到stat

   stat              统计的原始数据

   其他            按各个不同要求排序的结果

   Inn.mask      为南京大学内部网络的IP定义,

   Nju.mask     为南京大学正式IP的定义.

   Edu.mask     为教育网的IP定义(免费)

log/:

   search.log    用户搜索的完整纪录

   searchkey.log       搜索的关键字纪录

   submit.log    用户推荐站点的纪录

tmp/:

   工作目录

#############################################################################

#    修改列表

#############################################################################

4.0 (May-8-2001)

(1)Support multi keywords, exclusion and filename extention.

(2)FTP site Statistic, include number of files, sepcial archives like .rm,.mp3,

   Linux files(tar, gz, bz2),and show the last updata time.

(3)show the updata time at each site when shows the search result.

(4)sort the FTP sites, make the nearest site to the client as the first site. according to IP.

(5)remove many useless features, include interface of telnet,gopher and dos utils.

(6)remove Btree, less memory request, less harddisk space. can contain more site, more data.

     如果使用Btree,当处理超过100M原始数据使需要超过250M的内存,在达到150个站点后有很多服务器会无法处理数据。

(7)在线推荐FTP站点, detect the site IP,

   DNS name and scope. and collect site data automaticly.

4.1 (May-20-2001)

(1)使用LZO压缩算法保存目录数据,节省硬盘空间,大大提高了搜索速度。

    原来100M数据压缩成30M左右,可以自动被放在缓冲中,搜索就不会受到硬盘速度的限制。

(2)优化搜索的关键代码,大大提高了搜索速度。服务器用PIII-450,搜索100个站点数据只用了4秒。

4.2 (FEB-16-2002)

(1)把用perl语言写的搜集数据部分用C语言重写,使其

    能够运行在新的Linux版本之上。包括Redhat7.x, Mandrake 8.x

(2)在搜索时自动排除太久没有更新的站点;

(3)Multi user language supported:English and Chinese

(4)修正了许多bug

(5)作了一些清除代码的工作,使其更加的简洁;

(6)搜索列表恢复域名支持, 当然也可以用ip

#############################################################################

#    运行平台

#############################################################################

4.0 Redhat Linux 6.2, PIII-800

4.2 Redhat Linux 7.2,Mandrake Linux 8.1, Celeron 900, PIII-900

经过了对Linux ws-ftpd, Windows NT Server的测试

steff

2002.3.10


类别:软件使用 | 添加到搜藏 | 浏览() | 评论 (3)
 
最近读者:
 
网友评论:
1
2008-03-07 15:30 | 回复
我正再用parker的2007-05-21版,按照你的文档安装后,发现很多ftp服务器虽然登陆成功但是没有信息写入HostData目录,每次flashdata总是这样结束: 230 User logged in, proceed. --- Logged in 250 Directory changed to / 257 "/" is current directory. --- / 200 PORT Command successful. 150 Opening ASCII mode data connection for /bin/ls. 'movie.hit.edu.cn' received ALARM ! cat: ../HostData/*.info: No such file or directory 我不知道这是怎么回事,希望能给我答复,谢谢!
 
2
2008-11-19 15:21 | 回复
我与上面那位老兄同样的问题,此外搜索时提示: log file /var/parker-2007-05-21/log/search.log open fails. log file /var/parker-2007-05-21/log/searchkey.log open fails 请问是怎么回事啊,弄了好久了都。
 
3
2009-11-14 18:15 | 回复
log file /var/parker/log/search.log open fails.
log file /var/parker/log/searchkey.log open fails.
Internal error: 1

我也遇到这个问题,希望楼主给予解答,多谢
 
发表评论:
姓 名:
网址或邮箱: (选填)
内 容:
验证码: 请点击后输入四位验证码,字母不区分大小写
      

     

©2009 Baidu