文章列表
 
您正在查看 "Lucene" 分类下的文章

2007年09月19日 星期三 10:37
 
2007年06月14日 星期四 23:12

提高索引性能 利用 Lucene,在创建索引的工程中你可以充分利用机器的硬件资源来提高索引的效率。当你需要索引大量的文件时,你会注意到索引过程的瓶颈是在往磁盘上写索引文件的过程中

为了解决这个问题, Lucene 在内存中持有一块缓冲区。但我们如何控制 Lucene 的缓冲区呢?幸运的是,Lucene 的类 IndexWriter 提供了三个参数用来调整缓冲区的

 
2007年06月13日 星期三 19:48
昨天给一个项目的数据做索引,
采用内存索引和硬盘索引交替写,内存索引大小为64个Document,
结果发现一个晚上才做了17万条数据的索引(表的字段比较多,75个字段),花费了10几个小时.
生成文件 135M

今天优化了一下,决定在内存中做索引,做晚之后写道硬盘里面.
但是这是非常消耗内存的事情,自己的机器只有512M内存,发现用的内存到323M的时候,
就会发现内存不足的错误.

最后是放在一个服务器上运行,服务器4G内存,,至强的3G 16路 CPU,这个机器跑这个程序
CPU只有6%,(普通的都是100%),运行的过程中峰
 
2007年06月11日 星期一 19:51
Exception in thread "main" java.io.IOException: Cannot rename D:\Tomcat 5.0\webapps\search\index\segments.new to D:\Tomcat 5.0\webapps\search\index\segments

主要是cannot rename commit.clock
Caused by: java.io.FileNotFoundException:

网上的解决方法是:
解决的方式:
1. 查看杀毒软件是否已经关闭,有时候频繁的打开和关闭文件会唤醒杀毒软件拒绝某些操作.
 
2007年05月20日 星期日 10:46
使用JavaCC做语法分析[转]

实用javacc

前言

本系列的文章的宗旨是让大家能够写出自己的编译器,解释器或者脚本引擎,所以每到理论介绍到一个程度后,我都会来讨论实践问题.理论方面,编译原理的教材已经是够多了,而实践的问题却很少讨论.



前几节文章只讨论到了词法分析和LL文法分析,关键的LR文法分析这里却还没有讲,我们先不要管复杂的LR文法和算法,让我们使用LL算法来实际做一些东西后再说.本文将介绍一个在JAVA上广泛使用的LL算法分析工具Javacc.(这是我唯一能找到的使用LL算法的语法
 
2007年05月20日 星期日 10:36
 
2007年04月17日 星期二 13:39
背景:单线程为30万条数据建索引花了10分钟,为了提高效率采用多线程

起初我采用多个线程共享一个indexwriter实例(也意味着往同一个目录写索引),这是luceneinaction和lucenewiki的推荐做法,不知道到为什么总是报FileNotFoundException,很让人困惑。偶尔会成功一次。这个错误让我想起另外一个问题,就是在建索引的时候搜索也会报这个
错误,luceneinaction明明也说了建索引读的时候没问题。

言归正传,我第二次尝试使用每个线程单独拥有自己的indexwriter实例,但往同一个目录写索引,

 
 
   
 
 
文章存档
 
     
 
最新文章评论
  

ding
 

学习中
 

不错哦我支持你好吧
 

请问楼主,我安装成功后,当添加文件时提示 unable to add files to activeproject!
 

真是太有用了,很好!
   
帮助中心 | 空间客服 | 投诉中心 | 空间协议
©2012 Baidu