查看文章 |
一些关于文档聚类和搜索结果聚类算法的开源项目
2007年03月01日 星期四 上午 03:57
学习元搜索自然就需要文档聚类和搜索结果聚类的算法,于是在SF 上找了找,发现了一些还活跃着的项目,都是Java 语言开发的。用关键字"clustering"搜索了一下,有120个结果,筛选了以下几个,做个记录: 可以完成简单的文本处理,文本分类,文本聚类和信息检索 一个结合了结构化查询和文档聚类技术的可扩展的框架及用户接口 一个关于机器学习算法的Java 库(这个跟文档聚类没有直接关系,但将来用得着) 一个搜索结果聚类的工具 一个数据挖掘的工具,可以根据数据分类 实现了K-means 和分等级聚类
还有一个C#写的AggClustering 实现了K-means算法。 这儿有一片关于聚类分析的文章,比较全。 |
最近读者: