文章列表
 
您正在查看 "内容挖掘,文本分析,知识处理" 分类下的文章

2010-11-12 19:48

软件下载地址:www.fanpq.com 中的ROST DetailMiner(ROST DM)

内置了简单的使用手册。

该软件完全免费,最大的特色是这是一款细粒度信息的抓取工具。未来将整合到ROST NewScan中。是做研究获取文献信息的利器。软件需要.NET Framework 3.5以上的支持,win7已经自带了,支持库下载地址:

 
2010-09-24 13:11

发布文本挖掘软件ROST CM6的使用手册

下载地址:http://www.fanpq.com/soft/uploadsoft/ROSTCM.pdf

感谢湖北大学丁永刚老师及其学生的辛勤劳动。

 
2010-09-02 21:45

今天对ROST CM做了紧急更新。主要修改了相似分析的一些小内容。

建议一定要在电信网使用,不要有敏感词。如果有网友查英文,可以给我们一些反馈意见。

此外增加了一些高频过滤词。便于社会网络分析,如果有网友使用过程中积累了比较好的高频过滤词表,也可以发会给我。

升级了情感分析模块,增加了显示负面结果详解、正面结果详解。

修正了期刊分析中的一个bug,在电信网,可以直

 
2010-08-24 23:14

最近我们团队的王鹏同学把ROST WebSpider修改了之后,我们做了一次更新,本次修改主要优化了界面,增加了一个新的功能,就是在批量抓取链接的时候,时间间隔的设置,防止某些网站封锁死客户的IP地址,这种模式最好是单线程情况下使用。需要.NET Framework 2.0以上支持

下载地址:http://www.fanpq.com/soft/uploadsoft/RostWebSpider.rar

 
2010-08-10 9:15

去年一位香港城大的教授来武汉看我,和我聊起文本聚类的话题,后来我们决定弄一下。

他派了一个程序员由我来指导,弄了两三个月,有了一个极初步的成果。

今年上半年我去新疆,这事情就拉下来了。

回来后,刚好又和一位老师共同指导四位博士生,就把这个东西又拿出来重新梳理一下。

这不有了一个初步可看的东西。文本聚类分析的一个初步模块。聚类分析下载地址:

 
2010-08-07 21:09

为了更加丰富内容挖掘系统-数字人文研究平台的功能,我最近在考虑如何能够将ROST CM和更多网友开源闭源的系统或者工具结合起来。

最近我们虚拟团队的有些网友从网上找了些源代码修改之后形成了两款第三方的工具,一个是RSS数据的采集器,另外一个是全文检索。下载地址:

更新说明:http://hi.baidu.com/rostcm/blog/item/36585bca0cd40934b600c8a8.html

下载地址:

 
2010-08-05 22:38


现在微博都变测试版了。看来要做备份工具和实时搜索分析,昨天和今天就弄了一下,赶紧发布出来。

大家可以测试或使用一下,有什么意见可以留言。下载地址:ROST内容挖掘-微博分析模块

采集回来的数据使用记事本打开时,记事本要自动换行。

附一点我们以前发的一篇微博的论文的中文稿(英文发了,中

 
2010-07-27 17:52

这几天没什么大事,就是天下雨下的厉害。下雨天编一点代码很有感觉。觉得很有诗意。顺便看了一部网络小说。

和几个记者瞎聊了一些东西(私人聊天,不是报道性质的),还和某机构工作人员聊了一下。

突然发现自己对情报分析有了一些新的认识。

通过网络还是认识不少人,有的弱关系变得更强一些了。

25号去经管院大报告厅作报告。这个报告连续做了11年了。给武大新进的教师培训教育

 
2010-07-22 16:54

这一周杂事挺多的,只能每天抽会时间编一点代码。

今天总算可以提供一个新的版本给大家试用了。

不过今天这个版本还是挺让人鼓舞。更新说明及下载

比如试着以下步骤即可测试出某类人的网络形象

1.首先在全网分析中输入“黑客

 
2010-07-18 15:04

提供ROST CM每日更新5.5内测版下载。

更新下载地址:http://hi.baidu.com/rostcm/blog/item/6dea9f0d7a13068fd0581bf6.html

给ROST CM开了一个新的单独博客

http://hi.baidu.com/rostcm

 
2010-07-16 22:58

这两天做了一个报告,和不少出版的老师做了一些交流,有了一些新的想法。

下载入口页面:ROSTCM内容挖掘系统最新版

后来又在计算机学院听了几个博士的论文读感,突然有了想升级ROST CM5.5的冲动

今天开始重新思考和规划了ROST CM5.5的界面

初步考虑如下,欢迎大家提建议

 
2010-07-14 8:43


ROST Alexa网站流量分析工具是由武汉大学沈阳教授设计、黄记编码的一款小工具。已经整合在ROST 内容挖掘系统中的功能性分析的流量分析模块中,下载入口地址:http://hi.baidu.com/rostcm/blog/item/6dea9f0d7a13068fd0581bf6.html

 
2010-02-05 20:05


我小的时候就很喜欢看武侠小说,我记得初中二年级我一大早起来把白发魔女传的人物,按照小说中描绘的交手场景,做了一个武功从高到底的人物排序。

从文学作品中抽取我需要的一些数据一直成了我的一个愿望。

现在随着我们开发软件的深入,我正在朝这个愿望小步迈

 
2010-01-31 21:02


对于AJAX数据的抓取和采集是目前的一个小难点,需要使用嗅探等技术,本软件能够抓取AJAX评论,由沈阳老师设计、编码。

简陋之处,望谅。
ROST Sina评论采集工具操作手册(简易版)
1、请确定你的电脑已经连网。
2、将压缩包解压并打开软件。
3、将你想抓取新浪的评论网页链接地址复制并粘贴到ROSTsina“开始”键右边的第一个文本框里。
4、点击“开始”键右边的第二个文本框中的“…”键以在你的电脑中新建一个用来保存抓取数据的文件夹。
5、点击“开

 
2009-12-19 15:12

 
   
 
 
文章存档
 
     
 
最新文章评论
  

沈教授,您好。 今日偶然在一篇论文中看到您开发的情感分析工具,很感兴趣。因正在准
 

为什么我下载的最新版本没有情感词性标注工具啊
 

能否给我发一份,谢谢! 我的邮箱:bnunetyd2012@126.com
 

权值词典能否发一份以作学习研究之用
 

我试用一下,看看效果怎么样,谢谢
   
帮助中心 | 空间客服 | 投诉中心 | 空间协议
©2012 Baidu