您正在查看 "内容挖掘,文本分析,知识处理" 分类下的文章 2010-11-12 19:48 软件下载地址:www.fanpq.com 中的ROST DetailMiner(ROST DM)
内置了简单的使用手册。
该软件完全免费,最大的特色是这是一款细粒度信息的抓取工具。未来将整合到ROST NewScan中。是做研究获取文献信息的利器。软件需要.NET Framework 3.5以上的支持,win7已经自带了,支持库下载地址: |
2010-09-24 13:11 2010-09-02 21:45 今天对ROST CM做了紧急更新。主要修改了相似分析的一些小内容。
建议一定要在电信网使用,不要有敏感词。如果有网友查英文,可以给我们一些反馈意见。
此外增加了一些高频过滤词。便于社会网络分析,如果有网友使用过程中积累了比较好的高频过滤词表,也可以发会给我。
升级了情感分析模块,增加了显示负面结果详解、正面结果详解。
修正了期刊分析中的一个bug,在电信网,可以直 |
2010-08-24 23:14 2010-08-10 9:15 去年一位香港城大的教授来武汉看我,和我聊起文本聚类的话题,后来我们决定弄一下。
他派了一个程序员由我来指导,弄了两三个月,有了一个极初步的成果。
今年上半年我去新疆,这事情就拉下来了。
回来后,刚好又和一位老师共同指导四位博士生,就把这个东西又拿出来重新梳理一下。
这不有了一个初步可看的东西。文本聚类分析的一个初步模块。聚类分析下载地址: |
2010-08-07 21:09 2010-08-05 22:38
现在微博都变测试版了。看来要做备份工具和实时搜索分析,昨天和今天就弄了一下,赶紧发布出来。
大家可以测试或使用一下,有什么意见可以留言。下载地址:ROST内容挖掘-微博分析模块,
采集回来的数据使用记事本打开时,记事本要自动换行。
附一点我们以前发的一篇微博的论文的中文稿(英文发了,中 |
2010-07-27 17:52 这几天没什么大事,就是天下雨下的厉害。下雨天编一点代码很有感觉。觉得很有诗意。顺便看了一部网络小说。
和几个记者瞎聊了一些东西(私人聊天,不是报道性质的),还和某机构工作人员聊了一下。
突然发现自己对情报分析有了一些新的认识。
通过网络还是认识不少人,有的弱关系变得更强一些了。
25号去经管院大报告厅作报告。这个报告连续做了11年了。给武大新进的教师培训教育 |
2010-07-22 16:54 这一周杂事挺多的,只能每天抽会时间编一点代码。
今天总算可以提供一个新的版本给大家试用了。
不过今天这个版本还是挺让人鼓舞。更新说明及下载
比如试着以下步骤即可测试出某类人的网络形象
1.首先在全网分析中输入“黑客 |
2010-07-18 15:04 2010-07-16 22:58 这两天做了一个报告,和不少出版的老师做了一些交流,有了一些新的想法。
下载入口页面:ROSTCM内容挖掘系统最新版
后来又在计算机学院听了几个博士的论文读感,突然有了想升级ROST CM5.5的冲动
今天开始重新思考和规划了ROST CM5.5的界面
初步考虑如下,欢迎大家提建议
|
2010-07-14 8:43 2010-02-05 20:05 
我小的时候就很喜欢看武侠小说,我记得初中二年级我一大早起来把白发魔女传的人物,按照小说中描绘的交手场景,做了一个武功从高到底的人物排序。
从文学作品中抽取我需要的一些数据一直成了我的一个愿望。
现在随着我们开发软件的深入,我正在朝这个愿望小步迈 |
2010-01-31 21:02
对于AJAX数据的抓取和采集是目前的一个小难点,需要使用嗅探等技术,本软件能够抓取AJAX评论,由沈阳老师设计、编码。
简陋之处,望谅。
ROST Sina评论采集工具操作手册(简易版)
1、请确定你的电脑已经连网。
2、将压缩包解压并打开软件。
3、将你想抓取新浪的评论网页链接地址复制并粘贴到ROSTsina“开始”键右边的第一个文本框里。
4、点击“开始”键右边的第二个文本框中的“…”键以在你的电脑中新建一个用来保存抓取数据的文件夹。
5、点击“开 |
2009-12-19 15:12 | | |