2008-05-11 08:27
NekoHTML是目前最好的HTML转化成XML的工具之一,但它的Filter功能还是非常有限,比如它目前提供的ElementRemover仅支持对Element的accept和remove功能,假如我想生成一个仅由Element和Text结点构成的DOM树(Element去除"style"和"script"),则只能自己写一个ElementRemover来实现。下面是自己写的一个实现:
import org.apache.xerces.xni.Augmentations;
import org.apache.xerces.xni.QName;
import org.apache.xerces.xni.XMLAttributes;
import org.apache.xerces.xni.XMLResourceIdenti |
2008-04-19 18:44
 今天无意间打开一个网站——“去哪儿”(http://www.qunar.com/),随意搜索了一下从北京到长春的机票。真是不可思议,竟然有最低190元的飞机票。这个网站显然采用了web2.0的Ajax技术,一边即时与各网站相连下载机 |
2008-04-14 12:27
自己平时很喜欢在闲暇时学习一些新的计算机语言,它使我对计算机的
兴趣不至于在书写各种申报材料和论文中完全泯灭。特别是在我把工作平台转向
Linux后,学习各种开源语言更成为自己掌握在Linux下工作的一种必然选择,除了
C/C++、JAVA、C#这些主流开发语言外,我尤其对Perl、Python和Ruby这样的动态
脚本语言情有独衷,这里特别谈谈自己在学习它们的过程中的一些体会。
第一次接触Perl语言是自己在作Web Mining研究时从CMU大学的著名网页
数据集Web-KB开始的,它 |
2008-03-31 19:18
2008-03-27 22:49
一进入百度空间发现有15条系统消息,打开一看全是我的百度空间上加我的好友发给我的邀请。不用不行了,打开一看,还不错,至少很干净,最关键的是和百度空间上的好友联系更方便了。 |
2008-03-25 21:39
今天偶然在书店里避雪,没想到一呆就是一个下午。发现自从转行计算机以来已经很少有时间看其他书了。突然想起自己在漫长而无聊的五年大学时光中读过的数不清的书,我不知道还有哪个同龄人有与我相近的阅读经历,自己甚至把狄更斯的几乎所有或冗长或枯燥的小说都读过了一遍。不知道自己以后还能否有这样尽情阅读的机会,它是何等的欢乐源泉。它部分地构成了现在的我。自己最近最想看的书是《The World is Flat》。有时间还想重温一遍《战争与和平》。 |
2008-03-24 21:21
自己参加WWW大会有很多的心得,有意想不到的收获和惊喜,也有很多的遗憾,现总结一二,为以后留作参考:
- 在你决 定去参会之后即马上开始买飞机票,不必为签证没有办下来而有后顾之忧(这种参加学术会议的签证一定能办下来),这可以节省一大笔费用,因为越是早订的飞机 票越是便宜。比如这次如果我早买去加拿大的往返飞机票的话,最便宜4000人民币就能买下来,自己到最后时刻好不容易买到的票定价已经是11000元,贵 了几倍之多;
- 如果像WWW大会一样是按天注册的话,并且你恰好手头很紧,以
|
2008-03-24 21:20
今年www大会共有15篇第一作者是中国人的长论文,在所有注册的代表数量方面,中国也排在了美国、加拿大和英国后面居第四位。这很让人想起奥林匹克运动 会的中国队的历史。微软亚洲研究院长沈向阳还在他的博客上发出像征服奥林匹克一样向世界顶级计算机国际会议进军的口号。MSAR也确实远远走在了中国大陆 高校研究机构的前面,每年像WWW和SIGIR这样的顶级会议都收获颇丰。令人欣喜的是,这次WWW大会也出现了两篇完全本土化的论文,一篇是北京大学裘 宗燕老先生的关于Web service的论文,另一篇是东南大学XOBJECT研究组张祥博士的一篇论文, |
2008-03-24 21:19
Banff是加拿大著名的国家森林公园,位于加拿大的西南角,据说以前朱镕基总理去加拿大访问时特意冒雨去Banff一游.这里是一个典型的旅游城 市,整个城市只有一条主要街道Banff Avenue,数不清的大小旅馆就在这条街的两旁,城市的当地人口比外地的旅游人口要少得多.这里一 |
2008-03-24 21:19
5月9日是www2007正式大会的第一天,特别是上午从8:00到10:00有World Wide Web创始人兼Semantic Web的提出者Tim Berners-Lee的报告会是一场重头戏。我和Sen很早就出发但还是发现来晚了,会议大厅里已经坐满了各个国家、各种年龄和各种身份的参会者。大厅 前半部分有 |
|
|
|