查看文章 |
www2007之行(三)--正式会议的第一天
2008-03-24 21:19
5月9日是www2007正式大会的第一天,特别是上午从8:00到10:00有World Wide Web创始人兼Semantic Web的提出者Tim Berners-Lee的报告会是一场重头戏。我和Sen很早就出发但还是发现来晚了,会议大厅里已经坐满了各个国家、各种年龄和各种身份的参会者。大厅 前半部分有桌子,可供带有笔记本的代表使用免费的wireless网。自己好不容易找到个最后排的椅子坐好,大会便开始了。先是在大屏幕上播放了历届大会 的logo的动画演示,基本上www大会是一年美洲、一年欧洲、一年亚洲举办的。然后会议组织者介绍了一下本次会议的大体情况,特别有趣的一件事情是本次 会议绝大多数论文的提交时间都是在Dealine的最后几个小时,直到最后一天投稿量都少得可怜,这让会议组织者一度非常worried。这也间接地显示 了这个会议的级别,绝大多数投稿都是精雕细琢的用心之作。去年这个会议的录取比 率仅为10%多一些,今年多收录了20%的论文,但最终的录取率也不足15%。大名鼎鼎的WWW之父Tim Berners-Lee终于登场了。他的演讲题目叫“The Two Magics of Web Science”,仅看题目便可以猜出个大概,这两个Magics应该一个是他提出的Semantic Web,一个是他以前不愿承认但现在已经无法忽视的Web2.0。Tim已经不年轻了,但他说话很快,充满了激情,有的时候动作夸张到像在戏剧表演。他还 在现场进行了一次调查,先让参加过连续两届www大会的代表举手,然后三届、四届,会场上举手的代表越来越少,最后全部参加的举手的就只剩下Tim一个 人,显然这给予了他很大的精神满足。 自己在他还没有完全讲完的时候就提前去了外面,因为自己没有吃早餐,正好每天上午10左右会提供各种食物和饮料,除了各种饼干和coffee,有时会有我很喜欢的大个草莓供应,一个草莓大小抵得上一个桃子。 Tim 讲完之后正式的presentation便在各个分会场同时并行举行了,我感兴趣的主题也恰是www大会最核心的永恒主题:Web Search和Data Mining,一直到会议的最后一天都有这两个session举行。而像北大的裘老师是研究web service的,只在最后一天才能找到感兴趣的session。等我兴匆匆地赶往Alberta大厅时,已经有很多人占据了座位,有的人直接坐到了铺有 地毯的地上。今天我感兴趣的session都在这里举行,一天都是关于Search的。上午是Search Potpourri,下午是Crawlers和Web Graphs。这里面要讨论的论文自己以前都仔细看过,很遗憾今年和自己研究的小领域特别相关的论文非常之少。 在我到达时Search Potpourri的第一篇论文“Navigation-Aided Retrieval"的presentation已经开始了,像很多论文一样,这次的presenter也不是论文的第一作者,而是Yahoo!研究组的 有名的Christopher Olston,这是一篇非常有新意同时也很有趣的论文,有很多人提问,特别是来自百度的威廉张格外踊跃,在旁边的照片里最右边穿白色衬衫的那位就是那位老 兄。在随后几天的会议之中,他一直是我见到的听讲最积极活跃的人物。第二篇论文"Efficient Search Engine Measurements"是在www2006的最佳论文基础上的进一步工作,作者是原班人马,这次主要是大大提高了速度。它的第一作者算是这个领域的一 个牛人,个子很矮小却给人很冷酷和咄咄逼人的感觉。顺便说一句,web研究领域很多牛人都非常矮小,包括后来出现的Bing Liu。这让我得出一个结论,看研究者个人主页照片时一定要有所保留,因为照片里无法显示他真实的身高情况。虽然论文是非常好的工作,研究的是如何通过各 个主要搜索引擎的接口对其索引的网页数量进行探测。演讲者是第一作者的某个学生,台上很放不开。 第三篇 论文“Efficient Search in Large Textual Collections with Redundancy"是上午惟一一个第一作者的presenter,是国外大学的华人学生,英语明显有待提高但显然经过精心准备,这篇论文也是一篇 best student award的candidate论文,可能因为作者的精心打造,这篇论文最终获得了最佳学生论文奖。它的idea其实实在是简单到不能再简单,自己一直很 奇怪为什么它会得到这么大的关注。显然威廉张对这篇论文很兴奋,中午lunch时也能听到他不断重复着”interesting、 interesting"字眼。 吃完了lunch,开始了Crawlers的小session,它也是我可能整个会议里最相关的工作。第一篇论文 “The Discoverability of the Web"同样来自Yahoo!研究组,第一作者很瘦小,特别是英语发音非常令人奇怪。第二篇和第三篇都是来自犹他州立大学的同一个作者,分别是关于 Deep Web的发现和分类的。说实在话,他的工作并不是很让我佩服,后来休息时我直接走向他的跟前和他交流了几句,他承认他的工作不过是在Context Graph基础上加入了online学习的功能,并对link进行了细粒度的刻划而已。但他显然做了很多工作,特别是每个Form分类器的正例都是手工采 集的,这需要非常大量的人工劳动。晚上有个Reception我看见他和同样十分瘦小的女导师一起走过,我还和他打了招呼。他的mentor和他有非常相 近的气质,都极为严谨和清矍。看见这样两个极为瘦小但坚定的师徒二人匆匆和你擦肩而过,会给人一种非常奇怪的感觉。 下午最后一个小session 是Web Graphs,第一篇论文“Random Web Crawls"是一篇来自法国的论文,一个很胖操着明显法国口音英文的学生很放松得进行着陈述。第二篇论文”Extraction and Classification of Dense Communities in the Web"是一篇关于Web Communities的自动发现的论文,比前人大大前进了一步,演讲者是第一作者的导师,是一个意大利人,一个非常幽默的老头,也是惟一能用演讲把听众 逗乐的一位,说实话,我很喜欢这个老头。第三篇论文“Web Projections: Learning from Contextual Subgraphs of the Web"的演讲者是来自CMU的非常年轻的小伙子,年轻到你能想象到他作完演讲就可能上街去玩滑板去了。因为是来自CMU的,很容易想象一定是关于 Machine Learning的论文,但它的立意非常新颖,新颖到你不想去关注它在实际中到底有多大的用处。 正式会议的第一天结束了,像几乎所有会议一样,第一天的presentation得到最多听众的关注和呼应,所以如果以后论文被安排在会议的最后一天,你几乎不用为提问作准备,因为听众大部分或者已经打道回府了,或者去外面游玩去了。 |
最近读者:

