(部分重要文章仅百度好友可见)冲出宇宙-搜索引擎及相关讨论(享受技术)
百度首页 | 百度空间
 
文章列表
 
2008-06-30 22:20
 
2008-06-23 23:07

实在忍不住不更新博客了,这次拿笔者在《搜索引擎应用技术》(还未写完)草稿中的一段算法介绍给大家。

Cuckoo Hash算法,被认为是十分简洁,而又十分精美的数学思想的典范。虽然它一直不为人知,也不为人用,但它真的很好很好。笔者认识的人里面,只有那么1-2个听说过它。下面是它的简略介绍:

 
2008-05-18 23:22
每天默哀3分钟。
 
2008-04-17 20:57
欢迎加入我们的蜘蛛研究群,号码是:60197650,里面给大家提供了很多资料。但有加入门槛,所以,请对蜘蛛有点了解后再申请加入。
 
2008-03-16 22:36
今日无聊,在百度上面查询“冲出宇宙”,结果,没有看到我的页面;大惊,难道百度出问题了?然后查询:冲出宇宙 lotusroots,百度上面的结果里面还是没有出现我的博客!!
换用google,出现在第一位的就是我的博客!图例如下:

如下是百度的检索结果:


下面是google的检索结果:
 
2008-03-14 23:56
最近打算写一篇对大家真正有帮助的文章,这篇文章可能有上百页,将会详细的说明业界目前公开的搜索引擎技术。
希望大家监督。一定要让文章可以作为一本完整的Information Retrieve及其实践的参考书。

update at 2008-3-25:
深圳住的地方还没有搞定,电脑还没有开,不很清楚的地方正在思考。

update at 2008-6-3:
最近2个月在公司参加了好久的新员工培训,虽然郁闷,但也没有办法;听那些刚入门的小弟弟小妹妹们谈论各种入门技术,感觉犯困。
已经完成了第5章《数据结构和算法》,正在继续下一章《文
 
2008-03-14 12:40
QQ拍拍,在国内暂时不是最好的电子商务网站。淘宝用户数量,知名度都更高。
QQ拍拍,在国内暂时不是最好的求职处。百度薪水更高。

但我们有QQ这个庞大平台的支援,我们有着团结的队伍;我们不差流量,我们不差激情;我们差的是更多的人才。
加入我们吧,和我们一起超越淘宝,超越Ebay,也超越百度的薪水!是的,你将会在短时间内见证到这段历史!!

难道你还在犹豫?

联系方式:baobeileaf@gmail.com
 
2008-03-13 19:46
Lucene2.3.1于2008-2-2号正式推出,它的特点有:
参考:http://svn.apache.org/repos/asf/lucene/java/tags/lucene_2_3_0/CHANGES.txt

1)索引构建:
     Lucene这次的修改好像由一位对性能要求特别高的人进行,这点可从改进的大部分都是性能方面的问题看到。
    在索引构建方面,一个大的改进就是段合并的策略,使用了根据文件大小来合并,虽然这个策略比不上中科院的开源搜索的策略(Huffman树),但比2.2版本之前根据文档个数来合并要好了很多。
  
 
2008-03-13 08:22
多年前的梦想是做世界最强的科学家,但天赋没有那么多。想想去年的那位华裔数学家,才31岁,获得了数学界的2个最高奖之一。呵呵,多年以来,第一次看到中国血统的人获得这个奖项。他2岁就对数学十分有天赋了,仅仅通过看电视,就会告诉别人四则运算的规律,2岁啊,估计我们大家那时都还不会讲话。偶像。
科学界聚集了太多比自己更有天分更努力的人,所以,没有我的立足之地。
计算机工程界呢?呵呵,现在看来,大部分人都是天分一般,努力也是一般。正是我们的机会!只要我们天分还可以,十分的努力,总有机会成为世界顶级的工
 
2008-02-29 11:40

预备知识:
1)svm:svm(support vector machine)即支持向量机,是一种机器学习算法,2000年左右开始火爆,被认为是(2005年论文上写的)目前分类算法中最好的二个之一(还有一个是boost方法,即使用多个低分辨率的分类器线性组合成一个高分辨率的模式);根据它的原理,个人认为它和人工神经网络的计算公式本质一样,虽然它们的类切分方式不一样。至少svm是完全的基于超平面,利用核函数进行扩展。已有的证据表面对于基本的多分类来说,RBF(核函数

 
2008-02-18 13:18

从2月1号到今天,过去了半个月了。中途因为过年,医院都不开门。
最初的问题是:谷丙转氨酶偏高了一点(65,正常0-40),当时感冒,所以,尿功能检查也有一个微蛋白,血常规里面淋巴细胞过多。后来过了若干天后去南方医院检查,发现尿功能和血常规都正常了。但是,谷丙转氨酶连续检查了2天,都是偏高。不过,现在是59了。
问了医生(南方医院好像只有教授级的医生,每次挂号都是9块,贵啊),医生说恐怕是脂肪肝哦。(后来我仔细的查询了一番,原来没有乙肝的,略微有点胖的,搞计算机的,据说几乎肯定是脂肪肝)。医生

 
2008-02-12 22:18
最近网络上面都是陈冠希这个电脑盲乱拍的性爱照片。虽然我根本都没有听说过这个名字,但是,常常听Twins的歌曲。
虽然阿娇在里面出现了,而且,据说还十分的***。但,是人就会喜欢这样,无论私生活如何,都不能掩盖在唱歌方面的才能。更何况错误也不在她。我会继续支持你,阿娇。
 
2008-01-24 20:10

机器学习杂谈

1、分类

       现实生活中,我们总要面对各种情况做出各种判断和决定。下面,我们以一个例子来说明问题。

       这个例子中,“我”就是学习体(分类器,机器人)。

       今天早上,女朋友突然问:“我穿的衣服是不是很漂亮?”。为了准确的回答这个问题,我开始了

 
2008-01-24 09:15
以下是引用的别人说的一段原话:

据听说百度最近服务器被人黑了,数据全部丢失,百度只恢复到2007-10-30日的数据,因此百度最近的不正常表现并非是百度改了算法,而是数据丢失了 ,不知道是不是真的。 大家还记得上次百度被攻击吗?瘫痪半个小时!这是什么概念,只能说明一个问题,百度的计算机工程师白痴,无能!疏于防范,认为百度自己肚大腰粗!

虽然还没有去问问百度的朋友确认,自己却有一些感慨了。
事情是否真实,没有必要关心。
但事情本身说明了知名度太高了,公司就
 
2008-01-23 16:04
// 每次拷贝64字节,要求len必须是64的倍数
// 因为L2的cache line是64字节的,剩余的一些字节可以直接使用简单汇编实现。
// 为了通用,使用mmx指令;如果是intel的,可以使用SEE指令
void fast_memcpy1(void* dst, void * src, int len)
{
// 参考文献:vlc项目的fastmemcpy.h : fast memcpy routines。
    __asm
    {
        mov esi, src
        mov edi, dst
  
 
     
 
 
个人档案
 
lotusroots
男, 28岁
广东 深圳 
上次登录:
9天前
加为好友
 
   
 
最新照片
 
   
 
最近访客
 
 

astroblue

EOODCN

whitecpf

Kennlee

huangthreelast

iammonster007

benbendy

kekemao1
     
 
其它
 
已有人次访问本空间
 
订阅RSS  什么是RSS?

您也想拥有这样的空间?请点此申请。
     


©2008 Baidu