RoBa's Tech Blog
百度空间 | 百度首页 
 
文章列表
 
2009-06-02 14:55
欢迎访问 http://roba.rushcj.com
 
2008-06-09 20:34
int4str.c

先说句题外话:这个C语言写成的libbow库里面,占了很多代码的东西实际上都不过是C++STL里某些容器的粗糙实现,虽然作者是花了很多心思,但无论效率、精巧程度、易用性、可扩展性上都远比不上STL,由此来看STL对编程效率的提高真的很有用。

继续分析一些辅助函数,这次是一个hash表。一个关键的结构:

typedef struct _bow_int4str {
const char **str_array;
int str_array_length;
int str_array_size;
int *str_hash;
int str_hash_size;
}
 
2008-06-07 16:36
先把代码里面用到的各种缩写整理一下,不然很容易乱掉了,此列表以后可能会继续添加东西。

dv: document vector
de: document entry
di: document index
wv: word vector
we: word entry
wi: word index
dvf: document vector with file (?)
vpc: vector per class //这个不很懂
pv: position vector

另附一些从代码中看到的小trick,也是持续增加中(有一些是编译器相关,个人感觉并不推荐采用):

1. __attribute__ ((constructor))

GCC专用。给一个函数加上这
 
2008-06-07 13:29
strtrie.c

这一部分实现了一个trie,就是个普通的trie,没什么技术含量,假设字符串都是小写字母,用一个next[27]的数组记录指针。其中要注意的是,next[26]实际上是一个标识是否词尾的标志,而不是真正的指针。

相关结构体:

typedef struct _bow_strtrie {
struct _bow_strtrie *next[27];
} bow_strtrie;    //就是Trie的一个结点

提供操作:

bow_strtrie *
bow_strtrie_new ()   //申请新的结点

v
 
2008-05-31 00:21
主要是因为这篇文章给了我勇气……嗯……

简单来说,是关于这样一个叫做“海内网”的网站(和"校内网"十分想像,实话来说的话,都是抄的facebook),现在上面有一个买卖奴隶(当然,是虚拟的)的游戏,类似炒股票一样,挺好玩的。现在的问题的我的钱有点不够,而如果每邀请到一个好友加入,就可以给我增加1000元现金(当然,也是虚拟的- -)。如果你愿意的话,可以点击如下链接进入注册页面,这样就表明是因我
 
2008-05-27 13:55
 
2008-05-22 22:38
最近几天浑浑噩噩……唯一的一点成就是,论文已经扯出5000+字了……

又把以前看不明白的一些东西再看了一遍,有的恍然大悟了,有的仍然不懂中。但有一个想法我是愈加坚定了,那就是,一切复杂的算法、繁琐的推导等等,背后都是一个简单的思想在支持,paper或是教材里大都为了严密性起见,只把结果按逻辑顺序罗列了出来。顺着他罗列的引理定理推论一路看下来,固然是一个无懈可击的过程,但同时也很容易眼花缭乱迷失方向。其实我们要做的只是抓住那个简单的想法,然后一切豁然。

这是以前研究ACM题的算法的时候体会到
 
2008-05-18 20:05
今天把画图基本搞定了......另外数据跑出来的结果也很好,和我参考的那篇paper上的效果差不多,很赞的说。

Tips:
hist(X)是画直方图的,其中X可以是个vector,也可能是个matrix,如果是后者的话,会把每一列当作一组数据,把每列用不同颜色的矩形表示出来。
一般情况下后面画的东西会抹掉前面的图,这时候应该用hold on指令
那个一般在角上标注的“图例”,英文叫做legend,真囧
 
2008-05-17 19:58
今天干的事情不多,主要时间都来做ZOJ上浙江省赛的同步赛了。实话来说题目出得不怎么样,好题不多,光有量没有质,拍得我手抽筋。当然我做得也不怎么样,里面唯一感觉有点意思的1004也没做出来- -,还有1009也没做,一个恶心大模拟,如果真组队的话属于那种要直接牺牲一个人死磕在这题上的,单挑的话就无解了(以我的水平来说)。不过最后好歹还没被挤出前十……呃,可能也因为来的大牛比较少吧

正文开始:

今天终于把yalmip+sedumi
 
2008-05-16 19:38
今天继续看了一点最大熵建模时那个迭代求lamda参数的方法,就是所谓的IIS,结果是简单来说两个字:不懂 -____- 或者说,每步的推导都基本明白,但不知道为什么要那样来做。本来打算把这部分证明写进毕业论文里凑字数的,现在看来还是算了吧,不然答辩的时候一被问就惨了。-_-

还仔细看了下matlab下面几个专门求解SDP问题的toolbox:SDPT3和SeDuMi,感觉很强大,但调用起来也很麻烦。多亏有个YALMIP,相当的赞啊,直接什么都不用管了,把约束列出来、目标函数列出来、指定一个NB的solver,把solvesdp一跑,结果就出来了…… 看
 
2008-05-16 13:26
最近一直在看paper,现在感觉不写点什么的话感觉很没成就感。但因为这些收获又都是很零碎的东西,不容易写成很完整的文章,所以就先写个这个比较快的百度空间了,等以后可能整理一下发到roba.yo2.cn上。好了就说这么多了,这些东西估计对来这里的ACMer/OIer来说没什么吸引力,只能说sorry了。:)

先列一下想学的东西:

//理论上的东西
最优化理论继续看
NLP的各个方面都简单了解一下
随机过程?
泛函分析?

//偏工程一点的东西
Matlab编
 
2007-11-22 16:14
新blog: http://roba.yo2.cn 欢迎访问

前些天一直忙,一直也忘了说。以后技术类的文章会优化发在那边,是一个类WordPress的界面,插件很多,对Tags、代码高亮、数学公式等等的支持都很好很强大,有好多在免费blog服务里很难找到的功能。以后的新文章在百度空间这边也会不同步的更新,当作备份用了。

另, http://acm.roobaa.cn 过段时间也预计指向yo2的空间了。
 
2007-10-04 17:26
给定一个非负整数序列{d1,d2,...dn},若存在一个无向图使得图中各点的度与此序列一一对应,则称此序列可图化。进一步,若图为简单图,则称此序列可简单图化。

可图化的判定比较简单:d1+d2+...dn=0(mod2)。关于具体图的构造,我们可以简单地把奇数度的点配对,剩下的全部搞成自环。

可简单图化的判定,有一个Havel定理,是说: 我们把序列排成不增序,即d1>=d2>=...>=dn,则d可简单图化当且仅当d'=(d2-1, d3-1, ... d(d1+1)-1, d(d1+2), d(d1+3), ... dn)可简单图化。这个定理写起来麻烦,实际上就是说,我们
 
2007-09-11 14:13
发信人: RoBa269 (roba), 信区: Algorithm
标 题: 如何给图的边定向使得得到的有向图强连通?
发信站: 水木社区 (Fri Sep 7 20:55:22 2007), 站内

是一本组合数学书上的练习题

如果原图全是无向边的话,只要图无桥,就一定能找到这样一个定向。

现在图是混合图(部分有向,部分无向),要求对所有的无向边指定一个方向,使得生成的有向图强连通,这个怎么做?

--
Welcome to http://acm.tju.edu.cn/toj


※ 来
 
2007-09-07 16:07
Hall定理:二分图G有完美匹配,当且仅当G满足Hall条件:对X集的任意子集S都有|S|<=|N(S)|,N(S)表示S中的点在Y集中的相邻点组成的集合。

Hall定理是完美匹配存在的充要条件,另外还有一个充分条件(t条件):

若X集中每个顶点至少关联t条边,同时Y集中每个顶点至多关联t条边,则G中存在完美匹配。

证明:X集中任意k个顶点至少关联tk条边,这tk条边至少关联Y集中k个顶点,故满足Hall条件。Q.E.D.

推论:K正则二分图中存在K个边不重的完美匹配。

证明:设t=K,由上面的t条件可知图中必存在
 
     
 
 
个人档案
 
RoBa
男, 23岁
天津 
上次登录:
10月21日
加为好友
 
   
 
文章分类
 
 
 
 
 
Ojs(18)
 
     
 
最新评论
 
文章评论|照片评论

 
 

形式化的悲剧
 

学习一下!
 

学习了。
 
     
 
好友最新文章
 
     
 
订阅我的空间
 
已有人次访问本空间
 
订阅RSS  什么是RSS?

您也想拥有这样的空间?请点此申请。
     
 
最近访客
 
 

leehark

Megan_ye

幽优灵

cschenlu

laozhonggu

Linzertorte

颜艺林

weolar
     


©2009 Baidu