2007-12-15 14:27
有谁知道像Google,Baidu等搜索引擎的索引数据怎么备份么?
以及一些RSS阅读器里面的Feed和文章数据怎么备份?
他们都有一个共同点就是数据量大,而大数据量下的数据备份绝对成了一个很大的挑战。在SD2China大会上, 钱宏武谈到他在做搜狐社区产品的时候的一个关于数据备份的事。产品刚上线的时候他设计一个数据备份方案就是每天下午4点作 |
2007-12-02 16:45
大会的具体情况就不说了,相关的报道不少,从大会中的收获也很多, 下面谈一下会后总结到的东西。
系统设计,一般只为当前的系统需求或者可预见的未来的需求作设计,一个原则就是先解决好最关键的功能需求,并且最多只为用户增长5-10倍做设计。这点很好理解,因为为那些不知道什么时候才有的功能作预先设计实在是费力不讨好的事情,但是这并不表示瞎设计一通,系统足够的扩展性是必须的。举个实际的例子,在一般很多互联网WEB项目中,数据库系统都会随着用户量 |
2007-10-10 10:01
BANG6052B138F527216FEAA78D9AXIANGUO
鲜果认领频道
真正高性能的场合很难利用xml,xml占用空间大,解析慢。结构不适那么复杂的话存储还是用自定义格式的要好一些。最近刚刚把一个用xml存储的换成用自己的格式文本存储的,性能提高好几倍。
用文件来代替数据库作存储,需要注意的事项有:
1、是否会产生很多文件。如果产生相当多文件的话(比如1000w),结果很难看。
2、并发访问和缓存不好管理。这两点应 |
2007-09-06 19:36
google reader终于推出搜索功能了,功能比较强大,可以针对shared/star/一个分类/一个feed/所有文章等进行搜索,这点上比目前的几个RSS阅读器( 鲜果、 抓虾等)都要好。
本来我一直是对google reader寄以很高的期望的,但是在使用过程中却感到有些失望。其实我就测试了搜索“ 鲜果”,出来了很多关于 |
2007-08-14 18:44
1、php里使用memcached的压缩,性能相当糟糕。在实际生产环境中,每个缓存项约1-2K,然后启用缓存压缩,然后读取缓存的有时候比一次数据库读取还耗时,恐怖!取消压缩,性能成倍提高。因为这么小的数据压缩效果很差,反倒增加了cpu时间。
2、mysql中innodb存储引擎的默认配置下,update性能真是比蜗牛还慢,一定要根据系统实际情况修改mysql配置参数。
3、mysql中根据用where id in (id1,id2....)这样的查询,那么不连续的id1、id2远不如连续id1、id2的性能。id1,id2的先后顺序对性能没有影响,只要 id1、id2...排好 |
2007-07-30 12:59
最初的代码:
var s = [x1,x2,.....];
var t = [y1,y2,.....].
//s和t的长度对应,大约2700个元素。
function String.prototype.s2c(){
var k='';
for(var i=0;i<this.length;i++)
k+=(s.indexOf(this.charAt(i))==-1)?this.charAt(i):t.charAt(s.indexOf(this.charAt(i)))
return k;
}
//这段代码为:把String中在s数组出现的字符用t中相应位置的字符替换。这种方法可以用在繁简转换上。String的长度不小,一般为一篇blog文章的长度。
第一次 |
2007-07-18 10:46
刚在上一篇文章中说阅读器速度不稳定,时快时慢。不过在今天观察时就有了可喜的变化,xianguo和zhuaxia在页面加载性能上都有很大提升,每次展开文章列表所需要的时间都不超过1s,真是令人高兴的事情。
:) |
2007-07-17 19:57
比较的对象是我的71个feed,下面分别是比较的记录:
07-16 9:30
xianguo:15
zhuaxia:30
greader:34
出现更新的feed数量上基本相当,每个feed中更新的文章数xianguo中比其他两个要少点。
07-16 13:04
xianguo:9
zhuaxia:11
greader:9
出现更新的feed数量上greader最少,每个feed中更新的文章数zhuaxia比其他要多出两篇。
此次比较3个阅读器基本相当,因为更新的feed并不完全一样,所以出来的新文章也不完全一样。
07-16 16:40
xianguo:17
zhuaxi |
2007-07-15 15:36
我在大学一开始学习过VC/MFC,学了大约半年,学到做了一个带有简单界面的ftp客户段程序,之后就学.net,然后一学就是几年,直到不久之前,现在又转型到lamp了。
一开始从VC/MFC到.net的转变算不得是一个技术转型,因为一开始我的技术基础为0,从学VC/MFC开始了解了一下基本的编程知识(当然学习c/c++,操作系统等计算机专业也让我学到了很多),然后到学习.net基本没有技术转型上的不适。我记得当时转变是非常快而有效的,因为有了一些VC/MFC的编程基础,我记得开始接触c#的一周里 |
2007-07-08 23:08
2007-07-04 09:25
直接输入www.google.com,便被自动重定向到www.google.cn,还真是的.....
我想这是谷歌提升google.cn流量比较重要的一个手段吧,当然这么做对我来说并没有任何影响。 |
2007-06-12 13:06
我做了一下简单的测试:
往 鲜果里面导入了大约1660个feed,成功。我又往 鲜果里导了一个2000个feed的opml,也提示成功。两次导入后,我总共有2028个feed。然后刷新页面,不到10秒频道列表展示出来了。
我拿着上面的opml(1660个feed)往 google reader里导入了一下,结果分别到入了两次都提示失败(每次持续1.18m),绝望!然后我在频道列表中看了 |
2007-06-07 12:33
本来是认为没有什么不同的,
但是今天却发现了一点不同的地方,如下代码:
<div id="t1836733">
<div class="left"></div>
<div class="r |
2007-06-01 11:05
今天本来是打算比较 鲜果和Google Reader的抓取及时程度的,可是却发现了Google Reader的几个问题。
1、时间似乎全面出错了。
我分别调查了几个Feed包括我自己的:http://www.cnblogs.com/rss,http://hi.baidu.com/yzx110/rss,http://feeds.feedburner.com/readwriteweb,GReader中这些Feed中文章的时间都和源RSS中的时间不对应。难道GReader中的时间是文章被抓取的时间, |
2007-05-30 13:22
具体input相关的代码如下:
<div style="position:absolute;left:100px; top:100px;width:100px; height:20px;"><input type="text" /></div>
当div里面的input所在位置下的 |
|
|