中文分词 zhongwenfenci
百度空间 | 百度首页 
               
 
文章列表
 
2009-06-19 17:59
这回央视免费给 google 做了上亿元的广告, google 估计爽死了!
 
2009-05-15 20:54
下周我就可以完成自动可无限扩展分布存取系统了

我的新系统新平台将会强大的无与伦比,10年内将无人可以超越

前浪肯定会死在沙滩上

只要互联网上号称前辈的垃圾不要在那么无耻我就一定能超越你们

比起很多无耻的天天幻想抹杀我的那些所谓的前辈们,我感觉我比你们强大的多, 也比你们更坚强!

比起你们的狗奴才那就更不用我说了

奉劝某些满口仁义道德的人就不要在说一套做一套了!
 
2009-04-18 20:17

google也有瘫痪、发疯的时候,号称技术天下第一的水平不过如此啊,不信就来体验体验!

在google搜索 "么事 决 你 我 解" 翻页到 几十页之后 google就开始发疯了,每次检索至少需要 1.5秒 ,而且每刷新一下 google 就好象瘫痪一样,不旦慢的要死,而且每次显示的结果都不一样! 其它类似状况还有很多,就不一一举例了!

http://www.google.cn/search?q=%E4%B9%88%E4%BA%8B+%E5%86%B3+%E4%BD%A0+%E6%88%91+%E8%A7%A3&hl=zh-CN&newwindow=1&start=690&sa=N

大家可以尝试体验一下,其它类似状况还有很多,就不一一举例了!

号称技术天下第一的水平不过如此,没啥!

很多程序员就是喜欢人家放个P他都觉得香尤其是老外的屁,也不想想为什么香呀!

凡事自己多想想吧,人云亦云未必对啊!

技术鉴定人来自: 纳百海知识库搜索引擎 http://zsk.cangzhuo.com

 
2009-04-12 21:40
感觉这个模块没有多大意义!
 
2009-04-11 19:28

针对藏拙纳百海知识库我编了一个顺口溜

新浪爱问百度,百度知道答案在知识库藏着(拙)

http://zsk.cangzhuo.com
希望大家喜欢哈!

 
2009-04-05 12:20

昨晚3点修正了纳百海知识库搜索引擎的最后几个BUG,同时更改了检索算法,新的算法将使搜索结果更精准!

欢迎大家踊跃测试,发现一个BUG赏黄金千两!
http://zsk.cangzhuo.com
言必行,行必果!发现一个BUG赏黄金千两!

 
2009-03-29 12:44

藏拙知识库全面开发完毕,正式命名为:纳百海知识库

主要特点:采用实时全文索引方式,日可索引50万篇文章!

地址:http://zsk.cangzhuo.com/

欢迎大家踊跃批评指正!

 
2009-03-27 20:15

藏拙知识库开发好了,知识库搜索估计两天后开发完毕!速度将比贴吧还快至少3倍
先请大家测试发表和浏览体验一下知识库系统!
网站是: http://zsk.cangzhuo.com
提交知识的入口地址是:
http://zsk.cangzhuo.com/postzsk
欢迎大家踊跃测试,提交只需要输入标题和正文内容即可!
提交之后就可以在首页看到了!

本次知识库的设计可以保证最少1亿贴,而且速度保持不变!目前只是测试,欢迎大家踊跃测试!

 
2009-03-18 17:57

中文域名在线转码-punycode convert on line

http://punycode.cangzhuo.com/

中文域名在线转码

开发语言C语言 模式 ISAPI

 
2009-03-17 10:37

藏拙博客空间允许博客用户可以发布设置自己博客空间的广告位了!
目前允许大家自定义alimama和Google两种广告!

广告位销售指南
http://cangzhuo.com/help/addescript.html
注册地址:
http://cangzhuo.com/register.html

alimama或google设置后的效果观摩:
http://cangzhuo.cangzhuo.com/
http://test3.cangzhuo.com/

 
2009-03-05 13:20

重大消息提前发布:藏拙暗网搜索将于 4月份正式上线!

特点:一个搜索框可以让大家立即搜索到你想要的信息!
可无限扩展->可涵盖各行各业及各种类型的搜索

藏拙暗网搜索将比百度暗网搜索提前研制成功!

 
2009-02-24 14:05
【分享】中文分词服务器源代码&词库,一个简单的webserver,同时又还是一个Scoket server,又是一个windows服务

软件名称:藏拙简易中文分词服务器 作者:藏拙
具体使用时可将 cangzhuo.dat 放在分词服务器相同的目录即可
使用前请先启动分词服务器

藏拙简易中文分词服务器(C语言开发+词库+源代码),最大特色可以让javascript来调用!

高速下载地址1: http://tieba.cangzhuo.com/tieba-%25B2%25D8%25D7%25BE-kz-5e356c50fdaa11dd8000793300007833.html

分词服务器程序既是一个windows 服务程序, 服务名称是:cangzhuo fenci service and serve 0.1 (藏拙中文分词服务器)
同时又是一个简单的webserver安装启动后,你可以直接在浏览器中输入 http://127.0.0.1:888 进行使用
同时又还是一个Scoket server 通信端口是 888.

分词服务器安装方式有两种(假设你保存在D盘,如果不是请自行更改):
一、也可以直接通过双击 安装分词服务器.bat 来进行安装
二、d:\fenciserver.exe install 回车即可!(安装后就会自动启动服务)

分词服务器卸载方式是(假设你保存在D盘,如果不是请自行更改):
一、也可以直接通过双击 卸载分词服务器.bat 来进行卸载
二、d:\fenciserver.exe uninstall 回车即可!(卸载后就会自动关闭服务)

另外:为了便于大家的开发使用,
我提供了Delphi、C#、Java、Html、javascript这几中不同语言的使用代码。

详细说明、代码及最新更新信息请参见:http://tieba.cangzhuo.com/tieba-%25B2%25D8%25D7%25BE.html
另词库文件 cangzhuo.dat 请与分词服务器保存在同一目录下,并且不能改名!

使用步骤:
一、下载分词服务器和词库文件,词库文件与分词服务器保存在同一目录下。
二、分词服务器安装,请参考上面的说明。
三、可以开始使用了!

本分词服务器的作用是消除了词库加载的时间,同时支持大规模并发,线程安全!

有任何疑问请与我沟通:QQ 99923309
 
2009-02-18 20:59

开发了一个中文分词服务器(C语言开发+词库+源代码),最大特色可以让javascript来调用!当然也可以让其他任何语言来调用

软件名称:藏拙简易中文分词服务器 作者:藏拙
具体使用时可将 cangzhuo.dat 放在分词服务器相同的目录即可
使用前请先启动分词服务器

藏拙简易中文分词服务器(C语言开发+词库+源代码),最大特色可以让javascript来调用!

高速下载地址1: http://tieba.cangzhuo.com/tieba-%25B2%25D8%25D7%25BE-kz-5e356c50fdaa11dd8000793300007833.html

分词服务器程序既是一个windows 服务程序, 服务名称是:cangzhuo fenci service and serve 0.1 (藏拙中文分词服务器)
同时又是一个简单的webserver安装启动后,你可以直接在浏览器中输入 http://127.0.0.1:888 进行使用
同时又还是一个Scoket server 通信端口是 888.

分词服务器安装方式有两种(假设你保存在D盘,如果不是请自行更改):
一、也可以直接通过双击 安装分词服务器.bat 来进行安装
二、d:\fenciserver.exe install 回车即可!(安装后就会自动启动服务)

分词服务器卸载方式是(假设你保存在D盘,如果不是请自行更改):
一、也可以直接通过双击 卸载分词服务器.bat 来进行卸载
二、d:\fenciserver.exe uninstall 回车即可!(卸载后就会自动关闭服务)

另外:为了便于大家的开发使用,
我提供了Delphi、C#、Java、Html、javascript这几中不同语言的使用代码。

详细说明、代码及最新更新信息请参见:http://tieba.cangzhuo.com/tieba-%25B2%25D8%25D7%25BE.html

另词库文件 cangzhuo.dat 请与分词服务器保存在同一目录下,并且不能改名!

使用步骤:
一、下载分词服务器和词库文件,词库文件与分词服务器保存在同一目录下。
二、分词服务器安装,请参考上面的说明。
三、可以开始使用了!

本分词服务器的作用是消除了词库加载的时间,同时支持大规模并发,线程安全!

有任何疑问请与我沟通:QQ 99923309

 
2009-02-11 18:00

藏拙中文分词系统DLL版出台了,并提供C,java,C#,delphi各种语言的DEMO和开发源码!兄弟们大开眼界的机会到了,所有程序完全由本人独自一人所开发!

Demo及相关代码下载地址:http://tieba.cangzhuo.com/FenCiDll_SourceCode.rar

词库文件cangzhuo.dat下载地址:http://www.800ebay.com/fenci.rar

每种语言的相关详细说明在相应的代码中都有详细注释和说明
每种语言的DEMO均经过详细的测试,没有任何问题!

特殊说明:java版本我用的是:jdk1.5.0_11 另外输出编码为gb2312
编译方式:javac test.java 编译之后即可运行: java test 输入输出一切正常!
java 版本在windows各个平台上测试通过!

以上所有C,java,C#,delphi这几个语言的版本完全由本人亲自撰写并测试通过!

关于藏拙简易分词的详细说明请参见:
http://tieba.cangzhuo.com/tieba-%25B2%25D8%25D7%25BE-kz-217ac780f66411dd800065ed000065ed.html

有任何疑问或建议请与我本人联系:QQ 99923309 电话:13818466795

 
2009-02-09 19:48
用纯C语言开发了一个中文分词系统,速度大约1万字/1秒,大小100K(免费+开源+86万词库+操作示意图+测试用例)

高速下载地址1: http://tieba.cangzhuo.com/tieba-%25B2%25D8%25D7%25BE-kz-217ac780f66411dd800065ed000065ed.html

用法很简单,比如:你把中文分词系统解压后保存到D:\那你直接在 dos 窗口下输入:
d:\cfenci.exe
然后回车就可以了! 启动无需任何参数。

目前系统在进行了大规模分词测试后的大致性能指标如下:
1000字以内的文章完全切分,用时间不超过 10毫秒!
5000字以内的文章完全切分,用时间不超过 500毫秒!
10000字以内的文章完全切分,用时间不超过 1秒!
本版本是简易版,分词准确率为 91.8%,系统稳定性为99.99%,中文分词系统符合工业化的标准!

目前支持中英文混合切分词,各种全角,半角标点符号的过滤!
系统自带词库含有 86万多个中文词汇!
支持词汇的动态添加,新增词汇持久化保存!



有需要提供动态链接库(dll)版本或Linux版本的,可以跟我联络!

注1:词库文件是 cangzhuo.dat 请与分词程序 cfenci.exe 保存在同一目录下,另不得更改文件名,否则系统将无法加载词库!
注2:测试用例文件是 测试内容.txt 仅供参考,无任何其他作用!
注3:藏拙简易分词系统在遇到换行符的时候自动进行切分!所以在输入含有回车换行符的时候就认为输入完毕,开始切分!

我打算等有 200人回复说好的时候就开源!大家要是喜欢就回复哈!
 
     
 
 
其它
 
已有人次访问本空间
 
订阅RSS  什么是RSS?

您也想拥有这样的空间?请点此申请。
     
 
最近访客
 
 

灵修若木

seo_xxf

zhaokaien

悠悠远远悠悠

Freeze_soul

kwb0401

青春寻梦者

tagcool
     


©2009 Baidu