文章列表
 
您正在查看 "Image Processing" 分类下的文章

2009年08月28日 星期五 22:40

针对基于不同语言的文字图像的识别,Tesseract OCR是可以通过样本数据来训练引擎的识别能力(详细内容可以参考http://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract),那么就需要获取到一些指定的样本数据,比如Tesseract OCR默认支持的英文语言、TIF格式图像。

wx-tera是一款可以将PDF文件转换成为TIF格式图像文件的小程序,而且主要是提供对TIF格式图像中的文字进行编辑和验证(后面还会介绍它的使用方法),该程序发布于

 
2009年08月28日 星期五 18:00

最近,项目中需要使用基于图像识别验证码的技术,初步探索尝试了一下开源的Tesseract OCR项目。该项目简介如下:

This package contains the Tesseract Open Source OCR Engine. Orignally developed at Hewlett Packard Laboratories Bristol and at Hewlett Packard Co, Greeley Colorado.

The Tesseract OCR engine was one of the top 3 engines in the 1995 UNLV Accuracy test. Between 1995 and 2006 it had little work done on it, but it is probably one of the most accurate open source OCR engines

 
 
   
 
 
文章存档
 
     
 
最新文章评论
  

这个不错,很详细,对于我们初学spring框架的人不错的帮助,感谢楼主分享
 

最近用,学习了~
 

[表情]
 

[表情]
 

对于Ubuntu用户,有一个简单的办法: 将该用户添加到admin用户组,即 usermod -G adm
   
帮助中心 | 空间客服 | 投诉中心 | 空间协议
©2012 Baidu