tesseract_ocr 字符识别基础及训练字库、合并字库

admin | 屏幕取词 | 2016-09-11
最近公司让我做文字串识别,通过查阅资料,谷歌的开源框架 tesseract-ocr可以帮助我们进行识别图像,文字等等,tesseract可以识别多种语言(一些常用的语言),多种图片格式,非常强大。 首先体验一下tesseract的强大功能,先安装 tesseract_ocr ,下载地址为http://code.google.com/p/tesseract-ocr/,请务必下载3.0.1版本,我前面下的最新3.0.2版本,生... [阅读全文]
ė4,872 浏览数 6没有评论 0

wps的range对象

admin | C++, 屏幕取词 | 2013-05-21
环境:xp sp3,vs2008,wps2012,word2010 如果直接设置Range对象的Start或End属性可能会报异常,所以使用SetRange方法或者让Start小于等于Range的End值 word2010直接设置Start的值超过End不会跑出异常,但是会将End=Start C++ void Ctest09242Dlg::OnBnClickedOk() { // TODO: 在此添加控件通知处理程序代码 ::CoInitialize(NU... [阅读全文]
ė2,520 浏览数 6没有评论 0

基于VS 2005环境的MS office自动化开发之熟悉环境篇

admin | Windows api, 屏幕取词 | 2013-05-20
进行MS office自动化开发最好的工具或许是VBA,但是很多时候我们的应用系统往往和MS office的文件打交道,比如生成word文件和EXCEL报表等等,因此学习一下主流的开发工具关于MS office自动化的知识还是很有必要的。从今天起,我将推出一些基于VS 2005环境的MS office自动化开发的一些入门文章。第一篇是关于熟悉开发环境。 这次我使用的是VS C++ 2005。... [阅读全文]
ė2,415 浏览数 6没有评论 0

How to set text on “another” win32 application

admin | 屏幕取词 | 2013-05-15
I am using spy++ and see that the control I have has the decimal that matches the hex(after conversion of course) in spy++ and I see the parent window matches as well so I have the IntPtr for a Label and IntPtr for the form/window but my SendMessage is not working to change the text in the target application. Another approach... [阅读全文]
ė2,574 浏览数 6没有评论 0

How to get the password text in a text with password property from another process using C++ – 用C++如何从不同进程获取密码框文本

admin | 屏幕取词 | 2013-05-15
C++ CString str; CString strTemp; char buf[1024]; char cClassName[1024]; LONG lWndID; CString strText; ::GetClassName(hwnd,(LPSTR)&cClassName,1024); strTemp.Format("%s",cClassName); if("Edit" == strTemp) { LONG lngWndStype; lngWndStype = GetWindowLong(hwnd,GWL_STYLE); if(lng... [阅读全文]
ė5,448 浏览数 6没有评论 0

How can I get the text of another process’ window?

admin | 屏幕取词 | 2013-05-15
As you’ve probably found out by now, calling GetWindowText() won’t work most of the time. The reason for this is that GetWindowText() won’t do the necessary translation between the address spaces of the two processes. This is required because address that the calling process passes to GetWindowText() in the ... [阅读全文]
ė4,434 浏览数 6没有评论 0

Capture2Text

admin | 屏幕取词 | 2013-04-19
Capture2Text Contents What is Capture2Text? Download How to Install OCR Speech Recognition Output Options Configuration Substitutions Command Line Options What is Capture2Text? Capture2Text enables users to do the following: Optical Character Recognition (OCR) Allows the user to quickly snapshot a small portion of the scr... [阅读全文]
ė5,873 浏览数 6没有评论 0

利用开源程序(ImageMagick+tesseract-ocr)实现图像验证码识别

admin | 屏幕取词 | 2013-04-18
开源的力量是巨大的,借助于斯,我这个对验证码一窍不通的人也可以识别出很多基础的验证码了。 ————————————————–低调的分割线———————————————&#... [阅读全文]
ė10,598 浏览数 6没有评论 0

开源OCR引擎Tesseract

admin | 屏幕取词 | 2013-04-18
知名的开源OCR引擎Tesseract 3.0版本日前发布,可以在项目网站下载:http://code.google.com/p/tesseract-ocr, 新版本支持中文,中文语言包定义http://code.google.com/p/tesseract-ocr/downloads/detail?name=chi_sim.traineddata.gz。 Tesseract是Ray Smith于 1985到1995年间在惠普布里斯托实验室开发的一个OCR引擎,曾经在1995 UNLV精确度测试中名列... [阅读全文]
ė3,955 浏览数 61条评论 0

Tesseract OCR开源项目

admin | 屏幕取词 | 2013-04-18
最近,项目中需要使用基于图像识别验证码的技术,初步探索尝试了一下开源的Tesseract OCR项目。该项目简介如下: This package contains the Tesseract Open Source OCR Engine. Orignally developed at Hewlett Packard Laboratories Bristol and at Hewlett Packard Co, Greeley Colorado. The Tesseract OCR engine was one of the top 3 engines in... [阅读全文]
ė5,195 浏览数 6没有评论 0

Ɣ回顶部

无觅相关文章插件,快速提升流量