C# 使用Tesseract-OCR-v5.0，实现验证码，中文，身份证识别

2021-01-16 09:13

阅读：811

标签：使用 false character wrap data- == 优化 set 获取

OCR(Optical Character Recognition)：光学字符识别，是指对图片文件中的文字进行分析识别，获取的过程。
Tesseract：开源的OCR识别引擎，初期Tesseract引擎由HP实验室研发，后来贡献给了开源软件业，后经由Google进行改进，消除bug，优化，重新发布。项目地址：https://github.com/tesseract-ocr

本文使用最新版本Tesseract-OCR-v5.0，实现验证码，中文，身份证识别，效果如下图

技术图片 ?

演示程序结构
在vs2019创建WinForm窗体程序，添加相应的控件

技术图片 ?

程序执行

使用Process类，调用tesseract.exe执行图片识别。注意这个要执行成功，要先安装tesseract-ocr。具体安装，设置环境变量请看上一文章的第1到3步骤。

技术图片 ?

总结

本文演示了，C# 使用Tesseract-OCR-v5.0，实现验证码，中文，身份证识别。如果想提高图像的识别率，参考上一文章。使用Tesseract-OCR基本上可以实现简单识别了。

技术图片 ?

C# 使用Tesseract-OCR-v5.0，实现验证码，中文，身份证识别

标签：使用 false character wrap data- == 优化 set 获取

原文地址：https://www.cnblogs.com/channel9/p/12228457.html

上一篇：C#不引用IWshRuntimeLibrary获取快捷方式目标位置

下一篇：Windows API——文件处理函数

文章来自：搜素材网的编程语言模块，转载请注明文章出处。
文章标题：C# 使用Tesseract-OCR-v5.0，实现验证码，中文，身份证识别
文章链接：http://soscw.com/index.php/essay/42650.html

评论

亲，登录后才可以留言！

关于我们 | 版权声明 | 常见问题 | 素材投稿 | 联系我们 | 网站地图 |

搜素材网素材除本站原创外均由用户分享，若发现权利被侵害，请联系及时联系我们，我们会在第一时间进行处理。

特别说明：本站所有资源除本站原创外仅供学习与参考，请勿用于商业用途,如有侵犯您的版权请联系客服服务QQ：

点击这里给我发消息

Copyright © 2025 soscw.com 搜素材网素材网版权所有蜀ICP备18015633号-1