博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Java OCR(使用Tess4J)
阅读量:6264 次
发布时间:2019-06-22

本文共 1059 字,大约阅读时间需要 3 分钟。

hot3.png

 最近突然对手机上的OCR功能比较感兴趣,于是乎研究了一下Java OCR技术,在Google上找到了,最后找到了其对应的Java API版本 ,中间调试过程异常曲折,最后花了半天时间终于把它给调试成功了,跟大家分享一下!

一 下载相关的jar包

1.下载Tess4J jar,网址:http://sourceforge.net/projects/tess4j/

2.如果你使用的JVM 64位的,还需要下载 liblept168.dll、libtesseract302.dll的64位文件,下载地址:https://github.com/charlesw/tesseract/tree/master/src/lib/TesseractOcr/x64

二 项目整合

先看看最后整合成功的目录结构,开发环境:Win8.1 64位 + Eclipse 4.2 + JDK 7 64位,工程目录结构如下:

       src目录下是 Tess4J的源码目录,test目录 是Tess4J官方提供的demo目录,并将 liblept168.dll、libtesseract302.dll,gsdll64.dll(pdf转换需要用到此文件) 三个文件拷贝到 src根目录下。

三 测试代码

[java] 

  1. /** 

  2.      * Test of doOCR method, of class Tesseract1. 

  3.      */  

  4.        

  5.     public void testDoOCR_File() throws Exception {  

  6.         System.out.println("doOCR on a PNG image");  

  7.         File imageFile = new File("eurotext.png");  

  8.         String expResult = "The (quick) [brown] {fox} jumps!\nOver the $43,456.78 <lazy> #90 dog";  

  9.         String result = instance.doOCR(imageFile);  

  10.         System.out.println(result);  

  11.         assertEquals(expResult, result.substring(0, expResult.length()));  

  12.     }  

Demo下载地址:http://download.csdn.net/detail/fx_sky/7988469

转载于:https://my.oschina.net/airship/blog/503994

你可能感兴趣的文章
微软MVP社区巡讲
查看>>
总结一下,MariaDB 10(MySQL5.6企业版分支)的主要新特性
查看>>
MS UC 2013-0-虚拟机-标准化-部署-2-模板机-制作-3-安装-Tool
查看>>
IDS与IPS的区别
查看>>
初试Windows 8 RTM
查看>>
Linux 下rpm包搭建LAMP环境
查看>>
Windows Server 2016-Nano Server介绍
查看>>
未来架构师的平台战略范例(4)_大数据
查看>>
Grizzly学习笔记(二)
查看>>
思科路由器动态VTI IPSec***配置
查看>>
***S启动时遇到1053错误
查看>>
CentOS7.5 使用 kubeadm 安装配置 Kubernetes1.12(四)
查看>>
shell脚本实现对系统的自动分区
查看>>
Tokyo Tyrant基本规范(5)--教程
查看>>
理解图形化执行计划 -- 第3部分:分析执行计划
查看>>
90后美女的全能测试蜕变之路
查看>>
audit.rules
查看>>
Windows 10企业批量部署实战之WDS配置
查看>>
百元百鸡问题
查看>>
Microsoft System Center 2012部署(二)
查看>>