提取图片里的文字为文本,使用CAJViewer文字识别

首先把图片保存为PDF格式,简单的方法比如你装了Office 2007,打开Word,插入图片,选择你要识别文字的图片插入,把此文档另存为,保存类型选择PDF
下载 CAJViewer http://cajviewer.cnki.net/download.html
直接下载地址 http://viewer.d.cnki.net/CAJViewer%207.2.self.exe
运行CAJViewer,文件-打开,选择刚才转化完的PDF文件
菜单栏里选择“工具-文字识别”,然后在要识别的文字处,拉一个框,此框内的文件就会被识别