提高OCR软件工作效率两法|私募基金网生活频道

热度0票  浏览3次 【共0条评论】【我要评论 时间:2009年11月01日 17:55

S5~,K[&T@A0『simu001.cn』

t1IaP5{AU wJ0

5s:]/o&MJ%t0OCR软件就是光学输入识别软件,它可以把图片中的文字转换为字符,使用OCR处理印刷文档可以提高录入工作效率。但处理的长达几十页,甚至几千页的文档也是一件非常累人的活儿。笔者这里就和大家分享一些使用OCR软件的经验。私募社区 - 私募股权投资知识学习网 - www.simu001.cniN%K7eA!I3} gG!bc ]{

a R-A.g T.l0??一、减少时间等待,提高扫描识别工效

}1x0h5g n0

rBOaj"p.`@f0??使用OCR软件必经的程序一般是先用OCR自带的扫描功能扫描图片,再进行识别。而当处理较长的文档时等待扫描的时间会很长,如果要充分利用好时间我们可以利用Windows的多任务特性,用一个软件专门负责扫描,同时用一个OCR软件进行识别。私募社区 - 私募股权投资知识学习网 - www.simu001.cn9Po]-Y,Z B Q&Ud&S

私募社区 - 私募股权投资知识学习网 - www.simu001.cn%E!bMssYH I

??扫描软件推荐使用《丹青中英文辨识系统》4.0以上或ACDSEE4.0以上版本,它们的特点是能自动按编号存储图片,换稿后只需按“扫描”按纽继续扫描。OCR软件推荐使用《尚书六号》,它能支持包括JPG图片的多种图片格式,用灰度级和真彩图片时还能自动调节对比度,或者手动调节对比度来提高识别率。尚书六号还能准确识别中文引号、用软回车存档、支持追加存档,可以有效的减少了后续排版处理的工作量。

G*m1})Ts-`S*?0 私募社区 - 私募股权投资知识学习网 - www.simu001.cnTb[4u9Kj3z u*c

??二、弥补软件的不足,快速进行后续排版处理私募社区 - 私募股权投资知识学习网 - www.simu001.cn*},kw4j?E6l

Gr x U0[k3J dz0??要快速进行后续的文档处理,选择合适的OCR软件十分重要,前面也提到,《尚书六号》还能准确识别中文引号、用软回车存档、支持追加存档,有效的减少了后续的工作量。但不管什么软件都有其缺陷,就如《尚书六号》,它在识别“加”字时经常会识别成“力口”,追加存档时,括号、冒号、分号被识别为半角标点,跨页段落中会多出一个硬回车。

'?X$a&w6oF0

jYSEt0f Z8sG7q0??因此,当熟悉使用一个OCR软件之后,可针对其缺陷,用排版软件的功能来弥补其不足,就像“加”字识别为“力口”。因“力口”在文档中出现的几率极小,可以在排版时直接批量替换掉。半角标点则可全部替换为全角标点,对于跨页段落中间的硬回车,可在碰到跨页段落时时,在追加存档时在页间插入一个特殊记号,在排版处理时连同硬回车一并替换为空。 『simu001.cn』私募社区 - 私募股权投资知识学习网 - www.simu001.cnH j.{,\2E ts

顶:0 踩:0
对本文中的事件或人物打分:
当前平均分:0 (0次打分)
对本篇资讯内容的质量打分:
当前平均分:0 (0次打分)
上一篇 下一篇
发表评论
换一张

网友评论仅供网友表达个人看法,并不表明本网同意其观点或证实其描述。

查看全部回复【已有0位网友发表了看法】

网络资源