| 扫描OCR之经验(2) |
|
· 2002-9-9 · 浏览人数:287
|
| 请记下上海电脑维修上门服务电话:021-61121021,以备急用!(嘉定,青浦,普陀,闵行,松江)
|
5.存盘。
扫描出来的图像存盘还有讲究?其实也没什么,存为TIF格式就行。
6.OCR软件操作(不同软件可能有区别)。
打开已扫描好的图像文件,先将图像旋转,直至横排正文。然后进行图像倾斜校正、版面分析,版面分析后要将不是‘横排正文’的版块设置成‘横排正文’,还有,版面分析后,最好再将各板块倾斜校正一下。最后进行识别工作。
7.编辑。
识别后出现编辑窗口,这时打开汉字输入法,不要理会识别系统对可疑字的相似字提示(那样会浪费时间),直接参照修改参照行(又称浮动跟踪窗口,浮动在编辑窗口之内当前行之上或之下,显示了当前行的原始图象信息)进行修改。修改完,OCR工作也就结束了。
8.字体的区别。
经过多次OCR工作,我发现软件对不同字体的识别效果会有所不同,其中对楷体的识别效果最好,仿宋和宋体次之,圆体(特别是细圆体)的识别效果最差。
9.报纸的扫描识别。
由于报纸很薄且大部分纸质不高,导致扫描仪上盖板不能完全压住报纸(有缝隙),所以一般情况下报纸的扫描识别效果没有杂志的效果好。我的解决办法是在报纸上压一至两本16K的杂志,效果还不错。
|
|
|
| |
·连载文章 ·扫描OCR之经验-连载 ·扫描OCR之经验(2)
|
|
|
|
|
|
发表评语
|
| 文章原网址:http://www.yesky.com/20010903/194941.shtml |
管理通道
|