开启左侧

ocr求助,字符大小不一、打印质量差

[复制链接]
亮啊 发表于 2021-10-27 09:49:43 | 显示全部楼层 |阅读模式
本帖最后由 亮啊 于 2021-10-27 09:49 编辑

我希望能用一套参数处理所有图片,目前基本的预处理是emphasize + scale_image_max + dyn_threshold,这样可以识别绝大部分字符,但是还有一些问题,希望dalao们帮忙。
由于打印的问题,2图的"A"和"M"很难用一次threshold识别出一个区域,我用的方法是closing或dilation一次。但是这样会造成1图的"9-"粘连。
用partition_dynamic可解决部分粘连的问题,但同时会使2图的"A"或"M"分开。由于字体大小不一样,我参数调了很久效果都不好。3图的"2"就毫无头绪了。。。

【2图】

【2图】

【1图】

【1图】

【3图】

【3图】
绝地武士 发表于 2021-10-27 17:06:29 | 显示全部楼层
OCR识别差,你可以提前录入到数据库中搜索类似的接近也是可以的。其次,上面的一维码也是可以识别,一起参与判断。
如果没有条码的OCR就会棘手些,因为有些打印效果不好,通过算法都无法有效,这个时候可以参考我说的第一点,通过提前录入的数据库匹配规则、数据记录之类的进行参考。
 楼主| 亮啊 发表于 2021-10-28 08:35:24 | 显示全部楼层
绝地武士 发表于 2021-10-27 17:06
OCR识别差,你可以提前录入到数据库中搜索类似的接近也是可以的。其次,上面的一维码也是可以识别,一起参 ...

感谢回复。1. 由于某些原因,条码和文字不是对应的;2. 如何从数据库中搜索类似的可以详细讲讲吗,我是halcon新手,还没入门的那种新。
绝地武士 发表于 2021-10-28 09:22:31 | 显示全部楼层
亮啊 发表于 2021-10-28 08:35
感谢回复。1. 由于某些原因,条码和文字不是对应的;2. 如何从数据库中搜索类似的可以详细讲讲吗,我是ha ...

条码和文字不对应就要想办法了,比如利用模板大致识别出轮廓对应一组正确数据来识别,比如识别出20*11018,这样的数字,可以做数据库模糊查找,把类似20211018、20111018等类似的检索出来,再多次精准匹配,应该可以。
芜湖小肖 发表于 2021-11-4 09:40:25 | 显示全部楼层
带缺陷字符,还是走深度学习OCR比较靠谱
QQ截图20211104093337.png
QQ截图20211104093429.png
QQ截图20211104093757.png
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表