ocr字符识别训练

祝禹弢 · 发表于 2019-3-9 19:20:42

dev_display (ImageReduced)
rgb1_to_gray (ImageReduced, GrayImage1)
threshold (GrayImage1, Regions1, 191, 241)
dilation_circle (Regions1, RegionDilation1, 13)
dev_display (RegionDilation1)
connection (RegionDilation1, ConnectedRegions1)
*注：一定先输入膨胀后带不同连通域的region
intersection (ConnectedRegions1, Regions1, RegionIntersection1)
*按第一点排序
sort_region (RegionIntersection1, SortedRegions, 'character', 'true', 'column')
*计算连通域个数
count_obj (SortedRegions, Number)
*for循环编号
*区域、图像、xld索引数组都是从1开始，而字符索引从0开始，所以下面是word[i-1]
for i:=1 to Number by 1
select_obj (SortedRegions, SingleWord, i)
endfor
*形成trf文件，字符区域和字符关联
words:=['数','学']
TrainFile:='C://Users/Public/Documents/MVTec/HALCON-12.0/zyt/ocr字符训练/√单字符多个连通域/word0.trf'
for i:=1 to Number by 1
select_obj (SortedRegions, SingleWord, i)
*write_ocr
* 当前连通域转正后的图像对应文字保存路径
append_ocr_trainf (SingleWord, ImageAffinTrans,words[i-1], 'word0')
endfor
FontFile:='C://Users/Public/Documents/MVTec/HALCON-12.0/zyt/ocr字符训练/√单字符多个连通域/word0.omc'
* 读文件路径文件名字文件个数
read_ocr_trainf_names (TrainFile, CharacterNames, CharacterCount)
Numhidden:=20
*1创建神经网络分类器，被分割字符的宽高特征读取的文件（上面的CharacterNames）句柄
create_ocr_class_mlp (10, 30, 'constant', 'default', CharacterNames, 80, 'none', 10, 42, OCRHandle)
*2训练分类器输入句柄和文件路径进行训练
trainf_ocr_class_mlp (OCRHandle, TrainFile, 200, 1, 0.01, Error, ErrorLog)
*3保存omc文件写的路径
write_ocr_class_mlp (OCRHandle, FontFile)
*4清楚句柄
clear_ocr_class_mlp (OCRHandle)
read_ocr_class_mlp (FontFile, OCRHandle1)
do_ocr_multi_class_mlp (SingleWord, ImageAffinTrans, OCRHandle1, Class, Confidence)

复制代码

这是抠图之后的代码，“数”字并没有被识别

zrp785962235 · 发表于 2019-3-10 15:35:28

要腐蚀一下，将米女反文旁分开，在创建字典

祝禹弢 · 发表于 2019-3-10 20:13:53

zrp785962235 发表于 2019-3-10 15:35
要腐蚀一下，将米女反文旁分开，在创建字典

您好，分开是指的分成不同的连通域吗？还有一个问题就是，如果分开创建字典，如何让机器将“数”和“米女反文旁”联系起来呢？

Criss · 发表于 2019-3-11 10:45:18

建议中文训练把整个字符膨胀在和原来的区域做交集，求出整体字体区域做训练！楼主可以参考本站的车牌识别系统https://www.51halcon.com/thread-922-1-1.html

祝禹弢 · 发表于 2019-3-11 15:58:04

Criss 发表于 2019-3-11 10:45
建议中文训练把整个字符膨胀在和原来的区域做交集，求出整体字体区域做训练！楼主可以参考本站的车牌识别系 ...

好的，谢谢指导！

zrp785962235 · 发表于 2019-3-15 09:16:51

祝禹弢发表于 2019-3-10 20:13
您好，分开是指的分成不同的连通域吗？还有一个问题就是，如果分开创建字典，如何让机器将“数”和“米 ...

首先分开区域不能相连，分开后再组合就好了啊