Tesseract培训:只有几个字

我需要训练tesseract只承认十个字。
单词是药品的名称,如:Atrasil,Spectful
由于使用的字体是相当常见的,我试图解压eng.traineddata,用这些词replacefreq-dawg和word-dawg。 然后我把它们重新装入一个新的训练数据,不幸的是它似乎不能很好地工作。 匹配的结果仍然是不可接受的,即使使用从简单文件中获取的图像,我也无法使用它们。
有没有办法实现良好的匹配? 我是否需要从解包训练数据中删除其他文件?

Interesting Posts