Tesseract培训：只有几个字

我需要训练tesseract只承认十个字。
单词是药品的名称，如：Atrasil，Spectful
由于使用的字体是相当常见的，我试图解压eng.traineddata，用这些词replacefreq-dawg和word-dawg。然后我把它们重新装入一个新的训练数据，不幸的是它似乎不能很好地工作。匹配的结果仍然是不可接受的，即使使用从简单文件中获取的图像，我也无法使用它们。
有没有办法实现良好的匹配？我是否需要从解包训练数据中删除其他文件？