我如何获得一些文本的坐标是图像的一部分?
问题描述:
我想根据放置在其中的各种文本标记来剪切图像。标记的字体/大小取决于我。我如何获得一些文本的坐标是图像的一部分?
我知道商业OCR包提供这在他们的API,但我希望我可以自己编码。
理想情况下,我不必像素去像素和比较标记文本的图像。
我擅长用C++/C#,Java和PHP和其他语言,其中这样的库中存在...
答
理想的情况下我也不会去像素 像素和比较反对的 标记文本的图像。
那么,如果你想找到标记图像,那么这正是你必须做的。
这是一个想法...将标记文本设置为特定颜色,然后处理背景图像以确保它没有任何这种颜色的像素。在这一点上找到标记应该变得容易得多。
答
条形码比文本标记更易于检测。您始终可以将它们放在一起,条形码用于自动位置检测以及供用户使用的文本。
答
A fiduciary marker会比文字更好。这就是他们用于增强现实等等。
如果文字总是相同的大小,形状和方向相同,则可以使用normalized cross-correlation。
“理想情况下,我不必将像素映射到像素,并与标记文本的图像进行比较。”
那么你该怎么做呢?你只会搜索图像的一部分?
OCR肯定需要深刻的信号理论知识。如果你甚至不知道从哪里开始,那么你不可能自己写这个。你为什么不想使用外部'API'? – ereOn 2010-07-05 13:31:12