我如何获得一些文本的坐标是图像的一部分?

问题描述:

我想根据放置在其中的各种文本标记来剪切图像。标记的字体/大小取决于我。我如何获得一些文本的坐标是图像的一部分?

我知道商业OCR包提供这在他们的API,但我希望我可以自己编码。

理想情况下,我不必像素去像素和比较标记文本的图像。

我擅长用C++/C#,Java和PHP和其他语言,其中这样的库中存在...

+2

OCR肯定需要深刻的信号理论知识。如果你甚至不知道从哪里开始,那么你不可能自己写这个。你为什么不想使用外部'API'? – ereOn 2010-07-05 13:31:12

如果你想要做一个真正sufisticated的解决方案,你可以使用Hough变换。它通常用于增强现实的东西 - 那里有必要在图像中找到某个标记。 Ofc你将不得不改变你的标记点,这可能吗? ;-) 霍夫会给你你的标记线的位置,因此你要切出的区域。

这是一个关于霍夫的链接,但还有很多其他的。

Hough

或者这一个

Wiki

理想的情况下我也不会去像素 像素和比较反对的 标记文本的图像。

那么,如果你想找到标记图像,那么这正是你必须做的。

这是一个想法...将标记文本设置为特定颜色,然后处理背景图像以确保它没有任何这种颜色的像素。在这一点上找到标记应该变得容易得多。

条形码比文本标记更易于检测。您始终可以将它们放在一起,条形码用于自动位置检测以及供用户使用的文本。

A fiduciary marker会比文字更好。这就是他们用于增强现实等等。

如果文字总是相同的大小,形状和方向相同,则可以使用normalized cross-correlation

“理想情况下,我不必将像素映射到像素,并与标记文本的图像进行比较。”

那么你该怎么做呢?你只会搜索图像的一部分?