我如何获得一些文本的坐标是图像的一部分？

问题描述：

我想根据放置在其中的各种文本标记来剪切图像。标记的字体/大小取决于我。我如何获得一些文本的坐标是图像的一部分？

我知道商业OCR包提供这在他们的API，但我希望我可以自己编码。

理想情况下，我不必像素去像素和比较标记文本的图像。

我擅长用C++/C＃，Java和PHP和其他语言，其中这样的库中存在...

OCR肯定需要深刻的信号理论知识。如果你甚至不知道从哪里开始，那么你不可能自己写这个。你为什么不想使用外部'API'？ – ereOn 2010-07-05 13:31:12

答

如果你想要做一个真正sufisticated的解决方案，你可以使用Hough变换。它通常用于增强现实的东西 - 那里有必要在图像中找到某个标记。 Ofc你将不得不改变你的标记点，这可能吗？ ;-) 霍夫会给你你的标记线的位置，因此你要切出的区域。

这是一个关于霍夫的链接，但还有很多其他的。

或者这一个

答

理想的情况下我也不会去像素像素和比较反对的标记文本的图像。

那么，如果你想找到标记图像，那么这正是你必须做的。

这是一个想法...将标记文本设置为特定颜色，然后处理背景图像以确保它没有任何这种颜色的像素。在这一点上找到标记应该变得容易得多。

答

条形码比文本标记更易于检测。您始终可以将它们放在一起，条形码用于自动位置检测以及供用户使用的文本。

答

A fiduciary marker会比文字更好。这就是他们用于增强现实等等。

如果文字总是相同的大小，形状和方向相同，则可以使用normalized cross-correlation。

“理想情况下，我不必将像素映射到像素，并与标记文本的图像进行比较。”

那么你该怎么做呢？你只会搜索图像的一部分？