是否可以通过编程方式从视频中提取文本?

问题描述:

我知道我们可以使用ocr.But我需要提取出现在视频中的文字,就像那些在视频lectures.Or换句话说,是否有可能抄写到possible.If所以text.Is视频图像从文本中提取请教我如何用java或任何其他语言来做到这一点。是否可以通过编程方式从视频中提取文本?

我天真的Linux驱动的做法是:

  • 检查:确实在我的操作系统OCR工作?
  • 使用普通转轮从视频中提取一些样本。每个跑步者(例如VLC)都有这样的功能。
  • 检查:从图像文件中提取文本的OCR有多好?
  • 检查:从图像文件中提取视频所提供背景的OCR有多好?
  • 获得软件从批量视频中提取帧 - >还有它允许创建联系人表各种软件,这也应该是能够在abitrary个时刻提取全分辨率图像进行的视频。完整的解决方案可能是必要的,以允许OCR工作。如果您知道,也许您可​​以先剪裁图像,将文本定位在固定的矩形中。
  • 最糟糕的情况下,你让OCR分析电影的每一帧。

这主要取决于你的OCR是如何好,如何快速的工作。对我来说其他一切都是非常成熟的软件。该语言可能是bash-shell-script,因为这些组件可能是单独的Linux程序。正如我所提到的,它取决于您的OCR的质量,性能和运行时环境。

这主要取决于你的OCR是如何好,如何快速的工作。

同意。作为起点,Google Cloud vision OCR或OCRspace online OCR在“背景文本”情况下工作得很好。我用它来自己提取字幕。

要测试OCR质量是否足以满足您的使用案例,可以使用Copyfish Chrome/Firefox插件(来自ocr.space)。