使用OCR解析和分析收据

使用OCR解析和分析收据

问题描述:

我正在使用OCR读取收据并解析它以获取重要信息(如商家名称,日期,金额等)的项目。我正在使用由提供的vision API谷歌解析图像,并以JSON格式获取文本。现在我想进入下一步,我可以解析文本,并尝试通过它确定位置或表达式的信息。现在我可以从简单货币和数字字符串中提取金额。从这一点,我应该在哪里寻找分析文本以提取任何信息(试图开发一个可以从任何类型的收据中提取信息的系统)。即使是小小的领导也会帮助我前进。使用OCR解析和分析收据

谢谢。

我开始通过查找“Date”,“Amount”,“total”,“Rs”等令牌来从返回的文本格式中提取信息。我开发了一种算法,将实际数量中找到的不同数字排序。此外,我通过删除象(“the”,“in”,“welcome”等)的令牌来获得大多数情况下的商户名称。

+0

目前,我在此也是如此。你能解释更多关于你的排名算法吗? @sandy –

+0

嗨@DharmaSaputra,我正在使用正则表达式来检查字符串是否形成数量。与“Total”,“amount”等关键词最接近的字符串被赋予更高的等级。 – sandy