史上最全的支付宝二维码扫码优化技术方案

史上最全的支付宝二维码扫码优化技术方案](https://upload-images.jianshu.io/upload_images/23124486-f13a636642fe1e68.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

优化策略

  • 通过修改长宽比的判定规则,长宽比将不再受先后顺序影响;

  • 对于已知长度,修改规则将可接受的宽度范围扩大,增强长宽比的耐受;

在我们对比测试集中,识别率提高了 1% 左右。

策略 2:新增 1:5:1 桩点识别模式模式

在一张图片中,要找到二维码,关键在找二维码特征定位点:

史上最全的支付宝二维码扫码优化技术方案

三个角的回字型图案,这就是二维码特征定位点。中间区域的黑白色块比例是 1:1:3:1:1

史上最全的支付宝二维码扫码优化技术方案

以往的扫码算法,桩点识别是通过状态机 查找 11311 模式后 取中间位置确定 x 位置 (此时扫描线在第一行 11311 比例处) 在 x 位置纵向搜索 11311 模式, 确定 y 位置再以 (x,y) 位置横向搜索 11311 比例,修正 x 位置。这种模式在桩点污损的情况下,识别能力较差只要在任何一次 11311 模式搜索中遇到干扰点,哪怕是一个像素的椒盐噪声也能使桩点查找失败。(支付宝蓝的桩点,会在蓝色区域产生大量噪点,导致识别率低下)

史上最全的支付宝二维码扫码优化技术方案

为此,我们新增了一种桩点识别方式。在状态机达到 151 模式的时候,开始尝试确认桩点。(此时扫描线在第一行 151 比例处)。

史上最全的支付宝二维码扫码优化技术方案

优化效果

  • 新的查找方法将不再受桩点中心或边缘部分被污损的影响,支付宝蓝色桩点码识别率明显提升;

  • 修改后识别率整体提升了接近 1%,但识别失败的耗时有所提升;

策略 3: 添加一种对角线过滤规则

在枚举所有可能桩点组合 O(N^3) 之前,对所有可疑桩点进行一次对角线检查过滤。由于桩点对角线也应该满足 11311 模式 ,用这个规则做一次过滤可疑有效减少运算量,也就有效降低了识别成功和失败的耗时。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-GoSLXL5d-1589878852400)(https://upload-images.jianshu.io/upload_images/23124486-8117ed98f36bd45c.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)]

策略 4: 基于 Logistic Regression 的二维码分类器

在以往的扫码算法中在拿到三个桩点后,基于夹角,长度偏差,单位长度查三个数值,用简单公式计算得到阈值,判断是否为可能的二维码,误判概率较大。

为此,我们引入机器学习中的逻辑回归算法模型。基于支付宝丰富的二维码数据集,训练出逻辑回归模型,作为二维码分类器,明显降低了误判概率,也将明显降低无二维码时识别失败的耗时。

策略 5: 修改跳行扫描的间隔数

由于输入的相机帧分辨率高,像素点多,运算量大,以往的扫码算法在水平跟垂直方向跳行采样进行计算。但在实际运算中,由于跳过了太多列,错过了 11311 模式中某些 1 位置的点,导致桩点查找失败。

我们通过将跳行计算行数修改为可配置项,通过线上 AB 灰度测试得到最合适的跳行策略,整体配置此跳行策略后,识别率得到明显提升。

上述优化在测试集的表现

史上最全的支付宝二维码扫码优化技术方案

综上优化,扫码核心识别能力,在 7744 张图片测试集上提高了 6.95 个百分点。

特殊策略优化

除此上述通用扫码优化之外,我们还对特殊场景扫码能力进行提高。

1. 畸变?不怕不怕!

线下场景复杂多变。饮料瓶身上变形的二维码、超市小票卷起边角弯曲的二维码、路边小贩凹凸不平甚至折叠的二维码…这些畸变的二维码容易增加识别难度,甚至导致识别失败。以往的扫码算法抗畸变策略中,先用透视变换关系建立映射关系。优点是:适应性好,满足大多数应用场景。 不足也明显:对 Version 1 的码,因为映射关系退化为仿射变换,效果较差,手机必须和码平面平行才能方便识别。当物料表面不是平面的时候,效果较差。

优化策略

  • 假设采样坐标系到二维码坐标系遵守一个更复杂的映射关系,并且假设物料表面的卷曲较小,通过使用二次函数可以较好的拟合这个映射关系;

  • 实际发票上的二维码版本普遍大于等于 7,高版本二维码具有多个辅助定位点,更利于构造二次映射表;

  • 基于以上推论,使用新的映射代替旧的透视变换,进行更精准的采样;

用新的策略,发票码这个场景的二维码识别能力提升明显。

史上最全的支付宝二维码扫码优化技术方案

注意:由于采用了增强算法,请对准二维码稍作等待。

史上最全的支付宝二维码扫码优化技术方案

2. 容错识别能力提升

商户或者供应商生成二维码后,通常会在二维码的中间部分贴上 Logo,这部分有可能会使二维码 Decode 时出错。

优化策略:
对于采样后拿到的 BitMatrix,对于中间部分一块矩形区域内的点,采用某些策略来改变中间点的值,使它能够通过容错边界的检查。目前采用两种策略,第一种是反转,第二种是每一个点随机取值。目前所取的矩形区域是长、宽的四分之一。

通过此项优化后,扫码的容错能力也得到明显提升。

史上最全的支付宝二维码扫码优化技术方案

三、更小的识别耗时

GPU 计算二值化,降低识别单帧耗时
所谓图像二值化就是将图像上的像素点的灰度值设置为 0 或 255,也就是将整个图像呈现出明显的只有黑和白的视觉效果。下图左边为原图,右边是二值化处理过的图。

史上最全的支付宝二维码扫码优化技术方案

在扫码算法解码前,有二值化计算,图像的二值化计算能使图像中数据量大为减少,并弱化图像模糊、颜色对比度不强、光线过强 / 太弱、图像污损等情况下其他信息的干扰,更利于检测识别。

传统算法是在 CPU 上进行二值化运算,非常消耗 CPU 资源,但其实 GPU 更擅长大规模并行计算,所以我们选择使用 GPU 来做二值化计算。在安卓平台上使用 RenderScript,iOS 平台上使用 Metal,都是很底层的框架。

优化结果

1.iOS: 统一电池、角度、光线等环境变量, 在 iPhone6 上测试扫码核心 5 种摄像头二值化算法。表现如下:

史上最全的支付宝二维码扫码优化技术方案

史上最全的支付宝二维码扫码优化技术方案

史上最全的支付宝二维码扫码优化技术方案

可以看出,在图像二值化方面 Metal 有相当高的优势,相比原来的单纯 CPU 处理快了接近 150%, 同时降低了近 50 个百分点的 CPU 资源。

2.Android 机型众多,我们抽取了线上数据,可以看到 GPU 在二值化处理中显著降低了单帧耗时 30% 以上。

史上最全的支付宝二维码扫码优化技术方案

史上最全的支付宝二维码扫码优化技术方案

四、调度维稳

线下物料千奇百怪,扫码算法为了解决一些不理想的场景,如二维码有遮挡、污损、模糊或角度很不好的特殊情况,需要使用一些比较耗时但比较强大的算法,但普通情况不需要这些算法。所以,我们对识码算法定了优先级,通过时间推移、跳帧触发等方式调度:

优先级: 暂定高中低三个优先级。

  • 高优先级 每帧执行
  • 中优先级 降帧率执行
  • 低优先级 低帧率执行
  • 不同优先级的功能执行时机可配置。 不同功能属于哪个优先级可配置

特殊场景算法:

为码核心的一种特定能力,如:

  • 反色码识别能力
  • 容错边界码识别能力
  • 污损桩点识别能力等
  • 条码识别能力

看完以上这些,你 get 了吗?还有什么不懂的问题,欢迎在下方的留言区与我们交流!技术哥哥们在这里等着你哦!

本文转载自公众号蚂蚁金服科技(ID:Ant-Techfin)。

原文链接:

https://mp.weixin.qq.com/s/pB-15DdTwrf5_tp0wZoYaw

服务推荐