增值税进项发票采集分析及进项发票采集API接口
1.业务分析
增值税发票是很重要的数据,例如企业或单位的财务会计税务会计,都需要拿到企业或单位的进项和销项发票数据,进行财务分析,报税。甚至在某些业务场景下,需要拿到相关业务往来的发票数据对企业的财务进行分析,评定企业的信用等级,以便及时掌握管控业务往来企业单位的风险(在风投和网贷业务中至关重要)。
增值税发票包括销项发票数据和进行数据,其中进项发票数据用在增值抵扣中,增值税销项发票数据用在对企业的经营进行多维度的分析及报税。
2.进项发票的采集
目前进项发票的采集途径比较单一,需要从税局的勾选认证平台采集,需要插入金税盘/税控盘或税务UKey登录到勾选认证平台,根据查询条件查询进项发票。可以使用网络爬虫比较流行的python进行采集。但勾选平台的进项发票数据的向很少,只有发票号码,发票代码,发票状态,金额,税额等几项数据,明细数据是没有的。
图1-发票勾选认证平台
3.销项发票数据采集
销项发票的采集需要从企业单位安装的增值税开票软件中进行采集,采集的数据比较全发票的全面的数据(包含商品明细,清单明细,发票的状态)和发票统计数据等。
但目前市场常用的开票软件比较多,可以分为三个系列的多个版本。如航信新的增值开票软件(金税盘版),百旺的增值税开票软件(税控盘版),百旺的增值税开票软件(税务UKey版)。
进项发票的采集可以通三种方式进行采集,方式一通过增值税开票软件手工导出,方式二从税控设备中读取发票数据,方式三从开票软件的数据库中采集发票数据。作者对这三种方式进行简要的分析。
图2-税控设备
图3-三个系列的增值税开票软件登录界面
3.1 从增值税开票软件中导出数据
增值税开票软件中都提供了发票数据导出功能,可以根据条件手工导出发票数据,通过这种方式采集很难集成到业务系统中,这种方式对于小规模的采集场景中有应用,需要认为干预操作,最终的体验不佳,在大规模的数据采集中很少使用。
3.2 从税控设置中采集发票数据
税控设备(金税盘,税控盘,税务UKey)中都存储着发票数据,从税控盘中读取发票数据难度较大,首先需要对每个税控设备进行逆向分析,这个工作量比较大。另外,这种采集方式,需要采集时插入税控设备,并输入税控设备密码,用户体验也不太好。这种方式应用的也比较少。
3.3 从开票软件数据库采集
从开票软件数据库采集一者不需要插入税控设备,二者不需要输入税控设备密码。无论从工作量还是用户体验上都是比较好的选择,适合大规模的进行发票数据采集。但是,开票软件的数据库都做了较为严密的防护,不是随随便便的都采集到的。例如百旺税控盘版老版本,需要插入税控盘才能读取数据库中的数据,航信金税盘版新版本的数据库加密只有航信自己的进程才能读取数据库,百旺税控盘新版和税务UKey版,数据库密码均是动态密码,并且做了进程访问控制。所有的这些均需一一的逆向攻破。这种方式的工作量也是十分巨大的,并且工作难度不低于从税控设备中采集。
4.增值税进项发票采集API接口
作者,擅长逆向分析,长期从事税控相关的逆向分析研究,为了降低进行发票采集难度开发了进项发票采集API接口,支持金税盘,税控盘,税务UKey各版本开票软件的进项发票采集,作者欢迎和广大逆向技术,税控业务爱好者进行技术,业务,经验交流。作者联系方式QQ: 707534032。
增值税进项发票采集API接口下载地:https://download.****.net/download/kongguoqing791025/12983663
航信增值税开票软件数据库分析请参看作者的博文:https://blog.****.net/kongguoqing791025/article/details/108897319
百旺税控盘和税务UKey数据库分析请参看作者的博文:https://blog.****.net/kongguoqing791025/article/details/108563048
税务UKey数据采集分析请参看作者的博文:https://blog.****.net/kongguoqing791025/article/details/109272649