分类专业化 程序自动化
----中税答疑加强税务大数据人工智能建设纪实
近期,北京中税答疑软件科技有限公司(简称中税答疑)数据中心圆满顺利地完成山西税收优惠查询系统、招商金科税收知识库对接等两个大项目。这2个项目,时间紧,任务重,专业性极强,数据处理工作量巨大,中税答疑公司的研发团队能在客户规定的时间点提前完成,堪称奇迹。那么,该公司究竟是用了什么法宝来保证这2大项目顺利实施的呢?笔者近期专门进行了调研,一探其中的奥秘。
程序自动化的启动
以往,为了确保法规数据的准确性,中税答疑数据中心通过人工进行数据处理,虽然在一定程度上确保了准确性,但是速度慢,耗费巨大,也影响了项目进度,数据中心的员工为此没少吃苦头。那么有没有一个既能准确操作又能提高数据处理效率的好办法呢?数据中心的全体员工和研发团队成员,经过几十次的反复推演、无数次的论证研讨,一致认为,在现代互联网技术和人工智能的大背景下,采取“人工+程序”的方式进行,土洋结合,在人工对数据进行专业化处理的基础上,依托编程实现“大数据智能集成”,无疑是一个最佳选项。说干就干,中税答疑就此开启了税务大数据处理自动化、智能化的时代。团队的专业表现,受到了税务机关和众多大客户的连连点赞。
人工专业化处理
怎样才能把税收优惠政策变成大数据?怎样才能让优惠政策更好地服务于纳税人和税务机关?中税答疑公司接到了税务机关的这一研发项目,在公司内部激起了一个研发层面的“大地震”。大家一致认为,一个系统,必须要有一个专业的底层架构和分类理念,而这个理念是决定项目成败的核心因素。经过近20余次的研发会议讨论,最终决定,首先对项目进行专业化分类和底层架构的搭建,这一步,必须由人工来处理。山西税收优惠查询系统,为公司提供了一个良好的契机。基于此,公司调动115名专家、30名工程师集体攻关,认为,对税收政策分段分类处理,逐条逐句进行专业的分析和标签化处理,画像标签越细越专业,数据查询就越精准,经过近半年的艰苦工作,终于建立了成熟的税收标签化体系,精准度达到99%,这在国内首创了对税收政策进行碎片化处理的先河,项目得到了现场测试人员以及税务部门的高度赞赏。
程序自动化处理
数据中心不仅对数据的数量有着极高的要求,同时对数据的质量有着严格的标准,例如:法规数据的基础属性、正文排版、特殊符号、校对发布、后期维护、客户反馈等内容,有一套完整的数据处理标准,光有人工的专业化操作,还远远不能适应当前形势下税务大数据处理的要求。为此,中税答疑公司进一步加强了工程师队伍,充实了人工智能力量,配备了专业人员,工程师团队达到30人。同时,几度与腾讯、方欣科技、用友等大企业集团联合,集体攻关,获取了大数据批量处理的关键技术并有效地与税务大数据相结合,误差缩小为0.01%,程序的自动化处理大大加快了中税答疑税法知识库走向市场化、智能化的步伐,也为中税答疑的发展提供了更加广阔的空间。在中税答疑工作了12年的老员工王馨自豪地说:“我与企业共成长,经过了近4000多个日日夜夜的奋战,今天终于看到了曙光!”