所谓垃圾数据是指进入地税征管系统中失真的、虚假的和没有价值的数据。自2005年地税征管软件系统上线以来,系统采集的数据和覆盖的范围逐步扩大,但是垃圾、冗余的数据也相应增多。在征管系统运行近5年后,2008年全省地税曾系统地进行过一次数据清理,那次清理大体上解决了因上线初期信息采集不全、操作不规范而进入系统的垃圾数据和系统本身产生的垃圾信息。但是随着新的业务功能模块不断上线、税收政策的变化,系统中相应的垃圾数据又逐步增多,不仅影响了各项数据统计的准确性,也严重影响了软件运行的速度,极大地制约了地税征管软件作用的发挥。
一、充分认识清理垃圾数据的重要性
(一)清理垃圾数据是适应税收信息化发展的需要。从当前税收管理信息化发展趋势来看,综合征管软件运行管理重点是对数据的管理,各项税收征管工作对数据的存储、处理及依赖也逐步在提高,加之,目前征管数据均是由省级集中处理,则必须保证进入系统的数据的真实性、准确性和科学性,才能逐步实现现有信息系统的全面整合和综合业务应用。
(二)清理垃圾数据是实行精细化管理的需要。垃圾数据的出现,说明税收数据资源管理与精细化管理要求还存在较大的差距。清除垃圾数据,实质上就是优化数据资源,达到相适应的征管数据质量要求,对信息化管理方式的转变,进一步以信息化、规范化的数据管理推动税收精细化管理。
(三)清理垃圾数据是保证科学决策的需要。综合征管软件数据对科学决策起着至关重要的作用。垃圾数据造成系统数据失真,使得税务人员对数据的把握、分析都会出现不同程度的偏差,从而影响数据在科学决策中的利用价值,如果运用失真数据形成相关决策,将会直接导致决策失误。因此,有必要将系统中的各种数据去伪存真,以保证决策的科学性。
二、垃圾数据产生的原因分析
当前征管信息系统中的垃圾数据主要有登记类、认定类、系统系、企业报送类、票证类、稽查类、报表类等,究其产生的原因有管理上和技术上两大因素。
(一)管理上的因素
1、基础数据采集错误。部分工作人员对数据质量的重要性缺乏认识,在数据录入系统前就采集了错误的信息或者根本就没有去采集数据。如20××年9月省局发布数据清理中的项目登记类垃圾信息,有些项目登记信息让人一看就觉得不是真实的数据,可能是税收管理员根据企业申报的信息推算出来采集的,比如从业人数、生产地址、经营地址、开业日期、受理日期、注册资本为空的信息,则说明税收管理员根本就没有采集这些信息。
2、基础数据录入错误。部分工作人员录入数据不认真、不及时,对将要录入的数据不预先审核就直接录入或录入后不加审核并且错过了修改时间,如税务登记证号码错误信息,有些纳税人填写错误而前台人员没有审核出来,再如税收管理员在税务登记的流程最后一步时没有选择管理行业和地理位置信息而直接提交,导致有些管户的管理行业是系统默认的餐饮业,地理位置是默认排在全市第一的地理位置名称。
3、前台人员操作错误。少数工作人员业务不熟练、计算机操作不规范,造成误录。在这次的数据清理过程中发现有些前台人员在开税票时胡乱选择税目,如明明是查账征收的企业所得税纳税人,但开票时却另外加了一个核定征收的税目。
4、纳税人网报操作错误。少数纳税人申报时存在错误数据未及时发现。如有的企业在进行网报时,因为扣款不成功后不是走申报未扣款程序而是再一次进行申报扣款,导致系统中存在待征税款。
5、人为录入虚假数据。为了应对考核指标,比如在绩效考核中有对财务信息录入率和两税征收不一致的考核,很多税收管理员为了完成考核要求,要求纳税人随便填写财务信息或干脆就自己代劳,导致系统中很多企业财务信息不完整、不合理。比如系统考核规定有房产税必定有土地使用税,但在实际工作中按税法规定只能征收其中一项,例如房地产开发企业买了地但未开发的阶段只交土地使用税。面对这种情况,有些基层分局在季度末干脆就自己垫钱去完成,结果是系统中有些企业房产税或土地使用税才1—2元钱,登记的项目是零点几平米土地或几十元的房产。
6、监督考核机制不到位。针对数据质量问题,目前省局下发了《地税管理信息系统数据质量暂行规定》(赣地税发〔2008〕15号)和《地税征管业务系统操作若干规定》(赣地税发〔20××〕42号),但没有专门针对数据质量的考核办法,仅有部分指标零星地出现在绩效考核中,无法考核到具体的工作人员。
(二)技术上的因素
1、业务需求与系统功能不对称产生错误信息。由于开发过程中业务需求发生了变化,导致系统采集和提取的数据与实际不符,如在纳税评估时抽取不到纳税人补录的财务信息。
2、系统间数据交换接口产生错误信息。目前和地税征管平台有数据往来的系统有个人所得税基础信息管理系统、货运发票系统、网上报税系统、银行批量扣税系统、浪潮税控发票管理系统,这些系统一定程度上解决了征管系统的不足,为加强税收管理提供了便利,但系统间大量的数据传递有可能造成垃圾信息,如通过银行批量扣税时,曾因交换接口产生错误信息造成过重复扣款的情况。
3、软件故障产生错误信息。地税征管平台后台数据库中存储的数据量已经远远超过了1000g,在前台访问量大时数据库难免出现无法响应的情况,当正常流程提交时刚好出现系统无法响应时就有可能产生既无法前进又无法回退的流程,这些无法处理的流程就形成了垃圾数据。同样,在报表加工时由于要进行大最的数据运算也有可能产生错误的信息。
三、解决的对策
(一)管理方面
1、数据采集求真务实。求真就是要求在保证征管软件数据的真实性、准确性和完整性,要主动深入征管一线、税源企业收集数据,主动对各种征管和经济数据进行整理,进行科学分析。
2、数据管理齐抓共管。从征管软件数据管理与应用的特点和规律着手,注重部门间工作的协调统一,形成齐抓共管的良好局面。根据征管软件数据体系建设的需要,充分发挥征管部门在数据管理中的主导作用,征管部门组织人员对录入的数据进行对比,补录和修改清理垃圾数据。在此基础上,严格规范数据来源、入口和处理环节,及时发现新产生的问题数据,查明错误原因。同时,各业务部门每个月要对征管软件中的数据进行检测、考核。
3、数据考核权责分明。一是健全责任机制。提出征管软件数据质量的零差错目标,层层明确数据管理的责任部门和责任人,明确划分决策、执行、监督各环节的责任,正确区分监管责任和行为主体责任,有效解决责任不清、多头管理、交叉重叠和职责真空的问题,形成数据管理环环相扣的责任链;二是严格考核机制。对垃圾数据可能经过的主要环节或岗位进行全面考核,对违规操作造成数据质量问题的人员,实行过错责任追究。形成部门、环节的领导者和工作人员都能够自觉参与数据管理,共同关注数据质量的氛围。
(二)技术方面
1、完善征管业务系统。增加业务系统功能,如对一些关键字段增加页面的校验功能、减少垃圾数据产生的入口;整合业务系统功能,减少系统间数据传输产生的垃圾信息;优化业务流程,如对网络报税户可以把财务信息录入进行前置,要求纳税人必须录入财务信息后才可以进行网上申报税款,减少后面补录时人为的因素。
2、上线数据质量管理系统,对产生的垃圾数据及时进行提示和考核监督;建立专门的垃圾数据“推送中心”,负责日常的数据质量发布、清理和考核工作。
3、加强纳税人自我清理功能,如对项目登记信息和两业项目登记、财务信息录入等可以建立相关的提示页面,使纳税人在进行相关操作时能第一时间进行补录或修改。
4、开放数据清理权限。征管业务系统正式上线后,实现了税收数据的省级集中,对失真、错误数据的处理权也集中在省一级,基层税务机关发生的失真、错误数据只有一级级上报到省局才能删除,不仅时间长,还增加了基层网管员的工作量,造成垃圾数据大量堆积。建议在保证系统正常运行的前提下,给予基层网管员充分的清理权限,使数据清理压力有效的分流,从而解决垃圾数据的瓶颈问题。
返回调查报告列表