数据挖掘技术在税务稽查中的应用
更新时间:2023-08-11 07:32:01 阅读量: 教育文库 文档下载
数据挖掘技术在税务稽查中的应用
数据挖掘技术在税务稽查中的应用
◆ 蒋丽华
内容提要:多年的信息化建设,使税务应用软件系统中沉积了大量的数据。如何将这些“历史的、静态的”数据变成动态的、具有分析决策性质的信息,已成为当前急需研究的课题。本文通过对数据挖掘技术在税务稽查工作各个环节的应用研究,以期对纳税评估、税源监控与预测等具体工作提供思路,把“死数据”变成支持税务决策的有用信息,全面提升税务系统信息化建设的水平和应用效能。关键词:数据挖掘 税务稽查 应用
随着税务信息化建设的发展,应用数据库的规模和数据量在迅速膨胀,各个系统中存储着大量的涉税信息。但是面对这些海量的信息数据,在具体工作中,却往往是“数据丰富”与“信息缺乏”并存,因此如何将这些“历史的、静态的”数据变成具有分析决策价值的信息,已成为目前税务信息化建设向更高层次推进的瓶颈。本文拟从粗糙集、分类、聚类等数据挖掘技术在税务稽查中的应用做一些探讨,以期给纳税评估、税源监控与预测、纳税信誉等级评估等决策信息挖掘工作提供一些思路。
教育和收入等职能作用,有效地维护了税法的严肃性和税收经济的正常秩序。但离新形势下税务稽查工作的要求还有一定的距离,特别是稽查管理的精细化、科学化程度还不高。主要表现在:
1.税务稽查选案缺乏科学性、准确性。当前,涉税违法犯罪日益多样化、隐蔽化,传统的选案方法和选案结果已经制约了稽查案件的有效性、针对性。
2.稽查实施重点不突出。由于选案存在盲目性,制定稽查计划时,只能每年查一定的比例,几年轮一遍,这样就使检查的户数过多,导致日常稽查难以查
一、数据挖掘的基本概念
数据挖掘(Data Mining),又称数据库中的知识发现(KDD),是指从大型数据库或数据仓库中提取隐含的、先前未知的、对决策有潜在价值的知识和规则的高级处理过程。换言之,数据挖掘就是对观测到的数据集(经常是很庞大)进行分析,发现其中未知的关系并对其有价值的部分以一种新颖方式进行数据总结、分类。它是数据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、统计学等各个学科的理论和技术。目前,数据挖掘技术已经成功应用到金融业、零售业、电信业和政府决策等各个领域,取得了良好的社会和经济效益。
深查透;近几年开展的重点行业稽查,选择面太广,没有体现稽查的重点,也没有达到重点稽查的目的;稽查方式仍停留在就账查账的老路上,稽查人员采用“就账查账,账实相核”的传统稽查方法很难查处深层次的违法问题。
3.数据分析手段单一,应用软件间缺乏信息共享。目前在稽查局运行的金税工程协查系统、举报管理系统、以及中国税收征管信息系统等软件,都是相互独立的系统,系统间缺少信息共享。并且这些系统对数据的分析也仅停留于简单的统计和报表功能,缺乏对大规模征管及涉税数据的加工分析。
4.电子商务对税务稽查的挑战。网络经济不仅提供了集信息流、物流和资金流于一体的商务交易模
二、税务稽查工作中引入数据挖掘技术的必要性
式,而且带来了经济结构和运作方式的变革。这种变革直接导致了企业会计信息系统和会计核算方式的变革,也对以会计信息系统为客体的税务稽查产生了极大冲击。具体表现为:税务稽查环境、范围、线索、
技
(一)税务稽查工作现状
近几年来,税务稽查工作通过发挥监督、惩处、
数据挖掘技术在税务稽查中的应用
「Tax collection and Management 税收征管」
①
术方法以及税务稽查主体素质的改变等。如何利用网络模型对诚实纳税企业和非诚实纳税企业进行分类。研究中选用19 个财务比率指标,构建了三层的网络结构。由于BP神经网络方法对处理非线性问题具有明显的优势,其判别结果与统计分析中的判别分析方法比较,BP的效果要明显好一些。
与分类不同,聚类要划分的类是未知的,它完全是根据数据在各变量上的取值的相似性进行的。聚类方法是指系统根据纳税户属性,使群内纳税户具有最大的相同性,群间纳税户具有最大的相异性,自动产生聚类标准,再按此标准对纳税户进行归类。通过对分行业、分税种聚类分析的研究,可以更快地将存在不同疑点的纳税群体进行分类,确定各个类别的总体状况和特征,为制定稽查计划提供决策依据,使得税务稽查工作更具科学性和针对性。
3.异常纳税户的分析。通过离群点的分析可以发现异常纳税户。离群点是不符合数据的一般模型的数据
先进的计算机技术和工具对电子商务进行“网上稽查”,成为各级稽查部门需要思考和探索的问题。
(二)信息资源整合为税务稽查提供数据分析平台
随着中国税收征管信息系统(CTAIS)省级数据集中方式的全面推行,以及整合主体应用系统的逐步实施,税务系统的信息化正由扩张走向信息资源整合和数据集中管理的阶段。数据整合使业务数据集中处理迈向新台阶,不仅带来了数据处理平台的全面提升以及系统间信息交换共享的实现,而且也为税务稽查工作的数据分析带来了新的契机,给稽查工作提供了一个统一的、全面涵盖纳税人涉税信息的数据平台,使前沿的数据分析、挖掘技术有了发挥作用的基础,开辟了数据信息向知识信息转变的通道。
三、数据挖掘技术在税务稽查工作中的应用对象,对于聚类分析来说,就是那些散落在外,不能归并到任何一类中的数据对象。离群点中可能隐藏着重要的信息。税务稽查部门在选案过程中,先从数据仓库中根据企业的规模、行业、地区等维度查找出若干企业,将这些数据再用数据挖掘的有关方法查找纳税额明显偏低的企业,可以将他们作为重点检查对象进行稽查。
4.选案规则提取。在很多情况下,稽查人员需要得到如“IF(属性a)AND(属性b)……THEN纳税户是否被确定为稽查对象”等一些直观的选案规则,我们可以采用粗糙集、决策树、关联规则算法② 等辅助进行选择。应用实例:《基于决策树的税务稽查计算机选案》一文中利用决策树提取11条规则,并将挖掘规则应用于实际的地税征管信息系统进行计算机选案。
(一)选案环节
1.选案指标的建立。税务稽查选案评价指标的选择和确定, 是直接关系到评价结果的一项最重要的基础性工作。从理论上讲,设置的指标越多选案内容就越丰富,越有深度和广度。但是,实际选案中采用的指标并不是越多越好。其中有些属性(指标)是与问题无关、弱相关或冗余的,对这些属性必须继续检测识别和删除,否则会影响选案的效果。
属性约简是粗糙集理论研究的核心内容之一,粗糙集分析方法仅利用数据本身提供的信息,无须任何先验知识,能在保留关键信息的前提下对数据进行化简并求得知识的最小表达。 利用粗糙集等数据挖掘方法,对纳税户的属性(指标)进行简化,可以提高选案系统潜在知识的清晰度。
2.纳税群体的细分。为了准确地定位稽查对象,对辖区内纳税户的细分是非常重要的。一般有两种方法:分类和聚类。
分类是指事先人为根据纳税户属性确定分类标准,再对其进行归类。目前选案大多采用将纳税人简单的分为有疑问和没有疑问两种类型。有许多数据挖掘算法可以应用在分类分析中,例如决策树归纳、贝叶斯分类、神经网络等。应用实例:《神经网络在税务稽查选案中的应用研究》一文中利用 BP
(二)实施环节
在稽查实施环节中,要根据查处的问题进行定性。在定性和处罚过程中,其中违法违章类型有8种,
③
违法违章手段有100多种,违法违章成因有4种,根据
违法税款大小和《税收征管法》来进行处罚。税务人员通常是根据经验和查询相应的法律法规来决定进行什么样的处罚及处罚金额,这样比较麻烦和容易出错。我们可以用产生式规则解决税务稽查中的违法定性和处罚,即:将《税收征管法》整理成规则库,通过对规则的匹配和推理,得出定性处罚结论。
①范年茂、郭 冰《电子商务对税务稽查的挑战》,《税收与企业》2003年第8期。
②宋兴彬、徐 力《数据挖掘技术在税务系统中的应用》,《山东电子》2001年第2期。③闫建红《基于产生式规则的税务稽查系统的研究》,太原理工大学硕士论文2004年。
数据挖掘技术在税务稽查中的应用
美国州公司所得税
内容提要:本文在对美国各州就跨州经营征收公司所得税的方式以及州际税收协调机制进行全面考察的基础上,针对我国企业所得税实行中央与地方共享的特点,提出在我国建立法人所得税制下,必须坚持税收归属与税收来源一致性原则,妥善处理企业总机构所在地与分支机构所在地之间的税收分配关系的观点,并就采用“因素法”对企业跨区域经营所得在总分支机构之间进行分配以及地区间就跨区域经营的税收管理协调与合作问题进行了探讨。关键词:法人所得税制
美国州公司所得税税收收入归属
我国新的企业所得税制将实行法人所得税制,企业不具独立法人资格的分支机构与总机构将自动汇总缴纳企业所得税。基于我国现行企业所得税由中央政府和地方政府按比例分享这一前提,建立法人所得税制必须面临和解决的一个重要问题,就是要合理地确立跨区域经营的企业所得税收入归属机制,妥善处理分支机构所在地与总机构所在地的财政关系,确保新企业所得税法顺利有效地实施。本文重点就美国州公司所得税在对跨州经营的公司应税所得分配及其所得税收入归属方面的情况进行了考察,以期为我国企业所得税制改革和完善提供借鉴。
一、美国各州对跨州经营活动课征公司所得税的法律背景①
美国宪法允许州政府自行开征州所得税,但在1959年之前,根据美国最高法院的规定,州没有权利对非本州所属公司的跨州经营征税。1951年,在Spector
①
Robert M. Kozub, James T.Collins , 2006 Multistate Tax Guide to Pass-Through Entities, CCH incorporated, Chicago.
正在阅读:
数据挖掘技术在税务稽查中的应用08-11
2019年中国单轨交通行业深度研究与投资可行性报告(定制版)目录09-18
美好的未来生活作文700字06-17
win7家庭版升级密钥12-24
化学选修5第二章单元测试题03-20
宝利沥青:中国证监会关于核准公司首次公开发行股票并在创业板上市的批复 2010-09-2706-06
通用技术实验室06-27
2017年河南省——教育部直属师范大学免费师范毕业生专场双选供需见面会.doc -11-29
家长手记:宝宝永远不会错! docx03-20
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 数据挖掘
- 稽查
- 税务
- 应用
- 技术
- 有关英语语法中《平行结构》问题 附有习题及答案(免费下载)文库
- 幼儿简笔画涂色
- 外销人员管理制度2015.3.5
- 古代汉语通论词汇篇
- 读书节目停播读书请别停下2015.1.6
- 礼仪应用文请柬
- 科技论文格式样本
- 小学数学游戏(二) 猴子吃香蕉之九九乘法口诀游戏(数字7)
- 2012十大童装品牌排行
- 关于奇门遁甲作为预测术的若干问题之研究
- ProE基础与应用精品教程 第1章 开始ProE Wildfire 3.0之旅
- QGIS-2.8-PyQGISDeveloperCookbook-en
- Z3050型摇臂钻床的PLC改造设计
- 2013商业街研究(世联)
- 研究论文:网络传播环境下高职院校学生管理新视角探究
- 浅谈休闲农业的现状与发展
- 从《宠儿》透视美国黑人女性的悲剧与成长
- 足足笑了一整天
- 法语de用法完整版-超全哦
- 如何开发智能家居市场