数据挖掘技术在税务稽查中的应用
更新时间:2023-05-17 05:51:02 阅读量: 实用文档 文档下载
数据挖掘技术在税务稽查中的应用
数据挖掘技术在税务稽查中的应用
◆ 蒋丽华
内容提要:多年的信息化建设,使税务应用软件系统中沉积了大量的数据。如何将这些“历史的、静态的”数据变成动态的、具有分析决策性质的信息,已成为当前急需研究的课题。本文通过对数据挖掘技术在税务稽查工作各个环节的应用研究,以期对纳税评估、税源监控与预测等具体工作提供思路,把“死数据”变成支持税务决策的有用信息,全面提升税务系统信息化建设的水平和应用效能。关键词:数据挖掘 税务稽查 应用
随着税务信息化建设的发展,应用数据库的规模和数据量在迅速膨胀,各个系统中存储着大量的涉税信息。但是面对这些海量的信息数据,在具体工作中,却往往是“数据丰富”与“信息缺乏”并存,因此如何将这些“历史的、静态的”数据变成具有分析决策价值的信息,已成为目前税务信息化建设向更高层次推进的瓶颈。本文拟从粗糙集、分类、聚类等数据挖掘技术在税务稽查中的应用做一些探讨,以期给纳税评估、税源监控与预测、纳税信誉等级评估等决策信息挖掘工作提供一些思路。
教育和收入等职能作用,有效地维护了税法的严肃性和税收经济的正常秩序。但离新形势下税务稽查工作的要求还有一定的距离,特别是稽查管理的精细化、科学化程度还不高。主要表现在:
1.税务稽查选案缺乏科学性、准确性。当前,涉税违法犯罪日益多样化、隐蔽化,传统的选案方法和选案结果已经制约了稽查案件的有效性、针对性。
2.稽查实施重点不突出。由于选案存在盲目性,制定稽查计划时,只能每年查一定的比例,几年轮一遍,这样就使检查的户数过多,导致日常稽查难以查
一、数据挖掘的基本概念
数据挖掘(Data Mining),又称数据库中的知识发现(KDD),是指从大型数据库或数据仓库中提取隐含的、先前未知的、对决策有潜在价值的知识和规则的高级处理过程。换言之,数据挖掘就是对观测到的数据集(经常是很庞大)进行分析,发现其中未知的关系并对其有价值的部分以一种新颖方式进行数据总结、分类。它是数据库研究中的一个很有应用价值的新领域,融合了数据库、人工智能、机器学习、统计学等各个学科的理论和技术。目前,数据挖掘技术已经成功应用到金融业、零售业、电信业和政府决策等各个领域,取得了良好的社会和经济效益。
深查透;近几年开展的重点行业稽查,选择面太广,没有体现稽查的重点,也没有达到重点稽查的目的;稽查方式仍停留在就账查账的老路上,稽查人员采用“就账查账,账实相核”的传统稽查方法很难查处深层次的违法问题。
3.数据分析手段单一,应用软件间缺乏信息共享。目前在稽查局运行的金税工程协查系统、举报管理系统、以及中国税收征管信息系统等软件,都是相互独立的系统,系统间缺少信息共享。并且这些系统对数据的分析也仅停留于简单的统计和报表功能,缺乏对大规模征管及涉税数据的加工分析。
4.电子商务对税务稽查的挑战。网络经济不仅提供了集信息流、物流和资金流于一体的商务交易模
二、税务稽查工作中引入数据挖掘技术的必要性
式,而且带来了经济结构和运作方式的变革。这种变革直接导致了企业会计信息系统和会计核算方式的变革,也对以会计信息系统为客体的税务稽查产生了极大冲击。具体表现为:税务稽查环境、范围、线索、
技
(一)税务稽查工作现状
近几年来,税务稽查工作通过发挥监督、惩处、
数据挖掘技术在税务稽查中的应用
「Tax collection and Management 税收征管」
①
术方法以及税务稽查主体素质的改变等。如何利用网络模型对诚实纳税企业和非诚实纳税企业进行分类。研究中选用19 个财务比率指标,构建了三层的网络结构。由于BP神经网络方法对处理非线性问题具有明显的优势,其判别结果与统计分析中的判别分析方法比较,BP的效果要明显好一些。
与分类不同,聚类要划分的类是未知的,它完全是根据数据在各变量上的取值的相似性进行的。聚类方法是指系统根据纳税户属性,使群内纳税户具有最大的相同性,群间纳税户具有最大的相异性,自动产生聚类标准,再按此标准对纳税户进行归类。通过对分行业、分税种聚类分析的研究,可以更快地将存在不同疑点的纳税群体进行分类,确定各个类别的总体状况和特征,为制定稽查计划提供决策依据,使得税务稽查工作更具科学性和针对性。
3.异常纳税户的分析。通过离群点的分析可以发现异常纳税户。离群点是不符合数据的一般模型的数据
先进的计算机技术和工具对电子商务进行“网上稽查”,成为各级稽查部门需要思考和探索的问题。
(二)信息资源整合为税务稽查提供数据分析平台
随着中国税收征管信息系统(CTAIS)省级数据集中方式的全面推行,以及整合主体应用系统的逐步实施,税务系统的信息化正由扩张走向信息资源整合和数据集中管理的阶段。数据整合使业务数据集中处理迈向新台阶,不仅带来了数据处理平台的全面提升以及系统间信息交换共享的实现,而且也为税务稽查工作的数据分析带来了新的契机,给稽查工作提供了一个统一的、全面涵盖纳税人涉税信息的数据平台,使前沿的数据分析、挖掘技术有了发挥作用的基础,开辟了数据信息向知识信息转变的通道。
三、数据挖掘技术在税务稽查工作中的应用对象,对于聚类分析来说,就是那些散落在外,不能归并到任何一类中的数据对象。离群点中可能隐藏着重要的信息。税务稽查部门在选案过程中,先从数据仓库中根据企业的规模、行业、地区等维度查找出若干企业,将这些数据再用数据挖掘的有关方法查找纳税额明显偏低的企业,可以将他们作为重点检查对象进行稽查。
4.选案规则提取。在很多情况下,稽查人员需要得到如“IF(属性a)AND(属性b)……THEN纳税户是否被确定为稽查对象”等一些直观的选案规则,我们可以采用粗糙集、决策树、关联规则算法② 等辅助进行选择。应用实例:《基于决策树的税务稽查计算机选案》一文中利用决策树提取11条规则,并将挖掘规则应用于实际的地税征管信息系统进行计算机选案。
(一)选案环节
1.选案指标的建立。税务稽查选案评价指标的选择和确定, 是直接关系到评价结果的一项最重要的基础性工作。从理论上讲,设置的指标越多选案内容就越丰富,越有深度和广度。但是,实际选案中采用的指标并不是越多越好。其中有些属性(指标)是与问题无关、弱相关或冗余的,对这些属性必须继续检测识别和删除,否则会影响选案的效果。
属性约简是粗糙集理论研究的核心内容之一,粗糙集分析方法仅利用数据本身提供的信息,无须任何先验知识,能在保留关键信息的前提下对数据进行化简并求得知识的最小表达。 利用粗糙集等数据挖掘方法,对纳税户的属性(指标)进行简化,可以提高选案系统潜在知识的清晰度。
2.纳税群体的细分。为了准确地定位稽查对象,对辖区内纳税户的细分是非常重要的。一般有两种方法:分类和聚类。
分类是指事先人为根据纳税户属性确定分类标准,再对其进行归类。目前选案大多采用将纳税人简单的分为有疑问和没有疑问两种类型。有许多数据挖掘算法可以应用在分类分析中,例如决策树归纳、贝叶斯分类、神经网络等。应用实例:《神经网络在税务稽查选案中的应用研究》一文中利用 BP
(二)实施环节
在稽查实施环节中,要根据查处的问题进行定性。在定性和处罚过程中,其中违法违章类型有8种,
③
违法违章手段有100多种,违法违章成因有4种,根据
违法税款大小和《税收征管法》来进行处罚。税务人员通常是根据经验和查询相应的法律法规来决定进行什么样的处罚及处罚金额,这样比较麻烦和容易出错。我们可以用产生式规则解决税务稽查中的违法定性和处罚,即:将《税收征管法》整理成规则库,通过对规则的匹配和推理,得出定性处罚结论。
①范年茂、郭 冰《电子商务对税务稽查的挑战》,《税收与企业》2003年第8期。
②宋兴彬、徐 力《数据挖掘技术在税务系统中的应用》,《山东电子》2001年第2期。③闫建红《基于产生式规则的税务稽查系统的研究》,太原理工大学硕士论文2004年。
数据挖掘技术在税务稽查中的应用
美国州公司所得税
内容提要:本文在对美国各州就跨州经营征收公司所得税的方式以及州际税收协调机制进行全面考察的基础上,针对我国企业所得税实行中央与地方共享的特点,提出在我国建立法人所得税制下,必须坚持税收归属与税收来源一致性原则,妥善处理企业总机构所在地与分支机构所在地之间的税收分配关系的观点,并就采用“因素法”对企业跨区域经营所得在总分支机构之间进行分配以及地区间就跨区域经营的税收管理协调与合作问题进行了探讨。关键词:法人所得税制
美国州公司所得税税收收入归属
我国新的企业所得税制将实行法人所得税制,企业不具独立法人资格的分支机构与总机构将自动汇总缴纳企业所得税。基于我国现行企业所得税由中央政府和地方政府按比例分享这一前提,建立法人所得税制必须面临和解决的一个重要问题,就是要合理地确立跨区域经营的企业所得税收入归属机制,妥善处理分支机构所在地与总机构所在地的财政关系,确保新企业所得税法顺利有效地实施。本文重点就美国州公司所得税在对跨州经营的公司应税所得分配及其所得税收入归属方面的情况进行了考察,以期为我国企业所得税制改革和完善提供借鉴。
一、美国各州对跨州经营活动课征公司所得税的法律背景①
美国宪法允许州政府自行开征州所得税,但在1959年之前,根据美国最高法院的规定,州没有权利对非本州所属公司的跨州经营征税。1951年,在Spector
①
Robert M. Kozub, James T.Collins , 2006 Multistate Tax Guide to Pass-Through Entities, CCH incorporated, Chicago.
正在阅读:
数据挖掘技术在税务稽查中的应用05-17
“影迷大比拼”电影知识竞赛策划书12-16
函数定义域值域求解析式与对数综合练习题07-23
《2012辰溪县“走访群众听民声,深入基层解难题”作风建设主题活动方案》doc09-19
紫薇树的栽植管理与病虫害预防12-12
ORACLE2 - 数据库的安全性、完整性、并发控制和恢复05-13
关于村级残疾人情况的调研报告04-08
XX医院创建三级甲等综合医院工作汇报06-15
镇2021年建设用地置换项目实施方案08-16
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 数据挖掘
- 稽查
- 税务
- 应用
- 技术
- 东昌区林业局林业产业工作总结
- 科技论文格式样本
- 化工仪表及自动化(厉玉鸣)(第三版)第10章
- WTO保障措施与中国的文献综述(修改)
- 了双下肢无力出现是由于椎管内肿瘤引起
- 苹果的后乔布斯时代
- 海南省海南中学2020学年高一语文下学期期中试题精品
- 如何开发智能家居市场
- 11音乐表演专业技术词汇对照表_A-11
- 第3章 资本成本与资本结构
- 古代汉语通论词汇篇
- 2007货代专业英语考试真题
- 跑跑卡丁车新手教程评测
- 青浦交易中心现房流程
- 我国弱势群体的社会保障问题分析
- 2013商业街研究(世联)
- 宏观经济学第二章
- 关注幼儿心理健康教育
- 新人教版PEP小学英语三年级下册UNIT3分课时教学建议
- ProE基础与应用精品教程 第1章 开始ProE Wildfire 3.0之旅