鲁钰锋:赋予大数据一个全新的分析模式

2017-09-29 09:48:00 作者:佚名 分类 : 比特网

  我们今天呈现的这个项目是关于税制的问题,实际上税务的问题可能大家会觉得非常的熟悉,但是某种程度上又非常的陌生。其实在座的各位企业家,其实我们每天都在签订合同,我们签订了合同,实际上我们从文本上看起来好像是双方合同,但是大家有没有意识到,其实我们真正签订的是三方合同,因为税务局也在分钱,那么我们在签订合同的时候,我们会给我们的客户会仔细的去谈这个合同的条款,但是我们很多时候其实也需要了解税务,因为它也是我合同的参与方,因为我每个合同都需要交税。

  另外一个现象是最近可能7月1号以后大家都发现了我们去餐馆吃饭,好像所有的餐馆都要求我们在开发票的时候填上这个图示上的东西,这是为什么?事实上这正是应验了我们一个基本的判断,也就是说税收大数据的时代其实已经来了。在去年其实有两个非常重要的事件可能大家也都在关注,一个是营业税全面改增值税,营业税是我们以前所有的服务行业,包括住旅馆、吃饭都会开的是发票,发票是营业税发票,但是大家可能现在会发现开的都是增值税专用发票。也就是说我们把所有服务业现在全部纳入到增值税来进行管理,也就意味着我们国家的第二、第三产业都完全用增值税专用发票记录下来了,也就意味着我们国家的国民经济的每一个毛细血管里面的交易信息实际上都以一张发票在记录。它有上下游,它有商品分配代码,它有价格,这是第一个事件。

  第二个事件是金税三期的推广,它是我们国家的12金工程之一,它实际上实现了全国全省税务系统的核心应用系统,以及国税和地税之间的系统的应用的统一、数据的统一、业务的统一和服务的统一,这也就意味着说真正来讲税务的数据以前可能报给国税的和报给的可以不一样,报给北京的和报给广东的必须不一样,但是现在必须得统一了,因为系统已经统一了。

  通过这些数据实际上我们可以更多的分析,这些交易行为后面所蕴含的信息链、价值链和供应链相应的一些分析。我们身边的这个税务的大数据可能大家会理解会说我们前面的申报数据、发票数据是与税相关的,事实上现在税务大数据时代来临以后,税务局包括我们的企业也在关注后面的这些信息,包括经济的数据、第三方交易的数据、企业的数据、尽调的数据。那么海量的这些数据我们如何去分析?我们是不是还是用传统的AI的方法,我们还是用传统的数据仓库的这种方式来构建我们的大数据分析模型?罗格数据事实上我们在这个里面进行了一些探索,我们引入了一个方法这是2006年哈佛商业评论第一期他有一篇文章提到了在决策科学理念实际上更多的是依据证据来进行管理,而这个证据包含三个层面的内容,第一个是文献,是知识,第二个是案例,是别人以前怎么做的,第三个是指标,是模型,是算法。也就是说我们需要把知识、文献和案例,和我们的数据结合起来,而形成一个最佳决策或者说科学决策的一个数据,这也就是罗格数据现在正在尝试的赋予大数据的一个分析模式。我们会更多的去关注运用群众的方法,运用量化的方法,动态的发现企业的风险,动态的描述企业的信用,同时我们也会用到人工智能的一些方面,机器学习的一些方法,发现数据与数据之间,企业与数据之间的一些规律。

  事实上税务大数据的这个时代来临以后,它已经成为了全球的一个共识,不管是中国还是美国,大家都在刻画这个企业可能面临的风险,以及企业行为所承载的信用。在整个税务大数据的生态体系里面,它不仅仅包含了税务部门,还有其他政府部门,其实还有像我们的企业纳税人,现在很多的企业,集团企业也开始关注自己的税收问题。同时还有我们的金融机构,因为税务数据是谨慎的数据,税务的信用实际上是谨慎的信用,然后对于金融机构来讲他可以提供对我们的风控、获客,会给他金融机构提供非常丰富的证据。

  我们在分析它的时候,实际上我们按照传统的数据分析的理论可能很难做到,原因是什么?因为这些数据是分布在不同的企业之间,分布在不同的部门之间,那么我们按照传统的资源导向型的方式,我把数据都搜集过来,再来去做分析,往往可能效果不一定很明显。所以我们更多的是聚焦在客户的痛点,从专业的角度分析我们的客户,我们的用户他的痛点在哪,以场景设计的方式来构建我们的分析模型,这就是我们税收大数据的循证分析的方案。实际上我们试图在构建一个基于公有的一个循证云,我们会链接三方,一方是税务局,一方是金融机构,还有一方是企业,我们会把这些证据在金融机构、企业和税务局之间打通。

  对于税务来讲我们会构建一个数据分析的平台,我们会把来自于外部的这些数据和证据推送到税务机构。我们会帮助税务机构,首先第一个去组织跨界的数据源做信息的画像,会用量化的方法做风险的画像,然后会分析互联网舆情和涉税的情报,会计算税收流失的额度,会做税收和经济的分析,会做发票的专项分析。当然我们也会用到一些深度洞察和反欺诈的一些技术。

  这是我们所积累的模型体系,当然对于企业来讲我们在用税务大数据做刻画的时候实际上有两个维度,第一个是刻画风险,风险标注的说我们可能在某一些行为上存在相应的问题,其实还有一个是信用,信用实际上是说我们通过历史的数据可以回溯他的行为,回溯他的经营状况,可以综合构成他的信用打分,这个信用实际上来自三个方面,一是经营层面风险,二是财务层面风险,三是税务层面风险,然后我们构成一个信用的量化打分模型。这个模型实际上对于金融机构来讲同样适用,我们现在构筑的“银税互动”平台实际上就是把在税务内部用税务大数据所计算出来的这个风险和信用的结果把它传导到金融机构,我们帮助金融机构做三件事,第一个获客,我们可以发现白名单,企业白名单,我们可以帮着金融机构提供风控的证据,可以帮着金融机构提供金融创新产品的新的数据流。

  当然我们的模型体系,我们也可以为企业进行服务,这是我们所构建的智慧税务的风险管理系统,这些可以在企业自己做财务和税务管理的时候可以妥善的安排自己的风险,控制自己的风险。

  这是我们整个应用的一个基本展示。我们想呈现的是说税务大数据到底能做什么?比如说这张图,这张图实际上是用增值税专用发票的数据,我们用模式识别的算法可以快速在几亿张发票里面去发现这种循环开据的行为。为什么要关注这一点,首先第一个循环开据绝大部分都是因为我们在做收入,就是说我们在虚拟这笔交易,如果是循环开据的这个行为到了一定程度以后,某种情况下他们做这件事的初衷可能是为了到银行去拿贷款,也就是说他愿意交17%的税去撬动83%的本金贷款,所以这种循环开据的行为一方面是预示着税收方面的风险,其实某种程度上它也会预示着金融方面的风险。

  当然这个是我们从增值税专用发票这些数据简单做的一些统计,这是中关村的产业分布情况,当然这是一张比较粗的图,我们还可以把它细化,我们甚至可以分析每一栋楼宇里面它的企业的状况以及它的分布情况。这个是我们帮着税务总局所做的增值税专用发票全国的流向分析,通过这个流向分析可以看到整个经济的走向,以及区域与区域之间的经济的紧密程度。

  这个是我们做得京津冀三区的通过增值税专用发票分析的,这个行业与行业之间的耦合度,这个圈的大小代表交易额,然后这个线的粗细代表的交易的频度,其实也就是发票的数量。当然我们现在用的是国民经济分类代码的门类,我们还可以下放到小类,下到小类事实上更多的就可以发现我们在这个区域之间,产业与产业之间的关系,从某种程度上也可以帮着金融机构发现我们供应链的金融模型里面的行业白名单。

  这个是我们用机器学习算法构筑的金融财务数据所测算出来的可能企业存在的税收风险,比如说我们现在的这个案例是个真实的案例,企业我们通过所得税申报表以及外部的数据测算以后,它可能存在这么大的一个税收风险,我们把它叫做税收流失,或者叫税收风险,事实上从某种程度上我们可以帮助企业洞察他现在存在的税收风险。

  当然这个是我们从风险的视角可以给企业做画像,比如说我们针对他的税负,针对他的能耗,针对他的受益我们给他做量化,量化以后会综合得出一个评分,然后我们会把评分放到风险特定的区间,对于处于红色的这一部分很有可能要小心,数据会关注。对于绿色的这一部分实际上这都是好学生,我们理应得到褒奖。

  最后我们再简单介绍一下我们的创业团队,实际上我们这个团队基本上都是从事金税三期非常长的时候,我本人有将近20年的时间,金税三期推广完以后,我们这一批小伙伴们包括核心团队,我们为了一种新的理想,我们离开了税务系统,离开了体制,我们在尝试一种新的模式,以跨界的方式在为税务局还有企业,以及金融机构提供服务。所以我们的整个团队的特点实际上我想可能会体现在第一个是说我们对税务会非常熟悉,另外一个我们会非常专注,专注税务大数据的分析,另外第三个我们也希望通过我们的努力,能够为我们的企业,为金融机构,甚至我们以前服务的税务机关提供更多的服务以及创造更好的价值,谢谢大家!

最近更新
科普

科普图集
互联网+升级到智能+,开启万物智联新时代

互联网+升级到智能+,开启万物智联新时代>>详情

中国互联网消费市场,发展潜力一片大好

中国互联网消费市场,发展潜力一片大好>>详情

邮件订阅

软件信息化周刊
比特软件信息化周刊提供以数据库、操作系统和管理软件为重点的全面软件信息化产业热点、应用方案推荐、实用技巧分享等。以最新的软件资讯,最新的软件技巧,最新的软件与服务业内动态来为IT用户找到软捷径。
商务办公周刊
比特商务周刊是一个及行业资讯、深度分析、企业导购等为一体的综合性周刊。其中,与中国计量科学研究院合力打造的比特实验室可以为商业用户提供最权威的采购指南。是企业用户不可缺少的智选周刊!
网络周刊
比特网络周刊向企业网管员以及网络技术和产品使用者提供关于网络产业动态、技术热点、组网、建网、网络管理、网络运维等最新技术和实用技巧,帮助网管答疑解惑,成为网管好帮手。
服务器周刊
比特服务器周刊作为比特网的重点频道之一,主要关注x86服务器,RISC架构服务器以及高性能计算机行业的产品及发展动态。通过最独到的编辑观点和业界动态分析,让您第一时间了解服务器行业的趋势。
存储周刊
比特存储周刊长期以来,为读者提供企业存储领域高质量的原创内容,及时、全面的资讯、技术、方案以及案例文章,力求成为业界领先的存储媒体。比特存储周刊始终致力于用户的企业信息化建设、存储业务、数据保护与容灾构建以及数据管理部署等方面服务。
安全周刊
比特安全周刊通过专业的信息安全内容建设,为企业级用户打造最具商业价值的信息沟通平台,并为安全厂商提供多层面、多维度的媒体宣传手段。与其他同类网站信息安全内容相比,比特安全周刊运作模式更加独立,对信息安全界的动态新闻更新更快。
新闻中心热点推荐
新闻中心以独特视角精选一周内最具影响力的行业重大事件或圈内精彩故事,为企业级用户打造重点突出,可读性强,商业价值高的信息共享平台;同时为互联网、IT业界及通信厂商提供一条精准快捷,渗透力强,覆盖面广的媒体传播途径。
云计算周刊
比特云计算周刊关注云计算产业热点技术应用与趋势发展,全方位报道云计算领域最新动态。为用户与企业架设起沟通交流平台。包括IaaS、PaaS、SaaS各种不同的服务类型以及相关的安全与管理内容介绍。
CIO俱乐部周刊
比特CIO俱乐部周刊以大量高端CIO沙龙或专题研讨会以及对明星CIO的深入采访为依托,汇聚中国500强CIO的集体智慧。旨为中国杰出的CIO提供一个良好的互融互通 、促进交流的平台,并持续提供丰富的资讯和服务,探讨信息化建设,推动中国信息化发展引领CIO未来职业发展。
IT专家网
IT专家新闻邮件长期以来,以定向、分众、整合的商业模式,为企业IT专业人士以及IT系统采购决策者提供高质量的原创内容,包括IT新闻、评论、专家答疑、技巧和白皮书。此外,IT专家网还为读者提供包括咨询、社区、论坛、线下会议、读者沙龙等多种服务。
X周刊
X周刊是一份IT人的技术娱乐周刊,给用户实时传递I最新T资讯、IT段子、技术技巧、畅销书籍,同时用户还能参与我们推荐的互动游戏,给广大的IT技术人士忙碌工作之余带来轻松休闲一刻。