利用大数据技术提高税务数据价值

inttubiao

英特尔®至强™处理器E5 2630 V2系列
英特尔®固态盘DC S3500系列
政府/公共事业
大数据


logo-era2-1

“浪新公司以“互联网+大数据+政企应用”为战略,研发了拥有自主知识产权的浪新大数据智能分析平台,可以帮助府部门和企业客户快速提升业绩表现、全面优化资源配置、有效发现创新手段,使他们在社会逐步转型和经济持续发展中取得优异成绩。”

刘箭
总经理
浪新微电子系统(上海)有限公司

经历多年的信息化建设,国家职能部门积累了大量的原始数据。伴随数据量的不断增加,存
储、检索,尤其是挖掘和分析隐藏在这些数据背后的更多信息等需求对传统的信息架构提
出了新的挑战。例如,天津国家税务局已经积累了数十亿条发票和其它相关数据。作为大数
据与移动互联智能化解决方案提供商,浪新微电子系统(上海)有限公司(以下简称浪新公
司),利用大数据智能分析平台应对这一挑战,协助天津国家税务局充分利用数据资产,提
高服务品质和效率。 
解决方案

  • 数据为核心的业务:急待形成标准统一的数据服务体系,让结构化和半结构化的税务数
    据成为税务应用系统的基础和核心,满足不断深入和不断变化的业务需求。
  • 提高税务数据价值:为了发挥税务数据的更大价值,需要增强税务数据的检索能力和效
    率,同时分析和挖掘历史税务数据间的逻辑关联。
  • 集中、统一存储数据:分散在不同分局、不同系统下的税务数据加剧了税务数据处理和分
    析的挑战。

面临挑战

  • 建立大数据统一存储架构:部署10台基于英特尔®至强™处理器E5 2630 V2系列的华为
    Tecal RH2288H V2服务器形成统一的大数据资源中心。
  • 英特尔®固态盘:为增强数据的可靠性和数据读写性能,每存储节点部署5块480 GB 高性
    能英特尔®固态盘DC S3500系列,将历史和未来税务数据统一存储,并实现近乎实时的
    查询性能。
  • 部署浪新大数据智能分析平台:利用基于开源软件Apache* Hadoop*的浪新Hadoop分
    布式系统基础架构,实现海量结构化数据和半结构化数据的高速读写和可视化数据统计
    和分析。

影响

  • 统一数据标准、集中存储和管理:通过对海量涉税数据统一标准,并将分散的数据实施
    集中存储和管理,满足税务行业对数据的集中存储和快速检索等业务需求。
  • 提高服务质量:通过对海量数据开展分析,探寻、发现、理解信息内容及信息与信息之间
    的关系,深入挖掘数据潜在价值,通过纵向和横向对比的可视化分析结果,宏观和微观经
    济更加清晰,为税务行业的风险控制和经济运行及走势提供直观可靠的数据参考,精确
    实施税收风险监控,大幅度提高税收征管水平。
  • 增强可扩展性:基于Apache Hadoop的税务大数据系统的扩展能力,天津税务局灵活满
    足新业务对数据存储或性能的调整需求。
anli2-1

部署基于英特尔®至强™处理器E5系列和英特尔®

固态盘DC S3500系列的浪新大数据智能分析平

台,发挥税务数据的更大价值,增强税收服务。


持续增长的税务数据对存储和管理的挑战
数据是政府职能机构的业务基础。天津市国家税务局(以下简称天津市国税局)在多年的信息化建设过程中,不断的根据业务需求实施系统开发,数以十亿级别的税务记录分散的存储在不同系统的多台服务器上。伴随数据量的累积,传统的信息架构在存储的性能和数据管理能力上都面临艰巨挑战,同时原有关系型数据库已经无法应对越来越复杂的业务查询需求。

分散数据使用和数据挖掘的挑战
在数据使用上,一方面,分散的数据存储使得跨部门的数据检索异常复杂而且无法得到及时的查询结果,数据的查询性能已经对业务效率构成影响。另一方面,如果可以充分利用这些宝贵的历史税务数据资产,发掘数据间的隐藏联系和关系,为加强税收管理提供全新的工具。

对于极度依赖数据的税务行业而言,一个严峻的问题就是如何利用更新的技术手段对数据实施统一存储和管理,发现数据间的关联,并通过横向或纵向的多维度分析,形成直观的数据结果,从而提高工作效率和服务质量。

集中存储和管理数据
天津市国税局部署了基于英特尔®架构的大数据计算中心,利用浪新大数据智能分析平台,基于开源软件Apache Hadoop实现历史和未来的结构化和半结构化涉税数据的统一存储和集中管理。天津市国税局负责数十万规模的纳税用户,过去5年积累的申报数据、发票等数据等近10亿条记录,约7TB的容量。“基于运算性能和稳定性等因素,我们为该局部署了10台基于英特尔®至强™处理器E5 2630 V2系列的华为Tecal RH2288H V2服务器形成该局的大数据计算中心,其中2台为管理节点,其余8台为存储节点。”浪新公司刘箭说:“此外,基于税务系统对数据的可靠性和并发写入性能有较高的要求,每存储节点部署了5块480GB容量的英特尔®固态盘DC S3500系列。

提高数据查询和采集效率
原有分散在各系统的数据现在被集中存储,天津市国税局工作人员可以对统一存储的数据实现高效查询。同时还部署基于英特尔®酷睿™i5处理器的浪新EraPad商用平板电脑用于移动办公。

可视化的数据实现清晰的宏观经济和健康的微观经济
基于英特尔®至强™处理器和英特尔®固态盘的浪新大数据智能分析平台满足了天津市国税局对海量税务数据进行统计、横向、纵向或多维度分析,并可视化展现的需求。
anli2-2
anli2-3
现在,天津市国税局可通过经济地图查看经济活动的地域关系,直观了解本地各区域间、本地与全国其它地区的经济往来,以及不同行业间、不同类型企业间的经济关系,从而对开展税务管理提供支持。

天津市国税局同时实现了及时高效的年度税务发票统计,并从开票趋势、各类发票占比、代开情况等进行分析与展现,清晰反映全年发票的情况。刘军说:“通过统一的发票查询接口,利用大数据先进技术,使得我们能够更为深入地挖掘税务数据的潜在价值,掌握了各项税务相关指标数据,更好地

经验

  • 浪新大数据智能分析平台,基于开源的Apache Hadoop软件,通过可视化的数据分析结果为业务执行者和决策者提供直观的数据参考依据。
  • 利用英特尔®固态盘增强数据存储的可靠性和数据吞吐性能,是对性能和实时响应能力要求较高的大数据系统的理想存储解决方案。
  • 华为Tecal RH2288H V2服务器基于英特尔®至强™E5 2600 V2系列处理器,结合英特尔®固态盘DC S3500系列应对税务系统密集的海量数据写入和读取以及查询对存储性能和计算性能的挑战。

促进了日常税务工作的开展;同时,对潜在风险的发现和分析,能够帮助我们找到风险发生的因素和原因,对风险进行更为有效的管理。”

为未来做好准备
该局实现数据统一转换、存储并部署浪新大数据智能分析平台后,数据成为税务应用系统的核心。“由于不再依赖于传统的关系型数据库,数据结构不再是影响业务的扩充或新业务实施的因素,而且半结构化的图像、声音等数据存储成为可能。未来当出现新的数据存储和运算需求时,只需部署新的存储节点即可。”刘箭补充到。

接下来,浪新公司继续和英特尔公司在大数据计算领域不断合作,利用英特尔公司在大数据计算领域的技术优势,不断满足数据密集型行业更复杂的业务和规模更大的数据源计算和分析需求。

找到适合于您公司的解决方案。请与您的英特尔代表联系,访问英特尔 IT 管理成功案例或访问英特尔 IT 中心网站

 

英特尔技术特性和优势取决于系统配置,并可能需要支持的硬件、软件或服务才能激活。没有计算机系统是绝对安全的。更多信息,请见Intel.com,或从原始设备制造商或零售商处获得更多信息。性能测试中使用的软件和工作负荷可能仅在英特尔微处理器上进行了性能优化。诸如SYSmark和MobileMark等测试均系基于特定计算机系统、硬件、软件、操作系统及功能。上述任何要素的变动都有可能导致测试结果的变化。请参考其他信息及性能测试(包括结合其他产品使用时的运行性能)以对目标产品进行全面评估。所有性能测试的结果均来自于浪新公司的测试报告。想了解更多关于性能和标准的信息,请联系浪新公司。描述的成本降低情景均旨在在特定情况和配置中举例说明特定英特尔产品如何影响未来成本并提供成本节约。情况均不同。英特尔不保证任何成本或成本降低。英特尔公司2015年版权所有。所有权保留。是英特尔在美国和/或其他国家的商标。英特尔、英特尔标识是英特尔在美国和/或其他国家的商标。*其他名称和品牌可能属于其它公司的财产。 0815/SHA/PMG/XX/PDF

Comments are closed