402com永利平台|402com永利1站|55.402com永利网址

您的位置:402com永利平台 > 互联网资讯 > 中国四大银行的大数据应用已到了哪个阶段,合

中国四大银行的大数据应用已到了哪个阶段,合

2019-08-26 08:01

原标题:长亮科技牵手南京银行 助力“数字银行”战略

01 中国建设银行信息技术管理部资深经理林磊明

为响应国家“金融供给侧改革”与顺应大数据时代的市场趋势,越来越多的中小银行尝试创新,吸收金融科技发展的成果。在2019年Q1季度,浙江德清农商银行与排列科技再次达成合作,排列科技为德清农商行大数据平台二期建设项目提供技术服务,从多个维度对大数据平台进行优化与升级,以满足更高标准的业务需求和适应更广泛的业务领域。目前项目已经进行了一段时间,主要在整体效率、开发方式、安全管理、模型设计和机器升级等方面对德清农商银行大数据平台进行了优化。

近日,长亮科技与南京银行达成合作,将为南京银行提供定制化的企业级数据仓库解决方案,助力南京银行“数字银行”战略。

图片 1

 图片 2

图片 3

银监会在《中国银行业信息科技“十三五”发展规划监管指导意见》中,重点强调了大数据规划、建设及应用在银行整体数据管理及发展战略上的重要性。作为全国商业银行的杰出代表,南京银行一直都走在行业数字化转型的前列。今年3月,为落实数字化转型战略,南京银行正式成立数字银行管理部,以实现大数据体系对公司营销精准化和管理精细化的支撑,提升数据资产价值。

1)银行压力越来越大

图片 4

在当前“金融供给侧改革”大趋势之下,作为国家“改进小微企业和‘三农’金融服务”重要载体的农商行,改革的压力与动力俱在。在DT时代大背景下,德清农商银行充分认识到了数据的重要性,与专注于金融科技和智慧银行的排列科技在大数据平台项目上达成合作,进行数字化升级转型。

结合南京银行全面落实“经营数据化”和“管理数据化”的发展战略,长亮科技此次为南京银行定制化的解决方案,旨在建设面向未来的企业级数据仓库。参照国际领先的数据仓库体系架构,规划支持中国银行业多法人架构及满足监管要求的企业级数据仓库平台的技术框架、数据模型及应用框架,结合银行的业务管理发展制定整体实施计划,基于MPP Hadoop混搭模式,采用灵活的微服务应用架构体系,能帮助银行循序渐进地建设企业级商业智能与数据仓库体系。制定全面的行内业务数据及外部数据的标准规范,充分整合内外部海量数据,支持实时、微批、批量的数据分析,从中挖掘出有价值的信息,建设数字化管理体系,实现“大数据”带来“大价值”。

从十二五走到十三五期间,银行业面临的各方面的压力越来越大,从我们的年报数字可以看出去年四大行的利润增长基本上趋近于零增长。在这样的情况下,我们怎样通过IT的引领提升传统银行的竞争力,这是摆在我们面前的一个很重要的课题。

中国建设银行

排列科技通过调查发现德清农商银行原有的数仓存在一些不足之处:维护成本过高、数据挖掘支撑能力不足、数据处理效率不足、系统计算能力不足、系统可扩展性不足、非结构化数据处理能力不足、系统高可用性和高可靠性不足。

为了给客户带来更好的场景服务,长亮科技以创新理念打造金融科技产品,用产品印证先锋者的强大驱动力,赢得了市场青睐。在数据应用方面,长亮科技商业智能团队经过多年的努力耕耘,为客户在大数据平台建设、企业级数据仓库、数据治理、数据挖掘分析等商业智能领域提供领先的金融IT技术解决方案,帮助金融机构构建以客户为中心的金融服务体系,提高其核心竞争力,包括市场洞察能力、风险控制能力、盈利能力和金融创新能力等,使其转化为行动力,从而创造更多商业价值。

2)过去十多年期间,银行业务出现两个拐点

中国建设银行信息技术管理部资深经理林磊明

针对在德清农商银行数据仓库的现状,在一期项目中,在评估了包括原数据仓库技术和逻辑架构,项目周期等各方面因素后,为了保持数据仓库平稳迁移并稳定上线运行的大前提下,通过调研、分析以及技术选型后确定了最适合德清农商银行数据仓库迁移改造的方案,经过一段时间的设计、开发、测试、全量数据核对、试运行,已经将原有数据仓库全部迁移至CDH的Hadoop大数据平台上,并且上线运行。

依托在大数据领域的持续创新和积累,长亮科技已经为国家开发银行、进出口银行、平安银行、恒丰银行、兴业银行、广发银行等几十家金融机构建设了基于主流架构的大数据平台及应用体系;案例涵盖基于Hadoop的企业级数据仓库平台、基于Hadoop的自定义查询平台、历史数据查询平台、数据管控平台、外部数据接入服务平台、大数据精准营销系统、大数据实时营销系统、大数据风险预警系统、跨界联盟与实时授信系统、统一监管报送系统、绩效管理系统等。返回搜狐,查看更多

大数据怎么样能够在智慧银行的方向上起到更大的作用呢?

1、银行压力越来越大

德清农商银行大数据平台一期项目在2018年12月圆满完成,排列科技帮助客户建立了企业级Hadoop分布式大数据平台,以代替原有的数仓系统,为海量数据提供迁移、存储、计算、分析等服务。经过一期项目,排列科技已经了解了德清农商银行数据仓库ETL流程中数据的业务处理逻辑和具体实现过程以及对数据整合汇总的思想。经过一期项目的改造和对数据仓库的理解,排列科技发现如果引用新技术的处理思想、思维方式来进行数据逻辑处理,将更能适应和发挥出大数据平台的技术优势,而且数据仓库在离线、在线运行时的性能和效率将还会提高。

责任编辑:

通过银行的历程佐证这样一个观点。过去十多年期间银行基本上有两个拐点, 第一个拐点就是发生在互联网银行慢慢取代柜员,IT支持从支持几万十几万的柜员到支持面向所有的互联网客户,这里面发生了一个根本性的变化,无论是服务的形态还是IT的支撑,都发生了很根本的变化,这是移动和云要在里面发挥作用。 下一个拐点是什么?银行要从原来做的账务性的、交易性的处理转向能够渗透到经济生活的方方面面,这是一个场景化,如果抓不住这个拐点,银行就要被互联网金融颠覆或者管道化。

从十二五走到十三五期间,银行业面临的各方面的压力越来越大,从我们的年报数字可以看出去年四大行的利润增长基本上趋近于零增长。在这样的情况下,我们怎样通过IT的引领提升传统银行的竞争力,这是摆在我们面前的一个很重要的课题。

据技术提供应方排列科技介绍,德清农商行大数据平台二期建设将从技术框架、数据逻辑处理模式两个方面着手进行升级,技术升级后可以进一步提升数据仓库的运行性能、稳定性、安全性、扩展性、易用性、可维护性。整体改造方案范围分为五个部分:分别为基础平台升级方案、数仓模型升级方案,ETL逻辑开发升级方案,流程调度管理平台升级方案,大数据平台安全升级方案。其中,最大的技术亮点当属数据仓库处理逻辑开发,该技术可使数据的处理效率大幅度提升5-10倍,减少跑批时间,支持即时查询功能。

3)三大互联网渠道已建立,具备大数据基础

2、过去十多年期间,银行业务出现两个拐点

图片 5

这几年银行三大互联网渠道已经建立: 手机银行,已达到1.8亿多; 网上银行,我们有2亿; 微信银行,它占的客服服务总量已经超过了传统的客户服务。 这意味着我们的渠道、我们场景化的实践已经见到了效果,另外我们做大数据要具备的基础已经存在。

大数据怎么样能够在智慧银行的方向上起到更大的作用呢?

谈及业务应用,行方希望通过运用大数据平台与大数据技术,增强银行的数据管理能力,提高数据应用能力,提升数据价值和核心竞争力。基于大数据的高效和智能处理能力,可以满足银行更高标准的业务需求和适应更广泛的业务领域,支持银行在风险管理、营销获客、绩效管理、监督管理、服务体验等领域的变革升级。

4)大数据要解决3大问题

通过银行的历程佐证这样一个观点。过去十多年期间银行基本上有两个拐点:

“技术创新的行动,与德清农商行‘更高、更强、更优’的战略目标相符,也是为了达成‘真诚合作、贴心服务’服务宗旨。”行方负责人说道。

谈大数据,对传统银行来讲,要解决3大问题: 怎么样提升对于客户的识别? 怎么样对于客户的营销? 怎么样提升对于风险的防范?

第一个拐点就是发生在互联网银行慢慢取代柜员,IT支持从支持几万十几万的柜员到支持面向所有的互联网客户,这里面发生了一个根本性的变化,无论是服务的形态还是IT的支撑,都发生了很根本的变化,这是移动和云要在里面发挥作用。

德清农商行在金融科技上的变革,是国内中小银行数字化转型的一个缩影。农商行以服务县域经济社会和谐发展为中心,而如何按照现代金融企业发展要求,为县域百姓提供更好、更优的金融服务,一直是金融行业的难题,也是银企合作的结合点。

所以,无论是用传统的结构化的数据,还是用现在互联网形态下面非结构化的数据,要解决的问题都是这些,只不过我们现在有了更丰富的数据源,有了更好的对于数据处理的方法。 目前,建设银行已经成立了上海大数据分析中心,这不属于技术部门,属于信息管理部门。

下一个拐点是什么?银行要从原来做的账务性的、交易性的处理转向能够渗透到经济生活的方方面面,这是一个场景化,如果抓不住这个拐点,银行就要被互联网金融颠覆或者管道化。

排列科技创始人兼CEO夏真博士认为,“在数字化转型过程中,银企合作的空间很大。农商行需要金融科技非常落地的支持,而排列科技在这方面能够构建一整套体系去服务农商行,包括大数据平台、智能模型服务、全流程信贷风控和精准营销。大数据平台建设只是第一步。”

5)建行大数据平台设计思路

3、三大互联网渠道已建立,具备大数据基础

从设计目标有这几条:

这几年银行三大互联网渠道已经建立:

策略上架构先行,我们已经有很好的基础架构。1、基础能力上,我们在做一些基础的大数据分析工具的搭建。2、要想明白用数据做什么?我一直不太同意你先不要管你做什么,先把平台搭起来,我不太清楚有多少人从做数据仓库过来,当时提的很多的概念是垃圾进垃圾出,到了大数据时代没人提这个事情了,好像所有大数据都是质量很高的,但这方面要警惕。

手机银行,已达到1.8亿多

功能架构设计,和大家都差不多,从采集、存储、分析、展现到应用。我要强调的是从这个结构来说,这是很完美的一个结构,但要能够实时或者及时地反映到你的业务流程当中去,反映到你的营销当中去。不要拘泥于一个结构。

网上银行,我们有2亿

数据设计,我们有一个演变过来的整体的结构。这里面我想强调一点,大数据是数据的一部分,结构化的数据是大数据的一部分,这两个东西不要割裂来看。

微信银行,它占的客服服务总量已经超过了传统的客户服务

6)建行大数据成果

这意味着我们的渠道、我们场景化的实践已经见到了效果,另外我们做大数据要具备的基础已经存在。

我们的大数据平台取得了一些成果: 实时的数据仓库上:我们能够对客户经理做实时的数据提供和交付,提供无论是并发的访问还是实时服务方面。 从数据的应用模式上:我们总结了六类数据应用模式,包括挖掘类、数据实验室、机器查询、仪表盘、固定报表、自动查询等等。

4、大数据要解决3大问题

建立“模型实验室”:现在越来越发挥了更大的作用,我们能够基于结构化和非结构化的数据支持大数据模型的研发,这个模型研发出来我们能够很快地把它部署到生产当中去,能够为一些决策,未风先管理服务。

谈大数据,对传统银行来讲,要解决3大问题

在非结构化大数据的应用方面,做探索:比如客户行为偏好的数据,录音文本、地理数据的应用、能耗数据的应用、媒体信息、员工行为数据等等。通过位置服务终端识别的新技术新数据的采用,拒绝可疑风险事件,上半年避免1.9万起,避免客户损失1.4亿,这种数据越来越大。

怎么样提升对于客户的识别?

7)未来,场景化、标准化、平台化

怎么样对于客户的营销?

刚才我提到了场景化,我们希望能够把金融数据的服务将来标准化和平台化,平台化之后能够在基础的大数据能力、基础数据的提供甚至一些分析数据的提供,基础应用,客户花香、征信评级的监测,为无论是内部的客户还是外部的客户提供更好的大数据技术,这是从技术方面来看大数据下一步做的工作。

怎么样提升对于风险的防范?

02 中国工商银行软件开发中心信息科技专家王晓平

所以,无论是用传统的结构化的数据,还是用现在互联网形态下面非结构化的数据,要解决的问题都是这些,只不过我们现在有了更丰富的数据源,有了更好的对于数据处理的方法。

图片 6

目前,建设银行已经成立了上海大数据分析中心,这不属于技术部门,属于信息管理部门。

1)工行大数据面临的挑战

5、建行大数据平台设计思路

如何处理数据量的快速增长?首先全行的数据量的快速增长,包括我们现在工行每天的交易量,外部互联网金融,工行的三大互联网平台造成用户的交易数据和行为数据有大幅的增长。 如何快速智能分析历史数据? 工行从2000年开始建立数据仓库以来,拥有了庞大的历史数据资产,在新的环境下怎么能够快速地智能分析,对我们提出了更高的挑战。 如何使用内外数据,描述客户特征?在数据源方面,除了本单位数据,也需要采纳外部的数据来配合进行分析。工行已经引入了征信数据、税务数据等,怎么做到比较全的数据去描绘我行的客户特征,这是作为我们的一个新的课题。

从设计目标有这几条:

2)工行大数据战略思路

策略上架构先行,我们已经有很好的基础架构。1、基础能力上,我们在做一些基础的大数据分析工具的搭建。2、要想明白用数据做什么?我一直不太同意你先不要管你做什么,先把平台搭起来,我不太清楚有多少人从做数据仓库过来,当时提的很多的概念是垃圾进垃圾出,到了大数据时代没人提这个事情了,好像所有大数据都是质量很高的,但这方面要警惕。

工行整个的战略思路是通过我们行的两库一司的建设来完善大数据体系。 两库是信息库和数据仓库,数据仓库在工行的建设和银行的建设中都是比较传统的,主要是应对我们之前的银行交易数据、账户数据,采用结构化的数据存储来进行相关的处理。前两年的时候工行启动了信息库的建设,主要指非结构的数据。 通过两库的建设,我们还建设了一支分析师队伍,能够对这些庞大的数据进行相关业务的加工处理和分析。

功能架构设计,和大家都差不多,从采集、存储、分析、展现到应用。我要强调的是从这个结构来说,这是很完美的一个结构,但要能够实时或者及时地反映到你的业务流程当中去,反映到你的营销当中去。不要拘泥于一个结构。

3)发展阶段

数据设计,我们有一个演变过来的整体的结构。这里面我想强调一点,大数据是数据的一部分,结构化的数据是大数据的一部分,这两个东西不要割裂来看。

工行大数据的发展历程可以分几个阶段,从TB级已经进入了PB级的建设阶段,接下去在可预见的几年内会进入EB级的庞大体量。

6、建行大数据成果

最早工行是2000年初,那个时候大数据的领域更多的还是应用在一些报表的快速展现,所以那个时候我们是基于比较传统的Oracle和SaaS,做了T 1的动态报表,行领导和管理层能够在第二天上班前看到我们行昨天的经营数据,这是最早建立的。

我们的大数据平台取得了一些成果:

2007年工行基于当时较先进的企业级的数据仓库的体系架构启动了工行的企业级数据体系的建设,做了全行统一的管理数据的大集中。

实时的数据仓库上:我们能够对客户经理做实时的数据提供和交付,提供无论是并发的访问还是实时服务方面。

2010年基于我们的数据仓库的数据支持,我们推出了工行的MOVA管理会计系统,做了全行绩效考核的管理系统。 2013年随着外部形势的发展,大量数据爆发式的出现,我们引进了大数据领域在业界最流行的Hadoop技术,在Hadoop基础上搭建了信息库,发展是非常快的。

从数据的应用模式上:我们总结了六类数据应用模式,包括挖掘类、数据实验室、机器查询、仪表盘、固定报表、自动查询等等。

2014年工行基于大数据,原来的大数据采用连机异部批量的方式,通过文件存储的方式,不管是数据仓库还是信息库,在时效上相对来说比较慢,所以自主研发了一个流数据平台,能够提供实时或者准实时的流数据处理。 2015年下半年和今年正在推动分布式数据库的落地工作,会和企业级数据仓库做一个互补。这是大数据的主要技术演进。

建立“模型实验室”:现在越来越发挥了更大的作用,我们能够基于结构化和非结构化的数据支持大数据模型的研发,这个模型研发出来我们能够很快地把它部署到生产当中去,能够为一些决策,未风先管理服务。

4)大数据体系

在非结构化大数据的应用方面,做探索:比如客户行为偏好的数据,录音文本、地理数据的应用、能耗数据的应用、媒体信息、员工行为数据等等。通过位置服务终端识别的新技术新数据的采用,拒绝可疑风险事件,上半年避免1.9万起,避免客户损失1.4亿,这种数据越来越大。

在大数据平台上,我们可以把它抽象成如下几层:

7、未来,场景化、标准化、平台化

第一层是数据采集,统一针对外部和内部的数据进行相关的数据收集,包括日志信息、行为信息和业务信息。

刚才我提到了场景化,我们希望能够把金融数据的服务将来标准化和平台化,平台化之后能够在基础的大数据能力、基础数据的提供甚至一些分析数据的提供,基础应用,客户花香、征信评级的监测,为无论是内部的客户还是外部的客户提供更好的大数据技术,这是从技术方面来看大数据下一步做的工作。

再上面一层计算层,是我们不单单提供了传统数据仓库的批量计算的能力,也通过一些流数据的技术提供了实时的计算能力。

中国工商银行

再上面一层应用层,抽象了大数据相关的应用,包括用户可以自定义的查询功能。通过这些信息的服务,把这些服务抽象到我们的业务系统中,通过我们的管理会计系统,通过分析师平台、风险系统、营销系统,为我们在数据的运营、风险控制和营销方面都提供相关的支持,这就是主要的大数据分层体系。

中国工商银行软件开发中心信息科技专家王晓平

5)分布式、开源、通用成为趋势

图片 7

从大数据的起源开始,数据仓库到目前的大数据新形势下,数据仓库已经在做非常大的升级换代和变化。2014年工行从高成本封闭的专业系统(如:Teradata),开始向高性价比、通用设备和开放技术的系统转变。

1、工行大数据面临的挑战

转型有两个原因:

如何处理数据量的快速增长?首先全行的数据量的快速增长,包括我们现在工行每天的交易量,外部互联网金融,工行的三大互联网平台造成用户的交易数据和行为数据有大幅的增长。

第一是数据量太大了,原来只需要处理TB级已经转向需要处理PB级甚至以后EB级的数据量。如果是这么大的数据量,运用传统的设备没有办法进行相关的处理。

如何快速智能分析历史数据? 工行从2000年开始建立数据仓库以来,拥有了庞大的历史数据资产,在新的环境下怎么能够快速地智能分析,对我们提出了更高的挑战。

第二,性价比,我们做过测量,通过开放式的弹性可扩展的普通PC服务器的方式,比传统设备在成本上介绍十几分之一或者几十分之一。我们在新平台上一方面引进了Hadoop平台基于普通的PC服务器进行搭建,短短一两年的时间已经扩展到150个节点,存储空间已经超过1PB,超过建设了十几年二十年的Teradata的数据容量。

如何使用内外数据,描述客户特征?在数据源方面,除了本单位数据,也需要采纳外部的数据来配合进行分析。工行已经引入了征信数据、税务数据等,怎么做到比较全的数据去描绘我行的客户特征,这是作为我们的一个新的课题。

另外我们在研究也会尽快落地的分布数据库,会基于开源的底层架构,基于普通的PC服务器完成数据仓库体系的扩充。后续在大数据的处理加工方面会基于分布数据库进行处理。

2、工行大数据战略思路

从目前的分析角度来看,Teradata会保留,着重在高端的分析师分析挖掘的探索性的工作方面。后续工行的大数据体系会采用多种技术路线、多种技术平台共存的方式。

工行整个的战略思路是通过我们行的两库一司的建设来完善大数据体系。

6)非结构化数据信息库,通过搜索

两库是信息库和数据仓库,数据仓库在工行的建设和银行的建设中都是比较传统的,主要是应对我们之前的银行交易数据、账户数据,采用结构化的数据存储来进行相关的处理。前两年的时候工行启动了信息库的建设,主要指非结构的数据。

非结构化数据信息库的建设情况,建行已经介绍了,工行也有点像。信息库的建设原则,因为非结构化的数据的量是非常大的,所以我们的原则是信息库建设没有把非结构化建设进行物理存储的集中,我们只是通过统一的搜索引擎让用户能够快速地搜索找到他需要的非结构化的信息。

通过两库的建设,我们还建设了一支分析师队伍,能够对这些庞大的数据进行相关业务的加工处理和分析。

7)风险防控,是落地最快、最有成效的应用

3、发展阶段

工行在大数据应用方面主要侧重在风险方面。

工行大数据的发展历程可以分几个阶段,从TB级已经进入了PB级的建设阶段,接下去在可预见的几年内会进入EB级的庞大体量。

工行通过大数据在事前、事中、事后三个环节的运用进行风险的柔性控制。简单地举一个例子,事前,比如银行卡的授信过程中,或者信贷要进行发放做净值调查中,数据能给它一个支撑。事中,比如银行卡最近比较多地发生盗刷行为,我们可以在事中通过大数据的方式发现银行卡的盗刷行为。事后,可以根据事后的交易或者发生的事件进行相关的分析,分析我们后续在业务的拓展或者风险控制方面有哪些需要进一步改进或者补救的工作。

最早工行是2000年初,那个时候大数据的领域更多的还是应用在一些报表的快速展现,所以那个时候我们是基于比较传统的Oracle和SaaS,做了T 1的动态报表,行领导和管理层能够在第二天上班前看到我们行昨天的经营数据,这是最早建立的。

这里举了几个简单的案例。非常好的大数据的应用场景:

2007年工行基于当时最先进的企业级的数据仓库的体系架构启动了工行的企业级数据体系的建设,做了全行统一的管理数据的大集中。

第一,交易反欺诈,需要利用大数据流数据的技术,用户在做交易的过程中采用主机旁路技术,交易没有完成之前通过大数据在内存中进行一个判断。

2010年基于我们的数据仓库的数据支持,我们推出了工行的MOVA管理会计系统,做了全行绩效考核的管理系统。

第二,大数据怎么运用模型,通过比较好的用户特征的总结和模型做一个监控。通过标签信息,比如我们定义了两个标签,一个是用户开户的地区比较广泛,另一个他持有比较多的借记卡,我们可以认为他涉嫌倒卖银行卡的嫌疑,我们通过大数据的计算可以把这些人员抓出来,可以进行后续的业务处理和防空。这也是大数据应用的比较好的方面。

2013年随着外部形势的发展,大量数据爆发式的出现,我们引进了大数据领域在业界最流行的Hadoop技术,在Hadoop基础上搭建了信息库,发展是非常快的。

第三,现在各个银行业碰到的比较大的困境,信贷资产的质量问题。工行持续在推动运用大数据驱防控信贷风险,工行成立了信贷防控中心,运用大数据技术在进行相关的防控。

2014年工行基于大数据,原来的大数据采用连机异部批量的方式,通过文件存储的方式,不管是数据仓库还是信息库,在时效上相对来说比较慢,所以自主研发了一个流数据平台,能够提供实时或者准实时的流数据处理。

03 中国农业银行软件开发中心专家赵维平

2015年下半年和今年正在推动分布式数据库的落地工作,会和企业级数据仓库做一个互补。这是大数据的主要技术演进。

图片 8

4、大数据体系

1)银行在技术选择上,相对保守

在大数据平台上,我们可以把它抽象成如下几层:

我们在2003年初开始搞大数据,当时有很多困惑,首先感觉到大数据到来了,现在各个行业,中央台什么东西都用大数据说话,我们在银行业我们能做什么呢?

第一层是数据采集,统一针对外部和内部的数据进行相关的数据收集,包括日志信息、行为信息和业务信息。

早期在十几年前我们大家做数据仓库的时候,大家可能选择面都很窄,四大行除了我们没用TD其他都是用TD做的数据仓库。我们当时某系统也很痛苦,计算资源可以扩,但IO能力就在那里。当时觉得列存储带来很大的优势,处理通用的数据量减少了很多IO。平台选用什么?还用传统的吗?新型的怎么样?

再上面一层计算层,是我们不单单提供了传统数据仓库的批量计算的能力,也通过一些流数据的技术提供了实时的计算能力。

金融在有些技术的选择上还是相对比较保守的,我们不会用的技术,不会用的版本,这也因为金融工委和国家人民银行对于我们的连续服务要求特别高,一旦出了事情领导交不了差。

再上面一层应用层,抽象了大数据相关的应用,包括用户可以自定义的查询功能。通过这些信息的服务,把这些服务抽象到我们的业务系统中,通过我们的管理会计系统,通过分析师平台、风险系统、营销系统,为我们在数据的运营、风险控制和营销方面都提供相关的支持,这就是主要的大数据分层体系。

2)自主可控,我们从几点入手

5、分布式、开源、通用成为趋势

在自主可控上,基础硬件、基础软件、数据模型、工具平台和制度管理都是自主可控的。

从大数据的起源开始,数据仓库到目前的大数据新形势下,数据仓库已经在做非常大的升级换代和变化。2014年工行从高成本封闭的专业系统(如:Teradata),开始向高性价比、通用设备和开放技术的系统转变。

硬件方面,采用华为的RH2288系列,2C、docore、256内存、12 4T硬盘,不同时期买的硬盘的容量是不一样的,后来是4T,之前是3T。

转型有两个原因:

基础软件方面,我们引进了国产的南大通用做的MPP架构数据库,我们在原形试运行阶段从2013年圆形环境开始投产,采用28个数据节点,2014年3月份把它扩到56个节点。非结构化,结构化的数据上游生产数据基本都是放在MPV架构数据库里,使用起来技术上更流畅,效率更好。Hadoop方面,非结构方面目前使用的是CDH开源版,大概有100个左右的Datanode。

第一是数据量太大了,原来只需要处理TB级已经转向需要处理PB级甚至以后EB级的数据量。如果是这么大的数据量,运用传统的设备没有办法进行相关的处理。

数据模型方面,我们结合先进的建模理论,我们融合了范式和维度的思路。我们在主库核心层面基本是范式建模减少重复。维度方面由业务驱动的方式建立维度模型为主。

第二,性价比,我们做过测量,通过开放式的弹性可扩展的普通PC服务器的方式,比传统设备在成本上介绍十几分之一或者几十分之一。我们在新平台上一方面引进了Hadoop平台基于普通的PC服务器进行搭建,短短一两年的时间已经扩展到150个节点,存储空间已经超过1PB,超过建设了十几年二十年的Teradata的数据容量。

基础的工具方面,大家知道有ETL、批量调度、源数据的管理,这些东西都是我们自主开发的。我们制定了一套比较完备的规范、制度、方法、标准。

另外我们在研究也会尽快落地的分布数据库,会基于开源的底层架构,基于普通的PC服务器完成数据仓库体系的扩充。后续在大数据的处理加工方面会基于分布数据库进行处理。

3)整体逻辑架构

从目前的分析角度来看,Teradata会保留,着重在高端的分析师分析挖掘的探索性的工作方面。后续工行的大数据体系会采用多种技术路线、多种技术平台共存的方式。

数据源层,上游的生产系统,几乎全行所有的生产系统的数据到今年底已经全部进来了,金融交易类百分之百都进来了,现在有60多个上游系统,通过一个交换平台,交换平台不仅仅为大数据服务,负责上游生产和下游数据消费系统总分行之间、总行各应用系统间数据交互的平台。

6、非结构化数据信息库,通过搜索

数据处理层,淡黄色指关系型的数据库,也就是MPP架构数据库。操作数据区、非结构化数据区、历史数据平台、流计算,流计算用Hadoop Stam架构。

非结构化数据信息库的建设情况,建行已经介绍了,工行也有点像。信息库的建设原则,因为非结构化的数据的量是非常大的,所以我们的原则是信息库建设没有把非结构化建设进行物理存储的集中,我们只是通过统一的搜索引擎让用户能够快速地搜索找到他需要的非结构化的信息。

下面是Hadoop的东西。我们在整个大数据平台的结构化主库里分了基础数据库、共性加工区和指标区,非结构化有操作数据区、非结构化处理和历史数据平台。影像那部分早期已经建好了,为了减少网络压力基本上存在分行。

7、风险防控,是落地最快、最有成效的应用

跟传统不一样的是,大数据平台的日加工时间目前在七八个小时,早期批量一个是优化不到位,一个是处理的分层,所以用了Hadoop把ETL和操作数据区都放在Hadoop里,因为可以节点多、计算能力强,完成了ET的过程,上游来的全量数据在这里做了归类,生成了一个纯层量的数据,减少了一天的批量时间几个小时,提升33%的性能。

工行在大数据应用方面主要侧重在风险方面。

数据集市层,现在规划8个数据集市,跟其他行没有太多区别,客户营销、风险管控、外部监管,对分行服务的集市,各行服务的对象都是一样的。底下研了数据提取平台,外部监管和数据提取任务特别重,早期都得到生产去导带生成,现在我们通过单独建一个环境,把一些数据预加工好,基本以宽表的模式,以前做加法的事情变成了做减法,至少80%的提出需求都在我的环境里直接提取,大大减轻了人力。

工行通过大数据在事前、事中、事后三个环节的运用进行风险的柔性控制。简单地举一个例子,事前,比如银行卡的授信过程中,或者信贷要进行发放做净值调查中,数据能给它一个支撑。事中,比如银行卡最近比较多地发生盗刷行为,我们可以在事中通过大数据的方式发现银行卡的盗刷行为。事后,可以根据事后的交易或者发生的事件进行相关的分析,分析我们后续在业务的拓展或者风险控制方面有哪些需要进一步改进或者补救的工作。

底下是分析挖掘平台,ODM、SaaS都是农行已有的云,大数据只是它的用户而已,我们在Hadoop分装了应用,为全行的分期挖掘提供服务支撑。对上层应用的服务有直接访问,数据文件和外部服务和数据快速复制等技术和应用进行连接。应用主要是对资产负债领域、电子银行领域、信用卡和个人金融领域、风险和财务提供了一些支撑。

这里举了几个简单的案例。非常好的大数据的应用场景

大数据平台和集市,我们建成了4个集市,有3个集市在建的过程中,今年分行下半年要搞分行集市的试点。应用,我们提供统一的数据展示和服务。展示服务一个是对所有全行业的用户,对所有行业监管的各种报送,因为各种报送比较零乱,点也比较多,趋向不同部署也不一样,底层做了统一调度、统一监控和ETL,对全行描述类数据进行了统一管理,包括我们的数据标准和数据质量管理都在这里统一进行。

第一,交易反欺诈,需要利用大数据流数据的技术,用户在做交易的过程中采用主机旁路技术,交易没有完成之前通过大数据在内存中进行一个判断。

4)硬件环境如何进行有效支撑?

第二,大数据怎么运用模型,通过比较好的用户特征的总结和模型做一个监控。通过标签信息,比如我们定义了两个标签,一个是用户开户的地区比较广泛,另一个他持有比较多的借记卡,我们可以认为他涉嫌倒卖银行卡的嫌疑,我们通过大数据的计算可以把这些人员抓出来,可以进行后续的业务处理和防空。这也是大数据应用的比较好的方面。

在Gbase方面,56是生产环境,现在实现了56环境的双活,这两个56环境同时在工作,一个做T 1当天的数据加工,一个做隔一天的连级服务,这样的话连级服务的能力,按实侧的话会比以前做TD的测试中更强一点,另外个人客户集市、资产负债集市,还做了数据挖掘层次,Gbase集成了WODM和SaaS。Hadoop的生产环境是92个datanode和2个namenode。我们现在Gbase有236个节点,库内主副本的整个容量有5.2PB数据,Hadoop的集群是150个节点,容量是4.3PB。

第三,现在各个银行业碰到的比较大的困境,信贷资产的质量问题。工行持续在推动运用大数据驱防控信贷风险,工行成立了信贷防控中心,运用大数据技术在进行相关的防控。

56 8是56个数据计算环境,8个是加载机,56个环境每个节点是12块3T的硬盘,有2块做Read1,是存放操作系统和重要的参数信息和数据库环境,其他10个环境是Read5来存放数据,一个节点存放有效数据10几个T,56的环境里有效数据将近300个T,Gbase有5到10的压缩比,各个字段可以选择压缩去,300个TB的数据换算成仓外的文本量,就算简单乘以300T也是1.5PB以上,现在折算成1.8PB左右,是PB级的。

中国农业银行

我们跟Gbase从这个时候开始合作,我们在八方面跟他们共同做了一些优化工作,跟Gbase做了大量优化,有近百个优化的细项。MPP数据库,我们搭建了双活机制,两个库之间的同步加验证现在每天大概是22TB的数据,仅需要3小时。早期在给主库做备份的时候,100TB的数据有小40个小时,后来我们用了Hadoop做备份,100TB用了不到10小时,大家用TB备份一直是比较难的事情,在Hadoop方面我们做了大量基础性的工作,非结构化的数据、文件的服务、数据的备份等等。

中国农业银行软件开发中心的专家赵维平

我们做了MPP和Hadoop的交互,有些应用要交互,我们做了非结构化MPP和HDFS之间的融合。后来启用了MPP和Hadoop之间的备份,大大提高了效率,300T也需要将近20个小时,所以我们做了双活,如果双活稳定的话我们就不用备份数据了。开发的基础工具包括ETL工具、批量调度、整个的监控和统一访问层,监控这块我们还做了健康检查,通过SaaS把半年的日志交过去,最后生成一些模型,给我预测整个系统运行的安全状况。数据混搭的模型设计,我们有一套完整的方法论,能保证数据的准确、稳定、完整和可用。同时我们在方法论、开发规范、数据规范和流程规范都积攒了一系列文档。整个模型是分层的,操作数据区、基础数据区、共性加工区、指标层和集市层,完成了客户的统一试图、产品的统一管理和客户的精准营销和风险管控等等。

图片 9

通过6个方面对大数据平台的数据进行了全生命周期的管理,包括建模、验证、清理、准入、数据地图和一些规范。

1、银行在技术选择上,相对保守

5)如何充分体现大数据的价值?

我们在2003年初开始搞大数据,当时有很多困惑,首先感觉到大数据到来了,现在各个行业,中央台什么东西都用大数据说话,我们在银行业我们能做什么呢?

我们在大数据的建设中充分体现了数据的价值:

早期在十几年前我们大家做数据仓库的时候,大家可能选择面都很窄,四大行除了我们没用TD其他都是用TD做的数据仓库。我们当时某系统也很痛苦,计算资源可以扩,但IO能力就在那里。当时觉得列存储带来很大的优势,处理通用的数据量减少了很多IO。平台选用什么?还用传统的吗?新型的怎么样?

分析挖掘上,跟业务融合,分别在多个领域写出了20多份分析报告,有精准营销和业绩价值等九个方面都落到不同的应用去尝试实现。

金融在有些技术的选择上还是相对比较保守的,我们不会用最新的技术,不会用最新的版本,这也因为金融工委和国家人民银行对于我们的连续服务要求特别高,一旦出了事情领导交不了差。

培养的人才,对SaaS、Spack、R语言,熟悉这些算法,对聚类、分类、回归、神经网络等等进行了研究,要好用,建立一套多场景的实验环境,流水线式的作业、组建化的模型集脱拉拽式的服务,使业务人员能更快地使用我的系统。多个技术对用户来讲是透明的,用户要使用的话非常方便。我们展示了非常完整的服务,对基础环境融合,对资源的管理展现进行全覆盖,部署的模式也是收放自如的,展现也突破了传统的思维,我们在报表展示层面是可交付的、动态的,可以放大缩小,可以按某一列去排序,可以锁定表头,不是一个静态的页面,报表是可操作的。

2、自主可控,我们从几点入手

04 中国银行总行软件中心上海分中心副总经理牛晓峰

在自主可控上,基础硬件、基础软件、数据模型、工具平台和制度管理都是自主可控的。

图片 10

硬件方面,采用华为的RH2288系列,2C、docore、256内存、12 4T硬盘,不同时期买的硬盘的容量是不一样的,后来是4T,之前是3T。

1)思考:大数据没有成功的原因是什么?

基础软件方面,我们引进了国产的南大通用做的MPP架构数据库,我们在原形试运行阶段从2013年圆形环境开始投产,采用28个数据节点,2014年3月份把它扩到56个节点。非结构化,结构化的数据上游生产数据基本都是放在MPV架构数据库里,使用起来技术上更流畅,效率更好。Hadoop方面,非结构方面目前使用的是CDH开源版,大概有100个左右的Datanode。

2015年下半年将近年底,Ganner对这1000多家企业和机构做了另外一次调查,大数据项目成功上马的不到9%,为什么?Ganner对他们没有成功做了原因的分析,其中比较重要的几条是这样的。

数据模型方面,我们结合先进的建模理论,我们融合了范式和维度的思路。我们在主库核心层面基本是范式建模减少重复。维度方面由业务驱动的方式建立维度模型为主。

排在第一位的是无法挖掘出数据的价值是什么, 第二位是企业或机构没有明确的大数据的战略目标和战略规划, 第三是缺乏核心技术, 第四是无法有效的整合数据资源, 第五是企业的内部无法对大数据的实施和规划达成共识。 总结了这样一些不太顺利的原因之后,我觉得有一个清晰的完整的系统性的战略规划,对中国银行以后大数据的建设的作用是非常巨大的。

基础的工具方面,大家知道有ETL、批量调度、源数据的管理,这些东西都是我们自主开发的。我们制定了一套比较完备的规范、制度、方法、标准。

2)中行特别之处

3、整体逻辑架构图

中行的战略方向: 以平台为支撑构建大数据的技术体系; 以数据为基础充分整合数据资源; 以应用为驱动深入挖掘数据价值; 以人才为核心提升数据分析能力; 以平台为支撑构建大数据的技术体系。我们把大数据的技术体系分成战略层面、规划层面和设计及交付层面,在这里面最重要的是大数据的体系架构,分为业务架构、应用架构、信息架构和技术架构四个不同的架构,在这四个不同的架构里分别支撑我们的业务流程和端到端的场景及应用的组建及分析模块,最后是设计跟交付。

数据源层,上游的生产系统,几乎全行所有的生产系统的数据到今年底已经全部进来了,金融交易类百分之百都进来了,现在有60多个上游系统,通过一个交换平台,交换平台不仅仅为大数据服务,负责上游生产和下游数据消费系统总分行之间、总行各应用系统间数据交互的平台。

我们在实施的方面采用分行试点的模式,有很多的调查机构在对大企业实施大数据项目做了总结之后发现大数据的项目实施方法上分两个流派,一个流派是自顶向下的,上来规划很大的大叔据的东西,从地层往下逐渐延伸,累了大量的数据,在这里面做清洗分析,在这里面找规律,再看这个企业怎么从数据里得到什么样的东西。另一个流派是从底向上的,先看需要哪些东西,再对这些数据进行整合。我看了很多相关的实例之后,后一个方法在现阶段的效果会更明显,有了清晰的需求才会更准确的对位需求的产品。所以我们在大数据实施的策略上采取小步快跑、快速迭代、迅速试错的方式。

数据处理层,淡黄色指关系型的数据库,也就是MPP架构数据库。操作数据区、非结构化数据区、历史数据平台、流计算,流计算用Hadoop Stam架构。

3)中银开放平台,是中行大数据实施例子之一

下面是Hadoop的东西。我们在整个大数据平台的结构化主库里分了基础数据库、共性加工区和指标区,非结构化有操作数据区、非结构化处理和历史数据平台。影像那部分早期已经建好了,为了减少网络压力基本上存在分行。

中银开放平台,2014年IDC金融的大奖,去年获得人民银行的奖,亚洲金融家组织把它评为今年较佳的金融云服务产品,这个产品是我们对大战略的落地实施的例子。这个产品的主要设计思路是我们把整个中国银行的大数据进行了归并整理之后,开发了1000多个标准的API接口,这些API接口可以用与我们的分行甚至我们的客户,在我们规划的未来里,可以通过这些API访问和使用中国银行的数据,用于加工得到自己想要的相关结果。

跟传统不一样的是,大数据平台的日加工时间目前在七八个小时,早期批量一个是优化不到位,一个是处理的分层,所以用了Hadoop把ETL和操作数据区都放在Hadoop里,因为可以节点多、计算能力强,完成了ET的过程,上游来的全量数据在这里做了归类,生成了一个纯层量的数据,减少了一天的批量时间几个小时,提升33%的性能。

目前已经有很多分行利用这样的平台开发出了很多比较受欢迎的产品,大家如果有兴趣的话可以在苹果的APP Store或者安卓的平台下载这个产品看一下。

数据集市层,现在规划8个数据集市,跟其他行没有太多区别,客户营销、风险管控、外部监管,对分行服务的集市,各行服务的对象都是一样的。底下研了数据提取平台,外部监管和数据提取任务特别重,早期都得到生产去导带生成,现在我们通过单独建一个环境,把一些数据预加工好,基本以宽表的模式,以前做加法的事情变成了做减法,至少80%的提出需求都在我的环境里直接提取,大大减轻了人力。

4)让数据发挥较大价值

底下是分析挖掘平台,ODM、SaaS都是农行已有的云,大数据只是它的用户而已,我们在Hadoop分装了应用,为全行的分期挖掘提供服务支撑。对上层应用的服务有直接访问,数据文件和外部服务和数据快速复制等技术和应用进行连接。应用主要是对资产负债领域、电子银行领域、信用卡和个人金融领域、风险和财务提供了一些支撑。

我们非常希望在合规的前提下充分利用银行外部的数据服务。因为银行或者金融企业的数据在深度上不是一般的互联网企业能够比拟的,如果我们金融行业跟其他的相关企业进行有效的数据交换,大家彼此利用对方的优势,就能够使我们这个数据得到更完美的使用。

大数据平台和集市,我们建成了4个集市,有3个集市在建的过程中,今年分行下半年要搞分行集市的试点。应用,我们提供统一的数据展示和服务。展示服务一个是对所有全行业的用户,对所有行业监管的各种报送,因为各种报送比较零乱,点也比较多,趋向不同部署也不一样,底层做了统一调度、统一监控和ETL,对全行描述类数据进行了统一管理,包括我们的数据标准和数据质量管理都在这里统一进行。

以应用为驱动,深入挖掘数据价值。做大数据应用的场景产品。此外中国银行还推出来口碑贷、中银沃金融的服务,都是按照这个思路去进行我们产品的组合规划和设计。

4、硬件环境如何进行有效支撑?

精准地建设客户的营销平台,把线下的客户信息和线上的客户行为统一在一起,把结构化的数据和非结构化的数据有机地提炼并且整合,争取能够较精确地描述客户的各项属性特征。

这是硬件的环境,在Gbase方面,56是生产环境,现在实现了56环境的双活,这两个56环境同时在工作,一个做T 1当天的数据加工,一个做隔一天的连级服务,这样的话连级服务的能力,按实侧的话会比以前做TD的测试中更强一点,另外个人客户集市、资产负债集市,还做了数据挖掘层次,Gbase集成了WODM和SaaS。Hadoop的生产环境是92个datanode和2个namenode。我们现在Gbase有236个节点,库内主副本的整个容量有5.2PB数据,Hadoop的集群是150个节点,容量是4.3PB。

56 8是56个数据计算环境,8个是加载机,56个环境每个节点是12块3T的硬盘,有2块做Read1,是存放操作系统和重要的参数信息和数据库环境,其他10个环境是Read5来存放数据,一个节点存放有效数据10几个T,56的环境里有效数据将近300个T,Gbase有5到10的压缩比,各个字段可以选择压缩去,300个TB的数据换算成仓外的文本量,就算简单乘以300T也是1.5PB以上,现在折算成1.8PB左右,是PB级的。

我们跟Gbase从这个时候开始合作,我们在八方面跟他们共同做了一些优化工作,跟Gbase做了大量优化,有近百个优化的细项。MPP数据库,我们搭建了双活机制,两个库之间的同步加验证现在每天大概是22TB的数据,仅需要3小时。早期在给主库做备份的时候,100TB的数据有小40个小时,后来我们用了Hadoop做备份,100TB用了不到10小时,大家用TB备份一直是比较难的事情,在Hadoop方面我们做了大量基础性的工作,非结构化的数据、文件的服务、数据的备份等等。

我们做了MPP和Hadoop的交互,有些应用要交互,我们做了非结构化MPP和HDFS之间的融合。后来启用了MPP和Hadoop之间的备份,大大提高了效率,300T也需要将近20个小时,所以我们做了双活,如果双活稳定的话我们就不用备份数据了。开发的基础工具包括ETL工具、批量调度、整个的监控和统一访问层,监控这块我们还做了健康检查,通过SaaS把半年的日志交过去,最后生成一些模型,给我预测整个系统运行的安全状况。数据混搭的模型设计,我们有一套完整的方法论,能保证数据的准确、稳定、完整和可用。同时我们在方法论、开发规范、数据规范和流程规范都积攒了一系列文档。整个模型是分层的,操作数据区、基础数据区、共性加工区、指标层和集市层,完成了客户的统一试图、产品的统一管理和客户的精准营销和风险管控等等。

通过6个方面对大数据平台的数据进行了全生命周期的管理,包括建模、验证、清理、准入、数据地图和一些规范。

5、如何充分体现大数据的价值?

我们在大数据的建设中充分体现了数据的价值:

分析挖掘上,跟业务融合,分别在多个领域写出了20多份分析报告,有精准营销和业绩价值等九个方面都落到不同的应用去尝试实现。

培养的人才,对SaaS、Spack、R语言,熟悉这些算法,对聚类、分类、回归、神经网络等等进行了研究,

要好用,建立一套多场景的实验环境,流水线式的作业、组建化的模型集脱拉拽式的服务,使业务人员能更快地使用我的系统。多个技术对用户来讲是透明的,用户要使用的话非常方便。我们展示了非常完整的服务,对基础环境融合,对资源的管理展现进行全覆盖,部署的模式也是收放自如的,展现也突破了传统的思维,我们在报表展示层面是可交付的、动态的,可以放大缩小,可以按某一列去排序,可以锁定表头,不是一个静态的页面,报表是可操作的。

中国银行

中国银行总行软件中心上海分中心副总经理牛晓峰

图片 11

1、思考:大数据没有成功的原因是什么?

2015年下半年将近年底,Ganner对这1000多家企业和机构做了另外一次调查,大数据项目成功上马的不到9%,为什么?Ganner对他们没有成功做了原因的分析,其中比较重要的几条是这样的。

排在第一位的是无法挖掘出数据的价值是什么,

第二位是企业或机构没有明确的大数据的战略目标和战略规划,

第三是缺乏核心技术,

第四是无法有效的整合数据资源,

第五是企业的内部无法对大数据的实施和规划达成共识。

总结了这样一些不太顺利的原因之后,我觉得有一个清晰的完整的系统性的战略规划,对中国银行以后大数据的建设的作用是非常巨大的。

2、中行特别之处

中行的战略方向:

以平台为支撑构建大数据的技术体系

以数据为基础充分整合数据资源

以应用为驱动深入挖掘数据价值

以人才为核心提升数据分析能力

以平台为支撑构建大数据的技术体系。我们把大数据的技术体系分成战略层面、规划层面和设计及交付层面,在这里面最重要的是大数据的体系架构,分为业务架构、应用架构、信息架构和技术架构四个不同的架构,在这四个不同的架构里分别支撑我们的业务流程和端到端的场景及应用的组建及分析模块,最后是设计跟交付。

我们在实施的方面采用分行试点的模式,有很多的调查机构在对大企业实施大数据项目做了总结之后发现大数据的项目实施方法上分两个流派,一个流派是自顶向下的,上来规划很大的大叔据的东西,从地层往下逐渐延伸,累了大量的数据,在这里面做清洗分析,在这里面找规律,再看这个企业怎么从数据里得到什么样的东西。另一个流派是从底向上的,先看需要哪些东西,再对这些数据进行整合。我看了很多相关的实例之后,后一个方法在现阶段的效果会更明显,有了清晰的需求才会更准确的对位需求的产品。所以我们在大数据实施的策略上采取小步快跑、快速迭代、迅速试错的方式。

3、中银开放平台,是中行大数据实施例子之一

中银开放平台,2014年IDC金融的大奖,去年获得人民银行的奖,亚洲金融家组织把它评为今年最佳的金融云服务产品,这个产品是我们对大战略的落地实施的例子。这个产品的主要设计思路是我们把整个中国银行的大数据进行了归并整理之后,开发了1000多个标准的API接口,这些API接口可以用与我们的分行甚至我们的客户,在我们规划的未来里,可以通过这些API访问和使用中国银行的数据,用于加工得到自己想要的相关结果。

目前已经有很多分行利用这样的平台开发出了很多比较受欢迎的产品,大家如果有兴趣的话可以在苹果的APP Store或者安卓的平台下载这个产品看一下。

4、让数据发挥最大价值

1、我们非常希望在合规的前提下充分利用银行外部的数据服务。因为银行或者金融企业的数据在深度上不是一般的互联网企业能够比拟的,如果我们金融行业跟其他的相关企业进行有效的数据交换,大家彼此利用对方的优势,就能够使我们这个数据得到更完美的使用。

2、以应用为驱动,深入挖掘数据价值。做大数据应用的场景产品。此外中国银行还推出来口碑贷、中银沃金融的服务,都是按照这个思路去进行我们产品的组合规划和设计。

3、精准地建设客户的营销平台,把线下的客户信息和线上的客户行为统一在一起,把结构化的数据和非结构化的数据有机地提炼并且整合,争取能够精确地描述客户的各项属性特征。

【编辑推荐】

本文由402com永利平台发布于互联网资讯,转载请注明出处:中国四大银行的大数据应用已到了哪个阶段,合

关键词:

  • 上一篇:没有了
  • 下一篇:没有了