近来,我国人民银行树立金融科技(FinTech)委员会,旨在加强金融科技作业的研讨规划和统筹和谐。跟着金融科技在事务层面浸透率的逐渐进步,大数据技能在金融安排中的运用日益宽广,关于商业银行如安在金融科技年代运用、提取、办理好大数据的评论也愈加深化。
20世纪以来,信息技能在金融业的中很多广泛运用,使其累积了体量巨大的数据和信息,金融安排傍边存储着数亿万计的数据,这种情况迫使金融安排必需求考虑怎么将这些数据转换为可以发明实践价值的内容,为企业尽或许多的发明赢利。但是,这些数据并不是为了剖析意图而专门出产,仅仅是随商业活动发生,虽然数量巨大,但难于直接发生价值,因而需求凭借大数据发掘技能进行深度发掘,使之成为有价值的信息。跟着数据收集才能逐渐进步,金融企业将构成时刻接连、动态改变的面板数据,其间不只包含用户的买卖数据,也包含用户的行为数据。简略的数据收集和归并对金融企业来说不足以有用运用这些数据,只要对其进行深度发掘,才可以发现其间的隐性信息并运用其为客户供给愈加优质的金融产品和服务。怎么对多源数据完结快速高效的海量数据处理?怎么应对互联网金融发生的碎片化数据、快速呼应需求引发的危险问题?怎么充沛运用数据剖析、发掘来获取更大的经济效益?是金融企业在进行大数据剖析时面临的几大应战。
互联网的展开催生了大数据技能的诞生。在21世纪初,全球网页内容大规划添加,网页内容每日添加速度超百万。截止2001年底,全世界网页个数达50亿个[1],互联网用户检索有用信息的难度越来越大。谷歌(GOOGLE)等具有较高查找引擎技能的公司开端树立查找体系,其内容掩盖数十亿网页,进步了人们对互联网内容的运用功率,大数据技能由此诞生。因为网页内容傍边需求处理的数据包含很多的非结构化内容,传统的查找技能无法完结检索。谷歌公司提出了以“散布式”为根底的存储和检索体系,包含散布式文件、散布式并行核算和散布式数据库等体系,完结了非结构化据的检索,并奠定了大数据技能的根底。伴跟着互联网工业的兴起,这种立异的海量数据处理技能在电子商务、定向广告、智能引荐、交际网络等方面得到运用,取得巨大的商业成功。这启示全社会开端从头审视数据的巨大价值,金融、电信等具有很多数据的职业也开端测验这种新的理念和技能,取得初步成效。与此一起,业界也在不断对谷歌提出的技能体系进行扩展,使之能在更多的场景下运用。2011 年,麦肯锡、世界经济论坛等闻名安排对这种数据驱动的立异进行了研讨总结,随即兴起了一股大数据热潮。
虽然大数据现已成为全社会热议的论题,但到现在为止,“大数据”尚无公认的一致界说。笔者认为,知道大数据,要把握“资源、技能、运用”三个层次。大数据是具有体量大、结构多样、时效强等特征的数据;处理大数据需选用新式核算架构和智能算法等新技能;大数据的运用着重以新的理念运用于辅佐决议计划、发现新的常识,更着重在线闭环的事务流程优化。因而说,大数据不只“大”,并且“新”,是新资源、新东西和新运用的归纳体。
现代金融安排傍边,数据财物成为其差异于传统金融安排的最大出产要素之一。关于数据财物的办理、运用、发掘,成为现代银职业加速立异、增强办理才能等事务的最重要作业。大数据发掘剖析决议计划的首要流程见下图1。银职业海量的数据内容,需求从“数据收拾/整合——数据仓库——数据选择——数据发掘——形式点评——常识”屡次的循环反复,才有或许到达预期的作用。
银职业监管安排关于数据办理和监测的要求也在不断进步,在《我国金融业“十三五”信息化建造规划》[2]中,“加速银行信息资源的会集,完结数据视图在全行规划的同享,充沛运用数据仓库和数据发掘技能,完结财物负债办理、财政绩效办理、危险办理和客户关系办理等主题运用,树立面向主题、面向商场、面向决议计划、满意内部办理及外部方针要求的银行办理信息体系建造”。《我国银职业信息科技“十三五”展开规划监管辅导定见》中又进一步指出,“大中型银行要把数据办理作为重要的准则性建造与根底性作业,加强安排确保、准则确保与流程确保,有序推动、要点强化;一致数据标准,进步数据质量,深化数据运用,有用支撑银行事务展开,有用进步银行办理水平[3]。” “十二五”晚期,大部分银行均开端着力处理数据质量较差的问题,开端加强数据办理、管控,进步数据信息质量,选用数据发掘和大数据技能深层运用、提炼数据以进步运营管控效能。
大数据技能的发生本身就有其剧烈的运用需求布景,它从一开端便是面向运用的。数据发掘技能在决议计划支撑方面有着广泛的商场前景,并可用于事务办理方运用,是完结CRM和BI的重要技能手法之一。详细触及商业化运用的有数据发掘技能中的数据库营销(Database Marketing)、客户集体区分(CustomerSegmentation & Classification)、布景剖析(ProfileAnalysis)、穿插出售(Cross-selling)等商场剖析行为,以及客户丢失剖析(Churn Analysis)、客户信誉评分(Credit Scoring)、鉴别 (Fraud Detection)等运用手法。现在,许多商业范畴(银行、稳妥、证券、超级商场、电信等)均有大数据技能成功运用的事例。在金融安排中,因为其供给多储蓄、出资和信誉卡事务之外,稳妥、股票、基金出资等也是其重要事务。因而,大数据技能和数据发掘技能在金融业中的首要运用有:1.数据剖析和规划结构的数据仓库;2.特征数据变量选择、相关特色相关数据用于猜测客户信誉情况;3.聚类、分类剖析辨认方针客户和商场;4.数据可视化进程及归并、聚类剖析鉴别洗钱等金融犯罪行为。
将大数据技能运用于金融业不仅仅技能展开的需求,也是金融业进步本身盈余才能的需求。在当时“以客户为中心、以商场为导向”的剧烈竞赛年代,在各大金融安排预备“二次转型”的变革进程中,要想进步中心竞赛才能、防备事务危险、进步事务剖析数据的时效性及精确性,就必须懂得怎么运用现代办理信息体系进行归纳剖析,发掘客户的潜在价值,运用有价值的信息改善服务手法,运用数据发掘技能完结功用化的决议计划支撑功用办理。一直以来,金融职业对数据的注重程度十分高。跟着移动互联网展开,各种金融事务和服务的多样化和金融商场的全体规划扩展。关于大数据带来的首要事务价值,参与调研的金融企业表明,大数据的价值是他们可以依据商业剖析完结愈加智能的事务决议计划,让决议计划的拟定愈加理性化和有依据。依托有前瞻性的决议计划,完结出产进程中资源更优化的分配,可以依据商场改变敏捷做出调整,进步用户体会以及率,然后获取更高的赢利。
按照单个客户个性化的营销计划和沟服务体系,金融安排按照信息化技能手法可以树立起精确的营销计划以完结对个人客户的精准营销(Precision Marketing)。这种树立在精准定位根底之上的营销活动,包含着对个别的注重和差异化的认同,可以最大极限地摊平企业的本钱。精准营销关于每一位金融客户的的喜好、喜好、购买才能均可以做出猜测和判别,依据归纳化的评分向顾客引荐金融服务及产品,以确保引荐产品在其财力规划和喜好半径之内。精准营销的根本理念如图2所示:
传统银职业傍边,知道产品、发生喜好、付款购买三个环节是金融顾客在购买进程傍边必定呈现的环节。因为在认知产品的进程傍边,顾客会经过网络、私家途径进行检索,对产品信息、类别进行了解以确认其购买信息,在此进程傍边发生的查找数据便可以定位顾客的收入水平、喜好和喜好,企业凭借散布式存储和云核算深度发掘这一系列关于该类顾客的信息,构成完好的客户关系体系(CRM体系),然后规划出各种序列的营销计划,推送给顾客,完结精准化营销[5]。
大宗买卖数据是传统银行最为注重的事务内容,因为受制于银行较弱的数据处理才能,体量巨大、细节更多的精细化买卖数据无法得到有用处理。例如,传统银行运营形式之下,商业银行仅能记载每次的银行卡消费信息,却无法完结实时的消费信息反馈,归集收拾;在存款、借款危险管控进程傍边,银行也关于对施行有用的危险管控。一般的商业银行在记载了客户消费和选择产品的数据后,亦没有运用好这些并不是为商业银行运营活动(风控、催收)而发生的数据。顾客的每笔出资和消费都被记载剖析之后,运用数据发掘技能将发生信息化决议计划,有助于进步用户体会,精细化办理水平将不断进步。
传统银职业中的信息数据是手艺化发生的,简略发生过错。特别是在信贷活动进程傍边,关于银行客户信息在记载进程中发生的过错将会给银行运营的有用性构成丢失,这种传统的手艺信息处理办法功率低下、精确度差、本钱高。在商业银行的借款事务傍边,银行需求对客户的个人信息、财政情况和抵押品等内容进行尽职查询,信息获取的本钱较高。但在大数据年代,商业银行对客户信息的采录进程彻底主动,经过客户自填、自报,录入客户的个人信息,然后愈加精确地了解到客户的实践情况,下降人工处理本钱,进步办事功率。关于个别、小微层面的注重将有用处理长时刻以来困扰我国企业的“小微融资难”问题。
商业银行的传统事务形式傍边,跨地区、跨国运营本钱极高,商业银行不只要承当开设实体安排的本钱,还要承当与代理行之间发生的冲突运营本钱。在大数据技能的协助之下,商业银行总部安排将可以愈加快捷地获取更多有价值的信息,不只局限于当地的分支安排,跨过了地域、时空束缚。对各个条线的集约化办理,使得银行总部的运营权力愈加会集,分支行的履行功用将被强化,银行办理责任、风控战略将被会集于总行层面,有助于进一步进步安排全体履行力,避免上传下达进程傍边的冲突本钱[6]。
经济社会的三个重要组成要素:产品、信息、资金浸透于互联网年代的许多环节,互联网年代的剧烈竞赛傍边,电商、银行、物流三大类别企业代表着三种要素的重要占有者,三者都期望成为操纵着三种要素的利益取得者。虽然在互联网技能、途径层面商业银行有所落后,但从长时刻展开趋势来看,商业银行具有重要的优势一起也存在着许多困难,首要包含以下几个方面:
商业银行不只把握着很多资金,并且在信息收集方面也具有共同优势,不管是鉴别优、劣客户进行授信借款,仍是金融服务用户买卖活动留下的买卖痕迹都是其重要数据财物。尤其是商业银行的信息化建造也居于各职业前列,信息处理与建造现已根植入商业银行的“思维”。商业银行不只要信息化建造的志愿,并且具有建造优质信息化体系的条件。特是在2000年之后,我国的商业银行提出树立数据集市的思路。各大商业银行纷繁树立了数据中心和备份中心,进步了数据的存储运用功率和危险防控才能。别的,因为在借款和金融事务开办之前,各自然人都需求在商业银行开户并填写个人根本信息,社会上的资金划转要以商业银行为前言,因而商业银行有着广泛的途径获取客户信息和资金流信息,一起POS机和ATM也可以获取个人的消费信息。多年的堆集,使商业银行已构成海量的信息数据库,其结构化程度优于电商等企业。
我国的商业银行均设有科技开发中心、数据测验和收会集心以便于商业银行开发具有自主常识产权的个性化事务、功用。在二十世纪初提出的树立数据会集项目进程傍边,商业银行累积了很多建造杂乱数据信息体系的经历,触及软件开发、数据仓储等详细实操项目,这些项目训练了商业银行的科技开发部队,为商业银行堆集了许多软件开发、办理人才。金融人才和信息科技人才的结合是商业银行构建有用物流、信息流的重要根底确保。
商业银行的赢利率遍及较高,近几年来的成绩添加较快,许多商业银行的盈余才能开端超越国外商业银行。因而,商业银行内部具有足够的资金,有利于商业银行树立大规划的资金、物流、信息流操作体系。资金优势使商业银行在构建三网交融进程傍边可以树立先进的数据操作体系、存储体系和核算体系,有利于大数据技能和展开和运用。
我国的商业银行一方面自负盈亏,另一方面与方针存在着千丝万缕的联络。我国的商业银行车牌较难取得,电商和物流商的资历相对都比较简略。我国大型商业银行已根本完结集团化运营,全国十五家上市银行财物占到我国商业银行总财物的60%以上,其运营办理经历、理念、办法、办法都强于电商和物流企业,简略构成跨界、跨区域运营。
在运用大数据协助商业银行进行问题处理的一起,信贷客户个人信息保护、隐私保护的边沿在哪里,客户的哪些数据可以收集,可以经过什么样的办法收集?个人数据是不是可以悉数收集,收集在一起引起的副作用也要考虑。例如:美国有法令标准制止教育部分的数据就移民局数据联通,移民局不得运用教育部分数据来抄获不合法移民,意图是为了避免这些移民因为惧怕移民局而不将儿童送去上学,假如存在很多的失学青年或许会对美国社会的安靖和未来晦气。
哪些数据可以收集收集?是否可以追寻公司高管个人的信息?这些问题均触及到品德与法令层次的重要问题。数据财物的合理运用也需标准,数据成果能用于哪些方面,是否会违反非轻视准则?在证券买卖与商业银行数据运用进程中必定触及到方方面面的内容亟待处理。别的更大规划的数字化关于资本商场、信贷商场的的久远影响终究怎么?对各种参与者都是公正的吗?关于商业银行的存在实质是有利的吗?
以上种种问题,仅仅冰山一角,大数据对社会、对金融、对个人的影响还需详尽剖析和推演,需拟定在金融范畴的数据收集、数据剖析和运用规矩,拟定底线。
商业银行应当持续运用大数据和数据发掘技能及时、精确、全面地把握本身财物质量、数量及散布、头寸调度、信贷情况,供给给客户安全、牢靠及强有力的技能支撑。数据仓库、大数据、数据集市经过深度发掘可以取得“深度效益”;一起,大数据技能还收集了很多的商户、用户材料,可以为开发新的产品、事务及归纳化服务,让银行在不同的途径、层面上为用户供给异质化事务变得愈加简略,并且为商业银行的运营办理决议计划供给了支撑与依据,让商业银行可以随时依据与自已有历史经历来往的商户数据信息推断出客户的信誉情况,有助于银行危险的防备。
跟着各种新技能的展开,大数据与数据发掘技能也随研讨的深化而不断进步,往后将愈加快捷、有用地运用于未来的实践傍边去,结合新的理论、技能和模型点评办法,以添加数据发掘的有用性,进一步进步数据剖析东西的实用性。数据发掘在未来商业银行中的研讨焦点和需求进一步展开的作业在于以下几个方面。
传统商业银行的数据运用信息体系收集与保存体系在大数据运用环境布景下仍需进一步完善与,本文依据商业银行大数据的事务根本需求和监部部分的监管要求,结合我国金融安排当时的实践情况,选用企业级分层架构思维,构建出如图3所示的金融安排大数据信息体系体系架构图:
该大数据体系体系结构的特色包含:①层次化明晰。体系共分为运用层、服务层、网络层和数据层,在体系体系结构中,每层将具有相同服务功用的部分封装在一起,相邻层之间调用服务;②在传统三层网络体系结构的根底上,该体系结构加入了网络层,经过金融安排专用网络将服务层和数据层相连接,并设置了防火墙,充沛确保金融安排事务数据的安全性;③各个商业金融安排可以经过金融安排专用网络同享数据库信息,一起各监管部分与事务条线可以实时检查银行运营事务数据,进步事务展开功率与监管可行性。
不断注重数据发掘技能的实践运用。虽然国内关于大数据技能和数据发掘理论对算法模型的研讨较多,但实践运用事例和算法运用改善事例却比较少,缺少可以学习的经历数据。怎么引进国外的先进经历、技能,改善算法的功用并进行有用性测验,查验算法合理性和功用体系的稳定性?结合多种数据发掘算法完结,进步数据发掘的功率和技能成效仍是亟待处理的问题。
加强人机交互,可以把用户需求处理的问题便利地转化为数据发掘技能人员可以了解并处理的问题,然后将成果以更直接的表现形式被用户了解。完善解说机制,将各种算法的研讨趋向于简略化和易于了解。
从多媒体数据库中发现有含义的形式,包含对文本数据、图形数据、音频数据以及超文本数据的发掘等。根据内容的检索和类似度查找、概化和多维剖析、分类和猜测剖析对杂乱数据进行发掘,使数据发掘技能展开的全体趋势由处理简略的发掘问题逐渐到处理杂乱的发掘问题。
用科学的办法加以评价。现在许多算法所花费的时刻很短,但其发掘成果的数据却远远超出了可了解的规划。跟着信息技能的高速展开,往后的算法研讨需求会集在发掘成果的有用性上,便于用户快速得到自己所需求的、有价值的信息。包含对算法的动态保护、根据束缚的发掘算法和进步算法的可伸缩性等都将是首要的研讨方向。
[1]薛冬辉,大数据年代下的物流、信息流、资金流交融——根据商业银行视角[J].物流技能,2014(1)
[2]我国工商银行.大数据年代下的三流交融——根据商业银行的视角[R].银职业研讨,2013(8).