轉自:普林科技
導讀:2016年3月24日,“第九屆中國城市商業銀行信息化發展創新座談會”召開。可以說,大數據已經成為金融發展轉型的動力源泉。大會為此專門邀請了國際著名數學家,人稱“大數據院士”的中國科學院院士、北京大數據研究院院長、普林科技技術指導委員會主任鄂維南教授就“大數據在銀行業如何務實落地”發表了主題演講。
作為著名學者,鄂院士首先表示這是首次看到整個社會對一項技術產生強烈的興趣,這背后的深刻原因正是中國經濟的轉型升級。谷歌的Alpha?Go戰勝了人類圍棋最強選手,其背后的機理便是大數據技術。可以說,這是人類社會一個前所未有的機會,通過大數據技術可以幫助我們做出更加智慧的決策。
就整個大數據應用產業鏈條而言,首先隨著互聯網、物聯網的發展,企業經營活動、消費者行為產生了海量數據;于是數據采集、傳輸、存儲技術應運而生,Hadoop、Spark等大數據分布式基礎架構風生水起。
隨后在數據基礎上進行基本的運算處理,獲得對數據的初步認知。
最后便是應用數據挖掘技術,找到數據背后的規律,形成新的業務認知。當完成這最后一步,大數據的價值才真正被完全釋放。
在這方面,除了大家熟知的谷歌,美國還有一家專業從事大數據建模分析的公司Palantir,據傳正是他們協助美國政府找打了本拉登的藏身之所。
中國也有一家公司普林科技專業從事這方面的工作,他們幫助央行打造新一代評分模型,幫助證監會構建資本市場征信體系等。
說回到銀行業,目前銀行業主要面臨三方面的挑戰。
首先,經濟下行,需求不足,這對銀行業的精細化管理提出了更好的要求。
其次是新技術的沖擊,互聯網加大數據催生除了互聯網金融、大數據風控等全新的金融業態,傳統銀行所秉承的經營理念、技術手段遭到了前所未有的挑戰。
最后,相比于美國,可以說我國的銀行業基礎設施還是不夠健全,個人征信報告的覆蓋人群僅3.7億,這也就意味著大部分中國人沒有任何核心的金融履約行為記錄。
具體到城商行,面對這樣的大形勢,有四方面的問題更為突出。
那么,大數據技術可以如何幫助城商行應對這些挑戰呢?
首先,我們來看信貸風控。
信貸風控是銀行業務最核心的一環。要達到好的風控效果,好的風控模型和好的數據源都很重要。
就數據源而言,我國有3.7億人在央行有個人征信報告,這種金融履約行為是對一個人進行授信最核心的數據源。
其次,個人在銀行內部的交易數據、理財賬戶開通數據、存款數據等等可以作為個人金融行為數據的補充,對用戶進行更豐富的描摹。
最后,互聯網社交行為、手機通訊行為、電商平臺交易行為等,可以作為對個人信用描摹的外圍補充數據。
這里舉一個例子,大家都知道,我國有征信報告的人總共有3.7億,那么那些沒有任何金融履約行為記錄的人,在申請貸款時該怎么辦呢?
傳統的信用評估方法本質上其實一直秉持的是相同的理念,即假定難以得到大量數據、存儲大量數據成本過于高昂,或者說不可能使用大體量的數據。所以基于銀行本身數據的、基于經驗的審貸方法一直占據了主流。
但是大數據時代改變了這一切。傳統的信用評估只關注信用歷史等幾個變量,因而那些“金融活動不足者”便難以獲得貸款。于是美國一家公司收集了許多看起來微不足道的數據,甚至包括打字速度在內的上千維度的信息,再通過機器學習的方法建立這些信息和違約率之間的聯系。結果顯示,這種基于大數據和機器學習的評估模型較業內一流信用評分改善了40%。
可見,相對外圍的個人行為數據,結合大數據新算法,可以化學反應出非常神奇的結果。說回中國,其實現在也有很多互聯網征信企業,試圖通過借款人在網上的行為記錄來輔助放貸決策;也有公司試圖通過覆蓋面達到了12.3億人的手機,來“增厚”個人信用報告。
比如普林科技就打通了三大電信運營商,通過一個人的手機消費金額、通話對象、停機次數等眾多維度手機使用行為信息,來對信貸申請人進行信息核驗和風險評估。
我們再來看一下面對金融詐騙、網絡詐騙案件增多的情況,大數據可以如何幫助城商行?
基于行為標簽化的行為分析與異常識別是一點。通過對用戶的個人信息、交易偏好、交易習慣等大量信息的分析,可以清楚地描摹每一個用戶,甚至可以得出許多借貸人本人都不清楚的習慣。一旦這個賬戶出現了某些不符合分析結果的異常交易行為,就能夠被精準地識別出來。
關聯分析和社交網絡分析也是數學模型在金融反欺詐中的絕佳應用。比如詐騙團伙常常通過電話、郵編、身份證號、地址等不同類型的信息互相關聯,這些不同的關聯關系對應著特定類型的圖結構,通過大數據建模分析技術,可以構建基于圖的典型欺詐團伙模式庫,從而識別不同模式的詐騙團伙。
此外,在對申請人的信息進行處理時,其背后也用到了自然語言處理技術和中文模糊匹配技術,從而實現精準的分析匹配黑名單。
城商行目前面臨的第三個問題是,對客戶了解不夠,細分不夠,從而難以進行有效的產品營銷。那么我們如何認識我們的客戶呢?
這時就需要用到基于標簽化的用戶畫像技術。用戶畫像本質就是從業務角度出發對用戶進行分析,了解用戶需求,幫助尋找目標客戶。這里舉個例子幫助大家理解。
普林科技通過大數據分析和用戶畫像,為某商業銀行深入分析用戶的基本信息、消費行為、交易流水等,結合業務場景,將用戶細分,業務部門再據此設計產品、制定營銷策略,從而節省了45%的營銷成本。
最后,目前銀行內部數據之間,內部和外部眾多數據源之間難以進行數據整合和共享。我們以對公業務為例,傳統想要了解一個公司,需要投入大量的人力和精力去獲取各種信息,再根據經驗做出判斷。
而在大數據時代,通過互聯網爬蟲技術,我們可以獲取并整合包括工商、法院、稅務、互聯網輿情、企業招投標、招聘等海量數據,再通過建模分析將之歸結為信用歷史、運營指標、輿情指標等多維度,最后輸出綜合評分。其背后的技術則是網頁解析技術、圖像識別技術、自然語言處理技術和大數據建模分析技術。
首先,打造核心的風控與反欺詐系統,提高核心競爭力。
其次,將數據分析成果與營銷優化的具體方案結合,切實落地。
最后,立足本行數據,結合外部數據源,與專業分析團隊合作,有效實現數據共享、信息整合與技術融合。
]]>