取消
溫馨提示:
敬愛的用戶,您的瀏覽器版本過低,會導致頁面瀏覽異常,建議您升級瀏覽器版本或更換其他瀏覽器打開。

大數據“礦難”,以及它的災后重建

王超 來源:中國電子銀行網 2019-12-03 11:14:56 大數據 金融科技 原創出品
王超     來源:中國電子銀行網     2019-12-03 11:14:56

核心提示萬丈金山,毀于“爬蟲”。大數據礦難之后如何重建?

來源:Pixabay  作者:qimono

圖片來源:Pixabay ?作者:qimono

大數據礦難

千里之堤,潰于蟻穴。說的是防洪大堤的故事。

而在大數據領域,可謂萬丈金山,毀于“爬蟲”。

大數據被譽為金礦是早些年的事情。稱大數據為金山的,還有一人,那就是阿里巴巴的彭蕾。

早年間,彭蕾在請王堅幫助阿里突破技術瓶頸時說,“阿里巴巴的數據就是一座金山,但不知道如何挖掘,現在是坐在金山上吃饅頭。”

現如今,因為爬蟲事件,互聯網版圖上的大數據金山多有礦難發生。數據開墾受到不小的影響。爬蟲事件一度導致諸多號稱大數據智能風控/營銷的公司停止了相關的業務,而與其關聯的需求方里包括銀行。

大數據業務的停滯,直接導致了部分銀行的部分線上業務的關停。對相關方而言,這簡直是一次礦難,災害波及的廣度和深度都較大。

災后重建

大數據的災難發生后,我們不能因此而停止對金礦的挖掘,也就是不能因噎廢食。災后如何重建是個急需解決的難題。

阿里有大數據,大金礦,銀行同樣也有。

之前,有銀行開展線上營銷和服務,多是運用外部數據,原因是外部大數據技術較為成熟,而內部數據難挖。越是難挖,銀行越不愿意去挖,后面的數據也越堆越多。更要命的是,因其底層數據邏輯不通用,且存儲邏輯混亂,數據接口不一致,銀行的數據礦山越大,其挖掘難度也越大。其實,銀行也面臨著“坐在金山上吃饅頭”的窘境。

基于當前的現實,也就是外部數據風險不可控,內部數據難挖掘現狀。銀行應該思考如何從頂層設計上做好大數據的內部重構,讓數據標準逐步統一(一蹴而就地統一和服毒自殺沒區別),讓數據接口逐步統一,讓內部數據可用,讓金山可挖。

數據因為沉淀得過久導致數據龐大,陳舊的數據存儲和處理方式也導致數據難以統一。那么銀行新成立的金融科技子公司在成立之初,或許可以考慮做好大數據的頂層設計,為未來的開放銀行戰略做好鋪墊。

換個姿勢挖掘大數據金礦

目前來看,爬蟲事件的風險主要來自銀行外部。這是因為爬蟲技術的數據獲取方式粗暴,且不合規。

那么,我們應該因此而拒絕外部數據嗎?

當然不。

可我們該如何利用外部大數據呢?除了選擇合理合規的大數據公司或項目外,其實還有一個思路。

近期,南京江北新區和長沙湘江新區有不小的動作。而較為一致的一個做法是,成立新區大數據平臺。這些大數據平臺依托當地政企數據以及金融數據,通過云服務架構,構建生態數據庫,為經濟發展增速提效。

這種做法無異于自造數據金礦,無論是對當地企業還是金融機構都有不小的吸引力。

對銀行而言,在利用外部數據方面,與其猜疑私企數據的可靠性,不如花費一點心思考慮一下地方經濟新區主導的政企大數據平臺。不過,數據的采集、清洗、脫敏、流通等標準需要抓緊跟進了。

雖然,最近所謂“制造信任”的區塊鏈的概念比較火,但大數據礦難的出也讓金融科技的發展有了不小的信任危機。大數據行業的標準規范,以及行業監管和自律才是行業災后重建的關鍵。

責任編輯:王超

收藏

為你推薦

收藏成功

確定
江苏快3今天推荐号码 一分赛车计划在线计划 手上有闲钱如何理财 欢乐彩票app官网下载 股票行情软件 浙江十一选五最大遗漏前十名 广东快乐十分 黑龙江11选5中奖规则 什么股票配资平台安全 安徽十一选五开奖结果走势图 8波比分网址 棋牌麻将中心 贵州11元选5走势 剑的秘密 g-area番号福利 什么是股票期货配资 北京11选5最新开奖走势图