在阿里IT深入采訪第一天中,阿里人提到最多的兩件事:一是長腿歐巴李敏鎬,二是馬云最近一封內部郵件。3月8日,李敏鎬空降杭州銀泰將手機淘寶三八節的火熱推向頂點;而馬云的內部信件則明確了阿里的未來戰略:以走向激活生產力為目的的DT(data technology)數據時代。
阿里的大數據圖景
阿里的未來將由“云計算+大數據”組成。阿里正在建設一個大數據環境,讓數據變成工程,圍繞數據提供一整套的精細化服務。云計算使中小企業可以在阿里云上獲得數據存儲、數據處理服務,也可以構建自己的數據應用。阿里的大數據開放之后,線上線下的數據能夠串聯起來,所有人都是數據提供方,也是數據的使用者。
馬云已經在整個數據應用上確定了兩個方針,第一從IT到DT,從管理、控制到點燃和激發,DT就是點燃整個數據和激發整個數據的力量,被社會所用,被銷售所用,為制造業所用,為消費者信用所用。第二個讓阿里巴巴的數據、讓阿里巴巴本身今天所有做的這些工具能夠成為中國商業的基礎設施,能夠成為整個中國經濟變革的正能量。
在阿里數據平臺事業部的服務器上,攢下了超過100PB已處理過的數據,約等于1.04億個GB,相當于4萬個西雅圖中央圖書館,580億本藏書。淘寶和天貓每天會產生豐富多樣的數據,阿里巴巴已經沉淀了包括交易、金融、SNS、地圖、生活服務等多種類型的數據。這些數據相互關聯或產生巨大的能量。
阿里大數據類型最豐富的應用是什么?在小微金融企業融資領域,由于銀行無法掌握小微企業真實的經營數據,不僅導致很多企業無法拿到貸款,還因為數據類型的不足導致整個判斷流程過長,阿里已經通過交易、信用、SNS等多種數據來決定是否可以發放貸款,發放多少。貸款申請人像在ATM機上取款一樣,一提交貨款的申請時,即時就能獲貸、支用,整個流程在網上實現。
對于馬云所提到“云+端”到底什么含義?阿里巴巴集團商業智能部副總裁、數據委員會會長車品覺解釋:云有兩個很大的功能,一個是他的計算能力,一個是他的儲存能力。端是終端,手機、PC、可穿戴設備。能不能利用云的計算能力與儲存能力,快速計算到端去用,非常考驗云的計算能力跟儲存能力。如果我們做了一個數據模型,猜到一個人在他現在行為里面,有人用了他的手機,但是用這個手機的人并不是他的。在這種情況下,能不能停止他的手機使用。就是實時能從計算得知的。但是端到云的時候,他是收集及時的數據給到云那邊,讓云那邊能夠存儲關于判斷剛才這件事情的能力,所以端到云、云到端的數據是流動的。端的能力在于收集,云的能力在于計算存儲,是一種循環。
阿里大數據開放面臨的兩大問題
小微金服集團首席風險官胡曉明總結阿里目前大數據開放必須解決2個問題。第一,必須要給全球的數據開發者一個數據的工作平臺,阿里分布式的存儲平臺和在這個平臺上的算法工具,足夠形成數據開發。第二還沒有做好數據的脫敏,把數據的商業定義,每個標簽打得足夠清晰,能夠讓全球的數據開發者在阿里巴巴平臺展開數據思維,讓數據為政府所用、消費者所用、行業所用,這一點阿里還沒準備好。
數據分析師車品覺對數據開放的態度是:阿里如果認可一個BU,他首先要數據開放,首先去談這個項目的時候,必須要上報給到數據的安全小組。安全小組就會有安全的專家開始去看案例的本身是不是合理的開放,而且有沒有侵犯個人的隱私以及商務的隱私。有時候雖然包括了表面上沒有侵犯隱私,但是后面出現了侵犯隱私也不會給他開放的,所以我們要數據安全小組一起參與。我們會把這些案例積累在檔案里面,當時我們的判斷是因為這樣,為什么我要判斷不給,將來這種可能都成為案例,為判斷做積累。
車品覺還提出了自己思考的大數據十誡:認為當下大數據有十點最需要考慮:1、好的問題,答案就在里面。2在實踐中提煉數據。3讓數據變成Technology,Enable更多人。4讓數據跟著“人”走。5木有數據質量,神馬都是浮云。6以假設數據都能獲取去思考問題。7大數據安全,不是監管。8利用數據拿到更有用的數據。9建立數據的數據,才有進步。10讓人做人擅長的事,讓機器做機器擅長做的事。
大數據將帶來四個巨大改變
比較有趣的是,在首屆西湖品學大數據峰會上,小微金服集團首席風險官胡曉明并沒有針對金融領域詳談大數據應用,而是分享了對大數據的宏觀思考。他發現大數據帶來四個巨大改變:
第一,當數據出現以后,市場經濟和計劃經濟之間,哪個是對的,哪個是錯的?在亞當斯密或者金融學這個時代,是沒有數據的,沒有人的行為數據,沒有社會的數據,沒有資金流的數據。但是,今天有了數據以后,很多經濟學的一些基礎理論甚至可能會被修正,原來我們所有的在商業行為當中,都是有了先生產或者先制造才會有銷售行為,但今天有了互聯網,我們產生了先有銷售行為,才會有制造行為,他會影響到整個供應鏈。
第二,數據沒有大小之分,數據只有是否被商業認知之分。很多人對阿里巴巴的數據垂涎欲滴,認為有大數據以后才能做。當年帶領團隊做小微企業信貸,我們去看消費者信用的時候,所有的金融從業者都在笑話我們。但是通過整體的大數據,已經為70多萬家小微企業貸了款,整體貸款累積量是1800億,沒有見面,包括西藏的、新疆的,山東的、云南的,用的就是數據,盡管沒見見面,但是我們的風險率和不良率比商業銀行還要低,而且我們今天是沒有抵押和擔保的。我們在分析很多消費者的金融行為,目的只有一個,讓數據能夠產生商業價值。
第三,阿里巴巴對數據的未來看法是:要讓數據激發它的活力,讓數據成為一種信仰,讓數據發揮它的商業價值。
第四,是關于數據的消費者的隱私保密問題。隨著互聯網的開放性,特別是移動互聯網,數據、個人的隱私性數據,你的身份證、電話號碼,你的相關的數據,甚至連密碼都可能存在泄露。在數據不再隱私的情況下,怎么去保護消費者的整個資金安全、帳戶安全,我們在研究這個課題。
阿里的大數據是否也有自己的困惑?集團副總裁葉鵬:面對每天產生的巨大的量,我們的心情第一是感到很欣慰,因為我們具備了那么多的數據。第二我們也感到很敬畏,因為我們真的不知道,這個當中蘊含著什么,這個當中價值怎么挖掘。
阿里巴巴平臺上面,平均有超過1億的消費者,幾億的商品數,上千萬的商家。他們之間的互動,他們之間的行為、交易,是無價之寶,可以幫助商家更好地提供服務于商品。網站上面紙尿褲的銷量某一個區域如果嬰兒的紙尿褲量上升了,那么肯定是嬰兒的出生率比較好,但是從另外一個角度講,如果一個區域老年型的紙尿褲量逐步上升,就說明這個區域實際上已經開始步入老齡化了。站在更宏觀的角度來看,很多數據實際上是可以提供很多社會和經濟的價值的。包括對產業有指導意義。
作者:張宇婷