8月10日下午,億歐B2B子欄目在上海舉辦了“數據賦能—企業數據應用之道”垂直沙龍,戈壁創投管理合伙人朱璘、帆軟軟件聯創陳炎、駐云科技創始人蔣爍淼、Chinapex創略創始人Jimmy Hu、驛氪創始人閔捷、觀遠數據創始人蘇春園、奧凱大宗創始人白睿均有到場分享其對于數據服務市場的演變和理解。

駐云科技創始人兼CEO蔣爍淼做了《被誤解的大數據》主題演講,主要核心觀點有:
1、在萬物互聯和人工智能的前提下,才能觸發真正意義上的第三次工業革命。
2、互聯網化是要構建一個符合業務邊界的子網。
3、數據不是越多越好,有邊界、有場景化的數據,才能發揮更大作用。
4、中國絕大多數企業,根據傳統規則建立的數據體系并不科學。
以下是蔣爍淼的演講速記,經億歐整理編輯,供行業內人士參考。
很高興來到這里,簡單介紹一下,我是駐云科技的蔣爍淼,是湖畔大學的學員。我們在湖畔大學,學習了很多東西,馬云經常說DT時代,我對DT時代有一點小小的看法。
我最近比較興奮,孫正義說睡不著覺,有兩個東西讓他睡不著覺,第一個東西是人工智能,聽到人工智能這個詞,大家會有很多聯想。第二個讓他睡不著覺的東西,很多人都忘記了,或者錯誤的把它理解為另外的東西,叫做IOT,但他用的實際的詞是萬物互聯。
在萬物互聯和人工智能的前提下,才能觸發真正意義上的第三次工業革命。
當時螞蟻金服的首席戰略官跟我們講到一個觀點,第二次工業革命以后,到第三次工業革命之間,人類的總體生產力并沒有出現指數級的上升。不像蒸汽機的發明,電力的使用,它帶來生產效率的提高是指數級的?,F在很多工業產業,還是第二次工業革命帶來的,而不是信息革命帶來的,信息革命更多是一個輔助。所以我認為在萬物互聯、人工智能的背景下,才會真正產生第三次工業革命。
PC互聯網時代,我們催生了很多詞匯。像OA、ERP、生產線、供應鏈、CPU等,這些詞之間的相同點在于,它們是線性的一條鏈路。生產線是鏈,CPU和諾依曼式也是一行行指令執行的。
但是如今,每個人拿著手機,都被網絡連接著。今天人工智能最重要,其實深度學習神經網絡在五十年代就有論文了。為什么五十年代做不出來?因為最基本的計算能力沒有。沒有計算能力,那么復雜的所謂黑盒學習的多個神經元連接的人工智能就不可能成功。但是今天GPU高速發展,最新最快的GPU可以比去年最快的GPU快八倍。一個模型,用CPU跑預計要三天時間,用GPU跑,只要五秒。
大家現在做IOT,有一種我覺得是偽IOT,比如拿著手機去控制開燈,開空調,沒有什么意義。但共享單車是IOT的一個最佳應用實踐,因為它把每輛自行車連入了網絡,才讓自行車產生新的商業模式。今天人類社會的演變,從傳統的OA、ERP等詞匯,到GPU模式的改變,互聯網的改變,社交方式的改變。因為微信,現在傳播方式已經大大改變了。所以今天我們要思考,在萬物互聯的情況下,怎么互聯網化?
互聯網最煩的事情是什么呢?
有個現象,比如我們可以用滴滴打車,而不會用微信搖一搖。微信邊界太廣了,而滴滴打車的業務邊界很清楚,效率就高。所以我們要構建的,是一個符合業務邊界的網絡,是互聯網環境下的子網。你要對于你業務邊界充分定義,讓子網當中連接的每一個子點以最高的效率執行。
為什么我說大數據被誤解了?如果今天所有的數據,還是基于傳統的線性模式。舉個例子,比如一家蠻有名的電商公司,他們商業模式,有天貓店、京東店可以拿到一些數據,他們還有一些專柜,很多是走批發貨的,比如這個城市某個超市,有他的代理商,合作非常簡單。拿多少貨,就結算多少錢,根本不到零售端取得消費者數據。很多人把大數據理解成BI,在我看來,BI的意義卻不大。
很多企業沒有用互聯網方式在數據產生端,構建一個模式,因為沒有數據。不像盒馬鮮生,完全數字化,所有消費者行為的數據都有,所以它要分析處理,大數據才有意義。現在商業模式積累的數據、產生的數據結果分析數據,起源的本身模式就是錯誤的。沒有數據,或者是數據不對了。
還有數據清洗的問題。
我們在廣州有一家很大的購物中心做了實驗,把淘寶的一部分消費者個人的數據引入到了線下,最后發現只有性別有用,其他數據用處非常少。
我們在這個購物中心重新定義了數據,把場內數據用起來。通過混合支付,只用一個POS機,就可以讓客戶用微信、支付寶都可以支付。但我們的目的不是收商鋪的錢,而是收集數據。比如用戶在耐克購買了一雙鞋,在附近又買了其他的東西。我們將這些相關數據記錄下來,并進行直接處理,我們的目的不是為了收商鋪POS錢,而是收集了數據。
比方幾點幾分誰在耐克買了雙鞋,這是在這個購物中心產生的數據,同時你還會買其他的東西。我們做到這一點以后,通過對數據的直接處理,結果很像支付寶的口碑。你到星巴克喝了一杯咖啡,PAS給你一個小票,上面寫著“20塊錢耐克代金券,今天有效?!睘槭裁唇o耐克代金券呢?因為你買的耐克多,所以我在這么推薦。
包括未來還試圖引入消費貸,這雙阿迪達斯的鞋太貴了,學生黨買不起。沒關系,你是周邊的人,經常到購物中心消費,消費記錄非常好,現在花唄給你找打折。另外可以把一些消費者進行社群連接,比如同時喜歡阿迪和耐克的人,或者有明顯長鏈消費屬性的人組成各自的社群,通過微信群等各種方式運營起來,就會產生收益。我們估測可以為購物中心帶來10%以上的銷售額增長。
其實大家可以發現,這個例子里面,數據有邊界,有場景,數據不是越多越好。數據場景化之后,會讓數據發揮更大的作用。
如果在數據產生的一瞬間,定義它的用途,重新構建數據流和數據背后的結果,反而更容易催生垂直行業人工智能的應用。比如我們幫農業的上市公司在做一件很簡單的事情,搜集全國客戶所有的農田的土壤酸堿度、種植量、農產品的類型、對應的期貨的采購價格、以及整個成熟度產量,我們就可以給這些農業產品銷售人員,提供一個農業產品銷售助手。他到當地采集了土壤酸堿度等各種的數據,告訴農民,你種這個種子,打這個農藥,賺錢最多。馬上這個垂直應用就出來了。
如果你不改造這家農業公司的業務形態,你都沒有數據,怎么能做出這樣的人工智能呢?有一個概念叫“數據治”,意思是數據很多,通過治理它,讓數據能夠有用。今天中國絕大多數企業面臨的問題,是通過傳統的流程、規則建立了自己的數據體系,但這些數據體系本身就不科學。但是今天中國絕大多數企業,面臨的問題,就是通過傳統的流程規則,建立了自己的數據體系,但是這些數據體系本身就不科學。
回到非互聯網型企業,最重要的是,不是他們要不要用大數據,而是他們和終端消費者、合作伙伴、供應鏈距離太遠了,沒有用數據支撐。雖然這些數據本身就存在,但是它沒有用系統解決它,這一步沒有做到,最后只能用大數據賣個小產品,只有這樣的價值。不是說數據沒有用,而是它不能改變公司的形態。
最后總結,我認為真正意義上數據的價值,是小數據加場景,這個小不是指數據非常少,而是數據必須要在規則邊界內實現它的應用價值,能夠變現的數據才有價值,而不是純粹搜集更多的數據。實際上人工智能的研究也是這樣的。今天人工智能最新方向,是如何通過更少的樣本數據,訓練更有效的人工智能。而不是用更多的數據去訓練。
謝謝大家。