遠見華人精英論壇 | 我們今天依然沒有大數據,只有大的數據孤島!
首頁 > 人物 > 袁 岳北京 > 我們今天依然沒有大數據,只有大的數據孤島!
我們今天依然沒有大數據,只有大的數據孤島! 發文時間: 2018/1/18   文 / 袁 岳北京 瀏覽數 / 3,400+

我們知道任何一個數據源都是不完美的,而大數據的時代則告訴我們很重要的東西,就是我們趨於完美的方法不是有一個完美的數據源,是我們有更多不完美的數據源。

零點有數董事長、飛馬旅聯合創始人袁岳

上週六,袁岳登上「第四屆榮耀金雞湖年度盛典暨2017蘇州工業園區人工智能產業年會」舞臺。作為榮耀演說家之一,他以大數據與人工智能為題發表了精彩的演講。

(以下為現場演講整理,有刪減,小標題為編輯添加)

一、貼標籤式追風口

創新創業真能做成實事嗎?難道你們今天都會做人工智能嗎?難道兩年以後你們還會做人工智能嗎?在可穿戴那一波有幾個人做出來了?在AR、VR的時候有誰做出來了?這一波人工智能誰會做出來?

西安有一個大學叫西安交大,在今年中國科技進步獎項中間排名第二。它提出了一個什麼問題,難道行業的創造也跟時尚一樣,說一個口號,換一個標籤,就能實現嗎?難道一個創業者能夠用這樣的方法做你的項目嗎?沒錯,今天你講區塊鏈,過去一周中間,只要有區塊鏈概念的上市公司都漲價了。現在這個時候講一個概念就能掙錢的是那些已經做出成績的公司,但是講一個概念卻不至於你能夠起步。

之所以我提出這個問題是因為我今天要跟大家分享的話題是大數據,也許聽起來沒有那麼性感。但是我告訴大家,沒有大數據和數據的發展,人工智能是不可能的。因為它就像這個大樓一樣,你們每個人可能覺得這個演播室很棒,但是如果沒有地基,這個演播室就不存在了,如果沒有大數據和大數據智能,人工智能將不存在。如果現在回頭來看,大數據要不要幹?

我想告訴大家說,沒錯,將來我們甚至每個行業,甚至連普通的服務行業都會有人工智能+,都會帶人工智能+的元素,但是路徑是什麼?前面《創贏未來》的節目說,你能說說看現在這個創業的特點是什麼?我說創業就是兩種,有一種人,我就是有一個非幹不可的事。還有一種人,覺得是非追不可的時髦。一個是追風口的,一個是做自己想做的事,追風口的人我從來沒看到他追到過。

二、多維度數據與生活的數據化

廣大群眾一致認為,一個群眾都不要問,就寫「一致認為」,為什麼?沒數的,但同樣那樣寫。所以那時候我就覺得說,不可以這樣吧,我們怎麼也要問問吧,所以在1992年開始做了一個問老百姓的公司叫零點調查。

當然任何一個獲得數據的方式都是不完善的,所以這麼多年來,我們做了好多研究都會受人質疑,但是也有一點很好,比如說數字。我們知道任何一個數據源都是不完美的,而大數據的時代則告訴我們很重要的東西,就是我們趨於完美的方法不是有一個完美的數據源,是我們要有更多不完美的數據源。

你知道了阿里巴巴的數據,大概知道上網賣便宜貨的狀況,但是你不知道關於很多不便宜貨的狀況,所以換句話說阿里巴巴平臺上告訴了你一點,關於交易便宜貨的信息,但是用它的數據能知道國民經濟的狀況嗎?不能。今天蘇寧上面有很多交易家電的信息,他能告訴你一部分,但是蘇寧家電的交易量遠遠不如京東,所以也只能算是一個數據。

每一個角度的數據源,中國有多少人?我們有三個統計口徑,這三個口徑完全不同。一個統計口徑是來自於統計學,挨家挨戶問出來的。一個統計口徑來源於衛計委,生一個孩子有一個出生證。第三個統計口徑是身分登記和戶口登記,這三個放在一起,你說差多少人?上億。這就告訴我們說,看起來每一個很靠譜的數據源也說不到一起去。

差不多五十年以前有人說,對待人類的現象和社會現象的描述,因為它具有不確定性,因此最佳的描述是多決策點,意思是說有不同角度的信息和判斷,來幫助我們趨近於真實。

我們看一個城市會不會成為大數據,是看這個城市有沒有更多的數據源被開放出來。今天即使有了BAT公司,其實他們也是不夠開放的,你們能用到阿里巴巴的數據嗎?你能用到百度的數據嗎?百度能用到騰訊的數據嗎?騰訊能用京東的數據嗎?不能。

每一個人抱著他的數據,實際上還是一個數據孤島,只是說今天孤島比以前大了。我們今天依然沒有大數據,我們只有大的數據孤島。

當我們今天看到數據源的開放度和數據源的加工能力和數據源的交換水平都還不夠的時候,那麼我們今天講人工智能,吹牛逼的成分超過40%。

當我們有8個以上大數據源的時候,一個城市中間95%以上的問題,我能用很快的速度給它處理。最近華北地區煤改氣,煤改氣的結果發現河北很多群眾挨凍了,但是北京沒有,為什麼?因為過去5-6年中間,北京把所有群眾涉及到氣水電的人,每家每戶,在電子地圖上分佈在什麼地方非常清楚,誰會挨凍都知道,但是河北不知道,所以河北挨凍了。

表面上它是數據,實際上這個數據才連著每一個人做的行為和每一件事情,所以有沒有數據的本質是一個地方是不是數據化了。

三、大數據背後的區塊鏈邏輯

不管你是多小的公司,多大的公司,你的數據要能夠加工成可交換的狀態,也就是說,這個數據能夠拿出來跟其他公司交換。因為你只有一個數據庫,而你可交換狀態的時候,就可以跟很多人交換,一個數據可以延伸五千個數據或者五萬個數據,你就會掌握大數據了,因為只有可交換才是獲得大數據中間最低成本的方法。

還有很重要,數據可能造假,所以我需要使用區塊鏈技術,所以大數據再各地中間產生模式跟今天區塊鏈技術有很重要的關係,這就是我們今天看起來一個個好像零星的東西,實際上本質上都是數據技術。

美國是1979年以後才稱之為大數據的元年,為什麼?因為那一年美國政府通過了陽光下的政府法,政府部門的信息必須公開,公開的時候這個數據源就豐富了,那個時候才稱之為大數據元年。我們站在這個角度,當我們懂得公開,懂得把數據處理成為可交換,可分享的數據產品的時候,這樣我們產生了很多數據,而數據放到融合中間加以處理,這個融合我用了很形象的四個英文單詞(OEPA)。

O,是告訴你說,我把數據融合在一起的時候,我們把一個問題描述的特別清楚,如果描述一個人,能夠清晰的描述他的生活方式。如果描述一個企業,我就能夠精確的描述他的運營方式。如果我們要做一個城市,我們就要瞭解這個城市的夜行方式。

E,可以跟誰互動呢?到今天為止,大部分公司,包括我們覺得很棒很棒的BAT公司,其實他們能做到的大數據就是O和E。今天你在京東的平臺上,他能告訴你說,在買所有的電冰箱中間,誰的電冰箱賣得最好,這個可以告訴你。現在問題在於,假如我的電冰箱怎麼賣得更好?他會說,對不起,這不是我的事,我只能告訴你誰來買,他怎麼賣,賣得多好。

P,前沿技術在哪裡?怎麼樣做才更有機會?怎麼樣做才會更好?

A,怎麼樣做才是最棒的和具體怎麼做?

四、大數據應用模擬

我下面給大家做一個模擬,我們針對95後怎麼理解。你們知道嗎?00後和75後最相近,00後既不像80後,也不像90後,為什麼他們的特性差別很大,很有意思,這裡面有些很重要的原因,00後是70後生出來的。

從數據裡面分析就自然可以看得出來,針對裡面的矛盾,比如說旅遊,這個點完之後就知道在95後中間,他們去旅遊的時候會去什麼樣的地方,他買什麼東西會買什麼樣的東西,一看就非常清晰的展現出來了。

那我要做95後的生意,怎麼樣把襪子賣給他們更好?或者賣家具更好?所以下面我們要把跟95後相關的數據進一步來做更深入的分析,我們把95後分成兩部分人,一群分是遊戲玩得好的,一群是考試考得好的。

你們不要以為打遊戲的孩子傻,打遊戲的孩子的節奏、美學、能力、反應,完全不是考試考得好的孩子能跟得上的,因為遊戲沒有標準答案,考上考得好的有標準答案。你們搞創新創業,請告訴我,有標準答案嗎?

我們在這裡面把這個人分成兩群,總體來說,打遊戲的還是會越來越多,當然更重要的是,大家沒有把打遊戲歸結成那麼壞的事了,打遊戲的孩子目前占95後的85%。這些孩子分兩個大的類別,一個是萌系,一個是英雄系。

萌系的概念就是「裝孫子」,萌萌噠!所以00後看不上90後的就是,都老大不小了,還整天裝成小孩。我們跟你不一樣,我都長大了,我都17歲了,這是00後和90後不一樣的地方。

很重要的是,95後能在市場上找到萌的產品和服務。一般來說是有動漫畫,部分是遊戲化帶動的,核心力量是動漫。但是另外一些叫做英雄系,現在打得火的遊戲都是打仗的,不是機器人打仗,就是武士打仗。《王者榮耀》基本上就是統統打仗,不管哪個朝代的人混到一起打仗。武士,統統都是武士的樣子,這些就是英雄系。英雄系是影響中國95後最大的一個系,可惜在產品和服務表現中間是最弱的,換句話話說這是一個空白。

你們看到我穿的這個大衣嗎,這就是遊戲戰裝系的,這個衣服就比普通的大衣好賣。為什麼呢?有某種熟悉感。他打遊戲天天是被洗腦啊,他的美學是由這個塑造的,他的美不美是由遊戲裡面的人塑造的,這個美學觀念完全不同。當他喜歡這一套東西的時候,他用這個去看世界,他要尋找這些東西。

考試好的孩子,那些認真學習的孩子,他的價值觀跟前一個價值觀是很不一樣的,他核心價值觀是這個部分組成的,未來感,開腦洞,智能,他們也不只是認真考試,其實他們也知道未來我要學好知識,我現在要學人工智能,我要學數據化,我現在要學應用數學,這些孩子成為智能化產品很重要的消費者,這是一個核心的事。

另外還要考慮初心。年輕人有年輕人的情懷。請問95後的初心和65後的,55後的初心有什麼不一樣?你說95後小時候都沒有吃不飽的事,天天吃的都不想吃,他的初心是啥啊?如果我是65後,我小時候初心是啥?初心就是天天吃大閘蟹,其實初心是很不一樣的。

當然還有很重要的事情就是娛樂至死。哭、笑、忘記、放鬆,這就叫娛樂。大家在某一個專業工作上好累,我們希望不要再來一個「累」的產品、分享和服務,除了專業之外其他東西都要放鬆,都要娛樂,這就是娛樂化的事情。

認真學習的孩子最需要娛樂,如果不提供娛樂,他就崩潰,他就憂鬱,他就跳樓。所以那些希望自己孩子特別好好學習的父母,特別要記得,如果不打遊戲,就讓孩子好好放鬆,否則你們家養一個很容易崩潰的孩子,這是我們從價值觀中間已經看到有的東西。

五、大數據與城市配置

現在換一個視角,說一個城市。一個城市跟人一樣,有城市自己的生活方式,每一個城市都有自己的配置。像蘇州因為有了我們園區,其實蘇州這個城市的配置跟其他很不一樣,因為園區當初是中國和新加坡之間合作的工業園區,所以它也代表兩個國家,把世界上非常棒的很多東西整合在一起的特點,城市配置就很不一樣。而這些城市配置類似我前面說的,用同樣的數據可以展現一個跟生活相關的東西。

有很多城市,大部分的供應者都是來自體制內,而另外一個城市只有15%的供應者來自於體制內,城市支撐者是誰就很不一樣。支撐者跟城市服務效率之間有著非常密切的關係。通常,核心支撐者肯定是國有的,而運作和內容的應該是民間社會,這是一種最佳的方法,深圳就是這樣的方式。

下面這是智能模塊。假定我用了這個東西,我覺得這個東西非常棒,我希望兩年到三年左右的時候,應該把它換一套。如果十年中間,給我換三次,如果有一個服務商你創新了一個家裝方式,每三年再給我30%的錢就給你換一套,而且換的時候又不會造成太大的問題,所以你要考慮到這兩者之間的對接,這就是完全新型的家具思路和家裝模式,這樣的東西就是把週期化和對產品要素的需要,用數據演算的方法就能夠計算出來,怎麼樣能夠做這樣的事情。這不僅僅對於一個企業可以這樣來做,對一個城市也是這樣。

我到這裡跟大家講的OEPA,我們在座每一位,不是只聽人家人工智能成就的故事,我們每個人都是一個數據源,我們很多時候要過濾隱私,但是從另外一方面,如何在技術意義上使得哪怕一個個人也要成為大數據的一個源頭。我覺得數據不管大,還是小,都是可以跟人家交換的,而且我的數據在交換過程中間可以交換到更多數據的,在此過程中間不僅有大的數據,公司也要建立自己小的數據融合,以至於我用數據處理關聯的很多事務,但這意味著我們將來會用更多的智能模塊來面對我們所面臨的業務,或者我們用很多智能的工具來去處理生活中間遇到的問題。

今天我們的人工智能帶有神秘化的色彩,在去年我參加烏鎮互聯網大會的時候,我覺得庫克先生說的這個話非常好,他說蘋果的下一代,我們致力於做的是什麼?我們要致力於成為最強大的人工智能平臺,而讓普通的人借助於手上的移動終端就可以用上人工智能技術,來解決我們很多的問題。就如同今天電商的平臺,已經很方便的可以開網店。就像今天作為手機終端,可以很容易的使用APP。

站在這樣一個角度來說,當一個概念從空中落地的時候,既需要很基礎的工作,又需要我們被自己的業務在多大意義上,跟這個大潮流的發展,在什麼時間建立這樣的連接,我們怎麼樣推動和促使更好的條件,使得我們成為最早的探索者。

一般來說,我把數據和人工智能關係分成這樣四個級別,第一個級別是數據源的建設,衡量一個地方,衡量一個公司的能力,衡量我們行業的能力。第二個級別是數據智能化程度的水平,第三個級別智能化平臺跟我們之間的關聯。第四個級別是垂直方向上的應用。

我們剛才應用很多方向領域中間,其實它的前提在於數據的開放達到相應的程度,很多的數據,智能的模式和它的方法才能更好的加以應用的。我也同樣希望,在數字經濟的時代,我們在數據源的開放建設,數據智能的支持和投入,人工智能平臺的引入和合作,和垂直化應用中間積極的探索,當這四個層次的工作都並行不悖,往前推動的時候,我們才有可能形成一個豐滿、強大、富有潛力的智能化經濟形態。

謝謝大家!

原文出處:微信

天下文化 / 小天下 / 未來少年 / 遠見雜誌 / 30 雜誌 / 哈佛商業評論  Copyright© 1999~2018 遠見天下文化出版股份有限公司. All rights reserved.
讀者服務部電話:(02)2662-0012 時間:週一 ~ 週五 9:00 ~ 17:00 服務信箱:gvm@cwgv.com.tw