從大數據的角度看,房價一定會下跌
內容來自社科院世界經濟與政治研究所副所長何帆的一次講座。
大數據時代需要重視統計學
我們現在要開始重視大數據,要重視統計學,因為在數據足夠大了之后,我們突然發現一切社會現象到最后都有統計規律,它不像物理學那樣可以準確的去描述因果的關系,它從本質上來說就是一個統計的規律。統計學學好了,你再去學別的都戰無不勝,因為一切社會現象到最后都是一個統計規律。
為什么要強調統計學呢,因為我們的認知能力中最差的是統計思維。人的大腦有一些功能優良得超過我們的想象,比如我們的語言能力。著名的語言學家喬姆斯基曾說,其實語言不是你學來的,語言是你天生就會的,因為語言太復雜了,要是從出生再學語言根本學不會,等你出生的時候,你的大腦里頭已經預裝了一套操作系統,語言的操作系統。所以語言我們是天生就會的。.
還有,比如我們察言觀色的能力,也是天生就會的。但有,一些是我們不會的。一位得諾貝爾經濟學的心理學家寫過一本書,《思考快與慢》。里面就講到,我們有很多思維是靠直覺的快思維,這是我們幾萬年、幾十萬年、幾百萬年的自然演化,然后給我們留下來的,就是第六感覺。當你覺得可能有危險的時候,你就會跑掉。但是呢,我們另外一套操作系統是用來做邏輯推理以及進行統計分析的,裝得很爛,所以我們天生缺的是邏輯推理能力和統計思維能力。
所以,在大數據的時代,我們最需要補的,其實是我們認知能力中最差的統計思維。如果有在學校的學生,我建議統計學這門課要好好地上。
“大數據”何以成為熱門詞匯?
為什么突然之間,大數據變成了一個最熱門的詞匯?
首先是由于IT革命。IT革命之后,我們有了很多處理數據的能力,對計算機數據的處理能力、存儲的能力和計算的能力不斷的提高。人類儲存信息量的增長速度比世界經濟增長的速度要快4倍,而且這還是在金融危機爆發之前的世界經濟增長的速度。而計算機數據處理能力的增長速度,比世界經濟增長的速度要快9倍。
其次,能夠被數據化的東西越來越多。最早的時候是數字可以被數據化,所以我們有了阿拉伯的計數,后來又出現了二進位,再后來我們發現文字也可以處理成數據,然后我們發現又圖像也可以處理成數據。我不知道歐美同學會《時代大講堂》位置在哪里,我就趕緊上網查一查地圖,方位也可以被數據化;你用微信、微博,跟朋友在網上交流,說明你的社會關系也會被數據化。
所以這就是為什么現在要談大數據,因為可處理的東西太多了。而當你能夠被數據化的東西越來越多。當你能夠拿到的數據越來越多時,就跟原來不一樣了。原來的統計學得有一個抽樣,因為你不可能拿到整體,因為整體太多了,而且無法去計算。而現在,當存儲能力無限擴大,處理數據的計算能力不斷的進步,致使現在我們所處理的往往不是一個樣本數據,而是一個整體的數據。所以這個時候,有很多原來想都不能想的事情,現在你可以去做。
大數據時代的三個規律
規律一:知其然而不必知其所以然 外行打敗內行
我先講一個案例就是葡萄酒。葡萄酒怎么品酒?過去是靠品酒方面的專家。他會先聞一聞,什么味道、什么香味,然后看看是不是掛杯,最后告訴你,這個酒大概是什么莊園的,什么年份的。但是,當品酒師在品新酒時,因為葡萄酒真正的品質還沒有形成,所以這個時候,他的鑒定是永遠靠不住的。另外,當一個品酒師的聲譽越來越高時,由于要照顧到自己聲譽,他不敢做大膽的判斷。
普林斯頓大學有一個經濟學家也很喜歡收藏葡萄酒,他就想能不能自己預測出這一年這個地方的葡萄酒的品質如何?然后他就開始去找來很多數據,最后得到了一個秘訣。葡萄酒的品質跟跟冬天的降雨量、生長期的平均氣溫、收獲季節的降雨量、土壤的成分等等這些因素有關。1989年,葡萄酒剛剛下來,他說今年的葡萄酒是世紀佳釀,1990年他又做出預測,說今年的葡萄酒比1989年的更好。連續兩年說是世紀佳釀,一般的品酒師都不敢這么評,但是最后事實證明他說的完全正確。
第二個案例,怎么尋找潛在的棒球球星?著名的財經作家麥克劉易斯寫的書《Moneyball》,后來拍成電影叫《點球成金》,講到一個球隊教練遇到了一個經濟學家,他們用很另類的辦法,實際上就是用數據,把每一個選手的場上記錄拿過來,用數據去找,看誰是好的球星,這跟傳統的行規完全不一樣,但是后來非常成功。
我們原來講,要知其然,還要知其所以然。但是現在大數據時代,你可以知其然,不一定非要知其所以然。如果你去問普林斯頓大學的教授,為什么這個酒好?到底是什么香味?酒回甘是什么?他也不知道。但是他能夠知其然,他能夠做出來判斷。為什么呢,很可能是我們原來的認知里頭,我們執意去要尋找一些線性的、雙邊的直接因果關系。但是很可能萬物之間的聯系比我們想象中的要復雜,他可能是非線性的,可能是多元的。所以出問題的不是數據,出問題的是我們原來的認知模式。怎么辦?一個辦法,退而求其次,你可能要先去尋找相關關系,然后再去找是否有因果關系。
規律二:徹底的價格歧視 商家比你更了解你自己
有一個機構,專門做信用卡的刷卡記錄。他們攢了大量的數據之后,拿這些數據做分析,最后找到很多很奇怪的規律。比如,你是否離婚與你信用卡上的還款記錄和你駕駛車輛出車禍的概率有關系。比如在大數據時代大家可能會聽到的一個比較有名的例子,就是沃爾馬最早的時候發現很多奇怪的規律,比如尿布和啤酒的銷售量是有相關關系的。
這倆東西怎么會聯在一起?市場調查人員最后發現,往往當有新生的小孩之后,買尿布的任務就給新爸爸。盡管新生的寶貝的出來他的貢獻也沒有多少,但是他有一種自豪感,他去買了尿布時,為了慶祝,他會順手去買啤酒。如果你在尿布的旁邊就直接擺上啤酒,啤酒的銷量就會提高。還有一個店,專門賣母嬰用品的部門搜集顧客的信息去研究。比如說研究什么時候你可能會懷孕,你可能會買更多的母嬰用品,而營養品會增加,或者一些沒有香味的洗發劑,最后就可以預測潛在的客戶到底是誰。
所以大數據時代,動搖了我們原來的方法論。
有一個賭場,進去之后會刷卡,而你的基本信息全都在這個磁卡上面。包括國籍、性別、年齡等等全就掌握。他有一個龐大的數據庫,可以算出每個人的痛苦點,即如果輸錢超過了這個痛苦點,從此之后再也不來這個賭場。而賭場最好的辦法是在你快要達到痛苦點之前叫你住手。
所以當你快要到達那個痛苦點的時候,你的旁邊就會突然出現一個年輕貌美的公關經理,說先生玩得很累了吧,要不要休息一下,我們這個賭場剛請了一個法國大廚會做非常好的法國大餐,你很幸運,你被選我們的幸運顧客,請你和太太一起去享用免費的法國大餐!很好,但你不要忘了,當你享受到你覺得物超所值的服務時,往往就是你的最后一分錢被別人榨完了!包括信用卡調整額度,很可能也是在大數據的基礎之上自動調整額度。
那這個帶來了一個變化。原來經濟學講到,商家不能搞價格歧視,不是因為道義上不能,而是由于在過去商家很難對不同的顧客,進行價格歧視,你必須要定統一的價格。但這是過去的規律,在大數據的時代,這個規律被徹底顛覆。在大數據的時代,商家可以精準的針對每一個個體的消費者定價,把你最后的一分錢全部榨干,因為他比你自己更了解你的行為。你都不知道你的車可能要去保養了,他就已經給你發消息;你自己都不知道,身體已經處于亞健康狀態需要去旅游放松,旅行社馬上就會給你打電話。你說它怎么會這么了解我的心,大數據在幫他的忙。會用大數據的商家都是偷心者,都會把你的心偷走,他可以精準的定價。
規律三:打破專家的信息優勢 病人給醫生解惑
那我們接著再講一個案例,電視連續劇《豪斯醫生》的醫學顧問是紐約時報的一個專欄作家。他是倡導尋證醫學的一個代表人物。尋證醫學就是根據證據來治病。過去看病時,要先研究病理學,然后再研究治療辦法,而且有很多是一代一代口傳下來的。老師告訴,維生素B12口服的效果不好,必須打針。為什么?不知道,反正是老師的老師就這么告訴老師的。所以你的老師也這么告訴你,你就這么再告訴你的學生。但是后來發現,這里頭有很多問題。
為什么現在醫患之間的糾紛這么多?實際上醫院的誤診比例非常高。美國有一份研究稱美國醫院誤診比例大概是1/3,有20%的重大疾病的死亡原因是由于誤診。為什么?因為過去完全靠經驗,有很多都是主觀的。到現在來說,醫學不是科學,醫學研究的是復雜的生命體,所以它還沒有到能夠精準治病的程度。
后來,大夫開始另辟蹊徑,他通過數據最后找出規律。19世紀一個醫生發現,如果醫生先去了停尸房再回來給婦女接生,產婦的死亡率明顯提高,而洗手之后死亡率下降,那個時候還不知道細菌和病菌。所以當時每一個醫生都要洗手。沒有哪個病理學能夠告訴你洗手跟降低死亡率有關系,但是后來死亡率就大幅度下降。所以這就是尋證依據的思路,減少醫生的自主權利,也有道理。就如坐飛機時,飛行員能不能想停就停、想起飛就起飛?不行。飛行員其實沒有多少自主權,需要嚴格的按照操作程序一步一步去做。當這些所謂的專業人士的自主權被剝奪之后,你就會發現越來越安全。
所以按照大數據,醫生最后發現他自己被邊緣化了。因為有了互聯網,有了大數據之后,病人有時候比醫生還要精。美國有一個報道,有一個病人被推到病房里頭,他有多種免疫功能紊亂,一群大夫會診,最后都不知道到底這個病是什么。最后,主治醫生問這個病人,你覺得這個病大概是什么。病人說我知道,我這個病就是IPEX。你怎么知道的,他說很簡單,我把癥狀在谷歌里一搜,馬上就診斷出來了。
原來醫生能夠治病,是因為他的專業比你強,他信息比你多,而現在你的信息跟他一樣多。你可以拿著谷歌上打印出來的資料跟他說,“你的診斷錯了,按照我在谷歌上,我應該是這個病,不是你那個病”,完全顛覆了原來信息不對稱的情況,所以大數據時代的第三個規律就是打敗、打破了專家的信息優勢。為什么我要一開始就跟大家講不要信專家,因為在大數據的時代沒有專家。
大數據的時代,專家可能反而會誤事。比如谷歌有一個機器翻譯,一開始可能翻譯的很差,但是慢慢發現他的翻譯水平越來越好。為什么?谷歌機器團隊里頭總結出來一個經驗,說凡事當小組里解雇了一個語言學家,我們翻譯的精確程度就提高了,因為語言學家老在挑毛病,最后剩下來的全部是不懂語言計算機專家和數學家的時候,沒有專家在那里指手劃腳。
最后的啟示就是我們不能相信,我們也不能相信我們內心中的專家。
往往我們的認識模式里,對自己的能力盲目信任,往往會過分夸大自己的能力。所以,現在有一個投資的方法,叫量化投資。原來是價值投資:這個東西是不是物有所值,如果說它被價值低估了,你趕緊去買它,以后它價格會起來?,F在講的是,你不用管它到底有價值沒有價值,我只看它是漲還是跌。
那看什么?看量化投資。量化投資靠什么?靠大數據。但是量化投資到最后是誰來執行,不是靠數學天才。數學天才的貢獻是發現了一套投資方法,然后由電腦來執行。為什么要讓計算機來執行而不讓人?因為一個人哪怕你心理素質再高,哪怕你智商再高,總有無知和貪婪的時候。所以最好的辦法就是,放棄自己的主動性。
大數據帶來的風險:用你的隱私去賺錢
大數據給我們帶來的各式各樣的好處,但是這里頭也有很多風險。你害怕不害怕你的隱私被別人拿走?大數據的前提就是你必須把你的隱私要全部貢獻出來。你如果想享受到手機給你帶來的好處,那你手機馬上會知道你在哪、你干了什么、你每天的生活都是什么,然后當你這些數據被人家拿走之后,人家就會拿你這些數據,去分析你害怕不害怕。
有一個電影叫《少數派報告》,有點科幻性質,最后到什么程度,我根據你的數據,我判斷你今天出門殺人的概率有90%,所以你出門之前我先把你拘留起來行不行,有很多涉及到法律、倫理的層面,涉及到隱私的層面不太好解決,這種數據時代,這種IT革命并不是高歌猛進的,它已經出現了有一些回潮,就是其實你想想在最早的時候,其實整個互聯網的世界都是開放的,但是那個時候很奇怪,那個時候實際上每一個電腦的用戶,等于他的房門都是敞開的。
但是居然沒有黑客進去,因為大家都是黑客,那時候只有技術人員才會用電腦,大家居然互相之間都不侵犯,但是現在你想想網上這種偷你的信息,拿你的數據,對不對,接到很多電話那都是大數據時代,“哥你想買房嗎”,你怎么會知道我要買房,我大數據研究出來的,這個時候你為了隱私,為了保護自己的隱私,有很多時候你放棄了這個系統的開放性。
現在你覺得用蘋果的產品很爽、很酷,但是蘋果的產品是嚴重封閉的,你沒有辦法改它,跟你原來用Windows實際上理念是不一樣的,你喜歡你就用,你不喜歡你就不用,你說我有意見,有意見白提,沒有用,蘋果的整個操作系統是完全封閉的,你愛用不用,不用拉倒。
.
然后還有,你最近發現,原來的時候影響美國政治的往往都是一些金融家,但華爾街現在不行了,在金融危機之后華爾街不行了,現在新崛起的一代富豪,都不住在紐約,他住在加利福尼亞或者住在華盛頓州,他住在西雅圖,這些是新崛起的數據資本家,那你如果這些數據資本家到最后對政治的影響力越來越大,你可以想象他想要的是什么,他想要的更多是要求把數據公開,讓他能夠自由的拿你的隱私去賺他的錢,想想也是蠻可怕的,那還有一個更深層次的原因,就是大數據有可能會給我們帶來一個盲目的樂觀,我們認為什么東西我只要有數據,我都能夠預測出來。
你能夠預測出來的東西,其實是很少的,就是我們剛剛舉的那些例子,為什么能預測出來,因為它不斷的發生,它是常態情況下出現的,所以它經過幾萬個消費者、幾十萬個消費者、幾千萬個人到最后總結出來你個人的行為,你總覺得跟別人不一樣,大數據告訴你,歇了吧,你跟別人一樣。凡是當你認為你自己跟別人不一樣的時候,其實是你很幼稚的時候,你想一想你初戀的時候,你都覺得跟別人不一樣,那都是很世俗的,我這個是刻骨銘心的,現在呢,都結婚了,孩子都有了,你再回頭想一想,有什么不一樣的,都一樣。
所以大數據時代,它是能夠看出來,當你是在這種用統計學的術語講,當你是在正態分布的時候,當你是在正常狀態的時候,正常的世界是一個像鐘一樣的,就是它的概率發生的程度,極端的情況下概率發生的程度是小的,就是你是天才的概率是很小的,你是麥兜的概率也是很小的,大部分人其實都是在中等智力水平、中等道德水平,所以我能夠預測出來,你能夠大概怎么樣。
但是如果我們的分布不是正態分布呢,那就不一樣了,對不對,原來我們很多統計學基本上的方法論,我們的前提假設都是標準狀態分布,所以為什么金融學理論錯得一塌糊涂,按照標準的金融學理論,像2007年、2008年那樣的金融危機,大概250億年會發生一次,地球都不知道死了幾回了,就是這學問還能得今年的諾貝爾經濟學獎,他還好意思拿,所以原來的理論里頭其實有嚴重的缺陷,所以有一本書叫《黑天鵝》,黑天鵝是什么,黑天鵝就是看起來不可能發生的事情,因為原來歐洲人不知道有黑天鵝,在歐洲看到的都是白天鵝。
所以有一個說法說,你說的這個事情不可能發生,不然你給我找到黑天鵝。結果后來航海技術發達了,到了澳大利亞,發現一群黑天鵝,就是你認為不可能發生的事情發生的概率是很大的,你天天打開電視就是,百年不遇的洪水,50年不遇到的旱災,天天都遇到,因為你認為不可能發生的事情,其實發生的概率比你想象的是要大,說明什么,說明它不遵循標準的正態分布,所以這個書里面一句讓我感觸很深的話說,你不知道的事情比你知道的事情要更重要。
大數據時代 通過承受小風險來避免大風險
大數據給我們帶來的福音和帶來的風險是交織在一起的,我們有很多風險也是現在大數據給你帶來的,因為你沒有辦法找到到底哪條線索,線索太多了,所以回到最后一個概念,就是恢復力,就是你一定要向好。到最后我能不能回來,我們講投資,投資最高的理念不是賺錢,是第一不賠錢,第二不賠錢,第三不賠錢,你能不能有恢復力,因為什么呢?
第一個如果我們現在講究效益,我們把自己和整個世界,全球市場聯起來,聯起來效率是很高,但是會帶來一個問題,一旦互聯就會有風險,而且會有傳染的系統性風險,那么另外一個你得想清楚你很可能會失敗,不會的,別人會失敗,我不會的,我告訴你,從地球誕生以來,地球上的物種99%都已經絕種了,原來有一本書叫《從優秀到卓越》,你們父母當圣經,天天都在看,你今天再看看從優越到卓越,你去看第一版,他列出來的那些公司,現在有一半都去哪了,不知道,對不對,所以失敗是必然的,成功是偶然的,所以你想好到最后不是你想好如何成功,是如何避免失敗,尤其第一個必須保證你的核心業務在遇見危機的時候,還能夠正常的運轉;
第二,要有安全島的意識,要把它一個一個分開,然后要保持適當的冗余,你看起來不是核心競爭力的戰后重建部,它很有用,看起來它是累贅,但是它很有用,所以別減肥了,你看起來脂肪不好,但是它很有用,它到時候,真發生饑荒的時候,它會讓你比別人活得更久;最后,就是要不斷保持創新,那什么叫安全島。
舉個案例,在2003年北美出現了一個非常嚴重的斷電事故,很簡單,就是因為天氣太熱了,所以電線慢慢慢慢就垂下來了,垂下來了以后然后就掛在樹上,一掛在樹上然后就短路了,短路了之后按道理來說,這個時候馬上就會自動的報警,但是報警的線路也斷掉了,結果突然一下子在北美有4000多萬人一下子沒有電了,從來沒有出現過這個事情,所以后來智能電網就開始在設計,設計里頭有很多,實時監控、提高效率,但是里頭最重要的概念,就是去偶合,就是什么意思?
就是一旦出現斷電的事件之后我不會讓它蔓延得那么快,我把它馬上斷掉,斷掉之后那個停電了,但是我這邊還能夠正常的運營,我從原來的全不連起來的大電網,現在我要把它變成微型電網,最后這個安全很受軍方歡迎,因為部隊里頭最喜歡的是這個,部隊里頭作戰的時候,往往是為了送補給,傷亡就會很多,如果我不需要往前頭去背這些能源什么的,我能夠帶著太陽能電池的帽子,然后我自己就能供能源多好,能夠減少大量的傷亡。
所以現在的慢慢你會發現從大的系統開始轉變到小的系統,小分隊作戰,大決戰到最后成功,也是小分隊作戰,我們看到大決戰,第一場大決戰,解放戰爭第一場大決戰遼沈戰役,那其實是小分隊作戰,團自衛戰、營自衛戰、連自衛戰,最后不知道怎么著就把敵人的司令部給端了,我一直有一個很荒謬的見解,為什么國民黨打不贏共產黨,因為國民黨有飛機,他一有飛機一打仗,蔣介石坐著飛機到前線去指揮了,一指揮肯定錯,共產黨這都沒有飛機,你毛主席不著急,著急,林彪也著急,到最后的結果,你反而是在小分隊作戰的時候,能更好的發揮作用,你有一個大的頂層設計,但是底下有群眾創新,這是一個最好的組合。
如何防范風險,我們必須要主動的去承受一些風險,再有一個案例,就是在黃石公園曾經有一次出現了嚴重的森林火災,基本上從夏天一直燒,燒到最后實在沒有辦法等到冬天第一場雪才把這個火災撲滅,所以最后痛定思痛說哪有火災我們馬上就去把它撲滅,發現越撲火災越多,為什么,最后發現你不容忍風險,最后會帶來大的風險,因為你一有火災就把它撲滅,所以森林老化的速度就比原來快了,到處都是死掉的樹橫七豎八的。
如果出現火災的話蔓延的速度會更快,所以防止森林火災最好的辦法是什么,是主動的先放一把火,燒出來一個隔離帶,然后如果真的有火災的話,不會蔓延得那么多。所以我們過去的時候總是說要零容忍,其實我們需要的要容忍更多的風險,因為你去承受小的風險,到最后你是為了防止能出現致命的大的風險。
大數據并非萬能 重在改變固有思維模式
我前面盡管講了大數據很神很神,但是我要提醒大家,大數據并不是什么事情都能夠預測,它不能夠預知未來,它不能夠預測整個復雜的體系,那怎么辦,你只能是靠我們自己,就是原來的有很多理論都錯到離譜的程度。那你說那我們找一個英明的領袖來幫我們指引航向,對不起,沒用,這個是真的沒用。
2007年、2008年發生百年不遇的金融危機,美聯儲主席格力斯潘在美國國會,有一個國會議員問:“為什么會爆發金融危機,格林斯潘說我發現了一個缺陷,但是不知道它有多么嚴重,也不知道他會持續多久,但是這件事情使我深感苦惱?!痹谀钦f,然后議員馬上打斷他:“格林斯潘先生,你的意思是,你根本就不知道,為什么會出現這個金融危機?!备窳炙古算读艘幌抡f:“是,因為在過去40多年,甚至更長的時間里,我都有非常雄辯的證據,證據我過去的做法都會如愿所想,從無失算。”
這么大的一場金融危機爆發了,你問美聯儲的掌舵人為什么會出現金融危機,他說我不知道,要你干嘛。蘇聯解體,一夜之間一個不可一世的帝國灰飛煙滅,你問戈爾巴喬夫,戈爾巴喬夫同志蘇聯為什么會解體,他說不知道,沒人通知我。911襲擊出現的時候,小布什發表電視講話,說誰打我們,我們堅決饒不了他,但是他在發表電視講話的時候,他不知道誰打的,他連誰打他,他都不知道,你靠這些,就是這都是我們頂級的全球領袖人物,這都是達沃斯世界經濟論壇上看到的,你去問他們,我們到底發生了什么,不知道,他跟你一樣不知道,為什么,因為有時候我們真的是沒有辦法知道。
推薦一本書叫《信號與噪音》,也是講大數據,但是比那些完全歌頌大數據的要更清晰,這個書里頭講到有一些我們其實能夠預測,而且預測得很好,比如現在,原來我們認為天氣預測我們覺得老是失誤,其實現在天氣預測比原來要準確很多了,美國現在可以非常準確的預測颶風,到底會到哪里去,然后會變得多大,但是有一些還預測不了,地震預測不了,火山爆發預測不了,金融危機預測不了,革命預測不了,這些都預測不了。
那為什么預測不了,為什么不能靠大數據來預測,它這里頭講,它說OK,信息增長的速度快不快,很快,但是信息增長的速度這么快,那你有沒有想過,真理增長的速度是不是和信息增長的速度一樣快呢,沒有,顛撲不滅的可能也就那幾條。
那如果真理增長的速度沒有信息增長的速度快,你推論是什么,就是在你的信息中噪音的比重,所占的比重越來越高,對不對,所以當我們拿到的數據越來越多,我們拿到信息越來越多的時候,有時候反而會妨礙我們做出準確的判斷,為什么,為什么會出現這種情況,為什么,還要回到科學最新的發展,就是原來的時候,我們認為科學是牛頓力學體系。
其實現在科學早就已經認識到,真正的這個世界是一個復雜體系,而復雜體系是沒有辦法預測的,生態系統是沒有辦法預測的,金融體系是沒有辦法預測的,社會體系是沒有辦法預測的,從本質上就是不可預測的。你說我還不信了,我試試看,我去預測,最后看我能不能拿一個諾貝爾獎,有人已經試過了,最簡單的復雜系統,就是沙堆,就是你在海邊堆一個沙堆,金字塔一樣,那你有沒有想過你能不能一直往上堆,一直把這沙堆堆到月亮上去。
不可能,你肯定堆到一定程度的時候,這個沙堆就不穩定,你再往上放一粒沙子,原來的沙堆可能就更雪崩一樣就塌了,一定會發生的。那你能預測出來,再往上放一粒沙子會倒塌,還是放1000顆沙子它會倒塌,也預測不出來,你說我還不信邪了,這兒簡單的事情我還預測不出來,我到中科院去,用計算機調出來,過來預測,有物理學家還真干過這個事,預測沙堆到底什么時候出現不穩定性,最后發現預測不出來,為什么?
你比如說你開始有100粒沙子,然后你再往上放一顆沙子,你看起來是簡單的是往上放了一顆沙子,但是原來的100顆沙子會跟有人指揮一樣自動的調整位置,這個時候系統會達到一個叫自組織超穩定的一個結果,當過了一個閾值之后整個系統就變得不穩定,但是你這個時候你知道它變得不穩定,但是你不知道它再往上放多少顆沙子,會引爆整個沙堆,就跟股市。
我原來有炒股票的朋友,在股市3000點的時候他們就已經先知先覺的知道,說這個肯定要破,3500點的時候他們全都殺出來了,坐在那等,反正你就不信,你等著看,肯定得破,馬上就要崩盤,高3500點漲到4000點,4000漲到4500點,4500點漲點5000點,5000點漲到5500點,到5500點的時候,他們突然醒悟過來,說這次好像跟上次不一樣,又進去,所以你能夠準確的知道,這里頭有泡沫,但是你不知道什么時候破。
都說中國樓市有泡沫,但是你不知道它什么時候如何方式會引爆這個泡沫,你沒有辦法預測,凡是那些能告訴說未來幾年房價會漲多少的,跌多少的那都是騙人的,真正的這個是沒有辦法預測的,那怎么辦,算了,既然沒有辦法預測,那我們還聽什么《時代大講堂》,還學什么,就回去,該是什么就是什么。不是,沒有辦法預測,并不等于我們不能接近真理,但是我們必須要改變你原來的思維模式,就是你不去追求準確的預測而是去把握萬物之間可能存在的聯系。
大數據的啟示東方思維的優勢不能丟
以色列有一個情報部門,這個工作我估計除了中國的鐵道部,可能是世界上最難干的工作,因為它復雜的程度非常厲害,以色列的周圍全部都是潛在的敵人,情報部門現在有很多高科技,他能夠有很多竊聽的技術,你比如我們在這個房間里頭說話,他都不用安竊聽器,你說話的聲音傳到玻璃上面,他在外面然后弄一個儀器從玻璃的振動他就能知道你在說什么,然后衛星拍的照片越來越精準,現在情報部門都是在搜集這個,能看得見、聽得到的這些東西。
但是后來主管很不按常理出牌,他老是布置一些很奇怪的任務,他讓手下去看看敘利亞的首都大馬士革今天晚上演什么戲,去看看黎巴嫩菜場上現在賣菜賣得貴不貴,雇個保姆現在多少錢,雇個月嫂多少錢,有人說你是情報部門的主管,你管人家演什么戲呢,你管什么雇保姆多少錢,但是看起來沒有聯系的事物之間是有聯系的,黎巴嫩在中東號稱中東小巴黎,相對來說是很繁榮的。
所以有很多敘利亞的勞工到黎巴嫩去打工,如果你看到黎巴嫩雇個保姆很強手、經濟很繁榮,那就會有更多的敘利亞的勞工到黎巴嫩打工,打工完了之后就會把他們賺的錢匯回去,大馬士革就會歌舞升平,晚上就會演戲,那好了,那你就可以高枕無憂了,天下太平,但是如果你發現黎巴嫩經濟形勢不好,敘利亞能夠來打工的人就少,那敘利亞他依靠這些打工的人,會不會失業,它經濟不景氣,不景氣老百姓就會有怨言,然后敘利亞的領導就可能會說了,我知道你們有怨言,我知道你們過得不舒服,誰叫我們過得不爽,萬惡的以色列人,走我帶你們打他去,這個時候那你可能風險就會高了,所以你看起來沒有聯系的事物之間,是有聯系的。
在硅谷有一個很有名的紅杉資本,創始人叫莫里斯,他跟別的風險投資家不太一樣,他既不是在什么哈佛商學院、沃頓商學院畢業,也不是IT工程師,他上大學的時候本科是學英美文學的,本來想當詩人,想當劇作家,后來發現當不了,改行當風險投資家,你說他懂專業嗎,他肯定懂,但是他肯定不是專家。
有一天有人告訴他,說有一個小伙子想來跟你聊天,行,來,聊,小伙子你想干什么,小伙子說我想搞一個搜索引擎,搜索引擎當時已經是紅海了,我們講藍海紅海,已經是紅海了,是一個燒錢的,而且那個時候包括AOL,還有雅虎都已經開始在做搜索引擎,這個年輕人,就是斯坦福一個還沒有畢業的大學生,又沒有錢,又沒有經驗,莫里斯說小伙子你很有想法,我投了,他就投了,這個公司現在變成啥了,變成谷歌了!
讀詩讀得多了還是有用的,莫里斯說我能跟別人形成共鳴,他說如果我沒有辦法感受到,這個人想干什么,他說的再好項目可行性起來再好,我心里很慌,他說我不敢投資,我一定要找到,就是我能跟他有共鳴我才敢去投資,所以這個東西也很懸,跟我們原來想的也不一樣,所以這個就是帶來一個什么,你得調整你原來的想法。
調整你原來的思路,《信號與噪音》,就是我剛剛推薦的那本書里頭,用了一個,也是引用,用了一個很有趣的比喻,他說,個體專家比你行,拿出來單個挑,一個專家一個你,你不如專家;但是專家和群眾作為一個整體來比,專家的智商比群眾是要低的。
就是如果現在比如說,你去參加王小丫的什么開心辭典,問你一些古怪的題,然后問你,你肯定嗎,你心里不肯定,那你怎么辦,你有兩個選擇,一個選擇打電話問親友團,你的選擇,問現場的觀眾,我教你一招,問現場的觀眾,你越拿不準就問現場的觀眾,當現場的觀眾每個人都在獨立的情況下做初選擇,最后平均得到的結果一定比專家準確的程度會更高,群眾的智慧,所以我們為什么現在要搞群眾路線學習,群眾的智慧比專家的智慧是要高的。
但是專家里頭,又有不同,他說有兩類不同的專家,一類的專家叫刺猬,一類的專家叫狐貍,刺猬是什么,是知道一件事,但是知道的是一件大事,狐貍是什么,是知道很多事,但是知道的都是小事,原來大家覺得刺猬是好的,他能夠堅持一個大事,但是這個最后這個《信息與噪音》里面,它舉了一個研究,就是有一個研究說為什么專家老犯錯,最后你發現有的專家比有的專家犯錯要少,為什么這些專家犯錯比別的專家犯錯少,最后發現這些專家都是狐貍,如果狐貍跟刺猬比的話,狐貍往往能夠預測得更準。
但是狐貍成不了大家,因為你能在電視里頭當明星,能夠當大V,基本上是刺猬,你堅持一個,打死也不松口,市場經濟就是好,政府就是什么都不能干,你就能成大V,但是你要去問狐貍,狐貍說這個不肯定,有時候是好的,有時候是不好的,取決于你要討論的是什么問題,這看著真沒勁,從哪找來的這個專家,真沒勁,給一個痛快點的,到底是支持還是反對,但是真正的態度是狐貍,狐貍隨時愿意根據情況發生的變化調整自己原來的認知結構。
所以你要真想,你不想去當大V,不想去當明星,你真想能跟真理更親近一點的話,你應該當一個狐貍。所以我就是立志當一個小狐貍,大數據的時代跟我有什么關系,其實是有關系的,看起來沒有關系的事物之間,是有普遍聯系的。所以鼓勵大家,要努力的去尋找這種普遍的東西,尤其是中國人,我們本身就有這個長項,你不要把你這個長項最后都浪費了,中國人有不擅長的,中國人不擅長進行邏輯思維,進行邏輯推理,有時候看起來好象不如人家,但是我們思維很發散,我們善于尋找到普遍聯系。
有一個實驗心理學家做了一個實驗,什么,把學生里頭來自東方背景的中國、日本這些留學生分成一組,然后歐美背景的分成一組,西方的分成一組,然后把他們領到實驗室里頭,給他們放一張一張圖片,他旁邊有一個儀器,能夠記錄下來你看這個圖片的時候你眼神運行的軌跡,就是你在看哪。然后最后他發現,西方的學生,看東西的時候,你比如你給他看一張森林,森林里頭有一個老虎,他是這么看的,先掃一下,完了之后一看說這個畫的主題是森林中的老虎,然后他就死盯著老虎看,因為你畫的主題是森林中的老虎,他就死盯著老虎看,但是他發現東方的學生不是這樣的,東方的學生是他先看老虎,然后他看森林,回過頭來看老虎尾巴,然后他去看畫礦,眼神是散亂的,西方人不能理解,你一看就知道這個畫的主題是森林中的老虎,你看畫框干什么,他解釋是什么,他說東方人一生下來他的環境很復雜,所以他本能的他要把所有能夠搜集到的背景的信息全部搜集到了,他才敢下判斷。
你不信你去找一個當官的朋友你問他,今天過得好嗎,他會等半個小時,什么意思,然后他才敢回答你,因為他本能的他要把所有可能背景的信息,他都搜集到他才敢回答,所以東方的思維和西方的思維影響就很多看法都不一樣,比如西方人戰爭的經典著作《戰爭論》里頭講的戰爭怎么打,集中你的優勢兵力攻擊敵人的薄弱環節,你要打仗,你先看敵人是左翼不行,還是右翼不行,然后集中我的優勢兵力攻擊別人的弱勢,打仗不就這么打嗎?
中國人他不這么考慮,該打仗了,他琢磨點別的,派一個美女過去行不行?搞一個離間計行不行?把他爸爸弄過來威脅他熬一鍋湯不知道行不行?找幾個小孩教一個兒歌弄點謠言,網上發一個帖子不知道行不行?他就想這個,哪兒挖個水淹他一下行不行?放一把火燒他一下行不行?所以到最后的時候,西方人認為,常勝將軍叫百戰百勝,像巴頓那樣的,那真是打仗每次都打贏了,你真打過,那你叫常勝將軍。而東方人講究的最高境界,叫“不戰而屈人之兵”。
你說這東西跟我們有什么關系,有關系,比如我們有很多企業,學了很多西方的管理的思想學壞了,現在都知道,我們企業要有核心競爭力,但是你很難判斷什么叫你的核心競爭力,什么不是你的核心競爭力。
從大數據的角度看 房價一定會下跌
大家在關注這種瞬息萬變的大數據、IT革命時,還要把心慢慢地沉下來,除了關注快變量,我們還要關注慢變量,什么叫慢變量,慢變量就是看起來跟你沒有聯系,但是實際上是背后深刻的影響力,你比如說我問你為什么海上會有波浪,那你要信奉快變量,那你回答的可快了,因為天氣預報說今天有風,無風不起浪,當海上有波浪,最根本的原因是因為月亮,越來離你越遠。
月亮掛在那掛了幾十億年沒有變過,但是月亮帶來了潮汐現象,海上有波浪,所以我們為了更好的去了解這個世界,除了盡可能的去找到大數據,你還得找到哪些是藏在后面的慢變量,我們往往忽視了慢變量,現在都關心房價,房價到底漲還是低,到底會怎么樣,不知道,這些東西重要嗎,都不重要,真正決定房價變化的因素,是什么,從長期來看,是人口的因素。
你覺得說房價只會上漲,不會下跌,因為我看來看去都是只會上漲不會下跌,那我們過去十幾年經歷了的一個極其特殊的時期,其中非常關鍵的一個因素,是獨生子女第一代開始成家立業,開始買房,購買者的年齡越來越小,但是買房子的購買力越來越強,因為雙方的父母在幫他買房。我們的房價上漲是極其特殊的人口年齡結構導致的,那你不用問了,你說中國的房價以后會怎么走,隨著中國人口老齡化,中國房價一定會出現下跌的,這跟什么政府調控不調控,流動性到底多不多沒有關系,到最后決定房價的這些慢變量。
我們現在有很多同志,手邊有好多套房,你問他干什么,他既不出租也不出售,留著將來給兒子,留給而女兒,等我們兒子、女兒長大的時候,他們根本就不缺房,自己買一套,爸爸媽媽給他買一套,岳父岳母給他買一套,爺爺奶奶給他留一套,外公外婆給他留一套,五套,多好,自己住一套,把剩下的四套賣了,還找什么工作,問題你賣給誰,你去問親戚、朋友、鄰居、同學,他還等著把他那四套賣給你呢,所以到最后你去看影響到我們的房價的變化是這個慢變量。
出自“大數據棟查“,微信號為:BigDataInsight
這個是個不可證偽的論證,就是房子一直漲,你也可以說一定會降下來,只是還沒到時間。和共產主義一定會實現一樣。當然,土地財政的破產似乎等不到人口因素就會發生。
房價不降,小編去裸奔吧