數據分析最重要的目的就是從數據中尋找規律找到能夠指導我們未來實踐的原則和方法是產生智慧的主要途徑。所以預測分析是數據分析的終極目的。雖然數據分析承擔了很多功能但是預測才是最為關鍵的所以掌握數據分析和挖掘的預測方法才是數據分析師的看家本領。
預測包括現象的預測和規律的預測。自然科學的本質上也是對事物的屬性、本質和規律的預測。有了對事物的認知和對規律的掌握我們就能夠創造出更多的東西。商業也是如此我們能夠知道影響銷售的因素并能夠掌握這些因素的數據就能夠對市場做出精準的預測從而指導我們商業的決策做到穩定的發展。但事物具有復雜性我們無法掌握所有的信息更無法輕易掌握所有的規律。
隨著大數據、物聯網等技術的快速發展和應用我們會擁有越來越多的數據在這些數據上通過各種分析技術我們就能夠加工出越來越多的“智慧”從而就能夠知道我們的實踐而我們對未來的預測越來越精準越來越有效。
人們總是把數據分析師想象的過于美好認為做大數據的人能夠上知天文下曉地理能夠準確的預測未來。人類掌握了一些基本的事物發展規律對人類大腦、情感、心里的認知也逐步深入但是我們對這些學科的掌握程度還遠遠達不到準確的預測未來的程度至少現在還是沒有這個能力未來可能會有。
事物是復雜的我們對事物的認知是有限的正因為如此事物在發展的過程中會發生超越我們預期的偶然時間和隨機時間我們把這些叫做誤差誤差是必然存在的。隨著我們對事物的認知越清楚掌握的信息數據越完善這個誤差就睡越小偶然時間就會越少。預測不準確的正常的我們不能因為預測不準確而放棄對事物的預測掌握未來發展是人類的本能也是人類進化的動力。
我們現在出行是我們會根據地圖應用提供的交通流量信息選擇不堵車最近的線c;這是一個典型的應用場景把大數據當做平臺和基礎設施的應用場景。未來會有越來越多的這種應用場景這就是預測在我們的日常生活中影響著我們的日常生活。
我們認為一個優秀的人才一般都在優秀的公司中所以企業會更加看中應聘者是不是在優秀的公司中工作過這些都是為了佐證應聘者擁有豐富的相關“經驗”。所以優秀的公司在人才招聘方面的成本越低。而越是一般的公司用人成本越高——因為我們過度依賴經驗來管理。
經驗預測法在生活、工作中有大量的應用實例。人們最容易用自己過去的經驗做出判斷所以人們幾乎每時每刻都在做經驗預測。量化的經驗預測是一種數據化的方法。單純依靠少數人的預測往往風險很高因為我們每個人的生活經歷都是有限的并且看問題的視角也是有限的所以對于重大決策在沒有其他更好的方法可以預測是需要讓更多的人一起利用經驗來預測這個方法被稱為德爾菲法。
德爾菲法能發揮專家會議法的優點即能充分發揮各位專家的作用集思廣益準確性高。能把各位專家意見的分歧點表達出來取各家之長避各家之短。同時德爾菲法又能避免專家會議法的缺點權威人士的意見影響他人的意見有些專家礙于情面不愿意發表與其他人不同的意見出于自尊心而不愿意修改自己原來不全面的意見。
德爾菲法的主要缺點是缺少思想溝通交流可能存在一定的主觀片面性易忽視少數人的意見可能導致預測的結果偏離實際存在組織者主觀影響
事物有很多的相似性事物發展的規律也有相似性。例如人的成長歷程環境相同人的成長歷程也會有相近之處。當我們“閱人無數”后基本上能夠判斷這個人是一個什么樣的人。另外人的行為習慣和思維習慣都有一致性雖然會發生劇烈的變化但在大多數情況下都是可以預測的。我們可以根據一個人對一件事情的反應找到這個人的行為模式從而預測其未來的行為模式這就是類比預測法。
人的行為模式的背后是人的心智模式。無論是九型人格學說還是MBTI的人格測試其背后都是通過評測人的心智模式來預測人的行為模式從而為人們找到一個比較好的事業發展規劃。通過研究大量人員的行為模式為個人以后的發展做出知道這種方式的本質就是類比。
通過一個行業的發展來類比另一個行業的發展能夠給我們很多的啟發。例如智能手機取代了功能手機蘋果打敗了諾基亞和摩托羅拉成為智能手機的領導者。根據智能手機行業的發展規律我們可以預測未來智能汽車的發展規律特斯拉的創新性的智能汽車不止單純的電動汽車如果不出意外特斯拉很可能會徹底顛覆驅車行業那些原有的行業大佬在未來短短的幾年就會重新洗牌。
手機行業中消費者的更換周期為2-3年所以智能手機在2-3年就顛覆了手機行業原有的潮流。在城市中消費這更換汽車的周期為5-7年運用類比的方法未來的5-7年就是智能手機慢慢取代原有汽車行業。取代是一個緩慢且順應時代的產物取代的周期就是消費者的一個更換周期。
標桿研究也是一種類比的方法可以通過研究標桿企業的做法借鑒其經營和管理的決策。如果一家公司采用某種管理模式成功解決了一類問題那么我們也可以采用同樣的方法來解決類似的問題。所以當我們對于某些管理問題找不到方法的時候做簡單有效的方法就是尋找標桿企業的做法。學會站在巨人的肩膀上看待問題。
類比法也有局限性主要的局限在于類的可比性。類比的本質含義就是同類的或者相近類別之間的對比如果不具有可比性則類比的預測就會出現問題。當然沒有兩個事物是完全相同的也沒有相同的歷史和未來我們還需要在不同類別中尋找共同點在這個共同點上找到差異例如智能手機用了2年就顛覆了手機行業那是因為消費者更換手機的周期比較短。汽車行業就不適用這個周期因為消費者更換汽車的周期要比手機的更換周期長的多。
所以我們類比的過程中我們要思考可比的基礎是什么從而做出預測對結論進行修訂確保預測的合理性和準確性并在以后的過程中反思忽略了哪些重要因素以后在進行預測時還需要考慮哪些因素。
本質上慣性只存在于信息不對稱的領域在信息足夠對稱的情況下大家轉向的風向一致那么股票價格就不會有這樣的波動圖形。在信息不夠對稱的環境下以信息謀取利潤的行業就會有更多的暴力。如果信息已經充分對稱了那么以信息謀取利潤的行業就會消失。未來商品的價格會越來越透明根據信息不對稱來銷售商品的公司會倒閉。
時間序列分析模型是最典型的慣性分析法其本質就是探尋一個事物的數量化指標隨時間變化的規律。如果事物完全按照時間順序發展則一定會按照一定的規律繼續發展下去如果是向上的趨勢就會繼續向上發展如果是向下的趨勢就會繼續向下發展如果存在周期性就會按照周期性的規律發展如果具有循環往復的特征就會按照循環往復的特征發展下去
從上面的描述中可以看出時間序列模型最本質的局限忽略了現在的變化影響因素。即如果事物過去都是向上發展的則時間序列認為事物還會繼續向上發展但是因為某些因素的原因出現了下滑則這個因素不予考慮會認為是誤差或者受隨機因素的影響。
時間序列模型有多種類型這些類型的分類是從事物變化是否具有規律性來評價的。如果事物的變化很有規律性而隨機影響較小則可以通過慣性預測法對事物的變化進行預測如果事物變化是有規律的但是噪聲過大容易掩蓋事物自身的規律這個時候慣性預測法就不太使用了。噪聲的大小是我們是否可以使用慣性預測法來預測的非常重要的因素噪聲大規律就容易被掩蓋噪聲小我們可以通過趨勢來發現事物的規律。
我們對事物變化規律的認知其實是有限的。一般來說再利用慣性發探測事物變化規律時我們能夠掌握三種變化規律的探測分別是季節性、周期性、趨勢性。季節性是與時間變化有關系的變化規律。周期性是與變量取值有關系的盛極而衰觸底反彈。趨勢性是隨時間呈增長或者下降的趨勢這個趨勢可能線c;也可能是冪級增長或者指數增長。
沃爾瑪的“紙尿褲和啤酒”的事件讓我們覺得紙尿褲和啤酒的銷售量有較大的相關性。但是這個相關性能否站的住腳是否有足夠的邏輯解釋是否在任何情況都適用還是需要數據的支持沒有數據的完美論證。
在邏輯關系方面我們可以用各種模型來解讀數據需要不斷嘗試才能找到一個最佳的邏輯關系。有些邏輯關系只在特殊的情景下才成立而在其他的情境下就不會成立。邏輯關系的數學模型不是一成不變的他會隨時間、市場狀況的變化而變化。
每個邏輯規律都有其成立的條件。在廣告投放初期構建的模型不見得適合中期和后期品牌的知名度較低的時候廣告與銷售額的關系會被弱化邊際效應顯現。當公司的品牌已經非常強大的時候廣告本應該承擔一個提醒功能這個時候如果還是采用說服式廣告就非常不妥了消費者會覺得這是“忽悠”其自我保護機制顯現導致一些負面的成績。
。趨勢外推法的假設條件是:(1)假設事物發展過程沒有