隨著數(shù)據(jù)積累得越來越多,數(shù)據(jù)獲取成本不斷降低,人們開始走向另一個危險的極端,那就是任何事情都要看數(shù)據(jù),任何決定都去依賴數(shù)據(jù)。這種風(fēng)氣培養(yǎng)出了越來越多的“數(shù)據(jù)呆”。作為一個數(shù)據(jù)分析師,我是非常反對“唯數(shù)據(jù)論”的。為什么呢?讓我詳細地來說一說。
數(shù)據(jù)庫并不能記錄一切
你覺得,通過數(shù)據(jù)庫中的記錄,你能夠充分了解你的業(yè)務(wù)嗎?答案是否定的。說白了,數(shù)據(jù)庫只是記錄了發(fā)生在業(yè)務(wù)鏈條上的行為,但行為的結(jié)果并不代表業(yè)務(wù)的全部。舉個例子,通過用戶的使用行為數(shù)據(jù),我們就能知道用戶的體驗嗎?答案是不能,我們只是根據(jù)用戶的“行為結(jié)果”去猜測他使用體驗的好壞。真正的用戶感覺,在他們的心理,許多時候,不會通過既定的使用路徑和產(chǎn)品功能提現(xiàn)出來。
那么,數(shù)據(jù)庫不能記錄的信息,怎么獲取呢?答案其實很簡單,通過外部手段,創(chuàng)造條件去獲取。概括為“調(diào)查”和“實驗”兩個詞。比如用戶體驗不能量化的問題,直接問不就好了?調(diào)查分為訪談和問卷調(diào)查兩個方式,每種方式都需要落地成可量化的結(jié)果。問卷調(diào)查建議規(guī)律性地長期進行,連續(xù)收集的數(shù)據(jù)在時間維度上可比,價值遠遠大于單次的問卷調(diào)查。實驗的方式在第四章中有所論述,它正是一種創(chuàng)造數(shù)據(jù)的手段。通過實驗組和對照組,創(chuàng)造出一個對比的條件,進而量化出差異,最終形成可靠的判斷。
不可能分離多重因素影響
我們在運營當(dāng)中最容易犯的錯誤就是試圖用一個“宏觀指標(biāo)”的變化來評估某個細節(jié)動作(策略的改變、產(chǎn)品的改變或者活動的改變)的影響。做這件事情好比買彩票,幸運的時候,某個運營動作對業(yè)務(wù)的影響非常大,那么從指標(biāo)中能反映出來。但絕大多數(shù)時候,不管是策略的變更還是產(chǎn)品的改進,對業(yè)務(wù)全局的影響都是有限的,宏觀指標(biāo)(往往是KPI)的變化并不敏感。真正要做的是就事論事,根據(jù)具體的行動,去定義一個信度和效度高的指標(biāo)。
另一個角度,業(yè)務(wù)指標(biāo)的變動往往是多種運營動作共同施加的結(jié)果,這種影響并不能簡簡單單的分解為“A+B+C+…”或者“A*B*C*…”。有些因素疊加可能相互放大影響,有些則可能相互抑制,宏觀指標(biāo)只是這眾多影響的結(jié)果,內(nèi)部的影響機制是黑箱。極端點說,不可能將每個因素的影響都分離出來。
那么怎么辦呢?怎樣能衡量具體某個運營動作帶來的影響呢?答案就是實驗,也只有實驗。就是通常所講的AB測試。實驗中,運營動作施予對象必須分為實驗組和對照組,實驗組和對照組唯一的不同,就是實驗組被施予了運營動作,而對照組沒有。只有這樣,觀察實驗組與對照組的指標(biāo)差異(方差分析或者DID),我們才有可能去量化某個運營動作的影響。
數(shù)據(jù)不能替代邏輯推理
一個邏輯混亂的人,給他再多的數(shù)據(jù),也不會得出正確的結(jié)論。能否形成正確的判斷和合理的決策,很大程度上并不是數(shù)據(jù)的多少,數(shù)據(jù)足夠(信息充分)就可以了。很多時候,我們真正要鍛煉的是自己的分析問題的能力,或者說邏輯思維能力。尤其是在“根據(jù)數(shù)據(jù)變化查找問題”這樣的場景中。
要對這一點有深刻的理解,希望大家讀我的《數(shù)據(jù)驅(qū)動決策的13種思維方式》。你是不是一個明智的決策者,并不在于你手頭有多少的數(shù)據(jù),而在于你能否從數(shù)據(jù)中正確地解讀信息。需要提醒各位的是,當(dāng)數(shù)據(jù)達到一定的量后,數(shù)據(jù)越多,往往數(shù)據(jù)質(zhì)量越差,你犯錯的可能性越大。你是否記起了本書第一章最后部分,數(shù)據(jù)圖中指標(biāo)數(shù)量與混淆概率的關(guān)系了?
預(yù)測的根基未必牢固
數(shù)據(jù)分析工作,很大一部分是為了“預(yù)測”。所有預(yù)測模型的“根基”都是“通過過去發(fā)生的事來預(yù)知將來的事”。說得更玄乎一點,就是“歷史是會重演的”。但這個基本邏輯靠得住嗎?
從我的個人經(jīng)歷來說,許多時候是靠不住的。這也是我在工作中很少進行預(yù)測型建模的原因。在我所處的互聯(lián)網(wǎng)行業(yè),業(yè)務(wù)變化非常快。一個“政策”的決定,往往造成各項業(yè)務(wù)數(shù)據(jù)的巨變。經(jīng)常是“一夜回到解放前”或者“一晚跨入新時代”。在這種背景下,重要的不是去對某個指標(biāo)進行預(yù)測,而是理解業(yè)務(wù)背后最根本的商業(yè)邏輯(商業(yè)模式)。若一個商業(yè)邏輯被證明是有效的,那么它在相當(dāng)長的一段時間內(nèi)不會變化,那么你就能獲得一些“定性”的預(yù)測能力,這就足夠了。
大多數(shù)人會因數(shù)據(jù)而變傻
為什么這么說呢?在我的工作經(jīng)歷中,大多數(shù)的管理層,都會因為數(shù)據(jù)資源的豐富而或多或少地放棄思考。放棄思考意味著變傻,難道不是嗎?許多人,自身因為長期業(yè)務(wù)經(jīng)驗的積累,其實是有很好的直覺的。而現(xiàn)在,卻被一個不熟悉業(yè)務(wù),只會從數(shù)據(jù)庫中做些統(tǒng)計的所謂數(shù)據(jù)分析師牽著鼻子走。實在是“可歌可泣”。許多人過分地依賴數(shù)據(jù)統(tǒng)計了。這個現(xiàn)象是值得警覺的。
曾經(jīng)有一位學(xué)者告訴我,數(shù)據(jù)分析使人短視甚至盲目。開始我不以為意,但之后越來越覺得這話有道理。為什么呢?現(xiàn)實情況是,許多人有了數(shù)據(jù)資源后,放棄了最基本的商業(yè)思考,不斷地去統(tǒng)計數(shù)據(jù),不斷地去提“幫我查一下這個數(shù)字,幫我看一下那個數(shù)字”這樣的需求。失去了思考的深度,非常危險。
我覺得,真正的數(shù)據(jù)分析(業(yè)務(wù)分析),應(yīng)該有很高的門檻。這個門檻并不來自于分析方法的應(yīng)用,而來自于對業(yè)務(wù)的理解。只有對業(yè)務(wù)有深刻的理解,才能將分析方法用對地方,才能正確地解讀信息,獲得結(jié)論。
所以,許多深耕在業(yè)務(wù)中的管理者,不需要因為數(shù)據(jù)資源的爆炸而驚慌失措,真正有價值的東西在你們經(jīng)驗里,只需要有一個量化的出口,你才是那個將數(shù)據(jù)價值發(fā)揮到最大的人。
那么問題來了,如何做到不因數(shù)據(jù)而變傻呢?我沒有答案。我認為在未來,不應(yīng)該有數(shù)據(jù)分析師這個職業(yè),而應(yīng)該是所有決策者都懂得“分析數(shù)據(jù)”。這實際上是寫作本書最深層的一個目的。當(dāng)所有決策者都能正確地獲取數(shù)據(jù)、合適地應(yīng)用分析方法,得出可靠的結(jié)論時,我們的商業(yè)將進入一個新的階段,商業(yè)智能才真正落地。
最后,我還是想強調(diào),任何人在應(yīng)用數(shù)據(jù)前,都要記住這樣一句話:“對業(yè)務(wù)的理解和思考,永遠高于分析技術(shù)的選擇”。