產(chǎn)品經(jīng)理10大基礎(chǔ)技能(2):讀透模型
本文總結(jié)分享了什么是模型、模型的分類、建立模型的方法和步驟以及具體案例。
在產(chǎn)品經(jīng)理10大基礎(chǔ)技能系列文章的上篇文章《 產(chǎn)品經(jīng)理10大基礎(chǔ)技能(1):讀透SQL》中,筆者LineLian提到過(guò)模型概況,本篇文章著重介紹產(chǎn)品經(jīng)理如何理解模型?在團(tuán)隊(duì)建立模型的過(guò)程中產(chǎn)品經(jīng)理應(yīng)該懂哪些知識(shí)點(diǎn)?然后用口罩需求量的案例展示建立模型的過(guò)程和思路。
一、模型的定義
模型與算法在某種程度上指的是一回事,就像日常生活中你問(wèn)是先有雞還是先有蛋。模型是使用數(shù)學(xué)概念和語(yǔ)言來(lái)對(duì)一個(gè)系統(tǒng)的描述。創(chuàng)建模型的過(guò)程叫做建模。
二、模型的分類
模型通常由關(guān)系與變量組成。關(guān)系可用算符描述,例如代數(shù)算符、函數(shù)、微分算符等。變量是關(guān)注的可量化的系統(tǒng)參數(shù)的抽象形式。算符可以與變量相結(jié)合發(fā)揮作用,也不可以不與變量結(jié)合。
通常情況下,模型可被分為以下幾類:
- 線性與非線性:在模型中,如果所有變量表現(xiàn)出線性關(guān)系,由此產(chǎn)生的模型為線性模型。否則,就為非線性模型。
- 靜態(tài)與動(dòng)態(tài):動(dòng)態(tài)模型對(duì)系統(tǒng)狀態(tài)隨時(shí)間變化情況起作用,而靜態(tài)(或穩(wěn)態(tài))模型是在系統(tǒng)保持平穩(wěn)狀態(tài)下進(jìn)行計(jì)算的,因而與時(shí)間無(wú)關(guān)。動(dòng)態(tài)模型通常用微分方程描述。
- 顯式與隱式:如果整體模型的所有輸入?yún)?shù)都已知,且輸出參數(shù)可以由有限次計(jì)算求得(稱為線性規(guī)劃,不要與上面描述的線性模型相混淆),該模型稱作顯式模型。
- 離散與連續(xù):離散模型將對(duì)象視作離散的,例如分子模型中的微粒,又如概率模型中的狀態(tài)。而連續(xù)模型則由連續(xù)的對(duì)象所描述,例如管道中流體的速度場(chǎng),固體中的溫度和壓力,電場(chǎng)中連續(xù)作用于整個(gè)模型的點(diǎn)電荷等。
- 確定性與概率性(隨機(jī)性):確定性模型是所有變量集合的狀態(tài)都能由模型參數(shù)和這些變量的先前狀態(tài)唯一確定的一種模型;因此,在一組給定的初始條件下確定性模型總會(huì)表現(xiàn)相同。相反,在隨機(jī)模型(通常成為“概率模型”)中存在隨機(jī)性,而且變量狀態(tài)并不能用唯一值來(lái)描述,而用概率分布來(lái)描述。
- 演繹,歸納與漂移:演繹模型是創(chuàng)建在理論上的一種邏輯結(jié)構(gòu)。歸納模型由實(shí)證研究及演繹模型推廣而得。漂移模型則既不依賴于理論,也不依賴于觀察,而僅僅是對(duì)預(yù)期結(jié)構(gòu)的調(diào)用。
當(dāng)然模型還有從其他維度劃分的方式,例如從機(jī)器學(xué)習(xí)的維度又可以分為:有監(jiān)督的模型、無(wú)監(jiān)督的模型和半監(jiān)督的模型。
本篇按分類所舉的案例屬于線性和非線性的第一類模型。
三、建立模型的方法和步驟
一般來(lái)說(shuō)建模過(guò)程可用如下框圖來(lái)表明:
系統(tǒng)拆分建模方法和步驟如下:
1. 模型準(zhǔn)備
要了解產(chǎn)品的業(yè)務(wù)需求實(shí)際背景,明確建模目的,搜集必需的各種信息,盡量弄清需求的特征。
2. 模型假設(shè)
根據(jù)對(duì)象的特征和建模目的,對(duì)產(chǎn)品業(yè)務(wù)需求進(jìn)行必要的、合理的簡(jiǎn)化,用精確的語(yǔ)言作出假設(shè),是建模至關(guān)重要的一步。如果對(duì)問(wèn)題的所有因素一概考慮,無(wú)疑是一種有勇氣但方法欠佳的行為,所以高超的建模者能充分發(fā)揮想象力、洞察力和判斷力 ,善于辨別主次,而且為了使處理方法簡(jiǎn)單,應(yīng)盡量使問(wèn)題線性化、均勻化。
3. 模型構(gòu)成
根據(jù)所作的假設(shè)分析對(duì)象的因果關(guān)系,利用對(duì)象的內(nèi)在規(guī)律和適當(dāng)?shù)臄?shù)學(xué)工具,構(gòu)造各個(gè)量間的等式關(guān)系或其它數(shù)學(xué)結(jié)構(gòu)。建立模型是為了讓更多的人明了并能加以應(yīng)用,因此工具愈簡(jiǎn)單愈有價(jià)值。
4. 模型求解
可以采用解方程、畫圖形、證明定理、邏輯運(yùn)算、數(shù)值運(yùn)算等各種傳統(tǒng)的和近代的數(shù)學(xué)方法,特別是運(yùn)用計(jì)算機(jī)技術(shù)以及云計(jì)算、和算力芯片技術(shù)。
5. 模型分析
對(duì)模型解答進(jìn)行數(shù)學(xué)上的分析。“橫看成嶺側(cè)成峰,遠(yuǎn)近高低各不同”,能否對(duì)模型結(jié)果作出細(xì)致精當(dāng)?shù)姆治?,決定了你的模型能否達(dá)到更高的檔次。還要記住,不論那種情況都需進(jìn)行誤差分析,數(shù)據(jù)穩(wěn)定性分析。
四、建立數(shù)學(xué)模型的實(shí)例
本篇案例文章筆者LineLian以“N95口罩銷量”為背景,通過(guò)背景分析、數(shù)據(jù)收集、數(shù)據(jù)分析、數(shù)學(xué)建模、獲得結(jié)論等過(guò)程,得到牛頓冷卻模型。
1. 背景分析
背景本案例用新冠病毒背景下用戶購(gòu)買口罩預(yù)防病毒,假設(shè)病毒傳染到達(dá)高峰以后,用戶對(duì)口罩的需求數(shù)據(jù)到達(dá)無(wú)病毒狀態(tài)下的正常值模型探索。
2. 數(shù)據(jù)收集
收集50天內(nèi)口罩13個(gè)區(qū)域的口罩總計(jì)銷售數(shù)據(jù)。采集數(shù)據(jù)如下表所示:
在數(shù)據(jù)收集中數(shù)據(jù)產(chǎn)品經(jīng)理要明白如下知識(shí)點(diǎn):
設(shè)時(shí)間為x,口罩銷量為y,從上表中的數(shù)據(jù)來(lái)看,x,y的取值范圍是什么?
自變量x∈【0,50】,因變量y∈【50,99】。
3. 數(shù)據(jù)分析
數(shù)據(jù)分析是一種統(tǒng)計(jì)方法,其主要特點(diǎn)是多維性和描述性。有些幾何方法有助于揭示不同的數(shù)據(jù)之間存在的關(guān)系,并繪制出統(tǒng)計(jì)信息圖,以更簡(jiǎn)潔的解釋這些數(shù)據(jù)中包含的主要信息。
本案例是口罩銷量在病毒感染數(shù)到達(dá)峰值后,口罩銷量和時(shí)間是單值對(duì)應(yīng)的,專業(yè)的數(shù)據(jù)產(chǎn)品經(jīng)理能夠引導(dǎo)團(tuán)隊(duì)選擇合適的函數(shù)模型來(lái)描述兩者的關(guān)系。
例如畫出口罩銷量隨時(shí)間變化的大致圖像如下:
數(shù)據(jù)產(chǎn)品經(jīng)理需要懂的知識(shí)點(diǎn)是,具備一些行業(yè)數(shù)據(jù)分析需要的圖形化思維。
4. 模型選擇
數(shù)據(jù)產(chǎn)品經(jīng)理在模型選擇階段主要懂得知識(shí)點(diǎn)是,多儲(chǔ)備一些自己行業(yè)所需要的模型。例如口罩銷量隨著疫情被控制而下降案例中,我們可以從一次函數(shù)模型嘗試,y=kx+b (其中K≠0),我們肯定都知道,當(dāng)K>0直線上升,當(dāng)k<0,直線下降,均不符合口罩在無(wú)重大疫情下最終趨于一個(gè)常量的特征。
那么常見的二次函數(shù)模型y=ax2+bx+c(其中a≠0),能描述口罩隨著疫情被控制隨著時(shí)間下降的變化趨勢(shì)嗎?也不行,不論開口向上還是向下,當(dāng)x->+∞時(shí),y->∞,與隨著時(shí)間的增加口罩銷量下降并最終趨于一個(gè)向量相矛盾。
同樣的,對(duì)數(shù)函數(shù)模型y=m loga x 也不符合。因此可以選擇單調(diào)下降的指數(shù)函數(shù)模型y=ma x(其中0<a<1,m>0)。
數(shù)據(jù)產(chǎn)品經(jīng)理在模型選擇中通過(guò)層層啟發(fā),各個(gè)擊破,充分培養(yǎng)適合的模型的直觀感知、直覺判斷意識(shí)和能力。
5. 模型建立
確定指數(shù)函數(shù)模型y=ma x(其中0<a<1,m>0)。
根據(jù)收集的數(shù)據(jù),利用Python或者Excel或者其他工具進(jìn)行精確計(jì)算,由計(jì)算機(jī)自動(dòng)生成指數(shù)函數(shù):y=93.287e -0.014x。
6. 模型檢驗(yàn)
根據(jù)函數(shù)的圖像性質(zhì)推斷,指數(shù)函數(shù)的圖像的發(fā)展趨勢(shì)比較符合口罩隨疫情高峰時(shí)間后的變化規(guī)律,如下圖:
但指數(shù)函數(shù)模型也存在有明顯不足,當(dāng)x趨于正無(wú)窮大時(shí),y趨于0。事實(shí)上,沒有疫情下口罩的銷量將趨于一個(gè)正常值。
設(shè)計(jì)意圖,數(shù)據(jù)建模給出一種研究問(wèn)題的方法:從基本假設(shè)出發(fā),而非從假想結(jié)論出發(fā),用嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)方法去分析,結(jié)合數(shù)據(jù)挖掘現(xiàn)象背后的數(shù)學(xué)規(guī)律。
從而產(chǎn)品經(jīng)理大膽提出質(zhì)疑,發(fā)表自己的意見。
7. 模型建立總結(jié)
擬合類函數(shù)建立模型時(shí)一般可以按以下程序進(jìn)行操作:
在根據(jù)數(shù)據(jù)特點(diǎn)選擇模型函數(shù)時(shí),由于產(chǎn)品業(yè)務(wù)問(wèn)題本身的復(fù)雜性、開放性,所選擇的模型會(huì)有局限性,需要對(duì)模型的解進(jìn)行檢驗(yàn)或修正;有時(shí)由于從收集的數(shù)據(jù)中選擇的數(shù)據(jù)不同,得到的擬合模型結(jié)果會(huì)有所差別,但只要誤差在允許的范圍內(nèi)就認(rèn)為是何時(shí)的。
最后小結(jié)
隨著各個(gè)公司對(duì)數(shù)據(jù)的重視,產(chǎn)品經(jīng)理會(huì)無(wú)一例外的逐步變成全是懂?dāng)?shù)據(jù)的產(chǎn)品經(jīng)理,提的產(chǎn)品需求也講全部用數(shù)據(jù)說(shuō)話。而運(yùn)用數(shù)據(jù)的過(guò)程也是建立模型的過(guò)程。先理解產(chǎn)品的業(yè)務(wù)需求,然后再建模的過(guò)程中配置模型工程師決定每個(gè)數(shù)據(jù)的產(chǎn)品業(yè)務(wù)意義,然后用模型的結(jié)果來(lái)為產(chǎn)品做決策。
如果你想系統(tǒng)化入門AI產(chǎn)品經(jīng)理,掌握AI產(chǎn)品經(jīng)理的落地工作方法,戳這里>http://996.pm/7bjab
#專欄作家#
連詩(shī)路,公眾號(hào):LineLian。人人都是產(chǎn)品經(jīng)理專欄作家,《產(chǎn)品進(jìn)化論:AI+時(shí)代產(chǎn)品經(jīng)理的思維方法》一書作者,前阿里產(chǎn)品專家,希望與創(chuàng)業(yè)者多多交流。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash, 基于CC0協(xié)議
學(xué)習(xí)了~