便利店選址和機器學(xué)習(xí)能擦出什么火花?
編輯導(dǎo)讀:想開一個賺錢多的便利店,選址很重要!那么,應(yīng)該如何確認(rèn)開店的位置呢?本文從機器學(xué)習(xí)的角度,分析便利店應(yīng)該怎么選址,希望對你有幫助。
蘿卜同學(xué)最近做了一個夢,話說自己開了家便利店,賺了好多錢,然后抱著一堆錢笑醒了,然鵝,發(fā)現(xiàn)是個夢。
第二天,見了煎蛋,就對他說,我想開個便利店,你說我要怎么做呢?煎蛋頓時來勁了,發(fā)揮自己的專長,巴拉巴拉說了一大堆專業(yè)建議。
蘿卜一臉黑線,請說人話,我先做啥呢?煎蛋說,那當(dāng)然是先選址啊。煎蛋接著說,那我給你講講選址要考慮的事情。
借煎蛋的話題我們來說說選址的事。
如果你和蘿卜同學(xué)有同樣的想法,想開家便利店,如何才能選擇一個好的物業(yè)呢?
在這兒我借之前的一個項目經(jīng)歷,來分享下開店背后的業(yè)務(wù)邏輯和決策,以及如何通過數(shù)據(jù),算法來做出合理的決策和解釋。
一、業(yè)務(wù)背后的事
L公司,開店多年,積累了一筆巨款,發(fā)現(xiàn)了開便利店是個新機會,就打算投資迅速擴張,希望通過多年開店經(jīng)驗的積累,快速搶占市場。但是,在開荒的過程中發(fā)現(xiàn)個問題,用之前的開店流程,效率太低,沒法達(dá)到預(yù)定目標(biāo),能不能利用大數(shù)據(jù)和人工智能來輔助選址,提升選址效率呢?
下面我們來做下分析。
首先我們先簡單解釋下便利店背后的商業(yè)邏輯。
便利店的核心在便利,就是要離用戶近,不管是開在社區(qū)也好、辦公CBD區(qū),還是大客流如高鐵、機場等地區(qū),位置一定離人流足夠近,讓用戶方便看到你,甚至看到你賣的部分東西,來觸發(fā)他的購買欲望,提升進(jìn)店消費概率。
除了位置外,賣的商品也一定是高頻消費,比如零食、早餐、口香糖等,不能賣空調(diào)、冰箱。由于快消品的凈利低,經(jīng)營成本固定,想要獲利,就需要足夠的人流來消費,提升銷售額,那么位置對于便利店就顯得更尤為重要了。如果不考慮其它因素,單從位置便利和銷售額的相關(guān)性上分析,位置便利性和銷售的相關(guān)系數(shù)的總體分布會0.7-0.9?;谶@樣的邏輯,我們再來看選址這件事。
二、傳統(tǒng)的選址
傳統(tǒng)選址主要從哪些維度來評估便利呢?主要考慮以下幾個核心的維度。
- 位置屬性:所選物業(yè)位置屬性,是社區(qū)、CBD,還是商圈,所在圈子的成熟度如何、距離市中心的距離等。
- 客流:所選物業(yè)周邊3公里范圍內(nèi)的客流量及畫像。
- POI:也叫聚客點,所選物業(yè)周邊3公里范圍內(nèi)的大客流店,如餐館、大型商超、醫(yī)院、學(xué)校、交通樞紐等。
- 物業(yè)概況:所選物業(yè)的基礎(chǔ)信息、可到達(dá)性、輻射用戶數(shù)、競對店等。如物業(yè)面積、層高、店招高度、門寬、門前遮擋物、門前階數(shù)、到主干道的距離、到公交的距離等。
以上維度通過所選物業(yè)內(nèi)外兩部分因素來評估便利性,考慮的維度已經(jīng)比較全面了,但是在評估時,主要通過打分卡的形式,進(jìn)行打分評估,相對比較分散,沒法和銷售額做關(guān)聯(lián)分析。在決策時,決策團隊只能靠著主觀意義上的打分,來做出解釋性不強的決定。
還有個問題,那就是在數(shù)據(jù)收集時,所有的數(shù)據(jù)收集都是要通過人為收集,收集效率低,精準(zhǔn)度不高、而且收集成本還比較高。這些都是傳統(tǒng)選址方法上存在的問題,也是比較難解決的。那通過AI怎么選址,可以完全解決傳統(tǒng)存在的問題嘛?
三、智能選址
答案是不能,AI不是萬能的,機器學(xué)習(xí)是基于數(shù)據(jù)基礎(chǔ)上的統(tǒng)計分析和預(yù)測。如果沒有數(shù)據(jù),那AI就是空談。所以先要從數(shù)據(jù)入手,看看哪些是可以獲取的,哪些是沒法獲取但可以通過人為收集的,然后再評估哪些問題可以通過AI解決,怎么解決。
具體數(shù)據(jù)分析和獲取的途徑此略過。最終的結(jié)論是,圍繞銷量的客流量、畫像、行為、POI、競對等數(shù)據(jù)可以通過歷史沉淀和外部合作可以獲得,而所選物業(yè)的基本概況這些信息,需要通過人工進(jìn)行收集。
基于這樣的分析,AI可以在選址上解決一大部分問題,剩下的小部分問題需要靠人主觀經(jīng)驗去解決。那具體如何去分配,我們下面分析下基于量化模型和專家卡模型的解決方案,是如何協(xié)同解決問題的。
四、量化模型
希望通過量化模型,圍繞銷售額為目標(biāo)變量建立與客流量、客流畫像、競品數(shù)、POI、物業(yè)面積、訂單建立數(shù)據(jù)模型,來解釋這些因素間的關(guān)聯(lián)關(guān)系。
下面重點說一下樣本選擇、特征工程、模型構(gòu)建上的一些事情,描述下量化模型搭建的過程。
樣本選擇:我們抽取了運營一年的便利店作為樣本,過濾掉日均銷售額低于1000的樣本,圍繞此樣本來構(gòu)建數(shù)據(jù)集。為什么會選擇1000,因為這個對于業(yè)務(wù)來講,是基本的門檻,是經(jīng)過綜合評估后,日銷達(dá)到這個指標(biāo)才能有可能繼續(xù)運營下去。
特征工程:對每個維度進(jìn)行分類、分段、時間滑窗等方式做衍生變量,來尋找更貼近業(yè)務(wù)目標(biāo)的特征。
比如對于客流量,我們分析了日均人流、工作人口、常駐人口、7:00-9:00人流、12:00-14:00人流,6:00-8:00人流,停留小于30分鐘人流、停留30-60分鐘人流、停留1小時以后人流、進(jìn)店人流等;同樣其它維度的數(shù)據(jù)也做了衍生,并進(jìn)行綜合分析,最終確定了100多個特征,構(gòu)建了模型。
模型構(gòu)建:最終構(gòu)建的模型是預(yù)測模型和分類模型結(jié)合的綜合評估模型,主要是考慮到,對于業(yè)務(wù)方來講,如果我們輸出一個銷量預(yù)測,比如日銷、月銷、年銷在決策上給的建議有限,選址團隊最終想要的是決定性意見,就是適不適合開店。
那么標(biāo)準(zhǔn)是什么呢,就是給出不同類型的店日坪效,通過坪效標(biāo)準(zhǔn)來作為輔助決策的依據(jù)。
所以在預(yù)測模型基礎(chǔ)上結(jié)合坪效構(gòu)建了分類模型,通過兩個模型的融合,最終輸出可解釋的選址建議:推薦選擇 ;建議選擇 ;慎重選擇。
五、專家卡模型
希望通過專家卡模型,結(jié)合之前選址評估時用到的維度,通過人工經(jīng)驗,給出所選物業(yè)主觀打分。下面就抽樣、指標(biāo)設(shè)計、分值設(shè)計上來簡單說下模型的搭建。
樣本選擇:使用量化模型經(jīng)過規(guī)則加工過濾后的便利店做為樣本,并抽取開店決策時各維度的統(tǒng)計數(shù)據(jù),完成樣本數(shù)據(jù)整合。
指標(biāo)設(shè)計:由業(yè)務(wù)對樣本的維度、指標(biāo)、枚舉值進(jìn)行細(xì)化梳理,匯總出專家卡評估模型。比如對于基礎(chǔ)信息維度的指標(biāo),通過細(xì)化為:使用面積;店招高度;實際門寬;門前遮擋物;看到店招距離;內(nèi)部結(jié)構(gòu)等。然后再對使用面積進(jìn)行指標(biāo)細(xì)化,如100㎡,90-100㎡ ,小于90㎡等。目的就是通過逐步拆解,將一個復(fù)雜的維度拆分到不能拆分的程度,使解釋性更強。
權(quán)重及分值:通過模型對各維度的數(shù)據(jù)相關(guān)性及權(quán)重計算。比如對于所選物業(yè)性質(zhì),如果是社區(qū)的話,那么我們計算出的權(quán)重系數(shù)是:入住率85%:0.85;60-85%:0.67;30%-60% :0.58。通過各細(xì)項的打分,獲得一個總體分?jǐn)?shù)再乘權(quán)重系統(tǒng),獲得這個物業(yè)最終的分值。
六、初期協(xié)同,最終融合
這里提到兩個模型,那最終是不是還需要決策人員自己去綜合評估呢?一開始是這樣的,后面其實我們會考慮把專家卡模型和量化模型做融合,最終輸出一個綜合性的評分意見給到業(yè)務(wù)方,這樣更方便選擇決策了。具體怎么融合,需要結(jié)合業(yè)務(wù)綜合考慮,是需要逐步探索的,但一定是值得去做實驗研究的。
回到一開始的問題,機器學(xué)習(xí)帶給選址業(yè)務(wù)上的幫助是什么?
首先,從效率上,縮短了信息從收集、分析、決策的過程,傳統(tǒng)的做法可能需要一周的時間,而使用機器學(xué)習(xí)后,最多需要一天。
其次,從可解釋性上,為選址提供了更精準(zhǔn)的數(shù)據(jù)解釋。比如模型的分類準(zhǔn)確率達(dá)到85.3%時,那其實代表對于未來85.3%的備選物業(yè),我能夠提供精準(zhǔn)的數(shù)據(jù)關(guān)聯(lián)關(guān)系解釋,并且模型給出的結(jié)果是符合業(yè)務(wù)對于坪效、銷售額預(yù)期的。那需要承擔(dān)的風(fēng)險是多少呢?就是1-85.3%,而對于傳統(tǒng)的模式下,這種風(fēng)險和成功預(yù)期是沒辦法做到精準(zhǔn)解釋的。
再次,可解釋,可衡量,那就代表了另一件事,就是提升。通過解釋性讓我們知道可以通過數(shù)據(jù)沉淀,模型沉淀,逐步提高我們的預(yù)期,降低我們承擔(dān)的風(fēng)險。而傳統(tǒng)的做法,這種積累會沉淀到某一個人身上,人會流動,會帶來不穩(wěn)定的風(fēng)險,可能是會增加企業(yè)的風(fēng)險。
綜上,機器學(xué)習(xí)能夠帶給選址團隊的價值不僅是在效率上的提升,還能提供精準(zhǔn)的決策解釋依據(jù),降低選址風(fēng)險。
如果你想開個賺錢的便利店,可以考慮選址相關(guān)的AI產(chǎn)品,而不用自己在開店前,先把自己變成半個選址專家,最后還選到了一個自己心里都沒譜的物業(yè),在還沒開始賺錢就已經(jīng)把自己搞到精辟力盡。試試新的思路,說不定能幫你賺個盆忙缽滿呢!
本文由 @ 不瘋魔 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
請問作者的模型有實際落地嗎?作者是怎么通過判斷的結(jié)果對模型做修正從而提高算法準(zhǔn)確率的呢?有這方面思路嗎?