復(fù)盤(pán):購(gòu)買(mǎi)數(shù)據(jù)的案例分享

0 評(píng)論 6751 瀏覽 20 收藏 14 分鐘

編輯導(dǎo)語(yǔ):數(shù)據(jù),對(duì)于任何平臺(tái)或者企業(yè)來(lái)說(shuō),都很重要。無(wú)論是想要做出一些營(yíng)銷(xiāo)決策還是調(diào)整新產(chǎn)品的發(fā)布策略,數(shù)據(jù)的收集和分析都是必經(jīng)的一環(huán)。對(duì)于醫(yī)藥O2O電商平臺(tái)來(lái)說(shuō),得到權(quán)威而又準(zhǔn)確的數(shù)據(jù),尤其是藥品和病癥之間的關(guān)系數(shù)據(jù)源,顯得尤為重要。

本文復(fù)盤(pán)一次藥學(xué)服務(wù)數(shù)據(jù)購(gòu)買(mǎi)的案例,呈現(xiàn)當(dāng)時(shí)的處理方式和遇到的問(wèn)題。

該“買(mǎi)數(shù)據(jù)”案例,發(fā)生在做醫(yī)藥O2O電商平臺(tái),藥品這一特殊的電商商品,其“健康屬性”,可以作為附加值提供的載體。如,賣(mài)藥的同時(shí)附加提供健康服務(wù),以藥學(xué)服務(wù)拉近“人貨場(chǎng)”的溫度,打造線(xiàn)上線(xiàn)下產(chǎn)業(yè)化新零售生態(tài)。

藥學(xué)附加服務(wù),無(wú)論是用藥指導(dǎo)、尋醫(yī)問(wèn)藥,還是患者畫(huà)像之類(lèi)的,前提都是要有藥品-病癥之間的關(guān)系數(shù)據(jù)源。

這個(gè)數(shù)據(jù)即要權(quán)威準(zhǔn)確,又要通俗易懂,兼顧科學(xué)化和網(wǎng)絡(luò)大眾化。市場(chǎng)上單純的醫(yī)藥數(shù)據(jù),或單純的藥品商品數(shù)據(jù),都不難獲得。難獲得的是,針對(duì)醫(yī)藥電商人群和故事場(chǎng)景下的醫(yī)藥健康的資料。

本案例涉及到的內(nèi)容清單:案例 ║ 購(gòu)買(mǎi)數(shù)據(jù)的案例分享

一、前期需求分析

1. 分析需求

基于項(xiàng)目規(guī)劃,將本次藥學(xué)服務(wù)的需求場(chǎng)景,歸納如下:

案例 ║ 購(gòu)買(mǎi)數(shù)據(jù)的案例分享

這就要求,數(shù)據(jù)中起碼涉及這些字段:用法用量、功能主治、適用人群、禁忌不良反應(yīng)、服藥周期、治療的疾病、疾病的癥狀、疾病說(shuō)明等。結(jié)合業(yè)務(wù)場(chǎng)景,可以勾勒出這樣的簡(jiǎn)單的關(guān)系圖:

案例 ║ 購(gòu)買(mǎi)數(shù)據(jù)的案例分享

2. 確定核心要素

根據(jù)以上需求,我們可以得知 “藥”、“病”、“癥” 三者最為核心,關(guān)系如下:

案例 ║ 購(gòu)買(mǎi)數(shù)據(jù)的案例分享

且三者為多對(duì)多關(guān)系,如下:

案例 ║ 購(gòu)買(mǎi)數(shù)據(jù)的案例分享

3. 評(píng)估數(shù)據(jù)量級(jí)

常規(guī)藥品的數(shù)量,達(dá)到6萬(wàn)種(SKU)。

藥品基本都是單規(guī)格的(不同含量視為不同規(guī)格,不同含量不同的申報(bào),業(yè)內(nèi)視為不同的商品),因此大約要準(zhǔn)備接近這個(gè)數(shù)字的藥品資料,才能保證覆蓋面。

總結(jié):至此,從需求要素、核心內(nèi)容、需求數(shù)據(jù)量范圍,描繪了擬獲取數(shù)據(jù)的輪廓,作為尋找數(shù)據(jù)源的驗(yàn)收標(biāo)準(zhǔn)或參考。

二、調(diào)研獲取數(shù)據(jù)的途徑

我們的目標(biāo)數(shù)據(jù),是客觀(guān)標(biāo)準(zhǔn)的基礎(chǔ)數(shù)據(jù),不是運(yùn)營(yíng)產(chǎn)生的數(shù)據(jù)。因此權(quán)威性、客觀(guān)性最重要,那么如何獲取呢?

1. 假如自己維護(hù)?

請(qǐng)專(zhuān)人、找到藥盒、翻閱藥品說(shuō)明書(shū)、錄入、再翻閱醫(yī)藥詞典類(lèi)數(shù)據(jù)、對(duì)應(yīng)整理疾病信息……平均一天一人最多搞定100條,算下來(lái)6萬(wàn)就要很久。

顯然來(lái)不及且成本不菲,并且沒(méi)有驗(yàn)證的數(shù)據(jù)也不敢用,這條途徑pass。

2. 爬別人的數(shù)據(jù)

藥品信息在藥監(jiān)局官網(wǎng)比較權(quán)威,但是上面沒(méi)有疾病方面的,甚至連條形碼都找不到(備注:條形碼,國(guó)內(nèi)就是69碼,唯一標(biāo)識(shí)商品,13位、12位或8位數(shù)字組成)。

案例 ║ 購(gòu)買(mǎi)數(shù)據(jù)的案例分享

爬取其他網(wǎng)站,也曾嘗試的,結(jié)果不是不準(zhǔn)確、不齊全,就是不成功,這條路也走不通。

3. 購(gòu)買(mǎi)數(shù)據(jù)

購(gòu)買(mǎi)數(shù)據(jù)比起爬數(shù)據(jù)要正規(guī)些,咨詢(xún)了京東阿里和騰訊丁香,人家都不賣(mài)。這些公司是要自己做數(shù)據(jù)服務(wù)的,也不差這點(diǎn)錢(qián)。

咨詢(xún)了藥房網(wǎng)、135網(wǎng),沒(méi)疾病方便的可靠數(shù)據(jù),這時(shí)候業(yè)內(nèi)人事推薦了一個(gè)叫“YA”的公司,在做藥學(xué)服務(wù),就決定深入商談。

三、拿到樣本數(shù)據(jù)

經(jīng)過(guò)洽談,對(duì)方提供的是一批EXCEL格式的樣本數(shù)據(jù)。大概的表有14個(gè)表格,數(shù)據(jù)拿到之后,進(jìn)行初步驗(yàn)收。

1. 比對(duì)E-R模型

他們的數(shù)據(jù)是mongdb存儲(chǔ)的,首次抽離出來(lái)數(shù)據(jù)來(lái)賣(mài),所以數(shù)據(jù)在表結(jié)構(gòu)和表數(shù)量上有冗余。通過(guò)其表結(jié)構(gòu),繪制出E-R圖,基本與需求符合。

2. 競(jìng)品橫向?qū)Ρ?/h3>

在檢查樣本數(shù)據(jù)的過(guò)程中,也在做替代方案的對(duì)比。

制定檢驗(yàn)要點(diǎn)是:?jiǎn)伪頂?shù)據(jù)的錯(cuò)誤率、聯(lián)表查詢(xún)的匹配率、市場(chǎng)數(shù)據(jù)的覆蓋率、錯(cuò)誤修復(fù)時(shí)效等。從網(wǎng)站或App尋找同類(lèi)產(chǎn)品,但都有各種問(wèn)題,最終還是舍棄了其他選項(xiàng)。

3. 遠(yuǎn)程全量檢查數(shù)據(jù)

在未付款情況下,對(duì)方不提供全量數(shù)據(jù)。

由于樣本有限,為了進(jìn)一步了解數(shù)據(jù),協(xié)商采取遠(yuǎn)程查數(shù)據(jù)庫(kù)。對(duì)方在數(shù)據(jù)庫(kù)中進(jìn)行了單表驗(yàn)證和聯(lián)表查詢(xún)操作,我方遠(yuǎn)程觀(guān)看,并記錄檢查結(jié)果。

遠(yuǎn)程的操作畢竟是不便,只交叉抽樣驗(yàn)證了部分?jǐn)?shù)據(jù),當(dāng)時(shí)估計(jì)出的準(zhǔn)確率是93%——這也是決定繼續(xù)洽談的主要參數(shù)。

四、付首款并拿到全量數(shù)據(jù)

接下來(lái)的流程是談價(jià)格,價(jià)格談好就可以打包出售數(shù)據(jù)。

我方壓價(jià)的論點(diǎn)主要是:疾病方面的數(shù)據(jù)不到一萬(wàn)條,買(mǎi)回后仍需補(bǔ)充的人工成本;非獨(dú)家買(mǎi)斷,可以復(fù)制銷(xiāo)售,賣(mài)家邊際成本很低,內(nèi)容質(zhì)量不高。

口頭說(shuō)的是由執(zhí)業(yè)藥師團(tuán)隊(duì)和藥師專(zhuān)業(yè)、中國(guó)非處方藥物協(xié)會(huì)藥師進(jìn)行審核。但是并拿不出證據(jù),最終得到了折扣,擬定了全量數(shù)據(jù)驗(yàn)收的合同。

當(dāng)時(shí)的合同內(nèi)容比較簡(jiǎn)單,草稿截圖如下:

案例 ║ 購(gòu)買(mǎi)數(shù)據(jù)的案例分享

合同簽署后,拿到了全量數(shù)據(jù)。

雙方約定一周的時(shí)間進(jìn)行數(shù)據(jù)驗(yàn)收,驗(yàn)收無(wú)誤則支付尾款。因?yàn)閿?shù)據(jù)的敏感性,由專(zhuān)人以郵件壓縮包文檔的方式接收。然后存入堡壘機(jī)中,其他參與驗(yàn)收人員通過(guò)堡壘機(jī)進(jìn)行檢驗(yàn)。

1. 研究數(shù)據(jù)的質(zhì)量

檢查數(shù)據(jù)的合理性:也就是數(shù)據(jù)在邏輯機(jī)構(gòu)上的是否有缺陷。

案例 ║ 購(gòu)買(mǎi)數(shù)據(jù)的案例分享

數(shù)據(jù)的關(guān)聯(lián)度:采取的是手動(dòng)在EXCEL上比對(duì),并導(dǎo)入數(shù)據(jù)庫(kù)后程序員SQL查詢(xún)相結(jié)合的方式。基于對(duì)基礎(chǔ)數(shù)據(jù)的了解,制定了檢查方案,局部如下圖:

案例 ║ 購(gòu)買(mǎi)數(shù)據(jù)的案例分享

2. 檢查數(shù)據(jù)的權(quán)威性

這一點(diǎn)需要專(zhuān)業(yè)藥師或藥學(xué)人員參與,我們采用的是抽樣調(diào)查的辦法,比對(duì)的標(biāo)桿是藥典的權(quán)威資料,考察的對(duì)象比如“阿苯達(dá)唑”的服用時(shí)間、用藥禁忌等。

3. 數(shù)據(jù)的覆蓋率

采用的辦法是,指定20個(gè)常用藥物(比如對(duì)乙酰氨基酚),看是會(huì)否能查到全套的資料,得到的結(jié)論是數(shù)據(jù)并不理想。

比如:用條形碼匹配已有的商品,發(fā)現(xiàn)有1579個(gè)找不到,占比20.87%;再用這1579個(gè)的通用名查找,仍有147個(gè)仍找不到,即絕對(duì)找不到的比例1.9%。

4. 數(shù)據(jù)的冗余性

很多表都是從MongDB轉(zhuǎn)化過(guò)來(lái)的,所以表之間的結(jié)構(gòu)不合理。最終14個(gè)表,也就有7個(gè)表是有用的,其余的多是過(guò)度表(初步驗(yàn)收時(shí)候雖然也發(fā)現(xiàn)了)。

5. 雙方交涉

其實(shí)大家看得出,全量數(shù)據(jù)的檢測(cè)結(jié)果不理想。

主要發(fā)生在,表結(jié)構(gòu)不合理;數(shù)據(jù)存在錯(cuò)誤、一些名詞在各表中的表述不一致等。但是這個(gè)時(shí)期,合同的約定并不利于買(mǎi)方,因此只能繼續(xù)往前。

我們?cè)谝恢軆?nèi)輸出了問(wèn)題清單,摳合同字眼,尋找有利的機(jī)會(huì),然后責(zé)令對(duì)方將數(shù)據(jù)清洗后重新交接。

五、數(shù)據(jù)購(gòu)買(mǎi)后的應(yīng)用規(guī)劃

在經(jīng)歷5次數(shù)據(jù)交付后,雙方法務(wù)協(xié)商一致,進(jìn)行了價(jià)格的調(diào)整,最終完成了交易。

如果把驗(yàn)收當(dāng)做一次項(xiàng)目,那么雖然項(xiàng)目做的不太漂亮,但是數(shù)據(jù)還是有價(jià)值的,是可用用的。

數(shù)據(jù)拿到了,技術(shù)層面進(jìn)行應(yīng)用規(guī)劃:第一步,元數(shù)據(jù)檢查和清洗,將14個(gè)表,抽離成整潔的新表;第二步,指定底層服務(wù)邏輯,以作為數(shù)據(jù)中臺(tái),供應(yīng)用端接口調(diào)用。

比如:

案例 ║ 購(gòu)買(mǎi)數(shù)據(jù)的案例分享

第三步:對(duì)接具體業(yè)務(wù)場(chǎng)景,輸出具體方案(此處略)。

六、總結(jié)

1. 本次數(shù)據(jù)購(gòu)買(mǎi)主要涉及三方面

  1. 產(chǎn)品角度的需求鍥合度;
  2. 醫(yī)藥專(zhuān)業(yè)角度的數(shù)據(jù)權(quán)威性;
  3. 法務(wù)層面的合同約定項(xiàng):其中后兩點(diǎn)都沒(méi)做太好,尤其是法務(wù)方面,這導(dǎo)致了全量數(shù)據(jù)拿到之后的進(jìn)退兩難。

但是項(xiàng)目自身也存在局限性和難度:比如數(shù)據(jù)量大,很難發(fā)現(xiàn)細(xì)節(jié)問(wèn)題;缺少標(biāo)桿,自行推敲只能抽樣調(diào)查的方式;數(shù)據(jù)的價(jià)格方面沒(méi)有固定的標(biāo)準(zhǔn),難以拿捏。

2. 數(shù)據(jù)購(gòu)買(mǎi)帶來(lái)的經(jīng)驗(yàn)教訓(xùn)

  • 自身對(duì)數(shù)據(jù)的需求范圍和目標(biāo)明確;
  • 了解賣(mài)家,和賣(mài)家數(shù)據(jù)的影響力;
  • 應(yīng)當(dāng)在購(gòu)買(mǎi)之前,應(yīng)該了解還有誰(shuí)買(mǎi)過(guò)或者用過(guò),調(diào)查口碑;
  • 在于對(duì)方接洽之前,準(zhǔn)備充分的行業(yè)和技術(shù)方面的驗(yàn)證標(biāo)準(zhǔn)和計(jì)劃;
  • 制定基本的項(xiàng)目步驟,比如:前置研究、評(píng)估成本、購(gòu)買(mǎi)談判、后置約束;
  • 在拿到全量數(shù)據(jù)之前,應(yīng)當(dāng)充分采取遠(yuǎn)程調(diào)查的手段,挖掘?qū)Ψ綌?shù)據(jù)的漏或者不足,以作為合同約定和議價(jià)的前提;
  • 在合同簽署中,更多約定對(duì)“隔皮斷貨”的風(fēng)險(xiǎn)的鑒定標(biāo)準(zhǔn)和賣(mài)方的責(zé)任。這個(gè)份文檔一定要提供給行業(yè)專(zhuān)家、法務(wù),以便將來(lái)拿到真實(shí)數(shù)據(jù)之后,可進(jìn)可退;
  • 合同中要約定驗(yàn)收過(guò)程問(wèn)題的處理辦法,驗(yàn)收成本誰(shuí)來(lái)負(fù)責(zé),驗(yàn)收不通過(guò)的最大次數(shù)等。

#專(zhuān)欄作家#

唧唧歪歪PM,公眾號(hào):唧唧歪歪PM(ID:jjyypm),人人都是產(chǎn)品經(jīng)理專(zhuān)欄作家,2019年年度作者?!逗蠖水a(chǎn)品經(jīng)理寶典》作者,藥學(xué)碩士轉(zhuǎn)行互聯(lián)網(wǎng)產(chǎn)品多年;熟悉跨境電商業(yè)務(wù),醫(yī)藥領(lǐng)域;擅長(zhǎng)大型后臺(tái)體系,社交APP。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載

題圖來(lái)自Unsplash,基于CC0協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!