社媒是個(gè)大染缸,大數(shù)據(jù)挖掘有啥價(jià)值?

2 評(píng)論 30799 瀏覽 1 收藏 4 分鐘

社媒是個(gè)大染缸,頑主比爛,僵尸橫行,水軍泛濫,大數(shù)據(jù)挖掘又有什么意義?

無論是怎樣大的染缸,它實(shí)際上成為最具規(guī)模、最便捷、有時(shí)甚至是唯一的普羅網(wǎng)民的輿情宣泄口,尤其在東土。

水軍僵尸總會(huì)有對(duì)付的辦法。社媒的混沌和雜亂不是不作為的理由。從情報(bào)角度,它可能不是富礦,但肯定是金礦,就看你有沒有本事挖掘它。

有啥用處呢?先說它的不宜和禁忌,也許更好。

1、這種挖掘不宜做預(yù)測,更適合做回顧。當(dāng)然,歷史是未來的鏡子,回顧過去也未嘗不能透出一點(diǎn)趨向的預(yù)測。

2、這種挖掘一般不提供問題的答案,特別是科學(xué)問題,答案在專家或上帝手中,不在網(wǎng)民的口水中。

3、大數(shù)據(jù)不是決策的唯一依據(jù),只是依據(jù)之一。正確的決策必須綜合各種信息來源。大事不提,看看筆者購買洗衣機(jī)是怎樣使用大數(shù)據(jù)、朋友口碑、實(shí)地考察以及種種其他考量的吧。以為有了大數(shù)據(jù),就萬事大吉,是不切實(shí)際的。

有 網(wǎng)友怕大數(shù)據(jù)挖掘誤導(dǎo)讀者。的確,大數(shù)據(jù)的操作和挖掘可能有bug。但大數(shù)據(jù)提供的輿情全貌鳥瞰是其他手段代替不了的,而我們每個(gè)個(gè)體在日常接觸中只能看 到輿情信息海洋的一滴水。事實(shí)上,無視大數(shù)據(jù)更容易被自己的局限所誤導(dǎo)。害怕大數(shù)據(jù),就好比蒙上眼睛,世界就不見了一樣可笑。

好,回到有啥價(jià)值?

最直接的價(jià)值就是可以補(bǔ)充、加強(qiáng)并最終取代問卷調(diào)查。(譬如可以用來測量一場運(yùn)動(dòng)、戰(zhàn)役、廣告的效果,總統(tǒng)選情的檢測,等等。)

第二個(gè)價(jià)值就是為公關(guān)危機(jī)提供檢測和預(yù)警的工具。

企業(yè)中的usecases有十多類(scenarios),在我看與上述兩種都大同小異,但是企業(yè)人士不認(rèn)為這樣簡單,因?yàn)槊總€(gè)scenario都有其獨(dú)特的設(shè)置、優(yōu)化和資源配置,因此都有其獨(dú)特的價(jià)值,不少價(jià)值可以最終由ROI來客觀測量。

其他潛在價(jià)值可能也有,但不能確認(rèn),還在探索中。譬如相關(guān)性和不相關(guān)性研究。有了數(shù)據(jù),有了工具,應(yīng)該可以玩出一些花樣來。這些都是可以探索的。

作 者:李維,博士,首席科學(xué)家,架構(gòu)師,自然語言平臺(tái)和核心技術(shù)設(shè)計(jì)者。所設(shè)計(jì)研發(fā)的自然語言平臺(tái)支持新一代多語言搜索引擎和問答系統(tǒng)(包括中文),用于企 業(yè)市場,主要搜索互聯(lián)網(wǎng)上的商業(yè)情報(bào),包括產(chǎn)品技術(shù)信息,客戶反饋,社會(huì)媒體輿情等。該產(chǎn)品為多家財(cái)富500強(qiáng)的研究部門和市場部門采用。2001年獲加 拿大 Simon Fraser University 計(jì)算語言學(xué)專業(yè)博士學(xué)位。本文轉(zhuǎn)自他的博客。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 現(xiàn)在都流行大數(shù)據(jù)啊,大數(shù)據(jù)無處不在。突然讓我想到我朋友一家公司,日活躍用戶一千多,注冊用戶五六萬,還裝們成立了個(gè)部門搞大數(shù)據(jù),天天研究這點(diǎn)用戶,笑死我了。能研究出個(gè)啥。

    來自菲律賓 回復(fù)