AI和大數(shù)據(jù)襲來(lái),卻增加創(chuàng)業(yè)者顛覆科技巨頭的難度
隨著人工智能能和大數(shù)據(jù)的熱潮來(lái)臨,帶來(lái)了更所的科技創(chuàng)新的機(jī)遇與前景,但與此同時(shí),也增加了初創(chuàng)者們顛覆大公司的機(jī)會(huì)……
新的一周,Google公開(kāi)了一項(xiàng)在AI領(lǐng)域的破紀(jì)錄研究成果。該項(xiàng)研究成果揭示了一個(gè)重要的信息。傳統(tǒng)上我們認(rèn)為,日益依賴消費(fèi)者和社會(huì)經(jīng)濟(jì)的科技公司特征是創(chuàng)新和反壟斷的——這也是小企業(yè)可以顛覆大公司的機(jī)會(huì)所在。然而當(dāng)科技公司之間的競(jìng)爭(zhēng)依賴于通過(guò)大數(shù)據(jù)進(jìn)行的機(jī)器學(xué)習(xí)之時(shí),小公司顛覆巨頭的道路將會(huì)變得更加艱難。
Google周一發(fā)布了他們與Carnegie Mellon大學(xué)一項(xiàng)不菲的合作。雙方的圖像識(shí)別實(shí)驗(yàn)室在兩個(gè)月里整合了50個(gè)強(qiáng)大的圖形處理器,并使用了一個(gè)前所未有的3億張標(biāo)記圖像(其他實(shí)驗(yàn)室大部分都只使用百萬(wàn)量級(jí)的圖片標(biāo)準(zhǔn)集合)。這個(gè)實(shí)驗(yàn)的目的在于測(cè)試是否可以通過(guò)給計(jì)算機(jī)更大量的數(shù)據(jù),而不是通過(guò)調(diào)整算法來(lái)提高機(jī)器對(duì)圖片的識(shí)別率。
答案是可以。
Google和CMU的研究人員使用規(guī)模龐大的新數(shù)據(jù)集對(duì)一套標(biāo)準(zhǔn)的圖像處理系統(tǒng)進(jìn)行訓(xùn)練之后,發(fā)現(xiàn)系統(tǒng)在數(shù)項(xiàng)標(biāo)準(zhǔn)測(cè)試中得到了新的高分——這些測(cè)試目的在于在評(píng)估軟件解讀圖片的能力,比如識(shí)別照片中的物體。在他們輸入的數(shù)據(jù)量和圖像識(shí)別算法的準(zhǔn)確性之間有著清晰的關(guān)系。這些發(fā)現(xiàn)在某種程度上解答了一個(gè)在人工智能學(xué)界流傳的問(wèn)題,即即是否可以從現(xiàn)有的算法中獲得大量的數(shù)據(jù),從而進(jìn)一步獲得更多的數(shù)據(jù)。
數(shù)據(jù)越多能產(chǎn)生更多的性能。這表明,像谷歌、Facebook或微軟這樣的數(shù)據(jù)豐富的科技巨頭,可能會(huì)有更大的好處。
圖像處理系統(tǒng)基于谷歌包含3億張圖片的巨大數(shù)據(jù)集進(jìn)行學(xué)習(xí),這并未產(chǎn)生巨大的好處——從100萬(wàn)張圖片到3億張圖片,系統(tǒng)識(shí)別對(duì)象能力的得分僅僅提升了3個(gè)百分點(diǎn)——但論文作者表示,他們認(rèn)為可以通過(guò)調(diào)整軟件更好地適應(yīng)超大型數(shù)據(jù)集來(lái)擴(kuò)大這種優(yōu)勢(shì)。
即便事實(shí)證明情況并非如此,但在科技行業(yè)當(dāng)中,很小的優(yōu)勢(shì)也可能造成重要影響。比如,就自動(dòng)駕駛汽車視覺(jué)技術(shù)的準(zhǔn)確性來(lái)說(shuō),每一點(diǎn)增益都是至關(guān)重要的;而對(duì)一款能夠創(chuàng)收數(shù)十億美元的產(chǎn)品而言,小小的效率提升將能產(chǎn)生滾雪球效應(yīng)。
在科技公司眼中,囤積數(shù)據(jù)已經(jīng)成為一種防御性策略。
谷歌、微軟和其他公司都開(kāi)放了大量的軟件,甚至是硬件設(shè)計(jì),但是對(duì)于這些工具的使用卻沒(méi)有那么大的自由??萍脊敬_實(shí)發(fā)布了數(shù)據(jù):去年,谷歌發(fā)布了一個(gè)龐大的數(shù)據(jù)集,從超過(guò)700萬(wàn)的YouTube視頻中提取出來(lái),而Salesforce則開(kāi)放了一個(gè)從維基百科中提取的數(shù)據(jù),以幫助算法處理語(yǔ)言。
但是,人工智能發(fā)展實(shí)驗(yàn)室的合作伙伴、勞倫斯伯克利國(guó)家實(shí)驗(yàn)室的訪問(wèn)研究員盧克德Oliveira說(shuō),(正如你所預(yù)料的那樣)這樣的發(fā)布通常不會(huì)給潛在的競(jìng)爭(zhēng)對(duì)手提供太多的價(jià)值。他說(shuō):“這些數(shù)據(jù)從來(lái)都不是真正對(duì)產(chǎn)品市場(chǎng)地位至關(guān)重要的數(shù)據(jù)集。”
谷歌和CMU的研究人員表示,他們想要他們的最新研究成果,即他們所說(shuō)的“海量數(shù)據(jù)”的價(jià)值,以促進(jìn)更大的、谷歌規(guī)模的、開(kāi)放的圖像數(shù)據(jù)集的創(chuàng)建。他們寫(xiě)道:“我們真誠(chéng)的希望是,這能激勵(lì)愿景社區(qū)不要低估數(shù)據(jù),并在構(gòu)建更大數(shù)據(jù)集的過(guò)程中共同努力?!盋MU的Abhinav Gupta說(shuō),一個(gè)選擇是與普通的視覺(jué)數(shù)據(jù)基金會(huì)合作,這是一個(gè)由Facebook和微軟贊助的非營(yíng)利組織,它已經(jīng)發(fā)布了開(kāi)放的圖像數(shù)據(jù)集。
與此同時(shí),數(shù)據(jù)量小的公司想要在數(shù)據(jù)競(jìng)爭(zhēng)中生存下來(lái),他們需要自己的算法變得更聰明和更有創(chuàng)意。Jeremy Achin是初創(chuàng)公司DataRobot的首席執(zhí)行官,他猜測(cè),隨著機(jī)器學(xué)習(xí)變得對(duì)越來(lái)越多的公司和行業(yè)舉足輕重,一種見(jiàn)于保險(xiǎn)行業(yè)的模式可能在更大范圍內(nèi)流行起來(lái),即眾多小保險(xiǎn)公司(認(rèn)真地)把各自數(shù)據(jù)“拼”到一起,以使其風(fēng)險(xiǎn)預(yù)測(cè)能夠匹敵那些規(guī)模更大的競(jìng)爭(zhēng)對(duì)手。
讓機(jī)器學(xué)習(xí)不再那么渴求數(shù)據(jù),這方面的進(jìn)步有可能顛覆人工智能的數(shù)據(jù)經(jīng)濟(jì)學(xué);優(yōu)步去年就收購(gòu)了一家從事相關(guān)研究的公司。但現(xiàn)在,后者仍然有可能試著避開(kāi)人工智能巨頭公司已有的數(shù)據(jù)優(yōu)勢(shì)。
Fast.ai是一家致力于讓機(jī)器學(xué)習(xí)變得更容易的公司,其聯(lián)合創(chuàng)始人蕾切爾·托馬斯(RachelThomas)表示,初創(chuàng)公司可以在由互聯(lián)網(wǎng)巨頭把持的領(lǐng)域之外找到應(yīng)用機(jī)器學(xué)習(xí)技術(shù)的地方,就比如說(shuō)農(nóng)業(yè)?!拔也淮_信這些巨頭公司一定在所有領(lǐng)域占據(jù)著優(yōu)勢(shì),在很多特定領(lǐng)域中,根本沒(méi)有人在收集數(shù)據(jù),”她如是說(shuō)。即便是人工智能領(lǐng)域的巨頭也有盲點(diǎn)。
#專欄作家#
肥寒,微信公眾號(hào):chanpingdog,人人都是產(chǎn)品經(jīng)理專欄作家。九年產(chǎn)品經(jīng)理。做過(guò)數(shù)字閱讀,電商,社區(qū),目前致力于在線教育。
本文翻譯發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
原文地址:https://www.wired.com/story/ai-and-enormous-data-could-make-tech-giants-harder-to-topple/
- 目前還沒(méi)評(píng)論,等你發(fā)揮!