微信鍵盤誕生背后:國產輸入法30年

2 評論 6202 瀏覽 16 收藏 29 分鐘

國內輸入法已經經歷了30年左右的發展歷程,在這歷程中,互聯網巨頭們也嘗試于這一領域各自占領一席之地,而近日,微信鍵盤在應用商店的正式上線,則預示微信也正式加入了這一塊“蛋糕”的爭奪。那么,大廠們“研習”開發輸入法,背后隱藏著哪些原因?

用戶等了近兩年,微信鍵盤1.0.0正式版終于上線。

這是張小龍口中,為保護用戶隱私而開發的產品,它不收集數據、不用于盈利。

微信鍵盤誕生背后:國產輸入法30年

微信鍵盤界面

微信為什么要做輸入法?如果讀懂輸入法的前世今生,那也許能理解巨頭的想法。

一、鍵盤上的漢字生意

雖然不同輸入法的功能千差萬別,但它們的原理完全相同——

電子世界是只有1和0的二進制,無論輸入或者輸出什么漢字,中間都要經過二進制代碼轉換。

1980年頒布的GB2312-80《信息交換用漢字編碼字符集》,相當于給每個漢字都發放了唯一的“身份證”。而輸入法的工作,就是保證用戶以最快的方式,記住每一個漢字的ID。

從此,第三方輸入法各顯神通,市面上有了五筆、全拼、雙拼等各式各樣的輸入法,傳統的單機輸入法出現了——

1. 傳統輸入法

從輸入方式上,我們可以把輸入法分為兩類:形碼輸入法和音碼輸入法。

微信鍵盤誕生背后:國產輸入法30年

形碼輸入法中最有名的當屬五筆字型。1983年,中科大教授王永民根據漢字書寫特點的發明了五筆字型,并在1989年成立北京王碼電腦有限公司,銷售“王碼五筆輸入法”。

五筆字型解決了PC端漢字輸入的問題,新華社稱“其意義不亞于活字印刷術”,而王永民也因此成為“當代畢昇”和全國勞動模范[1]。

但實際上,早在1964年,王永民還是中國科學技術大學的一名本科生時,編譯家鄭易里就在為郵電科學院設計另一種形碼輸入法——“四碼漢字”,可惜后因不可抗力中斷。

1979年,河南省科委邀請鄭易里漢字編碼做專題報告。王永民還連夜趕到鄭州,向鄭易里討教漢字編碼問題。

直到1989年,鄭易里才與女兒鄭瓏發明出“字型通用碼”漢字輸入法,也就是后來人們口中的鄭碼[2]。

對五筆上有印象的人可能還記得,形碼輸入法的打字效率雖然高,但要花費大量時間記字根,學習成本非常高。怎么創作一款容易普及的輸入法,成了當時開發者面臨的問題,而答案則寄托在音碼輸入法上。

微信鍵盤誕生背后:國產輸入法30年

圖源:王碼官網[3]

音碼就是一種把漢字轉換拼音字母的編碼。用戶使用音碼輸入法時,只要輸入漢語拼音,就能找到想要的漢字,極大地降低了漢字輸入門檻。

80年代末,哈工大博士王曉龍研發出一款名為InSun的拼音輸入法,不僅讓PC用戶擺脫了復雜的字根,還可以支持整句輸入,在輸入效率和學習門檻中間進行折中。

不過,這款輸入法在當時并沒有得到廣泛關注。90年代中期,InSun被王曉龍以10萬美元的價格賣給微軟,成為Windows95內置的“微軟拼音”[4]。

被微軟收購的還有智能ABC。這款北京大學教授朱守濤在1990年研發出的輸入法,結合了音碼和形碼的功能:用戶可以在拼音輸入的基礎上,通過該字第一筆的形碼進行快讀定位。

雖然更多的人只是把它當作普通的拼音輸入法使用,但這絲毫沒能影響智能ABC的成功。被收購后,微軟將它內置在Windows2000上,成為彼時大陸使用人數最多的輸入法。

智能ABC的成功,帶動了更多開發者的參與,國內輸入法產業競爭越發激烈。紫光華宇、智能狂拼、黑馬神拼、拼音加加等優秀的拼音輸入相繼面世,也曾分別俘獲一批追隨者。

輸入法的“混戰”一直持續到2005年,直到碩果僅存的四位——智能 ABC、紫光拼音、拼音加加和微軟拼音,占據了90%的市場[5]。后來,以搜狗輸入法為代表的智能輸入法出現,國內的輸入法市場又發生了新一輪變化。

2. 智能輸入法

2005年,太原一家國企的應屆生馬占凱發現,在搜索框里打出“zhoujielun”的拼音時,搜索引擎會提示“您要找的是不是:周杰倫”。這給了他靈感——是否可以給輸入法聯網,借助搜索引擎的功能,開發一款能監控時下熱詞的輸入法呢?

于是馬占凱開始向百度發郵件、提建議。多封郵件石沉大海后,馬占凱又轉投搜狐,光速入職成為一名產品經理,加入王小川組建的團隊開發搜狗輸入法。直到2006年6月,搜狗輸入法正式上線,中文輸入法宣告進入“網絡時代”。

與傳統輸入法相比,自帶搜索引擎的智能輸入法不僅“猜詞”更準,還開創了輸入法的賬號登錄功能,把用戶的輸入習慣上傳至云端,方便用戶異地使用輸入法和備份個人詞庫。

可以說,智能輸入法就是一個用戶專屬的人工智能,用戶的每一次打字都是在訓練AI,只要用戶聯網登錄自己的賬號,就能切換到那個“最懂自己”的輸入法。

互聯網的普及印證了馬占凱的思路,微軟原生輸入法和其它傳統輸入法越發無人問津,其它大廠也推出同類產品。2007~2010年谷歌、騰訊、阿里、百度先后發布同類輸入法。不過最早入局的搜狗仍具有不可取代的優勢。到2009年6月,搜狗輸入法的裝機量已超過8000萬,占據輸入法市場70%的份額。

推出智能輸入法的公司越來越多,所屬公司之間的“騷操作”也屢見不鮮。

作為開創者的搜狗,率先把矛頭指向谷歌。2007年,搜狗發布聲明稱Google輸入法盜用搜狗詞庫,此事最終以谷歌公開道歉、刪除爭議詞庫結束。隨后,國內互聯網公司開始相互扯皮。

2009年6月23日,搜狗以不正當競爭和侵犯知識產權為由起訴騰訊,索賠2000萬元。不過騰訊沒慫,反而在同年11月4日向法院起訴搜狗虛假宣傳,索賠金額同樣為2000萬元。

騰訊甚至還為此在騰訊網開辟了“搜狗拼音輸入法不正當競爭”專頁。頁內不僅整理了最新報道、專家觀點、兩家產品功能對比,還專門介紹了搜狐官司纏身的諸多新聞,和QQ拼音的60項專利[6]。這個具有“紀念性的網頁”直到今天——騰訊與搜狗完成合并已近一年,仍未被下線。

微信鍵盤誕生背后:國產輸入法30年

《北京青年報》曾發文稱,搜狗輸入法與QQ拼音之爭,表明拼音輸入法的市場競爭開始進入了白熱化的階段[7]。此后,輸入法圈也有過數起糾紛,如2015年搜狗和百度相互起訴對方的輸入法專利侵權[8][9]、2019年百度和360等公司聯合起訴搜狗輸入法流量劫持[10]等。

一方面,互聯網大廠在為智能輸入法專利吵得不可開交;另一方面,第三方輸入法的廣告問題讓令用戶不勝其擾。

日漸式微的微軟輸入法突然抓住機會,在2010年宣布將加大更新力度,并在Windows10上針對性對中文輸入法的使用體驗進行改善[11]。新版微軟輸入法在延續原生輸入法純凈無廣告特點的基礎上,對功能進行了大量優化升級。

微軟的輸入法體驗是越來越好了,但它的奮發圖強還是遲了一步。這時的互聯網大廠,早已把業務重點轉向了移動端。

二、從PC到手機,輸入法成為“必需品”

早在那個萬能充還隨處可見的2008年,搜狗已經初涉移動業務,盯上了用戶的智能手機。只不過,那時谷歌剛推出第一部安卓手機,因此搜狗在移動端的試水選擇了彼時更加成熟的塞班系統。

輸入法的戰線從PC端來到手機端,小公司們也冒出頭跟大廠爭奪市場,出現了觸寶、A4、點訊梅花等一批專注于手機輸入法的產品。

到2009年,LG、索尼愛立信等廠商退出塞班生態。輸入法廠商見風使舵,開始推出安卓版App。2011年,安卓手機在智能手機中的市場份額躍升至48%,擠掉諾基亞成為世界第一大智能系統[12]。

塞班大勢已去,手機輸入法紛紛轉戰安卓。2014年,僅支持原生輸入法的蘋果在iOS 8首次開放第三方輸入法,各公司又紛紛宣布登陸App Store,雙線發展。

微信鍵盤誕生背后:國產輸入法30年

主流品牌手機輸入法上線時間

不過,后來的事實證明,即便是在移動端這樣的新興平臺上,輸入法想要起量,也得“抱大腿”。上述三家公司中,A4和點訊梅花在2019年分別被騰訊和百度收購,推出了QQ手機輸入法和百度手機輸入法。

到2017年,各類手機輸入法中只有搜狗、訊飛、百度三家頭部公司MAU超過百萬。在這之中,搜狗輸入法又占據絕對優勢,其MAU是訊飛和百度兩家產品MAU之和的兩倍[13]。易觀數據的報告顯示,到2020年11月,搜狗、訊飛、百度三家的去重用戶滲透率超過95%,而搜狗獨占58.4%[14]。

另外,至今仍是“自由身”的觸寶雖然已經上市,但也在國內失去了生存空間,全面轉戰海外,變成一款付費使用的產品。

輸入法有成為“大生意”的潛力。與社交、游戲等類別的App相比,工具類的輸入法天生具有極高的用戶粘性和滲透率。據CNNIC的數據,到2020年12月我國有9.86億手機網民[15],而在QuestMobile的2020年中國移動互聯網年度大報告里,輸入法App的活躍用戶規模已達8.82億,滲透率高達89.5%[16]。

明明用戶規模如此龐大,為什么只容得下幾家巨頭?

三、正經人誰做輸入法???

縱使輸入法行業在中國發展了近30年,仍有諸多問題未能解決,最大的問題是難以商業化。

1. 大公司的“玩具”

輸入法的商業模式和技術模式都決定了,這是一個有錢人才玩得起的“玩具”。

一方面,技術的進步給輸入法行業帶來了新的轉變,游戲規則對小公司越發的不友好。

十年前的輸入法更關注如何讓打字更快更準。有些公司開發出雙拼輸入、滑動輸入和T+1鍵盤,優化文字輸入體驗,有些則在選詞上下功夫,推出地域詞庫、專業詞庫和通訊錄詞庫等個性化詞庫。

十年后,輸入法越來越考驗公司的AI技術。

隨著人工智能技術的進步,用戶不再滿足于中規中矩的傳統輸入法。語音輸入、翻譯輸入、表情包斗圖等功能,更討用戶喜歡。

根據易觀數據2019年的調研,在選擇第三方輸入法時,有47.5%的用戶會考慮語音輸入是否好用,有46.6%的用戶考慮斗圖表情是否合意[17]。另外,智能助手、語音變聲、AI寫作助手和OCR掃描輸入等智能功能,也成為Z世代用戶高頻使用功能[14]。

而這些技術,往往只有大公司才拿得出手。

搜狗、百度、訊飛三家輸入法巨頭中,百度和搜狗是國內較早涉足人工智能搜索引擎的公司,訊飛則起家于語音識別和語義識別技術,實力過硬。

另一方面,輸入法的盈利模式至今仍是個謎。

在PC端,輸入法一直是款“基本上不賺錢”的免費產品,其盈利模式除了偶有的彈窗廣告外,幾乎沒有付費功能。背靠兩大互聯網巨頭的QQ和百度輸入法過得滋潤,但小公司們要么擇木而棲,被大公司收購,要么直接倒閉停運。

少數廠商曾測試過付費皮膚和輸入法廣告功能,但立刻引起用戶強烈反感。

王小川的“三級火箭”模式曾被輸入法行業寄予厚望,他發現輸入法雖不能直接賺錢,卻可以作為一個流量入口,為其它盈利業務輸血。

于是,搜狗在2008年又推出瀏覽器,建立了一個基于“輸入法-瀏覽器-搜索引擎”的產品體系——利用搜狗輸入法(一級火箭)帶動搜狗瀏覽器(二級火箭)安裝量,再通過瀏覽器給搜狗搜索(三級火箭)帶量。

搜狗的“三級火箭”模式,到2012年前后基本成型。這一年,搜狗搜索近半流量來源于搜狗瀏覽器[18];這一年,搜狗營收1.31億美元,較2011年增長108%[19]。

但歸根結底,三級火箭的模式只是一個導流手段,盈利壓力全指望搜狗搜索的廣告。后來,國內搜索引擎業務逐漸被百度壟斷,搜狗搜索的市場份額越來越少,這一模式也隨之失靈。

這幾年搜狗一直在吃搜索業務的老本,財報顯示,2019年搜狗總營收11.7億美元,其中搜索廣告業務貢獻率超過91.5%[20]。

最后,搜狗沒有找到更好的盈利途徑,最終被騰訊全資收購。

近幾年,輸入法也曾在手機廠商身上尋找其它出路。

搜狗曾與小米、OPPO、vivo三家手機廠商達成合作,在部分機型上內置深度定制的搜狗輸入法。百度也不甘示弱,除上述三家廠商外,還曾與華為達成獨家合作,后者全機型使用定制版百度輸入法。

但與廠家合作無法給輸入法公司帶來實際收益。

一方面,與手機公司合作雖然能快速帶來活躍用戶,但并沒有解決輸入法本身的盈利困境。另一方面,輸入法公司們還得隨時提防手機廠商帶著自研輸入法殺回來。2021年11月,華為推出了自研的“小藝輸入法”;而vivo自研的“Jovi輸入法”也在持續更新,應用市場就是輸入法的前車之鑒。

為了商業化,部分輸入法暗地里開始做起“倒賣數據”的生意,這又給輸入法行業帶來了隱私保護問題。

2. 用戶數據去哪了

2021年1月19日,張小龍在“微信之夜”上表示,因為用戶頻繁投訴自己的聊天記錄被竊取,出于保護用戶隱私的目的,才決定自研并推出輸入法。

張小龍一番話,把其它輸入法公司置于不義之地。

用戶數據一直是輸入法行業里“隱秘的角落”。即便輸入法公司一遍遍地向用戶聲明“我們將妥善處置用戶數據,保護用戶隱私”,用戶依然對輸入法心存芥蒂。

作為用戶手機中最大的信息集散地,輸入法與廣告商、分析服務商等建立了數據合作關系,你打開任意一款輸入法App的隱私政策,都能夠看到類似“會將用戶部分信息共享給合作伙伴”的描述。

所謂的“部分信息”不是用戶的敏感數據,而是“用戶畫像”“用戶標簽”等脫敏形式,用于推薦個性化廣告[21]。

比如,京東曾在2017年與搜狗簽下名為“京搜計劃”的合作框架。京東彼時便表示,與搜狗合作將獲得更多流量入口,能提升投放的精準性[22]。

正因如此,很多用戶跟朋友聊天時說了什么,就會在電商App接收到相關的產品推薦。

2019年12月30日,國家網信辦、工信部等四部門聯合發布《App違法違規收集使用個人信息行為認定方法》,提到App不得“違反必要原則,收集與其提供的服務無關的個人信息?!盵23]

2021年初,工信部對輸入法行業“格外關心”,一下子公布了26款侵害用戶權益的App。其中,QQ輸入法、快輸入、手心輸入法、微商輸入法四款輸入法均因違規手機用戶個人信息,被下架整改[24]。

這只是前菜。

2021年4月26日,工信部發布《移動互聯網應用程序個人信息保護管理暫行規定(征求意見稿)》,其中第七條規定“從事App個人信息處理活動的,應當具有明確、合理的目的,并遵循最小必要原則,不得從事超出用戶同意范圍或者與服務場景無關的個人信息處理活動?!盵25]

5天后,國家互聯網信息辦公室發布了“關于輸入法等33款App違法違規收集使用個人信息情況的通報”,其中15款輸入法App存在非法獲取、超范圍收集個人信息的現象。搜狗、訊飛、百度、QQ等主流輸入法App無一幸免[26]。

微信鍵盤誕生背后:國產輸入法30年

監管趨嚴的結果是,輸入法的數據管理越來越規范。搜狗輸入法2022年4月更新的《收集個人信息明示清單》和《第三方信息共享清單》里,已經看不到可用于個性化廣告的信息共享。

自此,輸入法的數據生意結束,正式成為互聯網巨頭的公益產品,最多為自家產品導導流——2022年9月,在微信鍵盤最近一次的灰度測試中,已經有了智能薦書和小程序、公眾號分享等功能。

但這就是微信的全部目的嗎?顯然不是。

四、手機行業的“名利場”

中國最大社交媒體、月活超12億的微信,掌握著幾乎全中國網民的隱私數據。這是社交產品難以企及的成就,同時也是塊“燙手山芋”。

而聊天打字用的輸入法,是除了微信以外,聊天信息的唯一出口。國家對用戶隱私的管理日益嚴格,微信有必要與這些“風險”切割,而自研輸入法就是最好的方法。

開發輸入法對微信來說并不難。

一來目前微信App上已經包括了語音輸入、語音轉寫、文字翻譯、表情包搜索等功能,與一款完整的輸入法比起來只差一個鍵盤;二來騰訊已經收購搜狗,無論是搜狗輸入法還是QQ輸入法的團隊,都有現成的技術和經驗供微信團隊借鑒。

微信也不必考慮開發輸入法的投入回報比,畢竟隱私面前無小事。至于怎么盈利,那是信息流廣告該考慮的問題。

那這不是砸了同行飯碗嗎?是的,但第一個飯碗已經被蘋果砸了。

2021年,蘋果在iOS 14.5中限制了App的廣告追蹤功能,砸了谷歌、亞馬遜以及彼時Facebook飯碗。雖然同行怨聲載道,甚至宣布起訴蘋果,但用戶一片叫好。

如今,不過是事件的主角換成了微信、戰場變成了輸入法,但手機行業依舊是那個隱私與盈利的名利場。

References:

[1] 中國發明協會副會長王碼五筆字型發明人 “當代畢昇”-王永民 http://www.wangma.net.cn/wangyongmin.aspx?sm=10

[2] 王碼與鄭碼 2014.11.8 https://www.qqxiuzi.cn/wz/zixun/1163.htm

[3] 王碼五筆字型86版、98版、新世紀版簡體字根鍵位圖 http://www.wangma.net.cn/InfoMationDetail.aspx?sm=5&m=41

[4] 打字雖快錯字罰五十 重溫輸入法發展史 2011.9.7 https://soft.zol.com.cn/247/2476547_all.html#p2476650

[5] 馬占凱:Sogou輸入法之父的故事 2007.10.11 https://blog.csdn.net/anzi57066381/article/details/1819943

[6] 騰訊QQ拼音輸入法正式起訴搜狗拼音輸入法不正當競爭 https://tech.qq.com/zt/2009/qqpinyin09/index.htm

[7] 拼音輸入法競爭進入白熱化 2009.7.1 https://www.chinanews.com/it/it-itxw/news/2009/07-01/1756009.shtml

[8] 搜狗起訴百度輸入法8項專利侵權 索賠8千萬元 2015.10.26 https://www.yicai.com/news/4702489.html

[9] 百度正式起訴搜狗輸入法 索賠一億元 2016.10.28 http://news.imobile.com.cn/articles/2016/1028/172563.shtml

[10] 因“流量劫持”被360及百度等公司起訴,搜索候選功能被判不正當競爭 搜狗輸入法之劫 2019.7.13 http://www.cb.com.cn/index/show/bzyc/cv/cv13418711641

[11] 新版Windows 10特別針對中國市場 改善簡體中文輸入體驗 2016.12.8 https://www.51cto.com/article/524434.html

[12] Android手機占據全球智能機市場48%份額 2011.8.2 http://www.techweb.com.cn/news/2011-08-02/1075173.shtml

[13] 極光大數據:2018年輸入法app行業研究報告 2018.8.31 http://www.199it.com/archives/766638.html

[14] 2020年中國第三方輸入法市場發展分析 2021.1.11 https://www.analysys.cn/article/detail/20020025

[15] 我國網民規模達9.89億 2021.2.4 http://www.xinhuanet.com/tech/2021-02/04/c_1127061748.htm

[16] QuestMobile2020 中國移動互聯網年度大報告·上:變局孕育新生,新“消費者觸達矩陣”掀起銷售、營銷變革 2021.1.26 https://mp.weixin.qq.com/s/_y6d43VvzRoL_OLndSREWQ

[17] 中國第三方輸入法市場專題分析2019 2020.1.3 https://www.analysys.cn/article/detail/20019622

[18] 搜狗姓搜,搜狐的搜 2017.8.2 https://www.pingwest.com/a/127351

[19] 解讀搜狐2012年財報:創紀錄下的隱憂 2013.2.6 https://www.huxiu.com/article/9979.html

[20] 搜狗財報 https://www.sec.gov/Archives/edgar/data/1713947/000110465920049011/a20-15253_120f.htm

[21] 輸入法會“背叛”我們嗎?2021.1.31 https://www.infzm.com/contents/200787

[22] 京東聯合搜狗推京搜計劃 全面開放企業核心能力 2017.10.20 https://tech.huanqiu.com/article/9CaKrnK5y44

[23] 關于印發《App違法違規收集使用個人信息行為認定方法》的通知 2010.12.30 http://www.cac.gov.cn/2019-12/27/c_1578986455686625.htm

[24] 關于違規調用麥克風、通訊錄、相冊等權限侵害用戶權益行為的APP通報(2021年第2批,總第11批) 2021.2.5 https://www.miit.gov.cn/jgsj/xgj/gzdt/art/2021/art_7893db5f4a4d403192f69c72fc0320d9.html

[25] 公開征求對《移動互聯網應用程序個人信息保護管理暫行規定(征求意見稿)》的意見 2021.4.26 http://www.gov.cn/xinwen/2021-04/26/content_5602780.htm

[26] 關于輸入法等33款App違法違規收集使用個人信息情況的通報 2021.5.1 http://www.cac.gov.cn/2021-04/30/c_1621370239178608.htm

作者:楊景詒,編輯:李拓;公眾號:果殼硬科技(ID:guokr233)

原文鏈接:https://mp.weixin.qq.com/s/aEKkngNJzZoGMiM8_Bst4w

本文由 @果殼硬科技 授權發布于人人都是產品經理,未經作者許可,禁止轉載

題圖來自 Unsplash,基于 CC0 協議

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供信息存儲空間服務。

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 這直接是從哪里找了篇綜述嗎?

    來自中國 回復
  2. 漲知識了,原來輸入法后面還有那么多的學問啊。

    來自廣西 回復