久久久久久久综合综合狠狠,欧美性受xxxx黑人xxxx

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業(yè)技能直播

會員專屬社群

榮耀標識

發(fā)布

注冊 | 登錄

今日頭條：AI助力用戶推薦（下篇）

連詩路AI產(chǎn)品

2019-03-28

2 評論 10061 瀏覽 52 收藏

10 分鐘

在上篇中主要講了AI助力實現(xiàn)智能推薦的原理流程和方法，在下篇中筆者將通過上手操作，來討論具體落地的方法。

本篇筆者選擇今日頭條中的13個類別的信息作為上手對象，如：時尚、旅游、美食、育兒、財經(jīng)、圖片、探索、娛樂、搞笑、直播、體育、科學等，分別通過抽取粉絲數(shù)超過百萬以上的用戶最近的文章、用戶標簽和分享的圖像，最終在13個類別上獲取了353個用戶的ID號和URL，共爬取13個類別的600 382張圖像，118 421條文章和 2378個用戶標簽作為數(shù)據(jù)集；然而13個類別的2378個用戶標簽中有1110個標簽重復(fù)，所以刪除重復(fù)之后，最終得到1286個不重復(fù)的用戶標簽。

由于本篇筆者的目的在于展示AI產(chǎn)品如何上手，so“探討用戶分享圖、文章和用戶標簽中的語義概念是否能夠表征用戶的興趣傾向，并比較單模型數(shù)據(jù)和多模型數(shù)據(jù)的推薦效果”，因此將353個用戶分為13個類別，其中圖像、文章和標簽數(shù)據(jù)如下圖：

文章數(shù)據(jù)處理過程如下：

主要是將13個類別的353個用戶的文本數(shù)據(jù)獲取后。

首先：對每個類別用戶的文本進行去停用詞；

停用詞是指在信息檢索中，為節(jié)省存儲空間和提高搜索效率，在處理自然語言數(shù)據(jù)（或文本）之前或之后會自動過濾掉某些字或詞，這些字或詞即被稱為Stop Words（停用詞）。這些停用詞都是人工輸入、非自動化生成的，生成后的停用詞會形成一個停用詞表。但是，并沒有一個明確的停用詞表能夠適用于所有的工具。甚至有一些工具是明確地避免使用停用詞來支持短語搜索的。

接著：再進行分詞，筆者所采用的是Python里的jieba分詞，分詞完畢后對文章進行深度學習，然后得出每個用戶下所有文章的64維特征向量，生成353個用戶文章的特征向量；

標簽數(shù)據(jù)處理：

再對用戶標簽數(shù)據(jù)處理過程主要是將13個類別的353個用戶的2378個用戶標簽數(shù)據(jù)獲取后，將重復(fù)的標簽刪除，最終得到 1286 個興趣標簽，1286 個興趣標簽通過程序生成1286 維度詞袋模型；

圖像數(shù)據(jù)處理：

圖像數(shù)據(jù)處理主要使用殘差網(wǎng)絡(luò)（ResNET），ResNet模型獲得過圖像識別大賽冠軍，通過深度殘差網(wǎng)絡(luò)對圖像進行識別，在深度和精度上比傳統(tǒng)的CNN可以獲得更好的語義信息表達。筆者通過使用ResNet模型來構(gòu)建50層的神經(jīng)網(wǎng)絡(luò)，獲取1000維特征向量。

最后，將13個興趣類別的3種數(shù)據(jù)類型的特征向量進行組合，每位用戶生成2350維特征向量。

總結(jié)：

在今日頭條的產(chǎn)品落地中不僅將用戶的文本、標簽和圖像特征融合進行推薦，也會將將用戶的屬性特征和社交關(guān)系特征融合進行好友推薦；

另外，用戶的興趣是多樣性、可變性的，有時推薦系統(tǒng)還會加入情境感知信息，如：時間、情感、場景等。這也是今日頭條產(chǎn)品重點迭代的一個方向。

最后：今日頭條也好、抖音也好、多閃也好都是字節(jié)跳動旗下的明星產(chǎn)品，均為AI賦能助力的產(chǎn)品相信推薦系統(tǒng)會越來越融合跨行業(yè)和跨平臺的推薦打法，突破數(shù)據(jù)孤島。具體系統(tǒng)的知識可以見筆者的暢銷書《AI賦能：AI重新定義產(chǎn)品經(jīng)理》。

升華在以上例子中AI產(chǎn)品經(jīng)理應(yīng)該做的事是：

1. 停用詞庫的構(gòu)建。

2. 明白關(guān)鍵詞術(shù)語和意義例如：精確率、召回率及F1值，精確率（Precision），查準率。即正確預(yù)測為正的占全部預(yù)測為正的比例。個人理解：真正正確的占所有預(yù)測為正的比例。召回率（Recall），查全率。即正確預(yù)測為正的占全部實際為正的比例。個人理解：真正正確的占所有實際為正的比例。F1值。F1值為算數(shù)平均數(shù)除以幾何平均數(shù)。

3. 研究定義產(chǎn)品的分析對象、分析指標、能夠應(yīng)用分析結(jié)果。

如果你想系統(tǒng)化入門AI產(chǎn)品經(jīng)理，掌握AI產(chǎn)品經(jīng)理的落地工作方法，戳這里>http://996.pm/7bjab

#專欄作家#

連詩路，公眾號：LineLian。人人都是產(chǎn)品經(jīng)理專欄作家，《產(chǎn)品進化論：AI+時代產(chǎn)品經(jīng)理的思維方法》一書作者，前阿里產(chǎn)品專家，希望與創(chuàng)業(yè)者多多交流。

本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于CC0協(xié)議

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

連詩路AI產(chǎn)品

AI產(chǎn)品有思路，連詩路AI產(chǎn)品LineLian，微信 firstbodytm

93篇作品 1543126總閱讀量

創(chuàng)業(yè)180天，我發(fā)現(xiàn)了工具型SaaS的最佳實踐

03-235046 瀏覽

2023年對產(chǎn)品經(jīng)理能力需求變化的主要趨勢

10-132630 瀏覽

抖音網(wǎng)頁版上線“放映廳”，真能免費看電影了？

01-094370 瀏覽

B端商業(yè)產(chǎn)品的用戶體驗設(shè)計

06-135508 瀏覽

美容儀領(lǐng)跑個護小家電賽道，品牌有哪些增長策略？

03-244289 瀏覽

評論

BATJ

花了5K大洋跟LineLian老師交流過AI產(chǎn)品三視圖正視側(cè)視和俯視來看人工智能產(chǎn)品，受益良多，老師不僅是AI技術(shù)和產(chǎn)品設(shè)計和算法邏輯清晰，更多的是指導我們做產(chǎn)品的一種綜合素質(zhì)極高的模式

最近來自上海回復(fù)
1. 微世界回復(fù)BATJ
  
  不錯不錯。
  
  最近來自廣東回復(fù)