99久久免费国产精品四虎,国内精品久久久中文字幕,99精品无码视频

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

AI搜索產品發展重點和體驗評價體系

杜昭

2024-08-12

3 評論 4500 瀏覽 13 收藏

25 分鐘

本文將深入探討AI搜索與傳統搜索的差異、AI搜索產品的競爭策略，以及AI搜索產品在短中長期的能力規劃和體驗評價體系，帶你一窺AI搜索產品的未來發展趨勢。

無論是AI搜索還是傳統搜索都是解決用戶的需求，傳統搜索只能解決需求過程的一部分，但其實也在為幫助用戶完整的解決問題而努力，像一些簡單的任務，查個股價、找個網站其實傳統搜索產品已經可以很好的滿足了，+AI之后這些任務的體驗其實并沒有提升，所以在討論+AI之后搜索產品的變化的時候，要先明確+AI更多的是為之前那些無法被直接快速完成的復雜任務做出新的解決方案。

復雜的任務可以是找到一個復雜問題的答案、可以是得到一張要放在PPT里的圖片，在面對這些復雜問題時，交互體驗提升和服務范圍延展將是兩方面重點。

交互體驗提升是說用戶可以用更自由的方式與搜索產品互動，以前只能打字，現在可以是不同媒體類型、不同模態通道，服務范圍延展是說以前我需要通過搜索產品找到一張圖片，下載之后再用電腦上的PS工具處理細節、調整大小才能放到PPT，現在不需要了，用戶可以在圖片搜索結果中直接使用變清晰、摳圖、調整尺寸等等能力，不需要再像以前一樣在多個工具里輾轉。

就像今天的會議，是先坐地鐵再倒公交最后掃了個共享單車才到會場，還是專車直達，兩種體驗自然區別很大。

而越復雜的需求在解決過程中的體驗給用戶的印象會越深，就像在公司內部，能解決越復雜困難的問題的員工會得到更好的評價，這決定了這家公司是否繼續聘請這名員工（用戶是否選擇使用某款產品）

一、用戶如何選擇AI搜索產品

人類在選擇工具時會有一些規律，手機可以錄音，但一個高頻率做采訪的朋友大概率會使用錄音筆，大模型可以回答兩個數字的計算答案，但用戶更傾向使用計算機，用戶在選擇工具時會根據已形成的用戶心智來選擇產品。

用戶心智的含義可以理解為用戶認為面對某一問題時應該選擇哪款產品來解決。

那么對于AI搜索產品來說，決定用戶決策結果的因素是什么呢？我認為是一站式服務，即能讓用戶在更沉浸的狀態中完整的完成任務。

這里的完成任務和傳統軟件中的完成任務區別較大，傳統軟件即使找到對業務非常熟悉的產品經理，依然是把實際業務中核心的、高頻的需求做了數字化，就像現在很多ToB產品，客戶經常要求做一些定制化的功能。這些定制化的就是某特定用戶需要的但不高頻的功能。如果提供一個標準化的SaaS產品這些需求就沒有辦法被滿足，回到剛剛說的，就是任務無法完成。

而在今天大模型的能力恰巧能滿足這些個性化的需求，包括在傳統搜索產品中很多長尾小眾的問題沒有搜不到答案一樣，大模型也可以解決這部分問題。

剛剛我提到的是能讓用戶在更沉浸的狀態中完整的完成任務。這句話還有一個重點是在沉浸的狀態中，沉浸的含義是不需要用戶在多個產品中切換。

對比幾個頭部的AI搜索產品，我們其實會發現功能范圍非常趨同，無非是圖文音視頻理解、總結與生成。這樣就會有一個非?，F實的問題，當用戶面對總結一份文檔的需求時，是會選擇夸克這樣的AI搜索產品還是WPS這樣的文檔處理類產品（WPS+AI也有相同的功能）。用戶面對這兩塊產品時做出的選擇決策，就是由用戶過去形成的心智模型決定的。

因此，我認為在現階段各個AI搜索產品的競爭過程中，搶占用戶心智將是重中之重，因為各個產品（不限于AI搜索產品）具備的AI能力是沒有很大差別的。在用戶體驗上也只能從較為表層的地方產生一些小優勢。不會成為競爭的決定性因素。

今天在高鐵站候車時偶然看到了豆包的廣告，說是很多教英語的老師在建議學生使用豆包練習口語，昨天孫老師也提到現在很多用戶在用豆包寫公文。

這兩件事啟發了我，建立用戶心智的過程如果是「豆包是新一代AI智能助手」這樣的概念是很難的，因為太寬泛了，用戶接受度會有問題。

相對而言更具體的概念更容易建立起用戶心智，例如豆包練口語效果很好，豆包可以寫公文。

一個細分的具體的心智被建立起來之后再在用戶使用的過程中可以再逐漸做心智擴展。引導到【豆包是個全功能AI助手】這樣的大概念，繼而引導用戶探索其他使用場景，完成更多停留時長的目標。

和傳統搜索產品相比AI搜索的價值更多體現在解決復雜任務的場景下，那么解決復雜任務的搜索還是不是搜索？任務重點部分在哪里完成？用戶操作的起點是搜索，但重點是后續服務。在觀察了三款國內第一梯隊的AI搜索產品后，其實我們也會發現這三款AI搜索產品的思路由明顯區別。

這里先講一下我主觀感受中的國內第一梯隊AI搜索產品，有三款分別是夸克、360和豆包。

AI搜索產品發展重點和體驗評價體系

夸克已經在產品名稱中不再強調瀏覽器了，無論是PC還是安卓和蘋果的應用商店完全看不到瀏覽器的概念。我猜測這可能與希望逐漸過渡用戶心智有關。

360在瀏覽器領域積累最深，用戶心智的就是瀏覽器，所以依然沿用了瀏覽器的概念，很早就打360AI瀏覽器的概念。這么做可以令他們把存量用戶轉移到AI產品中更加容易，但后續瀏覽器概念的轉變會落后一分。

豆包則比較激進的直接使用了AI助手的概念，包括產品的圖標也使用了一個人物形象來貼合助手的概念，好處是在AI助手這個領域搶占了先機，但同時也可以失去很多認知還停留在瀏覽器產品的用戶。

下載了豆包之后，可以在系統級層面使用劃詞觸發AI的能力，這一點是非常領先的，像莫妮卡等chrome插件的形式也僅僅是在瀏覽器層面，能夠觸發的用戶場景相對于系統級還是少了很多。

這樣來看的話，其實擁有更底層權限和可以更自由定義體驗的操作系統其實可以把AI能力和用戶場景結合的更好，但目前其實還沒看到實際發布的產品，不知道是不是在憋大招，可以期待一下。

做AI搜索時有幾點決策是比較牛的，第一是和客戶端綁定，意味著體驗更可控和留存有基礎。把客戶端下載到設備之后，也可以增加很多被用戶看到的機會，這就和網站形態有很大的區別了。第二是淡化瀏覽器的概念，這個夸克和豆包已經在做了。

現在的 AI 搜索的產品形態只是一個暫時的一個形式，為了讓傳統搜索引擎用戶，能夠很順暢地遷移到新形態的 AI 搜索上去。但是隨著技術和產品的迭代，我相信新的交互形式、新的產品形式都會在 AI 搜索上展現。

二、AI搜索產品短中長期能力規劃

AI搜索產品發展重點和體驗評價體系

1. 短期

更多類型的圖示。目前都支持了思維導圖和PPT，但常用的其他圖示如流程圖魚骨圖還不支持，這方面的需求是非常明確的，作者在群里也看到過數次用戶在清晰的描述這些需求。
更多媒體類型的輸入輸出?？梢允∪ビ脩粼谳斎氕h節手動轉換不同模態信息的工作，可以在輸出環節令信息的輸出形態與環境更適應。
問題轉寫小模型。針對這種小模型的優化工作相對于提升大模型能力成本更低，需要時間更短，可以更快看到效果。
信息源選擇規則。對問題分類后準確的選擇來源可以明顯的提升結果質量，例如做菜類問題的來源，寫代碼類問題的來源，沒有什么技術難度，就是個信息整理的工作。

2. 中期

1）信息源總量與輸入token總量提升（基于模型大降價）

目前的RAG過程會選擇搜搜結果中的前X篇內容來進行聚合總結生成，根據信息源選擇的規則可以基本做到拿到的X篇內容都是質量還不錯的，但是萬一某個優秀的觀點出現在X之外，那么結果質量就會受到影響。

當未來token價格大幅度下降之后，可能在聚合階段就可以聚合10X篇內容，這樣就可以令結果質量更好。（結果質量是AI搜索產品最重要的體驗指標之一）

2）多模態融合交互

不同模態的信息傳遞方式在人機交互中有諸多特點，視覺模態對信息的接收效率很高，可以以整體的角度認知大量信息的集合。也可以跳躍式的閱讀文字信息，不像聽覺一樣完全依賴時間線順序接收信息。但視覺模態不擅長輸出信息，眼動交互的操作效率很差，即使以蘋果公司的技術能力也只能作為一種輔助殘障人群使用智能設備的輔助交互方式。

聽覺模態則接收信息時具有被動性、環繞性、和瞬態性，在輸出信息時則具有穿透性。被動性是指只要聲波在用戶周圍產生了那么就可以被接收到，不需要用戶主動尋找信息。

鬧鐘就是符合聲音模態接收被動性的案例。環繞性則是相對于視覺模態而言，聲音在人的任意方向產生都可以被人接收到，而視覺大約只可以接收130°的范圍。瞬態性是聲音在不依賴外部設備時是不可以留存的，用戶只能在聲音持續產生的過程中接收，聲音停止接收也會停止，想再次接收只能再產生一次聲音，這一特征相對于通過視覺模態接收文字信息劣勢較大。

最后的穿透性則有兩方面的含義，一是在物理世界內即使人與聲音之間存在一定程度的阻隔，聲音依然可以被人接收到。這一點相對于視覺模態可以適應不同場景下的信息接收方式。

穿透性的第二方面含義是在軟件產品中可以不依賴屏幕顯示出來的內容對功能進行控制，傳統的GUI方式想進行一項操作，必須點擊屏幕中顯示的元素觸發，沒有顯示出來的元素只能通過切換頁面切換層級先找到再觸發，而聲音的穿透性可以直接被設備識別后觸發對應的功能，不依賴屏幕可顯示空間。

觸覺模態則在安全感建立和真實感方面有較大影響，包括人類五感中另外的嗅覺和觸覺，在今天應用到人機交互方面很少，可能在未來的虛擬現實產品中才能得到實際應用。

以上僅是介紹了多模態交互問題中各個模態的簡單特點，實際上多模態交互最重要的部分是多模態融合，具體到產品中應用則是能解決用戶在多任務場景下的交互帶寬問題。

例如人類無法同時看清兩幅畫的細節，無法同時聽清楚兩首歌的旋律，這都是由于單一模態在交互過程中的限制，而使用多模態融合交互的方式則可以解決這個問題（有極限）。

例如傳統的計算器，當用戶按下按鍵時就會發出與按鍵對應的聲音，【7】【加/減】【等于63】，用戶在使用時可以用視覺模態看著賬本、用觸覺模態確認自己按下的按鍵，用聽覺模態核查按鍵是否正確和接收計算結果。這樣就可以利用多個模態協同的效果更高效的完成算賬任務。

多模態融合交互的另一方面意義在于信息之間的轉化和非文字信息，不同模態信息之間的轉化意味著可用于回答用戶問題的數據總量提升了。

例如用戶問：北京XX書店有休息區嗎？這樣非常具體的問題以前需要依賴其他熱心網友給與回復，但未來如果搜索引擎找到了一張北京XX書店的照片，照片內有休息用桌椅的話，就可以直接回答用戶這個問題。

非文字信息是指情緒、語氣、語速、停頓、重音等等（還有很多），同樣一句話使用不同語氣說出來可能意思完全不同，陰陽怪氣是個很準確的描述詞。

3）用戶界面個性化

面對不同的問題，用戶界面的顯示形式可以完全不同，例如問題【小米14和華為mate60對比】就可以使用表格的形式來列舉寫明每一項參數的對比，而不適合用大段文字來描述。

網上很多文章中都有提到在回答不同問題時可以使用不同的agnet來回答促進答案質量，但答案生成后在UI設計角度如何呈現給用戶同樣重要，也是使用不同的agnet來回答促進答案質量的最終面對用戶形式。

4）廣告體驗

廣告與用戶匹配越精準，廣告的負面屬性就會越低，未來當能收集到用戶的信息維度變得更多，能保留的長期記憶（上下文）更多，傳感器能接收到的超模態信息更多之后，廣告的精準度一定會有大幅提升。即使是短期內來看，通過統一廣告與自有用戶界面的視覺樣式，也可以獲得更好的廣告體驗。

3. 長期

1）從多模態到超模態

模態一詞原指人類可以接收信息的通道，人的主要信息通道就是人的五感，過去的智能設備基本依賴視覺輸出和觸覺輸入，后來逐漸增加了聲音模態的輸入和輸出，但距離多模態融合的人機交互還有不短的距離，以一個非常簡單的計算器APP為例，當融入多模態能力后，完全可以做到眼睛看著一堆賬單，聲音同時讀出賬單上的數字和計算方式，這樣就不必來回轉動頭部在賬單和計算器之間切換，同時還可以利用計算器帶有的揚聲器來檢驗輸入是否有誤。

多模態融合的交互方式就像是從一個人變成了一個團隊，團隊中有擅長方向的成員，視覺可接收信息速度最快，聽覺則可以在360度的方向上接收信息，觸覺能帶給人安全感知，嗅覺和味覺可以接收更多維度的信息。團隊中多個成員協同工作后就能面對更加復雜的工作任務。

多模態交互無疑是人機交互過程的進步，但更令人興奮的是超模態，這個概念是我自己起的名字。人的主要信息通道（模態）只有5種，但對于智能設備來說則不然，對智能設備來說，有多少種傳感器就有多少個信息通道（模態）。手機利用光強度傳感器接收到環境亮度信息后可以做到自動調節屏幕亮度。手機OS融合了用戶行為數據和時間、地點等信息后可以形成智能建議，變人找服務為服務找人。

AI搜索產品中有個非常重要的能力是意圖識別，只有對用戶意圖識別的足夠強才能在下一步意圖與工具/內容的匹配時更加準確，而眾多傳感器傳遞聚合后的各種信息就是意圖識別判斷過程中的推理基礎。根據湖北日報的新聞，全球傳感器種類有2.6萬余種，雖然這些并不都能夠運用到產品設計領域，但相對于人類的5種已經不是一個數量級了，所以未來當智能設備集成更多種傳感器（或從其他地方收到多種傳感器感知到的信息）后，非常有可能實現從人找服務變成服務找人，即使是短期來看，也是對搜索結果準確性的重要增強，這意味著AI搜索產品最核心體驗的提升。

模態一詞原指人能接收信息的通道，人類常用的信息通道就是常說的五感，目前在與設備交互時又以視聽觸三感居多，但對智能設備而言，接收信息的通道可能比人類不是一個數量級的，設備集成了多少傳感器就可以有多少種信息通道，也可以做出基于這些超越人類模態信息的數據的能力，例如手機基于光強度傳感器可以做到自動調節屏幕亮度，基于GPS可以快速確定位置，都可以利用這些信息做到更智能的交互體驗。

目前，僅基于用戶行為數據和人的五種信息通道，已經可以做到非常智能的推薦策略，傳感器的種類按照湖北日報的報道，全球共有26000多種，這與人類能夠接收到的信息種類完全不在一個數量級（當然信息種類不會有這么多，有很多同類信息不同用途的傳感器），但總體來說依然比人類五感的模態種類不在一個數量級。

所以作者認為，未來基于更多來源、更大數量的信息，AI搜索產品及全部需要意圖識別能力的產品體驗都會得到很大提升，甚至從意圖識別進化到意圖預測，變人找服務為服務找人（現在也有這個說法但實用性較差）。

2）定制化功能

有贊的白鴉總曾在一次直播中說他們的產品功能繁雜，做SAAS產品必然有很多定制化需求，所以當客戶變多之后整個產品易用性會下降。

各種功能眼花繚亂導致用戶真正需要的功能難以發現，其實當產品有1000個功能，一萬家客戶，可能每家客戶需要的只有300個功能，因此未來使用大模型能力如果能做到功能的個性化那么對產品整體的體驗會有很大提升。

3、用戶記憶融合。為了更精準的識別用戶意圖，除了用戶在產品中的行為數據外，融合用戶本身的數據進行預測也是非常重要的一環，未來在不同產品中都必然用到用戶本身數據來提供更好的服務，但不同產品用戶數據是割裂的，所以掌握了用戶數據的產品更容易達成優秀體驗，或者也可能出現特定產品服務用戶儲存個人數據（長期記憶備份）。