亚洲欧美成人自偷自拍,欧美亚洲国产片在线播放,亚洲精品无码久久千人斩探花

搜索

APP

起點課堂會員權益

職業體系課特權

線下行業大會特權

個人IP打造特權

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導直播

12場專業技能直播

會員專屬社群

榮耀標識

發布

注冊 | 登錄

清華學霸引爆“長文本”大戰，大模型的應用前景清晰了嗎？

智能相對論

2024-04-03

0 評論 671 瀏覽 2 收藏

13 分鐘

生成式AI過去一年群雄逐鹿，大家都在卷參數卷表達，但Kimi的入局，讓大家好像突然找到了方向——原來“長文本”才是大家需要的。于是各個大模型都開始卷入長文本大戰，但方向對了嗎？且看作者的分析。

Long-LLM（長文本大模型）時代似乎來得有些突然，而引爆這場熱潮的，竟是一家由清華學霸牽頭的本土AI初創企業。

前不久，月之暗面（Moonshot AI）公司宣布旗下對話式 AI 助理產品 Kimi 應用現已支持200萬字無損上下文輸入。

對比去年10月份Kimi上線時僅支持的20萬字，這一波升級直接提升了10倍文本處理能力，同時也引起了強烈的市場反應，特別是在資本市場，Kimi概念股應運而生，諸如九安醫療、華策影視、中廣天擇等都受益于Kimi概念而實現了股價不同程度的漲幅。

這些刺激更讓大模型領域徹底卷起了長文本大戰。

01 “長文本”大戰，卷的不是字數而是財力

阿里率先完成自家的大模型產品升級，強化長文本處理能力，免費面向大眾開放最高1000萬字的長文本處理能力。

360則緊隨其后，宣布旗下360智腦正式內測500萬字的長文本功能，并在360AI瀏覽器開放給用戶使用。

而百度也宣布在下個月進行版本升級，開放長文本能力，文字范圍會在200萬-500萬字。

目前，文心一言的文本上限大致為2.8萬字。而像GPT-4Turbo-128k公布的文本范圍也不過為10萬漢字，Claude3200k上下文約16萬漢字。

可以說，這一波熱潮直接把國內的大模型廠商一下子都拉進了百萬量級的長文本競賽，而主流廠商的入局也為這場“長文本”大戰增添了很多看頭。

目前來看，“長文本”大戰的賽點主要呈現在兩個方面。

一方面，是大模型的支持文本參數。類似阿里通義千問的1000萬字、360智腦的500萬字、百度文心一言的200萬-500萬字、Kimi的200萬字等等，都在極力向市場爭“彩頭”，告訴用戶自家的長文本處理能力足夠“長”。

另一方面，是長文本處理能力的開放程度。有意思的是，Kimi是免費開放給用戶使用的，阿里通義千問的長文本處理功能也是免費的，360智腦、百度文心一言也沒有要收費的意思?！浴伴L文本”大戰為例，今年的大模型競爭遠比去年要“卷”得多。

還記得去年大火的妙鴨相機，以及各式各樣的圖片生成式服務，都或多或少地通過各種形式如充值、辦會員等，要求用戶付費才能體驗。

今年大模型領域的這把“火”燒得旺，也燒的離奇地“free”。

為什么？

Kimi自升級以來，就有大量用戶不斷涌入，激增的流量更是一度讓月之暗面（Moonshot AI）的服務器承受了巨大的壓力，一度陷入宕機，旗下的App和小程序都無法正常使用。

根據月之暗面（Moonshot AI）發布的官方消息，從3.20觀測到流量異常增高后，已經進行了5次擴容工作。推理資源會持續配合流量進行擴容，以盡量承載持續增長的用戶量。

簡單來說，用戶對長文本功能是非常有興趣的，相關的市場需求還在保持持續性的、爆炸性的增長。同時，大量的用戶涌進，不僅提高了大模型產品的知名度，更重要的是在大量用戶的基礎上通過類似于UGC的模式去探索大模型的應用，或許更能進一步推動Long-LLM（長文本大模型）的商業化進程。

當然，在這個過程中，不可避免地就得投入大量資金，一旦商業化加速，大模型廠商就得做好“卷”財力的準備。

阿里通義千問目前免費對所有人開放高達萬頁的文檔處理能力，如果要計算成本，按照目前最便宜的市價0.1元/頁，10000頁的文檔光解析費用就要1000元，這還不包括解析完成之后大模型處理文檔的成本?？紤]到通義千問網頁、APP、釘釘等多個端口的用戶基數，需要投入的資金恐怕不會是個小數目。

大模型的商業化在開始階段并非“賺錢”，而是“燒錢”。

02 長文本，直接“接駁”商業化場景

在大模型的商業化進程上，長文本的爆火是很關鍵的一環。

就大模型的技術原理而言，解決長文本問題是必要的。因為文本長度的提高，對應的模型能解決問題的邊界也將大幅提升，兩者呈現出明顯的正向關系。

傳統的文本處理模型受限于訓練結構，可支持的文本范圍都不算長，在處理復雜任務和深度專業知識（這一類知識往往都是長篇巨著）時，只能拆解輸入訓練，由此就有可能導致輸出的結果上下文邏輯不連貫不順暢等問題。

區別于傳統的文本處理模型，長文本模型就具備更準確的文本理解和生成能力以及更強大的跨領域遷移能力。這對于打造垂直領域的行業專家是一個非常必要的能力支持，比如面向一些長篇巨制的醫療文獻、法律文件、財務報告等，長文本模型就具備更好的理解能力，對應完成跨領域學習和應用，從而打造出更專業的醫療助理、法律助理以及金融助理等應用。

話不多說，實踐一下。

在這里，「智能相對論」向阿里通義千問相繼“投喂”了幾本長達數百頁的專業書籍，涵蓋以《高產母豬飼養技術有問必答》為代表的農業養殖、以《犬貓營養需要》為代表的寵物喂養等等小眾領域。

結果所能實現的效果確實令人驚訝，阿里通義千問不僅能高度概括總結這些長篇巨著的主要內容，還能有針對性的給出具體篇章的知識解答。比如，在《高產母豬飼養技術有問必答》一書中，「智能相對論」向其提問“夏季高溫提問應該如何飼養母豬？”很快就得到了書中的精煉解答。