黄色网址高清无码在线观看,婷婷五月综合人人网,狠狠综合久久综合88亚洲

搜索

APP

起點(diǎn)課堂會(huì)員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會(huì)特權(quán)

個(gè)人IP打造特權(quán)

30+門專項(xiàng)技能課

1300+專題課程

12場(chǎng)職場(chǎng)軟技能直播

12場(chǎng)求職輔導(dǎo)直播

12場(chǎng)專業(yè)技能直播

會(huì)員專屬社群

榮耀標(biāo)識(shí)

發(fā)布

注冊(cè) | 登錄

ChatGPT更像人了

字母榜

2024-05-14

0 評(píng)論 1724 瀏覽 2 收藏

14 分鐘

最近，OpenAI舉行了春季發(fā)布會(huì)，而這次發(fā)布會(huì)的主角無(wú)疑是GPT-4o，這個(gè)可以更靈活地與人進(jìn)行互動(dòng)的多模態(tài)大模型。怎么理解GPT-4o的進(jìn)步，與背后的AI助手競(jìng)爭(zhēng)？一起來(lái)看看本文的解讀。

ChatGPT又雙叒叕更新了，這一次，OpenAI沒(méi)有大談數(shù)字和術(shù)語(yǔ)，而是回歸到了“聊天機(jī)器人”本身。

北京時(shí)間5月14日凌晨1點(diǎn)，OpenAI舉行春季發(fā)布會(huì)，公司首席技術(shù)官米拉·穆拉蒂（Mira Murati）主持，現(xiàn)場(chǎng)展示了ChatGPT的更新。

發(fā)布會(huì)的核心，是最新多模態(tài)大模型GPT-4o。和之前發(fā)布新模型必強(qiáng)調(diào)訓(xùn)練數(shù)據(jù)量、各項(xiàng)測(cè)試成績(jī)等“硬核指標(biāo)”不同，GPT-4o的升級(jí)主要在使用體驗(yàn)上。

相較上一代GPT-Turbo，GPT-4o可謂是打通了任督二脈，各項(xiàng)技能融會(huì)貫通，和人的互動(dòng)更靈活、更快速——換言之，更像“人”了。

用戶可以以文本、音頻、圖像任意組合輸入，得到ChatGPT實(shí)時(shí)文本、音頻、圖像的任意組合輸出。在交流過(guò)程中，ChatGPT不再等待若干秒才響應(yīng)，而是實(shí)時(shí)回復(fù)，還能被隨時(shí)打斷。OpenAI的CEO山姆·奧特曼（Sam Altman）將之稱為“人類級(jí)別的響應(yīng)”。

OpenAI現(xiàn)場(chǎng)展示了和ChatGPT的若干互動(dòng)，包括：實(shí)時(shí)對(duì)話交互、語(yǔ)音多樣化（應(yīng)用戶需求使用不同情緒、語(yǔ)調(diào)等）、視頻指導(dǎo)做題、視頻識(shí)別環(huán)境和人（包括人的情緒）、以桌面應(yīng)用形式輔助編程、實(shí)時(shí)翻譯。

OpenAI同時(shí)還放出了預(yù)先錄制的展示樣例若干，包括：兩個(gè)GPT-4o交流和對(duì)唱、唱搖籃曲、在線會(huì)議應(yīng)用、毒舌諷刺、視頻識(shí)物并給出西班牙語(yǔ)單詞、幫助面試準(zhǔn)備、和狗互動(dòng)等。

OpenAI本次現(xiàn)場(chǎng)演示選擇的聲音是“Sky”，聽(tīng)起來(lái)酷似好萊塢明星（寡姐）斯嘉麗·約翰遜。讓人很容易聯(lián)想到科幻電影《她（Her）》，其中AI助手正是由斯嘉麗配音。電影中男主角從使用AI助手，一步步走向一段無(wú)果的人機(jī)戀情。

奧特曼自己也在X上發(fā)了這部電影的名字：her。還有人干脆把電影海報(bào)里的臉換成了奧特曼的。

ChatGPT更像人了

當(dāng)GPT-4o驅(qū)動(dòng)的ChatGPT用飽含情緒的聲音和人聊天，還能看、能聽(tīng)、能說(shuō)會(huì)唱，你就知道，科幻已經(jīng)照進(jìn)現(xiàn)實(shí)了。

更關(guān)鍵的是，穆拉蒂現(xiàn)場(chǎng)宣布，GPT-4o免費(fèi)向所有人開放。也就是說(shuō)，隨著后續(xù)更新，免費(fèi)用戶也可以直接使用GPT-4o，只不過(guò)每日限制條數(shù)比付費(fèi)用戶少，達(dá)到限制后會(huì)自動(dòng)切換回GPT-3.5。

以及，ChatGPT的桌面應(yīng)用將上線蘋果電腦系統(tǒng)Mac OS，Windows版本將在今年晚些時(shí)候推出。

01

如果用四個(gè)字總結(jié)GPT-4o的特點(diǎn)，就是：更通人性。

而這體現(xiàn)在兩方面，一方面是GPT-4o多模態(tài)融會(huì)貫通，反應(yīng)速度也大大提高，交互方式更接近于人；另一方面，是GPT-4o驅(qū)動(dòng)下的機(jī)器人明顯更活潑，更樂(lè)于表現(xiàn)出人類情緒。

先說(shuō)GPT-4o的多模態(tài)能力，準(zhǔn)確來(lái)說(shuō)，GPT-4o最亮眼的是跨模態(tài)的能力。

一年多以前，2023年3月，OpenAI發(fā)布了多模態(tài)模型GPT-4。從那時(shí)起，人們就可以給GPT-4發(fā)圖片讓它幫忙分析，也可以發(fā)文件、語(yǔ)音聊天。但是文本、圖像、語(yǔ)音之間是有“壁”的。

比如你想讓ChatGPT幫忙解一道數(shù)學(xué)題，就只能截圖或者復(fù)制題目，發(fā)給ChatGPT。如果想聽(tīng)ChatGPT語(yǔ)音講解，得先在文本框發(fā)完之后，再切到語(yǔ)音。

但在GPT-4o下，你可以直接使用桌面應(yīng)用，將ChatGPT打開放在一邊，和它聊著天的同時(shí)，用“拍攝”功能給它看你電腦桌面的內(nèi)容，它就可以在對(duì)話中為你答疑解惑。

在一則演示中，用戶將ChatGPT桌面應(yīng)用和做題界面同時(shí)打開。ChatGPT不直接給出答案，而是以問(wèn)題引導(dǎo)的方式，有問(wèn)有答地一步步帶用戶解了一道幾何題。

或者，你也可以打開攝像頭，ChatGPT也可以“看”著紙面指導(dǎo)解題。

在所有的演示當(dāng)中，最讓人直呼“恐怖”的還是視頻對(duì)話：用戶打開攝像頭，讓ChatGPT“看”到當(dāng)下，并進(jìn)行互動(dòng)。

用前置鏡頭自拍，ChatGPT不僅能識(shí)別用戶的情緒，如“看起來(lái)很開心，甚至可以說(shuō)是興奮的”，還能從用戶背后的畫面判斷其身處的環(huán)境，如“看起來(lái)你在一個(gè)攝影棚中，背后有一些燈光，你的胸前還別著麥克風(fēng)，可能在錄制視頻之類的”。當(dāng)有另一個(gè)人進(jìn)入鏡頭并且做鬼臉的時(shí)候，ChatGPT也準(zhǔn)確指出了這一“不太尋?！钡那闆r，并加以描述。

用后置鏡頭，ChatGPT就可以和用戶共享視角。如在語(yǔ)言學(xué)習(xí)的過(guò)程中，打開攝像頭讓ChatGPT用某種語(yǔ)言說(shuō)出物品的名稱?；蛘呖梢詾橐曊嫌脩籼峁┲敢?，告訴用戶“有一輛計(jì)程車來(lái)了，就是現(xiàn)在，招手吧”。

ChatGPT更像人了

再加上用戶話音剛落ChatGPT就接話，以及用戶可以直接打斷ChatGPT，它也都能接著聊，這就使得整體體驗(yàn)更像人與人的對(duì)話，快速且靈活。

順帶一提，由于GPT-4o的響應(yīng)速度快、可打斷，其實(shí)時(shí)翻譯效果非常驚艷。兩個(gè)語(yǔ)言不通的人將GPT-4o驅(qū)動(dòng)的ChatGPT放在中間充當(dāng)翻譯，就可以聊天了。

總而言之，GPT-4o驅(qū)動(dòng)下的ChatGPT，不再僅僅是一個(gè)什么都會(huì)的應(yīng)用，而是真正進(jìn)化成了一個(gè)“AI助手”。

02

再說(shuō)情緒，這一點(diǎn)不容小覷。

從2022年11月ChatGPT上線開始，這款聊天機(jī)器人在很長(zhǎng)一段時(shí)間里都給人一種不茍言笑的印象。這很有可能是OpenAI為了避免麻煩而有意為之的，ChatGPT不僅回答起問(wèn)題一板一眼，而且只要有機(jī)會(huì)就會(huì)向用戶強(qiáng)調(diào)“我只是個(gè)機(jī)器人，我沒(méi)的感情”。用戶如果想要ChatGPT更“放松”，需要給出明確的指令。

但GPT-4o驅(qū)動(dòng)下的ChatGPT明顯不同了。在沒(méi)有預(yù)先指令的情況下，ChatGPT不再刻意避免像人類，而是相反。

比如，當(dāng)用戶求助ChatGPT，說(shuō)自己馬上要參加OpenAI的面試，ChatGPT接過(guò)話開玩笑地說(shuō)：“OpenAI，嗯？怎么聽(tīng)起來(lái)這么耳熟嘞？”緊接著竊笑，轉(zhuǎn)而笑著亢奮地接著說(shuō)：“開玩笑的！太棒了洛基（演示人員的名字）！什么樣的面試？”

當(dāng)洛基尋求外形上的建議時(shí)，ChatGPT用幽默的方式表示頭發(fā)需要整理，說(shuō)他“看起來(lái)有寫了一整夜代碼的氛圍”。洛基戴上了一頂遮陽(yáng)帽，ChatGPT立刻“哈哈哈”地大笑，說(shuō)他“肯定會(huì)很顯眼”，但在面試中不合適，像朋友一樣勸他放棄這樣做。

也就是說(shuō)，GPT-4o驅(qū)動(dòng)下的ChatGPT，不再是一個(gè)只追求性能的AI工具，而是開始主動(dòng)提供“情緒價(jià)值”。

在ChatGPT走嚴(yán)肅路線的兩年里，不少競(jìng)品都以更活潑、更“通人性”的姿態(tài)出現(xiàn)，并俘獲了不少用戶的心。

如Inflection.AI曾推出的機(jī)器人Pi，主打的就是“陪伴”，總是語(yǔ)氣溫柔，對(duì)用戶充滿關(guān)懷，不到一年的時(shí)間里就做到百萬(wàn)日活用戶，平均對(duì)話持續(xù)時(shí)間超過(guò)半小時(shí)。

埃隆·馬斯克（Elon Musk）的人工智能公司xAI的大模型Grok，則因其毒舌一經(jīng)上線就吸引不少關(guān)注。

就連上一波AI聊天機(jī)器人熱潮也深諳此道。2011年蘋果將Siri集成到iPhone4S中，AI聊天機(jī)器人成賽博玩具，人們熱衷于“調(diào)戲Siri”，讓它唱歌、講笑話。Siri雖不算神通廣大，但提供了足夠多的樂(lè)趣。中國(guó)用戶熟悉的天貓精靈、小愛(ài)同學(xué)等，也無(wú)不有一個(gè)俏皮的“人設(shè)”。

但后來(lái)的故事我們都知道了，上一代AI助手因其技術(shù)限制，能做的實(shí)在有限，“俏皮”來(lái)自有限的預(yù)先設(shè)置，還因?yàn)槔斫饽芰Σ患?、不夠靈活，漸漸被用戶釘上“人工智障”的恥辱柱。

在2024年，人們?cè)?jīng)對(duì)Siri們抱有的期待——一個(gè)既能當(dāng)?shù)昧χ謳兔ψ鍪拢帜墚?dāng)賽博玩具聊天嬉笑的AI——終于在GPT-4o身上有了著落。

03

去年5月，比爾·蓋茨（Bill Gates）曾在AI Forward 2023活動(dòng)上談及AI，對(duì)AI的前景很看好：“你永遠(yuǎn)不會(huì)去搜索網(wǎng)站了，也不會(huì)再去亞馬遜了。”

而能干掉搜索和電商的，在蓋茨眼中不是別的，正是未來(lái)頂級(jí)的AI助理：“無(wú)論誰(shuí)贏得了AI助理的競(jìng)賽，這都是一件大事?！?/p>

面向C端用戶，AI助理的戰(zhàn)事已經(jīng)打響。

微軟已經(jīng)將Copilot帶進(jìn)Windows11，依托以側(cè)邊欄工具的形式輔助用戶；谷歌在內(nèi)部整合了谷歌大腦和DeepMind之后發(fā)布拳頭模型Gemini，未來(lái)有望更加深入地嵌入各個(gè)產(chǎn)品和應(yīng)用，如Android安卓、谷歌搜索和Workspace；亞馬遜則在去年9月發(fā)布新款A(yù)lexa，接入大模型。

蘋果也有明顯的戰(zhàn)略傾斜，加快AI步伐。6月，蘋果將舉行全球開發(fā)者大會(huì)（WWDC24），iOS18是否會(huì)以人工智能做軟件更新是外界關(guān)注的焦點(diǎn)。外界普遍認(rèn)為，蘋果會(huì)對(duì)Siri進(jìn)行大模型重塑。

今年3月之后，接連有幾個(gè)消息傳出。先是彭博社援引知情人士透露，蘋果正在就將谷歌Gemini大模型內(nèi)置于iPhone進(jìn)行談判，同期也在與OpenAI進(jìn)行類似談判。而后是蘋果CEO蒂姆·庫(kù)克（Tim Cook）訪華之后，《科創(chuàng)板日?qǐng)?bào)》報(bào)道蘋果將與百度進(jìn)行技術(shù)合作，在今年即將發(fā)布的iPhone16、Mac系統(tǒng)和iOS 18提供AIGC功能。

用GPT-4o，OpenAI再次給世界億點(diǎn)點(diǎn)震撼，接下來(lái)的AI助手競(jìng)爭(zhēng)只會(huì)更加精彩。

“新的語(yǔ)音（和視頻）模式是我使用過(guò)最好的計(jì)算機(jī)界面。這感覺(jué)就像電腦里的人工智能，它的真實(shí)性還是讓我有點(diǎn)吃驚。達(dá)到人類水平的反應(yīng)時(shí)間和表達(dá)能力是一個(gè)很大的變化?！痹陔SGPT-4o發(fā)表的一篇博文中，奧特曼寫道。

撰文：畢安娣，編輯：王靖

來(lái)源公眾號(hào)：字母榜（ID：wujicaijing），讓未來(lái)不止于大。

本文由人人都是產(chǎn)品經(jīng)理合作媒體@字母榜授權(quán)發(fā)布，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash，基于CC0 協(xié)議

該文觀點(diǎn)僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容，請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App