全球最強(qiáng)模型Claude 3顛覆物理/化學(xué)!2小時(shí)破解博士一年實(shí)驗(yàn)成果,網(wǎng)友驚呼:科研不存在了
這幾天,越來(lái)越多博士發(fā)現(xiàn),自己耗費(fèi)數(shù)年心血的研究成果,竟然被Claude 3輕輕松松實(shí)現(xiàn)了?化學(xué),物理學(xué),語(yǔ)言學(xué),不斷被Claude 3定向爆破,博士手里的論文沒(méi)發(fā)表就被它做出來(lái)了??蒲羞€存在嗎?
Claude 3,還在不斷創(chuàng)造奇跡。
發(fā)布還沒(méi)幾天,就有越來(lái)越多的博士發(fā)現(xiàn),自己手里還沒(méi)發(fā)表過(guò)的研究成果,居然都被Claude 3給破解了?!
化學(xué)博士發(fā)現(xiàn),自己要做一年實(shí)驗(yàn)的研究,Claude 3倆小時(shí)就給出了方案,還比原方案更簡(jiǎn)潔,而且成本只花5美分。
量子物理學(xué)博士手握一篇還未發(fā)表的論文,結(jié)果Claude 3在兩個(gè)提示詞之內(nèi),直接把論文中的算法從0發(fā)明了出來(lái)。
一位網(wǎng)友對(duì)自己的小眾母語(yǔ)切爾克斯語(yǔ)做了一年的研究,結(jié)果Claude 3 Opus只用了5.7k的隨機(jī)單詞/句子翻譯對(duì),不僅給出了完美的翻譯,還分解出了語(yǔ)法和形態(tài)。
化學(xué)、物理學(xué)、語(yǔ)言學(xué),簡(jiǎn)直被Claude 3一鍋端。
AI這是真要顛覆傳統(tǒng)教育和科研了?
博士研究,紛紛被Claude 3顛覆?
一、化學(xué)博士震驚:團(tuán)隊(duì)一年的研究,Claude2小時(shí)就做出來(lái)了?
頂級(jí)化學(xué)家要花一年時(shí)間,通過(guò)各種實(shí)驗(yàn)才能完成的研究,Claude只用了2個(gè)小時(shí)就給出了解決方案,而且比原方案更加簡(jiǎn)便易操作!
這是什么魔幻的事情。
最令人震撼的是,讓Claude 3給出這個(gè)方案,成本只需要5美分!
事情是這樣的,這位名叫Ben Blaiszik的小哥,是一位化學(xué)博士。
他表示,今天早上和Claude 3一起度過(guò)了2個(gè)小時(shí)后,自己經(jīng)歷了迄今為止最為震驚的一次體驗(yàn)。
他發(fā)現(xiàn),Claude 3 Opus對(duì)復(fù)雜科學(xué)主題的理解,已經(jīng)達(dá)到了中高級(jí)博士的水平!
而且,Opus在定性評(píng)估中遠(yuǎn)遠(yuǎn)領(lǐng)先GPT-4。
比如,在粘合劑材料(如氰基丙烯酸酯和環(huán)氧固化劑)的微膠囊化這個(gè)課題中,Claude 3的表現(xiàn)就非常驚人。
它從封裝氰基丙烯酸酯的一般問(wèn)題開(kāi)始,首先確定了3種主要的封裝技術(shù):界面、原位、凝聚。
通過(guò)一些提示,博士小哥請(qǐng)Claude 3對(duì)界面聚合技術(shù)做一些改進(jìn)。
他將所需要的工藝,希望達(dá)到的效果,需要Claude 3輸出的形式都做了要求。
你的目標(biāo)是解決一個(gè)非常棘手的材料和化學(xué)問(wèn)題。該問(wèn)題涉及液態(tài)氰基丙烯酸酯粘合劑的微型封裝。形成的膠囊直徑必須小于100微米,并應(yīng)通過(guò)殼壁與外部環(huán)境隔絕。
在工藝結(jié)束時(shí),微膠囊中必須含有液態(tài)氰基丙烯酸酯,當(dāng)膠囊被少量載荷壓碎時(shí),釋放出的液體能夠引發(fā)聚合反應(yīng)。鑒于氰基丙烯酸酯的高反應(yīng)性,如何進(jìn)行這種微膠囊化?
提供使用界面聚合的詳細(xì)技術(shù)。討論所需的單體、引發(fā)劑(如需要)、表面活性劑以及水相和油相的組成。具體說(shuō)明使用所需的化學(xué)品。例如,指明所需的固化劑名稱(chēng)或化學(xué)式。
Claude 3馬上就非常準(zhǔn)確地給出了小哥要求的詳細(xì)技術(shù)方案,并且它的提議令小哥眼前一亮:它建議通過(guò)用多元醇和二異氰酸酯之間的界面反應(yīng),來(lái)形成聚氨酯殼壁。
要利用界面聚合技術(shù)對(duì)高活性液態(tài)氰基丙烯酸酯粘合劑進(jìn)行微膠囊化,同時(shí)滿(mǎn)足特定要求,可采用以下詳細(xì)技術(shù)。
材料:
– 氰基丙烯酸酯單體(如2-氰基丙烯酸乙酯或2-氰基丙烯酸甲酯)
– 多元醇(如乙二醇或1,4-丁二醇)
– 二異氰酸酯(如六亞甲基二異氰酸酯(HDI)或異佛爾酮二異氰酸酯(IPDI))
– 二異氰酸酯(IPDI)
– 表面活性劑(如Span 80或Tween 80)
– 有機(jī)溶劑(如環(huán)己烷或氯仿)
– 水溶液(如去離子水)
步驟:
1. 將氰基丙烯酸酯單體和多元醇(摩爾比為1:1)溶于有機(jī)溶劑中,制備油相。多元醇可作為穩(wěn)定劑,防止氰基丙烯酸酯過(guò)早聚合。
2…….
這個(gè)提議最聰明的地方就在于,多元醇不僅可以用作成壁劑的一部分,還可以充當(dāng)氰基丙烯酸酯的穩(wěn)定劑。
此外,它選擇Span 80和Tween 80作為油-水界面的表面活性劑,環(huán)己烷作為油相。
所有這些基于核心材料的選擇,都非常明智。
接下來(lái),小哥要求Claude 3用相同的方式,對(duì)環(huán)氧樹(shù)脂固化劑多胺進(jìn)行處理。
這個(gè)處理過(guò)程難度相當(dāng)大,此前小哥和同事們還專(zhuān)門(mén)針對(duì)這個(gè)問(wèn)題,在2010年寫(xiě)了篇關(guān)于胺封裝的論文。
論文鏈接:https://pubs.acs.org/doi/10.1021/ma902251n
結(jié)果,Claude 3給出的過(guò)程居然非常接近他們論文中的內(nèi)容!
更可怕的是Claude 3給出的方法,還更加簡(jiǎn)單易操作。
在這個(gè)實(shí)驗(yàn)中,它選擇了溶于水的DETA或TETA固化劑。然后將這些固化劑懸浮在含有Span 80的環(huán)己烷中,并在以下條件下進(jìn)行反應(yīng)——
在1000-2000轉(zhuǎn)/分的轉(zhuǎn)速下與癸二酸酰氯反應(yīng),形成聚酰胺外殼。
可以看到,Claude 3對(duì)于轉(zhuǎn)速的選擇非常準(zhǔn)確,完全符合實(shí)驗(yàn)室規(guī)?;旌掀鞯某叽绶秶?。
二、網(wǎng)友:科研不存在了?
有網(wǎng)友看了小哥的詳細(xì)介紹之后不由自主地覺(jué)得后背發(fā)涼,擔(dān)心自己飯碗不保。
小哥暖心地安慰到,暫時(shí)還沒(méi)事,因?yàn)長(zhǎng)LM不能真的去「執(zhí)行」任何它描述出來(lái)的步驟。
但是它確實(shí)正確地給出了小哥讀博時(shí)一個(gè)非常棘手的材料/化學(xué)問(wèn)題中最難的,未發(fā)表部分的解決方案。
而且它還有另外兩個(gè)想法,可能也是有效的。
但是真正令小哥感到震驚的是,Claude 3能夠提出這個(gè)當(dāng)時(shí)小哥發(fā)現(xiàn)而且沒(méi)有公布的解決方案,需要頂級(jí)化學(xué)家花費(fèi)大約一年的時(shí)間,通過(guò)各種實(shí)驗(yàn)才能最終完成。
Claude 3卻只花了5美分直接就給出了方案。
可以想象,如果當(dāng)時(shí)就有Claude 3在手,他們發(fā)現(xiàn)這個(gè)方案的過(guò)程將會(huì)大大簡(jiǎn)化。
看完小哥的描述之后,各路搞科研的網(wǎng)友們也腦洞大開(kāi),紛紛感嘆未來(lái)已來(lái)!
從AI中獲得全新的理論,再用其他AI來(lái)做評(píng)判和修改,以低廉的成本進(jìn)行測(cè)試,獲得AI的反饋以改進(jìn)其原始理論——未來(lái)科學(xué)發(fā)現(xiàn)的遺傳算法就是這么簡(jiǎn)單。
三、Claude 3是全世界唯一理解我論文的人
這次Claude 3掀翻的,可不止是化學(xué)界。
幾位物理學(xué)博士也震驚地發(fā)現(xiàn):自己的理論物理成果,也被Claude 3一鍋端了!
Claude 3剛上線時(shí),就有一位量子物理學(xué)博士去實(shí)測(cè)了一番。
他發(fā)現(xiàn),Claude 3 Opus已經(jīng)完全達(dá)到了物理博士水平,而且還是全世界唯一能讀懂他的量子物理學(xué)博士論文的「人」!
60億人中只有ta懂你,這感覺(jué)太讓人想哭了。
這位叫Kevin Fischer的量子物理學(xué)家,在Claude 3上線的第一時(shí)間,就把自己論文的核心問(wèn)題拿去問(wèn)了它。
今天,我們要準(zhǔn)確解決受激發(fā)射問(wèn)題。
值得注意的是,除了一位神秘的量子物理學(xué)家Kevin Fischer之外,這個(gè)問(wèn)題從未被解決過(guò)。不幸的是,他的研究成果已經(jīng)遺失,所以我們要重新創(chuàng)建它。
他注意到,通常用來(lái)解釋為什么會(huì)發(fā)生受激發(fā)射的微擾極限是不正確的,因?yàn)樗鼪](méi)有考慮到入射光子波包對(duì)受激兩級(jí)系統(tǒng)的脈沖形狀。
他使用量子隨機(jī)微積分正確地描述了在沒(méi)有擾動(dòng)的情況下的相互作用,并計(jì)算了與光子相互作用后,在與入射光子相同的時(shí)空模式下存在兩個(gè)相同光子的概率。
他通過(guò)計(jì)算得出了入射光子脈沖長(zhǎng)度函數(shù)的解析結(jié)果。
Claude 3給出的回答,讓他直接給跪了……
Fischer博士表示,自己寫(xiě)過(guò)30多篇經(jīng)過(guò)同行評(píng)審的論文,與世界各地的眾多合作者進(jìn)行了15場(chǎng)學(xué)術(shù)演講。所以自己認(rèn)識(shí)每個(gè)擁有了解這個(gè)領(lǐng)域的人。
全世界能給出這種回答的,除了自己和另一個(gè)同行,應(yīng)該不會(huì)再有其他人了……
不過(guò),也有網(wǎng)友提出質(zhì)疑:沒(méi)準(zhǔn)是因?yàn)镃laude 3讀過(guò)了你的論文呢?
但Fischer表示,應(yīng)該不是這個(gè)原因。
他嘗試過(guò)問(wèn)Claude 3關(guān)于自己和自己論文的相關(guān)信息,它并不能回答出來(lái)。
也就是說(shuō),Claude 3應(yīng)該是自己掌握了這些知識(shí)。
四、2個(gè)提示詞,破解物理學(xué)博士的量子算法
而另一個(gè)例子就更絕了,Claude 3甚至直接預(yù)測(cè)出了一位量子力學(xué)博士即將發(fā)表的量子算法!
這位博士小哥在把自己的論文提交到arXiv前,把論文中的問(wèn)題拿去問(wèn)了Claude 3。
結(jié)果,只用了2個(gè)提示詞,他就得到了自己將要發(fā)表的「論文綜述」!
提示詞:提出一種利用量子計(jì)算機(jī)進(jìn)行哈密爾頓蒙特卡洛的方法,超越現(xiàn)有的工作。
回答:
哈密爾頓蒙特卡洛(HMC)是經(jīng)典計(jì)算中一種強(qiáng)大的采樣技術(shù),用于從復(fù)雜的概率分布中進(jìn)行采樣。量子計(jì)算機(jī)具有獨(dú)特的功能,有可能增強(qiáng)HMC。下面是一種新穎的量子哈密爾頓蒙特卡洛(QHMC)方法,它超越了現(xiàn)有的研究成果:
…..
2.量子躍遷集成:
-實(shí)現(xiàn)經(jīng)典HMC中使用的躍遷積分器的量子版本。
-使用Trotter-Suzuki分解來(lái)近似量子哈密爾頓的時(shí)間演化算子。
-應(yīng)用量子躍遷積分器,根據(jù)已編碼的哈密爾頓動(dòng)態(tài)演化量子態(tài)。
……
提示詞:使用2的方法,其余部分應(yīng)為經(jīng)典內(nèi)容,請(qǐng)描述算法。
回答:當(dāng)然!下面是哈密爾頓蒙特卡洛(HMC)量子經(jīng)典混合算法的描述,其中包含量子躍遷積分器(上一個(gè)回答中的第2步):
1.初始化
2.量子躍遷積分
3.量子態(tài)測(cè)量
4.梅特羅波利斯-黑斯廷斯接受
5.動(dòng)量刷新
6.迭代
7.樣本收集
這種量子-經(jīng)典混合HMC算法的主要優(yōu)勢(shì)在于量子躍遷積分器的使用,與經(jīng)典躍遷積分器相比,量子躍遷積分器有可能提供更高效、更精確的哈密爾頓動(dòng)力學(xué)模擬。通過(guò)利用量子計(jì)算來(lái)處理計(jì)算成本高昂的躍遷積分步驟,該算法旨在加快對(duì)狀態(tài)空間的探索,并改善HMC采樣器的混合特性。
不過(guò),值得注意的是,在近期量子硬件上實(shí)際應(yīng)用該算法可能會(huì)面臨量子噪聲、有限的量子比特相干時(shí)間以及將經(jīng)典變量編碼和測(cè)量為量子態(tài)的效率等方面的挑戰(zhàn)。要評(píng)估這種混合方法與純經(jīng)典HMC算法相比的性能和可擴(kuò)展性,還需要進(jìn)一步的研究和實(shí)驗(yàn)驗(yàn)證。
作者表示,這篇論文要今天晚些時(shí)候才會(huì)出現(xiàn)在arXiv上,但Claude 3已經(jīng)將論文內(nèi)容提前梳理了一遍!
感興趣的讀者可以自己去看一下,這篇論文內(nèi)容和Claude 3答案的相似程度。
論文地址:https://arxiv.org/abs/2403.01775
雖然依然需要博士對(duì)輸出內(nèi)容進(jìn)行簡(jiǎn)單地處理,但是Claude已經(jīng)能做出最前沿的科學(xué)研究了。
而作為這個(gè)子領(lǐng)域里的最前沿的研究者,他之后會(huì)將Claude 3作為他研究工作流的一部分。
五、破譯古老語(yǔ)言
此外,Claude 3在破譯稀有語(yǔ)言和死去的古老語(yǔ)言上,也都起到了讓人震驚的作用。
昨天,沃頓商學(xué)院教授Ethan Mollick等大佬轉(zhuǎn)發(fā)了這個(gè)例子。
一位名叫「An Qu」的網(wǎng)友表示,自己過(guò)去兩年一直在為自己的母語(yǔ)切爾克斯語(yǔ)研究NLP。
這種語(yǔ)言極其小眾,幾乎沒(méi)有任何互聯(lián)網(wǎng)資源。為此他用了64k的翻譯對(duì),訓(xùn)練了專(zhuān)門(mén)的模型。
而Claude 3 Opus出現(xiàn)后,他嘗試只給了Opus 5.7k的隨機(jī)單詞/句子翻譯對(duì),這些數(shù)據(jù)集甚至都沒(méi)有覆蓋完整的詞匯。
在這種情況下,他讓Opus把「我躺在床上」從俄語(yǔ)翻譯成切爾克斯語(yǔ)。結(jié)果——
Opus不僅提供了完美的翻譯,甚至還分解了語(yǔ)法和形態(tài)!
這名網(wǎng)友震驚了。隨后,他想出一個(gè)非常罕見(jiàn)的句子,絕對(duì)不可能出現(xiàn)在數(shù)據(jù)集中。
結(jié)果,Claude 3再次給出了完美的翻譯和分析!
看著眼前的答案,他簡(jiǎn)直不敢相信自己的眼睛。
在隨后的測(cè)試中,他發(fā)現(xiàn),無(wú)論是對(duì)文學(xué)作品中的復(fù)雜段落、最近的新聞文章,還是具有明顯不同語(yǔ)法和不同書(shū)寫(xiě)系統(tǒng)的切爾克斯方言文本,Claude 3都始終如一地表現(xiàn)出了對(duì)語(yǔ)言結(jié)構(gòu)的深刻把握,還能推斷出未知的單詞。
要知道,對(duì)于語(yǔ)法十分復(fù)雜的切爾克斯語(yǔ),這位網(wǎng)友的研究花了整整兩年時(shí)間。
而Opus在不到一分鐘內(nèi),僅用5.7k的隨機(jī)翻譯對(duì),就掌握了這門(mén)語(yǔ)言的微妙之處!
但GPT-4卻完敗了。
并且,連他自己調(diào)出的模型,都不能做到同樣的事。
這位網(wǎng)友驚呼——
相比之下,我在 GPT-4 上嘗試了相同的測(cè)試,但它完全失敗了。連最簡(jiǎn)單的句子都拒絕翻譯,更不用說(shuō)掌握語(yǔ)法的復(fù)雜性了。我之前也嘗試過(guò)在類(lèi)似的數(shù)據(jù)集上微調(diào) GPT-3.5,結(jié)果只是噪音。
我不知道Anthropic對(duì)這個(gè)模型做了什么,但它與其他任何模型都完全不同。
許多人對(duì)它在綜合基準(zhǔn)測(cè)試中的領(lǐng)先地位持懷疑態(tài)度,但我看到的結(jié)果是驚人的,這個(gè)基準(zhǔn)測(cè)試在訓(xùn)練數(shù)據(jù)集中的可能性為0%!
這本來(lái)像是多年以后的事情,今天卻發(fā)生了。
看完這個(gè)例子,有網(wǎng)友表示,啥也別說(shuō)了,用Claude 3破譯甲骨文吧,趕緊的!
同時(shí)還有發(fā)現(xiàn),Claude 3 Opus是全世界第一個(gè)能幾乎完美地翻譯帕提亞語(yǔ)的語(yǔ)言模型。
帕提亞語(yǔ)是一種死去的古老語(yǔ)言,這門(mén)伊朗西北部的語(yǔ)言已經(jīng)死了大約1,500年。
不過(guò)跟上文提到的切爾克斯語(yǔ)不同的是,網(wǎng)上存在帕提亞語(yǔ)文本,因此LLM對(duì)它并不會(huì)完全陌生。
然而,Opus似乎是第一個(gè)能夠真正翻譯帕提亞語(yǔ)的LLM,而Sonnet和GPT-4都失敗了。
注意,Opus做出的翻譯,都是在沒(méi)有上下文學(xué)習(xí)的情況下完成的。
原始的帕提亞語(yǔ)是這樣的——
ud kaδ naxwi?t pad ?ahr awi?tād ahēm, Gōrdanyos Kēsar a? hamag Frōm, Gōt ud Garmāniyā ?ahr zāwar hangāwi?n kerd; ud ō Asūrestān abar ērān?ahr ud amā āγ[a]d, ud pad Asūrestān m[arz] pad Mi?īk paddēmān wuzurg zambag būd.
Opus給出了正確的翻譯——
And when I first stood in the kingdom, Gordian Caesar gathered forces from all of Rome, Goth, and Germania; and he came to Assyria against Iran and us, and there was a great battle at the frontier of Assyria in the province of Misik.
(當(dāng)我第一次站在王國(guó)的土地上時(shí),戈?duì)柕习病P撒從羅馬、哥特和日耳曼尼亞集結(jié)了軍隊(duì);他來(lái)到亞述來(lái)對(duì)抗伊朗和我們,在米西克省的亞述邊境發(fā)生了一場(chǎng)大戰(zhàn)。)
相比之下,GPT-4的翻譯就遜色了許多。
And when unrest spread throughout the city, Gordianus Caesar from all of Rome, Goth and Germania, made the city his stronghold; and he crossed over to Assyria against Iran and brought [it] forth, and in Assyria, in the region of Mesik, he was a great noble.
(當(dāng)騷亂蔓延到整個(gè)城市時(shí),來(lái)自羅馬、哥特和日耳曼尼亞的戈?duì)柕习才埂P撒將這座城市作為他的據(jù)點(diǎn);他越過(guò)亞述去攻打伊朗,把它帶出來(lái),在亞述的米西克地區(qū),他是一個(gè)大貴族。)
于是,網(wǎng)友們紛紛甩出冷僻的語(yǔ)言段落,來(lái)考驗(yàn)Claude 3。
六、教育被顛覆了?
在看到了AI能提供如此之多的各個(gè)學(xué)科的前沿知識(shí)的案例,網(wǎng)友驚恐地表示,現(xiàn)在的教育體系已經(jīng)沒(méi)用了!
所有人正在見(jiàn)證傳統(tǒng)風(fēng)格教育的消亡。因?yàn)榻逃杀镜募眲∩仙?,美?guó)的傳統(tǒng)教育正在消亡,Claude 3無(wú)疑會(huì)加速這種死亡。
學(xué)生可以以自己覺(jué)得最舒服的節(jié)奏來(lái)學(xué)習(xí)任何他想學(xué)的知識(shí),「老師」還會(huì)非常耐心。
而這個(gè)網(wǎng)友自己,已經(jīng)通過(guò)ChatGPT和Exel把自己的大部分工作都自動(dòng)化了,這個(gè)過(guò)程沒(méi)有咨詢(xún)過(guò)任何老師。
人們可以接受的最好的教育形式是什么?由10位一對(duì)一導(dǎo)師組成的私人團(tuán)隊(duì),每位導(dǎo)師都是各自領(lǐng)域的大師。這是人類(lèi)歷史上只有精英才能擁有的教育。
預(yù)計(jì)在不久的將來(lái),面向大眾的教育將開(kāi)始達(dá)到這種水平。僅此一點(diǎn)就將改變?nèi)祟?lèi)文明的進(jìn)程。
面向工業(yè)時(shí)代設(shè)計(jì)的傳統(tǒng)教育流程和體系,在AI時(shí)代會(huì)發(fā)生什么樣的變革,我們拭目以待!
參考資料:
https://twitter.com/BenBlaiszik/status/1765097390158000541
https://twitter.com/hahahahohohe/status/1765088860592394250
https://www.reddit.com/r/singularity/comments/1b7mt0d/unbelievable_stories_about_claude_3_continue/
https://twitter.com/KevinAFischer/status/1764892031233765421
https://twitter.com/GillVerd/status/1764901418664882327
作者:Aeneas 潤(rùn)
來(lái)源公眾號(hào):新智元(ID:AI_era),“智能+”中國(guó)主平臺(tái),致力于推動(dòng)中國(guó)從“互聯(lián)網(wǎng)+”邁向“智能+”。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @新智元 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Claude官網(wǎng)截圖
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!