"產品評測"相關的文章
AIGC
大模型集體失智!9.11和9.9哪個大,幾乎全翻車了

大模型集體失智!9.11和9.9哪個大,幾乎全翻車了

最近,一個看似不言自明的問題——"9.11和9.9哪個大"——竟然讓眾多主流大模型紛紛"失智",給出了令人啼笑皆非的答案。從GPT-4o到谷歌Gemini,再到Claude 3.5 Sonnet,這些先進的AI模型在這個問題上的表現,不禁讓我們思考:在追求技術進步的同時,我們是否忽略了AI的"常識"教育?