萬(wàn)字長(zhǎng)文詳解:大模型時(shí)代AI價(jià)值對(duì)齊的問(wèn)題、對(duì)策和展望
人工智能的價(jià)值對(duì)齊(AI Alignment),就是讓人工智能系統(tǒng)的行為符合人類的目標(biāo)、偏好或倫理原則。 價(jià)值對(duì)齊是AI安全研究的一個(gè)核心議題。 在理論上,如果一個(gè)強(qiáng)大的AI系統(tǒng)所追求的目標(biāo)和人類的真實(shí)意圖、價(jià)值不一致,就有可能帶來(lái)災(zāi)難性后果。