最近,Meta 的首席 AI 科學(xué)家 Yann LeCun 表示,自機(jī)器智能(AMI)能夠真正幫助人們的日常生活。Meta 正在努力提升其 Llama 模型的推理能力,希望能與 GPT-4o 等頂尖模型相媲美。

Meta 的副總裁 Manohar Paluri 提到,他們正在探索讓 Llama 模型不僅能夠 “規(guī)劃”,還可以實時評估決策并在條件變化時進(jìn)行調(diào)整。這種迭代的方法結(jié)合了 “思維鏈” 的技術(shù),旨在實現(xiàn)能夠有效結(jié)合感知、推理和規(guī)劃的自主機(jī)器智能。

此外,Paluri 強(qiáng)調(diào),在 “非可驗證領(lǐng)域” 的 AI 推理中,模型需要將復(fù)雜任務(wù)分解成可管理的步驟,以便動態(tài)適應(yīng)。例如,規(guī)劃一次旅行不僅要訂機(jī)票,還要處理實時的天氣變化,這可能會導(dǎo)致重新規(guī)劃路線。Meta 最近還推出了 Dualformer 模型,能夠在人類認(rèn)知過程中在快速直覺和緩慢深思之間動態(tài)切換,有效解決復(fù)雜任務(wù)。

關(guān)于 Llama 模型的訓(xùn)練,Meta 使用自監(jiān)督學(xué)習(xí)(SSL),幫助模型在多個領(lǐng)域?qū)W習(xí)廣泛的數(shù)據(jù)表示,使其具備靈活性。同時,強(qiáng)化學(xué)習(xí)與人類反饋(RLHF)則使模型在特定任務(wù)上精細(xì)化表現(xiàn)。兩者的結(jié)合使得 Llama 模型在生成高質(zhì)量的合成數(shù)據(jù)方面表現(xiàn)突出,特別是在語言特征稀缺的地區(qū)。

關(guān)于 Llama4的發(fā)布,Meta 首席執(zhí)行官馬克?扎克伯格在接受采訪時透露,團(tuán)隊已經(jīng)開始了 Llama4的預(yù)訓(xùn)練。他還提到,Meta 正在為 Llama4建立計算集群和數(shù)據(jù)基礎(chǔ)設(shè)施,預(yù)計將會是一個重大進(jìn)步。Paluri 幽默地提到,如果問扎克伯格發(fā)布時間,他可能會說 “今天”,強(qiáng)調(diào)了公司在 AI 開發(fā)上的快速進(jìn)展。

Meta 希望在未來的幾個月內(nèi)繼續(xù)推出新的 Llama 版本,以便不斷提升 AI 能力。通過頻繁的更新,開發(fā)者們可以期待每次發(fā)布都能帶來顯著的升級。

劃重點:

- ?? Meta 首席 AI 科學(xué)家認(rèn)為自主機(jī)器智能將幫助改善日常生活。

- ?? Llama 模型將結(jié)合自監(jiān)督學(xué)習(xí)與強(qiáng)化學(xué)習(xí),提升多領(lǐng)域推理能力。

- ?? Llama4的預(yù)訓(xùn)練已開始,預(yù)計將在2025年前后推出。