法國AI初創(chuàng)公司Les Ministraux 推出兩款全新輕量級模型Ministral3B和Ministral8B,專為邊緣設(shè)備設(shè)計,參數(shù)分別為30億和80億。這兩款模型在指令跟隨基準測試中表現(xiàn)出色,Ministral3B超越了Llama38B和Mistral7B,Ministral8B則在除代碼能力外其他方面均優(yōu)于這兩個模型。
測試結(jié)果顯示,Ministral3B和Ministral8B的性能可媲美Gemma2和Llama3.1等開源模型。 這兩款模型都支持高達128k的上下文,并在知識、常識、推理、函數(shù)調(diào)用和效率方面為低于10B參數(shù)的模型樹立了新的標桿。 Ministral8B還配備了滑動窗口注意機制,以實現(xiàn)更快、更高效的內(nèi)存推理。 它們可以被微調(diào)到各種用例中,例如管理復(fù)雜的AI智能體工作流程或創(chuàng)建專門的任務(wù)助手。
研究人員對Les Ministraux模型進行了多項基準測試,涵蓋知識與常識、代碼、數(shù)學(xué)和多語言等方面。 在預(yù)訓(xùn)練模型階段,Ministral3B在與Gema22B、Llama3.23B的比較中取得了最佳成績。 Ministral8B在與Llama3.18B、Mistral7B的比較中,除代碼能力外其他方面均表現(xiàn)最佳。 在微調(diào)后的指令模型階段,Ministral3B在不同基準測試中均取得最佳成績,Ministral8B僅在Wild bench上略遜于Gema29B。
Les Ministraux模型的推出為用戶提供了高計算效率、低延遲的解決方案,滿足了越來越多用戶對關(guān)鍵應(yīng)用程序本地優(yōu)先推理的需求。 用戶可以將這些模型應(yīng)用于設(shè)備上翻譯、無需聯(lián)網(wǎng)的智能助理以及自動機器人等場景。 Ministral8B的輸入輸出價格為每百萬token0.1美元,Ministral3B則為每百萬token0.04美元。
值得注意的是,Mistral 公司此前曾以磁力鏈接方式開源多款模型,并獲得AI社區(qū)的認可。 然而,該公司今年陷入爭議,因為它不再像以前那樣開放。 有消息稱微軟將收購Mistral的部分股份并對其進行投資,這意味著Mistral的模型將在Azure AI上托管。 Reddit網(wǎng)友發(fā)現(xiàn)Mistral已從官網(wǎng)上刪除了關(guān)于開源的承諾。 該公司的一些模型也開始收費,包括此次發(fā)布的Ministral3B和Ministral8B。
詳情:https://mistral.ai/news/ministraux/

