Yi-Lightning是什么

Yi-Lightning 是零一萬物公司最新發布的旗艦模型,在國際權威盲測榜單 LMSYS 上取得了顯著成績,超越了硅谷知名 OpenAI 的 GPT-4o-2024-05-13 和 Anthropic Claude 3.5 Sonnet,排名世界第六,中國第一。這一成就標志著中國大模型在全球競技場上首次超越了 OpenAI 的 GPT-4o,展現了中國在人工智能領域的實力和進步。

Yi-Lightning 模型在多個分榜上也展現了出色的性能,在中文分榜上,超越了其他國內外優質模型,與 o1-mini 等模型并列排名世界第二。在多輪對話分榜上,Yi-Lightning 排名第三,在數學和代碼分榜上,分別取得了第三和第四名的成績。

Yi-Lightning 在推理速度和成本方面也實現了突破。與上一代旗艦模型 Yi-Large 相比,Yi-Lightning 的最高生成速度提升了近四成,首包時間縮短了一倍。Yi-Lightning 的推理成本得到了進一步的降低,每百萬 token 僅需 0.99 元,直逼行業最低價。

Yi-Lightning  零一萬物最新推出的旗艦模型 第1張Yi-Lightning的主要功能推理速度和成本:Yi-Lightning 在推理速度上相比上一代旗艦模型 Yi-Large 有顯著提升,最高生成速度提升了近四成。推理成本也得到了進一步的降低,每百萬 token 僅需 0.99 元。AI 2.0 數字人解決方案:零一萬物推出了基于 Yi-Lightning 模型的 AI 2.0 數字人解決方案,聚焦零售和電商等場景。這套解決方案包括角色大模型、直播聲音大模型、電商話術大模型等,具備動作訓練、表情生成、多國語言和情感表達、智能對話等能力。在實際應用中,某酒旅企業接入后 GMV 較此前上升了 170%。全行業解決方案:Yi-Lightning 模型也被應用于零一萬物的全行業解決方案中,這些解決方案除了基座模型外,還會搭配 RAG、Function Calling 等實用工具。已經在零售、醫療、教育、物流等領域內完成落地,涉及 AI 搜索、AI 生產力工具、AI 智能巡檢等應用場景。模型架構創新:Yi-Lightning 采用了 Mixture of Experts(MoE)混合專家模型架構,在模型訓練過程中引入了混合注意力機制和動態 Top-P 路由機制,創新嘗試提供了更高起點的標準化基座模型,能更快速、高效、低成本地完成定制模型訓練。極速推理:Yi-Lightning 的推理速度非常快,基于動態 Top-P 路由機制,能根據任務的難度動態自動選擇最合適的專家網絡組合,平衡推理成本和模型性能。多階段訓練:Yi-Lightning 的訓練過程采用了多階段訓練模式,前期注重數據多樣性,后期側重于更豐富、知識性更強的數據,這種訓練方法有助于模型吸收不同階段的知識,通過調整 batch size 和學習率(LR)來保證訓練速度和穩定性。Yi-Lightning的技術原理MoE混合專家模型架構:Yi-Lightning 采用了 Mixture of Experts(MoE)混合專家模型架構,這種架構通過結合多個專家網絡(Experts)來處理不同的任務,使模型能根據任務的難度動態選擇激活哪些專家網絡,平衡推理成本和模型性能。在訓練過程中,所有專家網絡都被激活,在推理階段,模型會選擇性地激活更匹配的專家網絡。混合注意力機制(Hybrid Attention):Yi-Lightning 優化了混合注意力機制,只在模型的部分層次中將傳統的全注意力(Full Attention)替換為滑動窗口注意力(Sliding Window Attention),降低計算成本,同時保持對長序列數據的高效處理能力。跨層注意力(Cross-Layer Attention, CLA):Yi-Lightning 引入了跨層注意力機制,支持模型在不同的層次之間共享鍵(Key)和值(Value)頭,減少對存儲資源的需求,提高模型的推理效率。動態 Top-P 路由:Yi-Lightning 根據任務的難度動態自動選擇最合適的專家網絡組合,無需人工干預,使模型能更加智能地適應各種任務需求,實現極速推理。Yi-Lightning的項目地址項目官網:platform.lingyiwanwu.comYi-Lightning的應用場景翻譯場景:Yi-Lightning 在翻譯領域表現出色,能處理語言理解和生成、跨語言能力、上下文感知能力等,提供高質量的翻譯服務。在與多個模型的對比中,Yi-Lightning 的翻譯能力得到了直觀的展現,用詞精準且具有文學色彩 。零售電商直播場景:零一萬物推出的 AI 2.0 數字人方案聚焦于零售和電商等場景,基于Yi-Lightning 提供的技術支持,實現了彈幕互動、商品信息提取、實時話術生成等功能。接入 Yi-Lightning 后,數字人的實時互動效果更好,話術更流暢,回復也更準確。企業級解決方案:Yi-Lightning 也被應用于零一萬物的 To B 戰略下的企業級解決方案中,為企業提供定制化的 AI 服務,幫助企業提升效率和營收。多語言處理:在中文分榜上,Yi-Lightning 展現了強大的中文處理能力,與國際頂尖模型相比也毫不遜色 。數學和代碼生成:在數學和代碼分榜上,Yi-Lightning 分別取得了第三、第四名的成績,顯示了其在這些領域的強大能力 。長提問和艱難提問:Yi-Lightning 在處理長提問和艱難提問方面也表現出眾,均取得世界第四的優異成績,證明了其解決復雜問題的能力 。