?北京智源人工智能研究院宣布推出原生多模態世界模型Emu3。這一模型基于下一個token預測技術,無需依賴擴散模型或組合方法,就能夠完成文本、圖像、視頻三種模態數據的理解和生成。Emu3在圖像生成、視頻生成、視覺語言理解等任...
-
-
近年來,人工智能(AI)在醫療行業的影響越來越顯著,特別是在疾病診斷和治療規劃方面。醫學大型視覺語言模型(Med-LVLMs 的發展,為實現更智能的醫療診斷工具提供了新的可能性。然而,這些模型在實際應用中,常常面臨一個不容忽...
-
一項由以色列理工學院主導的最新研究表明,大型語言模型(LLM)可能“深藏不露”,掌握的知識比實際表現出來的更多。研究人員發現,LLM 的內部表征編碼了關于其輸出正確性的信息,即使它們最終生成了錯誤的答案,也能在內部識別出正確...
-
近日,人工智能搜索引擎初創公司 Perplexity AI 宣布,希望在即將進行的新一輪融資中將自身估值提升到約90億美元。根據 CNBC 的報道,這家公司的估值在今年6月時為30億美元,而他們目前計劃籌集大約5億美元的資金...
-
阿里巴巴達摩院與中國人民大學近日聯合開源了一款名為 mPLUG-DocOwl1.5的文檔處理模型,該模型主打無需 OCR 識別即可理解文檔內容,并在多個視覺文檔理解基準測試中取得了領先的性能。結構信息對于理解富文本圖像(例如...
-
在構建以人工智能為核心的未來時,Gusto的聯合創始人兼技術負責人Edward Kim提出了一個與眾不同的觀點。他認為,削減現有團隊并雇傭一批經過特別訓練的AI工程師并不是正確的做法。Kim在與TechCrunch的一次訪談...
-
就在今年的 WWDC 大會上,蘋果展示了一些 AI 新特性,雖然這些功能吸引了許多用戶的目光,但據業內分析師稱,蘋果實際上在 AI 技術的發展上落后于競爭對手約兩年。相較于谷歌、微軟等公司,蘋果在 AI 技術的應用上明顯慢了...
-
Midjourney 的創始人 David Holz 宣布,一款全新的圖像編輯器將在下周上線,這款編輯器的亮點在于它能夠利用上傳圖像的深度信息來生成新的圖片。這意味著用戶可以保留原始圖像的構圖和內容,同時對紋理、顏色和細節進...
-
據《書商》報道,圖書出版商企鵝蘭登書屋正在以印刷形式表明其對人工智能訓練的立場。新書和再版書籍的標準版權頁現在將寫明:“本書的任何部分不得以任何方式用于或復制用于訓練人工智能技術或系統。 ”這意味著企鵝蘭登書屋不允許任何人將...
-
字節跳動近期針對“實習生破壞大模型訓練”的傳聞進行了官方回應。該公司確認,確實有一名實習生惡意干擾了商業化技術團隊的研究項目模型訓練任務,但這一行為并未影響到公司的正式商業項目和線上業務,也沒有涉及到字節跳動的其他大型模型業...







