?北京智源人工智能研究院宣布推出原生多模態(tài)世界模型Emu3。這一模型基于下一個(gè)token預(yù)測(cè)技術(shù),無(wú)需依賴擴(kuò)散模型或組合方法,就能夠完成文本、圖像、視頻三種模態(tài)數(shù)據(jù)的理解和生成。Emu3在圖像生成、視頻生成、視覺語(yǔ)言理解等任...
-
-
近年來,人工智能(AI)在醫(yī)療行業(yè)的影響越來越顯著,特別是在疾病診斷和治療規(guī)劃方面。醫(yī)學(xué)大型視覺語(yǔ)言模型(Med-LVLMs 的發(fā)展,為實(shí)現(xiàn)更智能的醫(yī)療診斷工具提供了新的可能性。然而,這些模型在實(shí)際應(yīng)用中,常常面臨一個(gè)不容忽...
-
一項(xiàng)由以色列理工學(xué)院主導(dǎo)的最新研究表明,大型語(yǔ)言模型(LLM)可能“深藏不露”,掌握的知識(shí)比實(shí)際表現(xiàn)出來的更多。研究人員發(fā)現(xiàn),LLM 的內(nèi)部表征編碼了關(guān)于其輸出正確性的信息,即使它們最終生成了錯(cuò)誤的答案,也能在內(nèi)部識(shí)別出正確...
-
近日,人工智能搜索引擎初創(chuàng)公司 Perplexity AI 宣布,希望在即將進(jìn)行的新一輪融資中將自身估值提升到約90億美元。根據(jù) CNBC 的報(bào)道,這家公司的估值在今年6月時(shí)為30億美元,而他們目前計(jì)劃籌集大約5億美元的資金...
-
阿里巴巴達(dá)摩院與中國(guó)人民大學(xué)近日聯(lián)合開源了一款名為 mPLUG-DocOwl1.5的文檔處理模型,該模型主打無(wú)需 OCR 識(shí)別即可理解文檔內(nèi)容,并在多個(gè)視覺文檔理解基準(zhǔn)測(cè)試中取得了領(lǐng)先的性能。結(jié)構(gòu)信息對(duì)于理解富文本圖像(例如...
-
在構(gòu)建以人工智能為核心的未來時(shí),Gusto的聯(lián)合創(chuàng)始人兼技術(shù)負(fù)責(zé)人Edward Kim提出了一個(gè)與眾不同的觀點(diǎn)。他認(rèn)為,削減現(xiàn)有團(tuán)隊(duì)并雇傭一批經(jīng)過特別訓(xùn)練的AI工程師并不是正確的做法。Kim在與TechCrunch的一次訪談...
-
就在今年的 WWDC 大會(huì)上,蘋果展示了一些 AI 新特性,雖然這些功能吸引了許多用戶的目光,但據(jù)業(yè)內(nèi)分析師稱,蘋果實(shí)際上在 AI 技術(shù)的發(fā)展上落后于競(jìng)爭(zhēng)對(duì)手約兩年。相較于谷歌、微軟等公司,蘋果在 AI 技術(shù)的應(yīng)用上明顯慢了...
-
Midjourney 的創(chuàng)始人 David Holz 宣布,一款全新的圖像編輯器將在下周上線,這款編輯器的亮點(diǎn)在于它能夠利用上傳圖像的深度信息來生成新的圖片。這意味著用戶可以保留原始圖像的構(gòu)圖和內(nèi)容,同時(shí)對(duì)紋理、顏色和細(xì)節(jié)進(jìn)...
-
據(jù)《書商》報(bào)道,圖書出版商企鵝蘭登書屋正在以印刷形式表明其對(duì)人工智能訓(xùn)練的立場(chǎng)。新書和再版書籍的標(biāo)準(zhǔn)版權(quán)頁(yè)現(xiàn)在將寫明:“本書的任何部分不得以任何方式用于或復(fù)制用于訓(xùn)練人工智能技術(shù)或系統(tǒng)。 ”這意味著企鵝蘭登書屋不允許任何人將...
-
字節(jié)跳動(dòng)近期針對(duì)“實(shí)習(xí)生破壞大模型訓(xùn)練”的傳聞進(jìn)行了官方回應(yīng)。該公司確認(rèn),確實(shí)有一名實(shí)習(xí)生惡意干擾了商業(yè)化技術(shù)團(tuán)隊(duì)的研究項(xiàng)目模型訓(xùn)練任務(wù),但這一行為并未影響到公司的正式商業(yè)項(xiàng)目和線上業(yè)務(wù),也沒有涉及到字節(jié)跳動(dòng)的其他大型模型業(yè)...







