OSAID 1.0(The Open Source AI Definition – 1.0)是Open Source Initiative(OSI)發布的官方標準,用在明確AI系統成為開放源代碼的條件。參與制定OSAID 1.0的組織包括微軟、谷歌、亞馬遜、Meta、英特爾、三星、Mozilla基金會、Linux基金會、Apache軟件基金會等超過25個組織。OSAID 1.0要求AI系統必須在OSI認可的法律條款下,自由提供必要的代碼、數據和參數,確保用戶能無限制地使用、研究、修改和分享AI系統。OSAID 1.0特別強調機器學習系統中數據信息和代碼的重要性,支持在法律限制下排除某些訓練數據,促進AI技術的透明度和協作發展。
OSAID 1.0的具體定義內容自由使用:開源AI系統應支持用戶無需請求許可,可將系統用于任何目的。自由研究:用戶可以研究系統如何工作并檢查組件。自由修改:系統可以被修改,包括改變其輸出,滿足任何目的。自由分享:用戶可以與他人共享系統,無論是否經過修改,用于任何目的。這些自由適用于完整的系統,也適用于系統中的獨立元素。前提是能訪問首選形式以對系統進行修改。OSAID 1.0特別指出,對于機器學習系統,首選形式的修改必須包括以下元素:
數據信息:提供足夠詳細的數據信息,熟練的人可以使用相同的或類似的數據構建一個實質上等效的系統。包括所有用于訓練的數據的完整描述,包括不可共享的數據的來源、范圍和特征,以及如何獲取和選擇數據、標簽程序、數據處理和過濾方法等。還需列出所有公開可用的訓練數據以及如何獲取它們,所有可從第三方獲得的訓練數據及其獲取途徑(包括付費獲取)。代碼:提供用于訓練和運行系統的完整源代碼。代碼應展示如何處理和過濾數據以及如何進行訓練的完整規范。代碼應在OSI批準的許可下提供。參數:提供模型參數,例如權重或其他配置。參數應根據OSI批準的條款提供。對于機器學習系統,AI模型由模型架構、模型參數(包括權重)和運行模型的推理代碼組成。AI權重是一組學習參數,根據給定輸入生成輸出。“開源模型”和“開源權重”必須包括用于導出這些參數的數據信息和代碼。
OSAID 1.0的項目地址項目地址:opensource.org/ai/open-source-ai-definitionOSAID 1.0的適用人群開源社區:為開源AI項目提供明確的標準和指導,有助于提高項目質量和可靠性,吸引更多開發者參與。企業:影響企業AI模型的發布策略,需要調整確保符合OSAID標準,包括涉及技術、法律和業務方面的調整。開發者:提供更多的選擇和靈活性,開發者根據OSAID標準選擇和使用開源AI系統,促進創新和定制化開發。教育和研究機構:基于開放源代碼,教育機構和研究人員能更容易地獲取和使用AI技術,促進AI教育和研究的發展。法律和政策制定:為政策制定者提供參考框架,有助于制定和調整與AI相關的法律和政策,確保法律體系與技術發展同步。OSAID 1.0的行業優勢明確性:OSAID 1.0提供套明確的定義和標準,幫助開發者、企業和用戶理解什么是真正的開源AI,及如何確保AI項目符合開源的原則。促進創新:鼓勵開放和共享,OSAID 1.0有助于促進AI領域的創新。開發者能自由地訪問和修改開源AI項目的代碼,推動新技術和應用的發展。增強信任:遵循OSAID 1.0標準能增加用戶對AI系統的信任。開源意味著透明度,用戶能驗證系統的工作原理,有助于建立對AI技術的信任。協作機會:開源AI項目能吸引全球開發者的參與,OSAID 1.0項目提供共同的框架,讓協作變得更加容易和高效。OSAID 1.0的影響范圍影響AI模型的開發和使用:OSAID規定了開源AI模型必須提供足夠的信息以便任何人能“實質性地”重建該模型,包括訓練數據的來源、處理方式和獲取方式。促進AI透明度和開放性:OSAID強調了透明度的重要性,要求開源AI模型公開用于訓練和運行AI的完整源代碼,以及模型參數。推動AI技術的健康發展:為開源AI的發展和應用提供了明確的指導和標準。對現有AI模型的影響:許多自稱“開源”的AI模型實際上并不符合OSAID的標準,可能會對這些模型的開發和使用產生影響。法律和版權問題:對AI模型的法律地位和版權問題產生影響,尤其是在模型是否可以被版權保護的問題上。
