1月13日消息,,馬斯克在CES期間接受采訪時指出,現實世界能用來訓練AI模型的資料,,已經消耗的差不多了,。
馬斯克表示,,基本上,AI訓練已經將人類累計的知識全數耗盡,,而這個時間點就是去年(2024年),。
馬斯克的這一觀點呼應了OpenAI前科學長Ilya Sutskever在去年12月機器學習會議“NeurIPS”上的說法,Sutskever當時表示,,AI產業(yè)能夠消耗的數據已經達到了頂峰,。
面對現實世界數據的枯竭,馬斯克暗示合成數據(synthetic data)將是未來的發(fā)展方向,。
他指出,,補充現實世界數據的唯一方法就是合成數據,由AI自行生成用于訓練的數據,,通過合成數據,,AI將能夠為自己打分,并展開自我學習的過程,。
事實上,,許多科技巨頭已經開始使用合成數據來訓練AI模型,微軟,、Meta,、OpenAI及Anthropic等企業(yè)已經在其AI模型訓練中廣泛應用合成數據。
科技市場研究機構Gartner估計,,2024年AI及分析項目使用的數據中,,約60%是合成數據。
例如,,微軟在1月8日開源的AI模型“Phi-4”就是通過合成數據結合現實世界數據進行訓練的,,谷歌的“Gemma”模型也采用了類似的方法,。
Anthropic使用部分合成數據開發(fā)了表現最佳的系統(tǒng)之一“Claude 3.5 Sonnet”,,而Meta則運用AI生成數據來微調其最新推出的Llama系列模型。
本站內容除特別聲明的原創(chuàng)文章之外,,轉載內容只為傳遞更多信息,,并不代表本網站贊同其觀點。轉載的所有的文章,、圖片,、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者,。如涉及作品內容,、版權和其它問題,請及時通過電子郵件或電話通知我們,,以便迅速采取適當措施,,避免給雙方造成不必要的經濟損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。