《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動(dòng)態(tài) > NVIDIA蘋果等巨頭被曝違規(guī)用數(shù)據(jù)訓(xùn)練AI

NVIDIA蘋果等巨頭被曝違規(guī)用數(shù)據(jù)訓(xùn)練AI

超17萬個(gè)視頻
2024-07-17
來源:快科技
關(guān)鍵詞: NVIDIA 蘋果 AI

7月17日消息,據(jù)媒體報(bào)道,,包括NVIDIA,、蘋果、Salesforce和Anthropic在內(nèi)的多家科技巨頭,,被曝光涉嫌違規(guī)使用數(shù)據(jù),,用于訓(xùn)練其AI模型。

這些公司被發(fā)現(xiàn)使用了超過173536個(gè)YouTube視頻的字幕數(shù)據(jù),,而這些數(shù)據(jù)的獲取并未得到視頻創(chuàng)作者的許可,。

這些公司所使用的數(shù)據(jù)集名為“YouTube Subtitles”,由非營(yíng)利組織EleutherAI創(chuàng)建,,該數(shù)據(jù)集包含了來自超過48000個(gè)頻道的視頻文本,。

其中不乏知名教育機(jī)構(gòu)和媒體公司的內(nèi)容,例如可汗學(xué)院,、麻省理工學(xué)院,、哈佛大學(xué)等,此外,,一些廣受歡迎的YouTube創(chuàng)作者,,如MrBeast等的視頻也被包括在內(nèi)。

此前,,EleutherAI發(fā)布了名為“Pile”的數(shù)據(jù)匯編,,其中的大部分?jǐn)?shù)據(jù)集都是對(duì)公眾開放的,包括YouTube Subtitles,。

不過值得注意的是,,蘋果在使用Pile數(shù)據(jù)集訓(xùn)練OpenELM模型時(shí),并未直接下載數(shù)據(jù),,因此在技術(shù)層面上,,是EleutherAI違反了YouTube的使用條款。

YouTube明確禁止未經(jīng)授權(quán)從平臺(tái)獲取素材,,同時(shí)這些數(shù)據(jù)不僅用于訓(xùn)練AI,,還可能涉及到版權(quán)和隱私問題。

創(chuàng)作者們也對(duì)此表示震驚和不滿,因?yàn)樗麄儾⑽幢桓嬷约旱淖髌繁挥糜谏虡I(yè)目的,,更遑論從中獲得任何補(bǔ)償,。


000.jpg

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,,并不代表本網(wǎng)站贊同其觀點(diǎn),。轉(zhuǎn)載的所有的文章、圖片,、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有,。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容,、版權(quán)和其它問題,,請(qǐng)及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,,避免給雙方造成不必要的經(jīng)濟(jì)損失,。聯(lián)系電話:010-82306118;郵箱:[email protected],。