當(dāng)?shù)貢r(shí)間4月5日,視頻網(wǎng)站YouTube首席執(zhí)行官尼爾·莫漢(Neal Mohan)在采訪(fǎng)中表示,他并沒(méi)有直接證據(jù)能夠證明OpenAI確實(shí)使用了YouTube的視頻來(lái)完善其文生視頻AI工具Sora,如果真的使用了,那就“明顯違反”了YouTube平臺(tái)的使用條款。
莫漢表示:“從創(chuàng)作者的角度來(lái)看,當(dāng)創(chuàng)作者將他們的辛勤勞動(dòng)上傳到我們的平臺(tái)時(shí),他們有一定的期望。其中之一就是符合YouTube的服務(wù)條款,不允許下載文字或視頻片段等內(nèi)容。這(OpenAI使用YouTube視頻)明顯違反了我們的服務(wù)條款。”
此外,莫漢還在采訪(fǎng)中提到,谷歌確實(shí)使用了YouTube上的一些內(nèi)容訓(xùn)練旗下大模型Gemini,但在使用這些內(nèi)容之前,已經(jīng)得到了創(chuàng)作者的授權(quán),并遵循了YouTube與創(chuàng)作者之間的合同。
近日,《紐約時(shí)報(bào)》報(bào)道,OpenAI和谷歌涉嫌使用YouTube視頻的轉(zhuǎn)錄文本來(lái)訓(xùn)練其人工智能模型,這一行為可能侵犯了YouTube創(chuàng)作者的版權(quán)。報(bào)道稱(chēng),OpenAI通過(guò)使用其Whisper語(yǔ)音識(shí)別工具,轉(zhuǎn)錄了超過(guò)一百萬(wàn)小時(shí)的YouTube視頻內(nèi)容,并將這些數(shù)據(jù)用于訓(xùn)練模型。
OpenAI的Sora是一種文生視頻工具,能夠一次生成整個(gè)視頻或擴(kuò)展生成的視頻以使其更長(zhǎng)。和其他生成式AI工具的工作原理一樣,Sora也是從網(wǎng)絡(luò)上吸收各種內(nèi)容,并使用這些數(shù)據(jù)作為生成新內(nèi)容的基礎(chǔ),包括視頻、照片、敘述文本等。
AI的強(qiáng)大功能建立在大量數(shù)據(jù)訓(xùn)練的基礎(chǔ)之上,隨著OpenAI、谷歌和其他公司競(jìng)相開(kāi)發(fā)更強(qiáng)大的AI工具,他們正在尋求越來(lái)越多的數(shù)據(jù)來(lái)訓(xùn)練模型,以生成更好的結(jié)果。
但這已經(jīng)引發(fā)了人們對(duì)數(shù)據(jù)來(lái)源、用途的質(zhì)疑。此前,OpenAI因其訓(xùn)練模型的內(nèi)容來(lái)源而被《紐約時(shí)報(bào)》以及一些出版社和作者起訴。
今年1月,《紐約時(shí)報(bào)》在紐約南區(qū)法院向OpenAI及其投資人微軟公司提起侵犯版權(quán)訴訟,指控二者未經(jīng)許可使用其數(shù)百萬(wàn)篇文章以訓(xùn)練人工智能模型,而這些聊天機(jī)器人現(xiàn)在與該新聞機(jī)構(gòu)形成競(jìng)爭(zhēng),成為可靠的信息來(lái)源。
訴訟稱(chēng),被告應(yīng)對(duì)與“非法復(fù)制和使用《紐約時(shí)報(bào)》獨(dú)特有價(jià)值的作品”相關(guān)的“數(shù)十億美元的法定和實(shí)際損害”負(fù)責(zé),還要求其銷(xiāo)毀使用《紐約時(shí)報(bào)》版權(quán)材料的所有AI模型和訓(xùn)練數(shù)據(jù)。
隨后OpenAI回應(yīng)稱(chēng),《紐約時(shí)報(bào)》的訴訟毫無(wú)根據(jù),但仍然希望與其建立建設(shè)性的合作伙伴關(guān)系。
此外,據(jù)外媒報(bào)道,今年3月,OpenAI首席技術(shù)官M(fèi)ira Murati在接受采訪(fǎng)時(shí)還曾對(duì)Sora的訓(xùn)練數(shù)據(jù)來(lái)源含糊其辭。
當(dāng)被追問(wèn)具體來(lái)源是否包含YouTube的視頻時(shí),Murati回復(fù)“我實(shí)際上并不確定”,并拒絕回答有關(guān)Instagram或Facebook視頻是否被納入訓(xùn)練集的問(wèn)題。她辯稱(chēng),如果這些視頻是公開(kāi)可用且可以使用的,那么可能會(huì)被使用,但她本人對(duì)此并不確定。
推薦閱讀
官方微信
官方微博
今日頭條
川公網(wǎng)安備51019002004313號(hào)