AI對(duì)作品的“學(xué)習(xí)”使用,已經(jīng)落入需要獲取著作權(quán)人許可的范疇,至少需要支付購(gòu)買合法復(fù)制品的對(duì)價(jià)。如果任由AI全網(wǎng)爬取免費(fèi)學(xué)習(xí)資源而無(wú)需支付合理對(duì)價(jià),相對(duì)于常規(guī)學(xué)習(xí)中需要購(gòu)買教材、支付學(xué)費(fèi)的自然人,難言公平——
從西漢匡衡的鑿壁偷光、旁聽(tīng)私塾的佳話,到孔乙己“竊書不算偷”的趣談;再?gòu)恼n堂朗讀、背誦詩(shī)文,到美術(shù)生臨摹畫作、雕塑,很少有著作權(quán)人對(duì)他人單純學(xué)習(xí)其作品的行為提出異議。但是,隨著AI大模型學(xué)習(xí)的出現(xiàn),著作權(quán)人越來(lái)越反對(duì)AI大模型未經(jīng)許可學(xué)習(xí)其作品。那么,AI學(xué)習(xí)和人類學(xué)習(xí)有什么差別?AI學(xué)習(xí)作品需要獲取著作權(quán)人許可嗎?
AI學(xué)習(xí)與人類學(xué)習(xí)同為“利用”,是否應(yīng)同等看待?
人類的學(xué)習(xí)活動(dòng)通常被認(rèn)為是人類個(gè)體內(nèi)在的認(rèn)知過(guò)程,且所獲取信息的認(rèn)知程度存在明顯的個(gè)體差異。信息通過(guò)視覺(jué)、聽(tīng)覺(jué)甚至觸覺(jué)進(jìn)入大腦,經(jīng)過(guò)人類特有的理解、消化、遺忘、重構(gòu),形成了對(duì)信息內(nèi)容的不同程度地吸收,并在特定條件下可能產(chǎn)生對(duì)既往吸收信息內(nèi)容不同程度的調(diào)取、輸出和各種形式的利用。最簡(jiǎn)單的學(xué)習(xí)場(chǎng)景,莫過(guò)于自然人個(gè)體閱讀一首詩(shī)歌,了解詩(shī)歌文字表達(dá)出的字面含義;進(jìn)而對(duì)詩(shī)歌進(jìn)行背誦、默寫,顯然涉及到對(duì)作品的“復(fù)制”和“再現(xiàn)”,但仍屬于普遍被接受的學(xué)習(xí)行為;在學(xué)習(xí)詩(shī)歌基礎(chǔ)上,寫成風(fēng)格類似的原創(chuàng)詩(shī)歌,雖然也涉及一定程度上對(duì)在先作品的利用,但通常也會(huì)被認(rèn)為是可以接受的學(xué)習(xí)成果;如果對(duì)詩(shī)歌進(jìn)行修改、擴(kuò)寫,則突破了常規(guī)的學(xué)習(xí)范疇。
AI學(xué)習(xí)通常涉及數(shù)據(jù)收集與預(yù)處理、分詞處理、神經(jīng)網(wǎng)絡(luò)訓(xùn)練和微調(diào)四個(gè)階段,每個(gè)階段都涉及到對(duì)作品內(nèi)容的直接使用。在數(shù)據(jù)收集與預(yù)處理階段,AI 需要使用者錄入作品或通過(guò)互聯(lián)網(wǎng)自動(dòng)爬取作品并儲(chǔ)存在本地服務(wù)器中,形成新的作品復(fù)制件;在分詞處理階段,AI通常將文本轉(zhuǎn)換為數(shù)值形式,即將單詞、子詞或字符映射為唯一的數(shù)值token。在此階段,文本轉(zhuǎn)換為數(shù)值,是由人類語(yǔ)言轉(zhuǎn)換為機(jī)器語(yǔ)言。而在神經(jīng)網(wǎng)絡(luò)訓(xùn)練和微調(diào)兩個(gè)階段,也不可避免地調(diào)用已經(jīng)轉(zhuǎn)化為機(jī)器語(yǔ)言的作品內(nèi)容,并按AI預(yù)設(shè)或使用者要求,復(fù)制、修改、改編已有作品,抑或調(diào)用已有作品的“風(fēng)格”參數(shù)生成“新成果”。
由此可見(jiàn),相對(duì)于人類學(xué)習(xí)某一作品,AI學(xué)習(xí)該作品后也能輸出看似與人類一樣的背誦、改寫,抑或類似風(fēng)格的“學(xué)習(xí)成果”。其模仿人類學(xué)習(xí)的過(guò)程,本質(zhì)上是信息數(shù)據(jù)的錄入、分析和按要求輸出,雖然與人類的認(rèn)知行為目前在存儲(chǔ)、調(diào)用機(jī)理上存在差異,但從行為表現(xiàn)上并無(wú)本質(zhì)差別,都涉及對(duì)作品不同程度的利用。
版權(quán)許可必然成為合作新趨勢(shì)
基于著作權(quán)制度逐漸完善的歷史和不斷積累的《著作權(quán)法》保護(hù)實(shí)踐,《著作權(quán)法》規(guī)定了著作權(quán)人就其作品所享有的權(quán)利種類,以及無(wú)需著作權(quán)人許可即可使用作品的合理使用制度。人類學(xué)習(xí)某一作品之所以無(wú)需獲取著作權(quán)人的許可,是因?yàn)椤吨鳈?quán)法》在賦予著作權(quán)人專有權(quán)利基礎(chǔ)上,對(duì)其著作權(quán)進(jìn)行了合理限制和權(quán)利讓渡,這是對(duì)著作權(quán)人和公眾利益的平衡設(shè)置?!吨鳈?quán)法》允許自然人個(gè)體在通過(guò)合法渠道獲取作品或作品復(fù)制件后,通過(guò)閱讀、欣賞作品,吸收作品表達(dá)所承載的信息,并在合理使用范圍內(nèi)對(duì)作品加以利用。
著作權(quán)制度和現(xiàn)行《著作權(quán)法》體系顯然沒(méi)有考慮AI學(xué)習(xí)中使用作品的場(chǎng)景。不論是合理使用制度,還是法定許可制度,目前都不能適用于在AI大模型訓(xùn)練中使用作品的場(chǎng)景。另外,大多數(shù)AI產(chǎn)品由科技企業(yè)、科研機(jī)構(gòu)開(kāi)發(fā)運(yùn)營(yíng),具有明顯的商業(yè)目的,抑或具備收費(fèi)提供服務(wù)的可能,不具有參照人類學(xué)習(xí)要求著作權(quán)人作出權(quán)益讓渡的正當(dāng)性和必要性。
筆者傾向認(rèn)為,AI對(duì)作品的學(xué)習(xí)使用,已經(jīng)落入需要獲取著作權(quán)人許可的范疇,至少需要支付購(gòu)買合法復(fù)制品的對(duì)價(jià)。如果任由AI全網(wǎng)爬取免費(fèi)學(xué)習(xí)資源而無(wú)需支付合理對(duì)價(jià),相對(duì)于常規(guī)學(xué)習(xí)中需要購(gòu)買教材、支付學(xué)費(fèi)的自然人,難言公平。
隨著AI訓(xùn)練使用作品需求的增加,以及著作權(quán)人越來(lái)越抵制AI免費(fèi)使用其作品,AI學(xué)習(xí)場(chǎng)景下的版權(quán)許可必然成為AI科技企業(yè)與著作權(quán)人之間合作的新趨勢(shì)。據(jù)悉,《紐約時(shí)報(bào)》與亞馬遜達(dá)成多年版權(quán)許可合作,允許亞馬遜使用《紐約時(shí)報(bào)》內(nèi)容訓(xùn)練其AI平臺(tái)。
筆者相信,未來(lái)會(huì)有越來(lái)越多的版權(quán)持有和管理機(jī)構(gòu)與AI科技企業(yè)達(dá)成合作,不斷豐富AI領(lǐng)域的版權(quán)使用場(chǎng)景,建立并不斷完善能夠滿足AI學(xué)習(xí)需求的版權(quán)許可規(guī)則,通過(guò)公平互惠、明晰有序的合同約定,保障著作權(quán)人與AI科技企業(yè)之間的利益平衡。
