ARTICLES
專業(yè)文章
跨越AIGC合規(guī)上市之路(四):知識產(chǎn)權(quán)合規(guī)篇
?
《生成式人工智能服務(wù)管理暫行辦法》(以下簡稱《暫行辦法》)為AIGC服務(wù)的知識產(chǎn)權(quán)保護(hù)提供了明確指導(dǎo)。根據(jù)其第4和第7條,AIGC服務(wù)的提供與使用需尊重知識產(chǎn)權(quán)、遵守商業(yè)道德,保守商業(yè)秘密,不得利用算法、數(shù)據(jù)、平臺等優(yōu)勢實施壟斷和不正當(dāng)競爭行為;同時,AIGC服務(wù)提供者在進(jìn)行預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動時,如果涉及知識產(chǎn)權(quán),則不能侵犯他人的知識產(chǎn)權(quán)。
?
當(dāng)前,AIGC服務(wù)從輸入數(shù)據(jù)的獲取及預(yù)處理,算法模型的構(gòu)建與訓(xùn)練,到生成內(nèi)容的輸出與優(yōu)化等各環(huán)節(jié),均可能涉及專利、著作權(quán)、商業(yè)秘密等多種知識產(chǎn)權(quán)客體,屬于侵權(quán)糾紛高發(fā)區(qū)。例如,用于算法模型訓(xùn)練的輸入數(shù)據(jù)可能包含眾多受版權(quán)保護(hù)的作品、個人隱私數(shù)據(jù)或商業(yè)秘密;采用的算法模型可能實施了他人的專利技術(shù);AIGC產(chǎn)品生成的文本和圖片可能與某些知名文學(xué)作品或繪畫構(gòu)成實質(zhì)性相似。此外,由于AIGC產(chǎn)品通常依賴開源生態(tài),開源合規(guī)在AIGC產(chǎn)品開發(fā)過程中亦十分關(guān)鍵。本文將從知識產(chǎn)權(quán)保護(hù)的角度,為AIGC技術(shù)開發(fā)者建立知識產(chǎn)權(quán)保護(hù)和開源合規(guī)體系提供建議。
?
一、知識產(chǎn)權(quán)保護(hù)框架
?
?
AIGC產(chǎn)品在知識產(chǎn)權(quán)保護(hù)方面展現(xiàn)出其特殊和復(fù)雜的特征。一方面,由于其需要大規(guī)模的數(shù)據(jù)輸入、多元化的輸出結(jié)果以及算法黑盒問題,其在現(xiàn)行的知識產(chǎn)權(quán)保護(hù)框架下存在許多待解決的問題。另一方面,由開發(fā)者構(gòu)建的程序代碼、用戶反復(fù)塑造的指令以及AIGC產(chǎn)品本身的訓(xùn)練成熟度共同決定了AIGC產(chǎn)品產(chǎn)出的特定生成物,故而在確定侵權(quán)主體時可能存在一定的困難。因此在現(xiàn)有環(huán)境下,不同的角色存在不同的知識產(chǎn)權(quán)合規(guī)保護(hù)視角。如技術(shù)開發(fā)方會重視數(shù)據(jù)來源、技術(shù)許可、專利合規(guī)以及開源合規(guī)等問題,而技術(shù)使用方則會更加強(qiáng)調(diào)版權(quán)風(fēng)險、隱私風(fēng)險和競爭風(fēng)險等問題??紤]到篇幅問題,本文主要從技術(shù)開發(fā)方的視角,結(jié)合我們的相關(guān)實踐經(jīng)驗,為有關(guān)企業(yè)提供知識產(chǎn)權(quán)的合規(guī)框架建議:
?
1. 算法專利保護(hù)
?
對于生成式人工智能涉及的算法的可專利性,業(yè)界存在爭論。根據(jù)《專利法》第二十五條,規(guī)則和方法的智力活動不能獲得專利。因此,算法作為一種數(shù)學(xué)運(yùn)算模型,可能被視為抽象運(yùn)算思維而不具備可專利性。在申請專利的過程中,AIGC服務(wù)提供者應(yīng)將算法與實際解決的技術(shù)問題相結(jié)合,體現(xiàn)算法步驟的執(zhí)行能夠采用具有自然規(guī)律的技術(shù)手段,解決具體技術(shù)領(lǐng)域的具體技術(shù)問題,并形成具體的技術(shù)效果,進(jìn)而在算法設(shè)計中將各個特征與參數(shù)與解決該具體技術(shù)問題的特征和參數(shù)緊密關(guān)聯(lián),使之成為可專利的新發(fā)明。具體要求,企業(yè)可參考國家知識產(chǎn)權(quán)局發(fā)布的第343號公告。另外,在AIGC產(chǎn)品的研發(fā)過程中,應(yīng)避免使用他人已專利的工具進(jìn)行開發(fā),以防止專利侵權(quán)糾紛。
?
此外,如上所述,算法專利的侵權(quán)訴訟中常常面臨侵權(quán)舉證難、侵權(quán)主體認(rèn)定難等困境。從降低權(quán)利人侵權(quán)舉證責(zé)任的角度考慮,算法專利在撰寫時應(yīng)盡量保證技術(shù)特征的可視化。例如,當(dāng)算法改進(jìn)在于模型時,優(yōu)先考慮布局模型應(yīng)用權(quán)項;當(dāng)算法改進(jìn)僅在于數(shù)據(jù)清洗、特征提取、數(shù)據(jù)采集、特殊場景轉(zhuǎn)用等,而不涉及模型本身的結(jié)構(gòu)或參數(shù),可以將模型視作黑盒處理。此外,也可以考慮將專利與開源軟件相結(jié)合,即將算法對應(yīng)的代碼對外開源形成開源代碼,針對算法對應(yīng)的方法申請專利,在開源代碼與對應(yīng)的算法專利之間建立對應(yīng)關(guān)系,從而將專利侵權(quán)舉證轉(zhuǎn)化為開源軟件使用行為舉證,降低舉證難度。
?
從降低侵權(quán)主體認(rèn)定難度的角度考慮,算法專利在撰寫時建議布局方法、設(shè)備、存儲介質(zhì)和系統(tǒng)等多種保護(hù)主題,以全面保護(hù);另外,方法權(quán)利要求盡可能限定由單一主體實施,在同一權(quán)利要求中不要將訓(xùn)練階段和執(zhí)行階段混為一談,因為這兩個過程通常是由不同主體實施的。
?
2. AIGC產(chǎn)品的著作權(quán)保護(hù)
?
首先,開發(fā)者應(yīng)當(dāng)重視計算機(jī)軟件的著作權(quán)保護(hù)問題。AIGC產(chǎn)品的權(quán)重和參數(shù)等通過編碼生成,受計算機(jī)軟件著作權(quán)保護(hù)。當(dāng)前,AIGC產(chǎn)品的開發(fā)過程中往往會對已經(jīng)相對成熟的AIGC產(chǎn)品進(jìn)行不同程度的借鑒,可能涉及到模型結(jié)構(gòu)、算法優(yōu)化、訓(xùn)練方式等多個層面。故此,AIGC企業(yè)在開發(fā)過程中需要對潛在的著作權(quán)侵權(quán)風(fēng)險保持足夠的警惕。在具體操作過程中,如果開發(fā)團(tuán)隊在研發(fā)過程中對他人的專有軟件進(jìn)行借鑒,則必須盡量避免采用逆向工程、反編譯等往往易觸發(fā)軟件著作權(quán)侵權(quán)風(fēng)險的源碼溯源措施。同時,開發(fā)團(tuán)隊還需要嚴(yán)格遵守相關(guān)產(chǎn)品的許可使用限制。以O(shè)penAI的ChatGPT產(chǎn)品為例,其使用條款中明確禁止任何人利用其產(chǎn)品生成的內(nèi)容開發(fā)競品,或者通過任何自動化或編程方式爬取其數(shù)據(jù)。對于利用開源軟件的開發(fā)團(tuán)隊,雖然開源社區(qū)的開放性為AIGC產(chǎn)品的快速研發(fā)提供了便利,但團(tuán)隊也需要對開源軟件的許可協(xié)議有所了解,以確保合規(guī)使用。對開源許可協(xié)議的理解和尊重,將在下文中進(jìn)行深入討論。總的來說,AIGC產(chǎn)品的研發(fā)過程涉及多個環(huán)節(jié)和層面,對于著作權(quán)保護(hù)的理解和遵守,不僅需要在技術(shù)層面有所保障,還需要在內(nèi)控措施層面有所制度化,形成全方位的保護(hù)機(jī)制。
?
其次,要充分考慮現(xiàn)有法律對作品使用的限制。AIGC在訓(xùn)練中需要大量使用各種數(shù)據(jù)物料,進(jìn)行充分的文本與數(shù)據(jù)挖掘(Text Data Mining,下稱“TDM"),其中不乏享有著作權(quán)保護(hù)的作品。目前,世界主要國家對TDM都規(guī)定了不同的版權(quán)例外規(guī)則。從鼓勵產(chǎn)業(yè)發(fā)展的角度以及從現(xiàn)有境外立法而言,以“合理使用"的角度去豁免TDM無疑是當(dāng)下的趨勢。但從我國現(xiàn)有立法和法律實踐上看,以“合理使用"來對TDM進(jìn)行合理合法性論證存在諸多問題,無法自圓其說。故TDM的突破仍有賴于立法者對現(xiàn)有法律的進(jìn)一步解釋或?qū)Ψ傻母?。對于AIGC從業(yè)者而言,在產(chǎn)品發(fā)布前,AIGC服務(wù)提供者應(yīng)細(xì)化有關(guān)的知識產(chǎn)權(quán)保護(hù)策略,至少從風(fēng)險防范和訴訟的角度去規(guī)劃自身的知識產(chǎn)權(quán)合規(guī)體系。例如,AIGC產(chǎn)品通常通過生成圖片、文字、視頻或音頻等為用戶提供服務(wù)。為避免生成內(nèi)容侵犯他人著作權(quán),我們建議提供者建立知識產(chǎn)權(quán)評估體系,對采集+訓(xùn)練+生成+服務(wù)的產(chǎn)業(yè)閉環(huán)進(jìn)行知識產(chǎn)權(quán)合規(guī)性評價。另外,我們建議企業(yè)可從侵權(quán)訴訟角度進(jìn)行合規(guī)分析,即在控制侵權(quán)風(fēng)險的情況下對生成結(jié)果進(jìn)行一定程度的干預(yù),確保生成物去風(fēng)格化、去特定情節(jié)以及去特定藝術(shù)特質(zhì)等。我們看到,一些成熟企業(yè)已設(shè)定了使用限制,例如禁止用戶將AIGC生成的內(nèi)容展示為人工制作作品,或在公開發(fā)布生成作品時,必須聲明AIGC產(chǎn)品的作用。這樣可以防止生成內(nèi)容被誤認(rèn)為人的“智力成果",一定程度上避免侵權(quán)糾紛。
?
3. AIGC產(chǎn)品的商業(yè)秘密保護(hù)
?
《反不正當(dāng)競爭法》將商業(yè)秘密定義為未公開、有商業(yè)價值并經(jīng)保密措施保護(hù)的技術(shù)或經(jīng)營信息。在生成式人工智能領(lǐng)域,優(yōu)秀的AIGC產(chǎn)品的核心技術(shù)、數(shù)據(jù)集、模型結(jié)構(gòu)等“know-how"至關(guān)重要。對于這些商業(yè)秘密的保護(hù),權(quán)利人必須證明已采取了嚴(yán)格有效的保密措施。我們建議所有AIGC企業(yè),特別是新設(shè)立的技術(shù)公司,制定并執(zhí)行嚴(yán)格有效的保密措施,包括設(shè)立保密制度、內(nèi)控流程、技術(shù)限制以及對核心員工的競業(yè)限制等,規(guī)范企業(yè)的商業(yè)秘密保護(hù)措施。
?
另外,AIGC技術(shù)和服務(wù)場景的交互性也為企業(yè)商業(yè)秘密保護(hù)帶來了新的課題,即AIGC服務(wù)提供者必須在提供服務(wù)時應(yīng)謹(jǐn)慎對待用戶的輸入內(nèi)容,不能一概而論地將用戶數(shù)據(jù)進(jìn)行收集并用于算法訓(xùn)練,而導(dǎo)致用戶商業(yè)秘密泄露。個別公司禁用ChatGPT事件中,正是由于其員工在使用ChatGPT過程中輸入了公司產(chǎn)品的機(jī)密信息,而導(dǎo)致商業(yè)秘密外泄。因此,若未來AIGC產(chǎn)品追求商業(yè)化的普及,則必須更好的回應(yīng)用戶對其商業(yè)秘密和技術(shù)秘密保護(hù)的需求。
?
二、開源合規(guī)應(yīng)對措施
?
?
開源生態(tài)已成為當(dāng)前人工智能領(lǐng)域的主流技術(shù)開發(fā)趨勢。2023年7月18日,Meta公司宣布其最新版本的LLAMA2模型將采用開源模式發(fā)布以鼓勵使用。ChatGPT-2及其之前的版本,也采用了開源模式。目前,我國的司法實踐對開源軟件的保護(hù)模式已有初步的判斷和認(rèn)識。根據(jù)(2019)粵73知民初207號案例對GPL3.0開源協(xié)議的判例,開源軟件與商業(yè)軟件的主要區(qū)別在于:開源軟件作者將全部著作財產(chǎn)權(quán)利讓渡給了使用者,開源軟件采用的是放棄著作權(quán)特定權(quán)利的形式進(jìn)行的軟件開發(fā)模式。盡管開源軟件作者將著作財產(chǎn)權(quán)利讓渡給了軟件使用者,但并不等同于沒有使用限制。
?
根據(jù)(2019)粵73知民初207號的判決,開源協(xié)議具有合同特性,權(quán)利人向不特定用戶授予一定權(quán)利,用戶對此作出承諾,形成法律關(guān)系。其授權(quán)邏輯是通過預(yù)先設(shè)定的格式化條款,確保開源代碼按照權(quán)利人預(yù)期的方式傳播和使用。因此,一旦授權(quán)人違反開源協(xié)議,一方面可能產(chǎn)生違約責(zé)任,另一方面因違反開源許可而導(dǎo)致授權(quán)被終止,產(chǎn)生侵權(quán)責(zé)任。在這種違約與侵權(quán)并存的情況下,權(quán)利人可以選擇救濟(jì)途徑。因此,我們建議AIGC服務(wù)提供者在利用生成式人工智能的開源生態(tài)進(jìn)行研發(fā)時,重點注意以下合規(guī)事項:
?
1. 審慎甄別開源許可類型
?
開源許可類型大體上可以分為強(qiáng)開源的“著佐權(quán)"(copyleft,是一個由自由軟件運(yùn)動所發(fā)展的概念,是一種利用現(xiàn)有著作權(quán)體制來保護(hù)所有用戶和二次開發(fā)者的自由的授權(quán)方式。)類,例如GPL、AGPL、LGPL,以及寬許可類(permissive)開源許可,例如MIT、Appache2.0、BSD等。在“著佐權(quán)"權(quán)類許可場景下,如AIGC產(chǎn)品研發(fā)過程中對其進(jìn)行結(jié)合、部分結(jié)合或衍生創(chuàng)作,將會引發(fā)傳染效應(yīng),即整個產(chǎn)品都必須按照同一許可證進(jìn)行開源發(fā)布。否則,該產(chǎn)品將被取消相關(guān)授權(quán),產(chǎn)生違約或侵權(quán)風(fēng)險。相比之下,寬許可類許可證對下游使用者的限制非常少,通常包括免責(zé)聲明、保護(hù)和尊重原作者的著作權(quán)、對衍生創(chuàng)作部分進(jìn)行顯著標(biāo)識等要求,但并不限制下游使用者進(jìn)行閉源商用。因此,我們建議在AIGC產(chǎn)品研發(fā)過程中,開發(fā)者應(yīng)優(yōu)先考慮使用寬許可類許可證下的模型或代碼,避免使用“著佐權(quán)"類開源許可證下的模型或代碼。若非要使用“著佐權(quán)"類開源許可證下的模型或代碼,應(yīng)通過技術(shù)與法律手段,結(jié)合特定開源許可證的特性(例如LGPL可以考慮采取動態(tài)庫鏈接的方式)來合理規(guī)避開源“傳染"風(fēng)險。對常見開源許可證的具體要求,為方便企業(yè)能夠跟直觀的理解,我們初步總結(jié)如下:
點擊可查看大圖
?
2. 注意區(qū)分應(yīng)對開源合規(guī)風(fēng)險
?
由于生成式人工智能產(chǎn)品的組成部分具有一定的獨立性,實踐中常常出現(xiàn)AIGC不同版本,或者單個AIGC產(chǎn)品的權(quán)重、參數(shù)等,分別對應(yīng)不同許可模式,或者不同開源許可證的情形。結(jié)合Github上的公開信息舉例說明,ChatGPT2.0為開源模式,其許可證為使用限制極少的MIT寬許可證[1],但ChatGPT3.0與4.0則為商用專有軟件,受其復(fù)雜的商用許可條件限制;ChatGLM-6B雖然總體處于開源許可證下,且其許可證為限制較少的Appache2.0寬許可證,但其模型參數(shù)卻受到額外的“MODEL_LICENSE"許可條件限制[2]。另外,Meta聲稱其最新版本的LLAMA2為開源模式,但其并未使用任何通行開源許可證進(jìn)行發(fā)布,而是自行制作了適用于該模型的“社區(qū)版使用許可"。在該許可中,Meta要求在LLAMA2發(fā)布時,所有活躍用戶超過700萬人的企業(yè)禁止按照“社區(qū)版使用許可"的條件使用LLAMA2,以達(dá)到限制競爭的目的。因此,我們建議AIGC開發(fā)者在開源生態(tài)中借鑒其他產(chǎn)品進(jìn)行開發(fā)時,要深入了解與適應(yīng)不同的開源許可證要求,注意區(qū)分不同產(chǎn)品、同一產(chǎn)品不同版本與不同部分所使用的具體許可類型及其開源許可范圍?;诖?,企業(yè)才能提前構(gòu)建完善的開源合規(guī)體系,有效防范潛在的知識產(chǎn)權(quán)風(fēng)險。在構(gòu)建內(nèi)部開源合規(guī)管理體系時,企業(yè)可以參考以下步驟和方向:
?
(1) 步驟一:源代碼識別。企業(yè)需要系統(tǒng)地識別和記錄所有使用開源代碼的來源和許可證類型。
?
(2) 步驟二:確定使用策略。在了解清楚每份代碼的許可證類型后,企業(yè)需要明確每種許可證下的代碼或軟件的使用方式,以及這些許可證對商業(yè)化模式的影響。同時,企業(yè)還需要研究許可證之間的兼容性,以防止許可證沖突。
?
(3) 步驟三:風(fēng)險應(yīng)對策略。企業(yè)需要特別關(guān)注開源侵權(quán)和違約風(fēng)險較高的商用模式,例如使用了GPL/AGPL許可證的軟件。對于這些模式,企業(yè)需要預(yù)先準(zhǔn)備應(yīng)對可能的侵權(quán)指控,并積極尋找和開發(fā)替代方案。
?
至于非標(biāo)準(zhǔn)加密類(non-standard cryptography)開源軟件的出口管制限制,鑒于目前尚未見到此類軟件在AIGC領(lǐng)域的具體應(yīng)用,故暫不贅述。
?
三、結(jié)語
?
?
在AIGC蓬勃發(fā)展并帶來新的機(jī)遇與挑戰(zhàn)時,在全世界都在構(gòu)建開源開放的AI創(chuàng)新生態(tài)和向善可信的科技治理體系時,我們愿以此AIGC合規(guī)系列文章做為契機(jī),拋磚引玉,為行業(yè)提供一些初步的合規(guī)思考和實踐參考。我們相信,無論是算法治理、隱私與數(shù)據(jù)、安全評估、科技倫理,還是開源體系、知識產(chǎn)權(quán),甚至資質(zhì)證照等,均是AIGC領(lǐng)域未來發(fā)展道路上所必須謹(jǐn)慎對待的合規(guī)課題。有鑒于此,對于那些志在AIGC賽道上努力奔跑且有長期目標(biāo)的企業(yè)而言,我們建議在積極擁抱監(jiān)管的同時,亦盡早部署并落實具有對應(yīng)性和前瞻性的法律合規(guī)體系,以期為實現(xiàn)健康、可持續(xù)的業(yè)務(wù)發(fā)展創(chuàng)造穩(wěn)固的法律“避風(fēng)港"。
?
[注]?