ARTICLES

專業(yè)文章

跨越AIGC合規(guī)上市之路（四）：知識產(chǎn)權(quán)合規(guī)篇

作者：蔡鵬張鵬胡云浪于麗君 2023-08-15 語音播報

《生成式人工智能服務(wù)管理暫行辦法》（以下簡稱《暫行辦法》）為AIGC服務(wù)的知識產(chǎn)權(quán)保護(hù)提供了明確指導(dǎo)。根據(jù)其第4和第7條，AIGC服務(wù)的提供與使用需尊重知識產(chǎn)權(quán)、遵守商業(yè)道德，保守商業(yè)秘密，不得利用算法、數(shù)據(jù)、平臺等優(yōu)勢實施壟斷和不正當(dāng)競爭行為；同時，AIGC服務(wù)提供者在進(jìn)行預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動時，如果涉及知識產(chǎn)權(quán)，則不能侵犯他人的知識產(chǎn)權(quán)。

當(dāng)前，AIGC服務(wù)從輸入數(shù)據(jù)的獲取及預(yù)處理，算法模型的構(gòu)建與訓(xùn)練，到生成內(nèi)容的輸出與優(yōu)化等各環(huán)節(jié)，均可能涉及專利、著作權(quán)、商業(yè)秘密等多種知識產(chǎn)權(quán)客體，屬于侵權(quán)糾紛高發(fā)區(qū)。例如，用于算法模型訓(xùn)練的輸入數(shù)據(jù)可能包含眾多受版權(quán)保護(hù)的作品、個人隱私數(shù)據(jù)或商業(yè)秘密；采用的算法模型可能實施了他人的專利技術(shù)；AIGC產(chǎn)品生成的文本和圖片可能與某些知名文學(xué)作品或繪畫構(gòu)成實質(zhì)性相似。此外，由于AIGC產(chǎn)品通常依賴開源生態(tài)，開源合規(guī)在AIGC產(chǎn)品開發(fā)過程中亦十分關(guān)鍵。本文將從知識產(chǎn)權(quán)保護(hù)的角度，為AIGC技術(shù)開發(fā)者建立知識產(chǎn)權(quán)保護(hù)和開源合規(guī)體系提供建議。

一、知識產(chǎn)權(quán)保護(hù)框架

AIGC產(chǎn)品在知識產(chǎn)權(quán)保護(hù)方面展現(xiàn)出其特殊和復(fù)雜的特征。一方面，由于其需要大規(guī)模的數(shù)據(jù)輸入、多元化的輸出結(jié)果以及算法黑盒問題，其在現(xiàn)行的知識產(chǎn)權(quán)保護(hù)框架下存在許多待解決的問題。另一方面，由開發(fā)者構(gòu)建的程序代碼、用戶反復(fù)塑造的指令以及AIGC產(chǎn)品本身的訓(xùn)練成熟度共同決定了AIGC產(chǎn)品產(chǎn)出的特定生成物，故而在確定侵權(quán)主體時可能存在一定的困難。因此在現(xiàn)有環(huán)境下，不同的角色存在不同的知識產(chǎn)權(quán)合規(guī)保護(hù)視角。如技術(shù)開發(fā)方會重視數(shù)據(jù)來源、技術(shù)許可、專利合規(guī)以及開源合規(guī)等問題，而技術(shù)使用方則會更加強(qiáng)調(diào)版權(quán)風(fēng)險、隱私風(fēng)險和競爭風(fēng)險等問題?？紤]到篇幅問題，本文主要從技術(shù)開發(fā)方的視角，結(jié)合我們的相關(guān)實踐經(jīng)驗，為有關(guān)企業(yè)提供知識產(chǎn)權(quán)的合規(guī)框架建議：

1. 算法專利保護(hù)

對于生成式人工智能涉及的算法的可專利性，業(yè)界存在爭論。根據(jù)《專利法》第二十五條，規(guī)則和方法的智力活動不能獲得專利。因此，算法作為一種數(shù)學(xué)運(yùn)算模型，可能被視為抽象運(yùn)算思維而不具備可專利性。在申請專利的過程中，AIGC服務(wù)提供者應(yīng)將算法與實際解決的技術(shù)問題相結(jié)合，體現(xiàn)算法步驟的執(zhí)行能夠采用具有自然規(guī)律的技術(shù)手段，解決具體技術(shù)領(lǐng)域的具體技術(shù)問題，并形成具體的技術(shù)效果，進(jìn)而在算法設(shè)計中將各個特征與參數(shù)與解決該具體技術(shù)問題的特征和參數(shù)緊密關(guān)聯(lián)，使之成為可專利的新發(fā)明。具體要求，企業(yè)可參考國家知識產(chǎn)權(quán)局發(fā)布的第343號公告。另外，在AIGC產(chǎn)品的研發(fā)過程中，應(yīng)避免使用他人已專利的工具進(jìn)行開發(fā)，以防止專利侵權(quán)糾紛。

此外，如上所述，算法專利的侵權(quán)訴訟中常常面臨侵權(quán)舉證難、侵權(quán)主體認(rèn)定難等困境。從降低權(quán)利人侵權(quán)舉證責(zé)任的角度考慮，算法專利在撰寫時應(yīng)盡量保證技術(shù)特征的可視化。例如，當(dāng)算法改進(jìn)在于模型時，優(yōu)先考慮布局模型應(yīng)用權(quán)項；當(dāng)算法改進(jìn)僅在于數(shù)據(jù)清洗、特征提取、數(shù)據(jù)采集、特殊場景轉(zhuǎn)用等，而不涉及模型本身的結(jié)構(gòu)或參數(shù)，可以將模型視作黑盒處理。此外，也可以考慮將專利與開源軟件相結(jié)合，即將算法對應(yīng)的代碼對外開源形成開源代碼，針對算法對應(yīng)的方法申請專利，在開源代碼與對應(yīng)的算法專利之間建立對應(yīng)關(guān)系，從而將專利侵權(quán)舉證轉(zhuǎn)化為開源軟件使用行為舉證，降低舉證難度。

從降低侵權(quán)主體認(rèn)定難度的角度考慮，算法專利在撰寫時建議布局方法、設(shè)備、存儲介質(zhì)和系統(tǒng)等多種保護(hù)主題，以全面保護(hù)；另外，方法權(quán)利要求盡可能限定由單一主體實施，在同一權(quán)利要求中不要將訓(xùn)練階段和執(zhí)行階段混為一談，因為這兩個過程通常是由不同主體實施的。

2. AIGC產(chǎn)品的著作權(quán)保護(hù)

首先，開發(fā)者應(yīng)當(dāng)重視計算機(jī)軟件的著作權(quán)保護(hù)問題。AIGC產(chǎn)品的權(quán)重和參數(shù)等通過編碼生成，受計算機(jī)軟件著作權(quán)保護(hù)。當(dāng)前，AIGC產(chǎn)品的開發(fā)過程中往往會對已經(jīng)相對成熟的AIGC產(chǎn)品進(jìn)行不同程度的借鑒，可能涉及到模型結(jié)構(gòu)、算法優(yōu)化、訓(xùn)練方式等多個層面。故此，AIGC企業(yè)在開發(fā)過程中需要對潛在的著作權(quán)侵權(quán)風(fēng)險保持足夠的警惕。在具體操作過程中，如果開發(fā)團(tuán)隊在研發(fā)過程中對他人的專有軟件進(jìn)行借鑒，則必須盡量避免采用逆向工程、反編譯等往往易觸發(fā)軟件著作權(quán)侵權(quán)風(fēng)險的源碼溯源措施。同時，開發(fā)團(tuán)隊還需要嚴(yán)格遵守相關(guān)產(chǎn)品的許可使用限制。以O(shè)penAI的ChatGPT產(chǎn)品為例，其使用條款中明確禁止任何人利用其產(chǎn)品生成的內(nèi)容開發(fā)競品，或者通過任何自動化或編程方式爬取其數(shù)據(jù)。對于利用開源軟件的開發(fā)團(tuán)隊，雖然開源社區(qū)的開放性為AIGC產(chǎn)品的快速研發(fā)提供了便利，但團(tuán)隊也需要對開源軟件的許可協(xié)議有所了解，以確保合規(guī)使用。對開源許可協(xié)議的理解和尊重，將在下文中進(jìn)行深入討論。總的來說，AIGC產(chǎn)品的研發(fā)過程涉及多個環(huán)節(jié)和層面，對于著作權(quán)保護(hù)的理解和遵守，不僅需要在技術(shù)層面有所保障，還需要在內(nèi)控措施層面有所制度化，形成全方位的保護(hù)機(jī)制。

其次，要充分考慮現(xiàn)有法律對作品使用的限制。AIGC在訓(xùn)練中需要大量使用各種數(shù)據(jù)物料，進(jìn)行充分的文本與數(shù)據(jù)挖掘（Text Data Mining，下稱“TDM"），其中不乏享有著作權(quán)保護(hù)的作品。目前，世界主要國家對TDM都規(guī)定了不同的版權(quán)例外規(guī)則。從鼓勵產(chǎn)業(yè)發(fā)展的角度以及從現(xiàn)有境外立法而言，以“合理使用"的角度去豁免TDM無疑是當(dāng)下的趨勢。但從我國現(xiàn)有立法和法律實踐上看，以“合理使用"來對TDM進(jìn)行合理合法性論證存在諸多問題，無法自圓其說。故TDM的突破仍有賴于立法者對現(xiàn)有法律的進(jìn)一步解釋或?qū)Ψ傻母?。對于AIGC從業(yè)者而言，在產(chǎn)品發(fā)布前，AIGC服務(wù)提供者應(yīng)細(xì)化有關(guān)的知識產(chǎn)權(quán)保護(hù)策略，至少從風(fēng)險防范和訴訟的角度去規(guī)劃自身的知識產(chǎn)權(quán)合規(guī)體系。例如，AIGC產(chǎn)品通常通過生成圖片、文字、視頻或音頻等為用戶提供服務(wù)。為避免生成內(nèi)容侵犯他人著作權(quán)，我們建議提供者建立知識產(chǎn)權(quán)評估體系，對采集+訓(xùn)練+生成+服務(wù)的產(chǎn)業(yè)閉環(huán)進(jìn)行知識產(chǎn)權(quán)合規(guī)性評價。另外，我們建議企業(yè)可從侵權(quán)訴訟角度進(jìn)行合規(guī)分析，即在控制侵權(quán)風(fēng)險的情況下對生成結(jié)果進(jìn)行一定程度的干預(yù)，確保生成物去風(fēng)格化、去特定情節(jié)以及去特定藝術(shù)特質(zhì)等。我們看到，一些成熟企業(yè)已設(shè)定了使用限制，例如禁止用戶將AIGC生成的內(nèi)容展示為人工制作作品，或在公開發(fā)布生成作品時，必須聲明AIGC產(chǎn)品的作用。這樣可以防止生成內(nèi)容被誤認(rèn)為人的“智力成果"，一定程度上避免侵權(quán)糾紛。

3. AIGC產(chǎn)品的商業(yè)秘密保護(hù)

《反不正當(dāng)競爭法》將商業(yè)秘密定義為未公開、有商業(yè)價值并經(jīng)保密措施保護(hù)的技術(shù)或經(jīng)營信息。在生成式人工智能領(lǐng)域，優(yōu)秀的AIGC產(chǎn)品的核心技術(shù)、數(shù)據(jù)集、模型結(jié)構(gòu)等“know-how"至關(guān)重要。對于這些商業(yè)秘密的保護(hù)，權(quán)利人必須證明已采取了嚴(yán)格有效的保密措施。我們建議所有AIGC企業(yè)，特別是新設(shè)立的技術(shù)公司，制定并執(zhí)行嚴(yán)格有效的保密措施，包括設(shè)立保密制度、內(nèi)控流程、技術(shù)限制以及對核心員工的競業(yè)限制等，規(guī)范企業(yè)的商業(yè)秘密保護(hù)措施。

另外，AIGC技術(shù)和服務(wù)場景的交互性也為企業(yè)商業(yè)秘密保護(hù)帶來了新的課題，即AIGC服務(wù)提供者必須在提供服務(wù)時應(yīng)謹(jǐn)慎對待用戶的輸入內(nèi)容，不能一概而論地將用戶數(shù)據(jù)進(jìn)行收集并用于算法訓(xùn)練，而導(dǎo)致用戶商業(yè)秘密泄露。個別公司禁用ChatGPT事件中，正是由于其員工在使用ChatGPT過程中輸入了公司產(chǎn)品的機(jī)密信息，而導(dǎo)致商業(yè)秘密外泄。因此，若未來AIGC產(chǎn)品追求商業(yè)化的普及，則必須更好的回應(yīng)用戶對其商業(yè)秘密和技術(shù)秘密保護(hù)的需求。

二、開源合規(guī)應(yīng)對措施

開源生態(tài)已成為當(dāng)前人工智能領(lǐng)域的主流技術(shù)開發(fā)趨勢。2023年7月18日，Meta公司宣布其最新版本的LLAMA2模型將采用開源模式發(fā)布以鼓勵使用。ChatGPT-2及其之前的版本，也采用了開源模式。目前，我國的司法實踐對開源軟件的保護(hù)模式已有初步的判斷和認(rèn)識。根據(jù)(2019)粵73知民初207號案例對GPL3.0開源協(xié)議的判例，開源軟件與商業(yè)軟件的主要區(qū)別在于：開源軟件作者將全部著作財產(chǎn)權(quán)利讓渡給了使用者，開源軟件采用的是放棄著作權(quán)特定權(quán)利的形式進(jìn)行的軟件開發(fā)模式。盡管開源軟件作者將著作財產(chǎn)權(quán)利讓渡給了軟件使用者，但并不等同于沒有使用限制。

根據(jù)(2019)粵73知民初207號的判決，開源協(xié)議具有合同特性，權(quán)利人向不特定用戶授予一定權(quán)利，用戶對此作出承諾，形成法律關(guān)系。其授權(quán)邏輯是通過預(yù)先設(shè)定的格式化條款，確保開源代碼按照權(quán)利人預(yù)期的方式傳播和使用。因此，一旦授權(quán)人違反開源協(xié)議，一方面可能產(chǎn)生違約責(zé)任，另一方面因違反開源許可而導(dǎo)致授權(quán)被終止，產(chǎn)生侵權(quán)責(zé)任。在這種違約與侵權(quán)并存的情況下，權(quán)利人可以選擇救濟(jì)途徑。因此，我們建議AIGC服務(wù)提供者在利用生成式人工智能的開源生態(tài)進(jìn)行研發(fā)時，重點注意以下合規(guī)事項：

1. 審慎甄別開源許可類型

開源許可類型大體上可以分為強(qiáng)開源的“著佐權(quán)"（copyleft，是一個由自由軟件運(yùn)動所發(fā)展的概念，是一種利用現(xiàn)有著作權(quán)體制來保護(hù)所有用戶和二次開發(fā)者的自由的授權(quán)方式。）類，例如GPL、AGPL、LGPL，以及寬許可類（permissive）開源許可，例如MIT、Appache2.0、BSD等。在“著佐權(quán)"權(quán)類許可場景下，如AIGC產(chǎn)品研發(fā)過程中對其進(jìn)行結(jié)合、部分結(jié)合或衍生創(chuàng)作，將會引發(fā)傳染效應(yīng)，即整個產(chǎn)品都必須按照同一許可證進(jìn)行開源發(fā)布。否則，該產(chǎn)品將被取消相關(guān)授權(quán)，產(chǎn)生違約或侵權(quán)風(fēng)險。相比之下，寬許可類許可證對下游使用者的限制非常少，通常包括免責(zé)聲明、保護(hù)和尊重原作者的著作權(quán)、對衍生創(chuàng)作部分進(jìn)行顯著標(biāo)識等要求，但并不限制下游使用者進(jìn)行閉源商用。因此，我們建議在AIGC產(chǎn)品研發(fā)過程中，開發(fā)者應(yīng)優(yōu)先考慮使用寬許可類許可證下的模型或代碼，避免使用“著佐權(quán)"類開源許可證下的模型或代碼。若非要使用“著佐權(quán)"類開源許可證下的模型或代碼，應(yīng)通過技術(shù)與法律手段，結(jié)合特定開源許可證的特性（例如LGPL可以考慮采取動態(tài)庫鏈接的方式）來合理規(guī)避開源“傳染"風(fēng)險。對常見開源許可證的具體要求，為方便企業(yè)能夠跟直觀的理解，我們初步總結(jié)如下：

點擊可查看大圖

2. 注意區(qū)分應(yīng)對開源合規(guī)風(fēng)險

由于生成式人工智能產(chǎn)品的組成部分具有一定的獨立性，實踐中常常出現(xiàn)AIGC不同版本，或者單個AIGC產(chǎn)品的權(quán)重、參數(shù)等，分別對應(yīng)不同許可模式，或者不同開源許可證的情形。結(jié)合Github上的公開信息舉例說明，ChatGPT2.0為開源模式，其許可證為使用限制極少的MIT寬許可證[1]，但ChatGPT3.0與4.0則為商用專有軟件，受其復(fù)雜的商用許可條件限制；ChatGLM-6B雖然總體處于開源許可證下，且其許可證為限制較少的Appache2.0寬許可證，但其模型參數(shù)卻受到額外的“MODEL_LICENSE"許可條件限制[2]。另外，Meta聲稱其最新版本的LLAMA2為開源模式，但其并未使用任何通行開源許可證進(jìn)行發(fā)布，而是自行制作了適用于該模型的“社區(qū)版使用許可"。在該許可中，Meta要求在LLAMA2發(fā)布時，所有活躍用戶超過700萬人的企業(yè)禁止按照“社區(qū)版使用許可"的條件使用LLAMA2，以達(dá)到限制競爭的目的。因此，我們建議AIGC開發(fā)者在開源生態(tài)中借鑒其他產(chǎn)品進(jìn)行開發(fā)時，要深入了解與適應(yīng)不同的開源許可證要求，注意區(qū)分不同產(chǎn)品、同一產(chǎn)品不同版本與不同部分所使用的具體許可類型及其開源許可范圍?；诖?，企業(yè)才能提前構(gòu)建完善的開源合規(guī)體系，有效防范潛在的知識產(chǎn)權(quán)風(fēng)險。在構(gòu)建內(nèi)部開源合規(guī)管理體系時，企業(yè)可以參考以下步驟和方向：

(1) 步驟一：源代碼識別。企業(yè)需要系統(tǒng)地識別和記錄所有使用開源代碼的來源和許可證類型。

(2) 步驟二：確定使用策略。在了解清楚每份代碼的許可證類型后，企業(yè)需要明確每種許可證下的代碼或軟件的使用方式，以及這些許可證對商業(yè)化模式的影響。同時，企業(yè)還需要研究許可證之間的兼容性，以防止許可證沖突。

(3) 步驟三：風(fēng)險應(yīng)對策略。企業(yè)需要特別關(guān)注開源侵權(quán)和違約風(fēng)險較高的商用模式，例如使用了GPL/AGPL許可證的軟件。對于這些模式，企業(yè)需要預(yù)先準(zhǔn)備應(yīng)對可能的侵權(quán)指控，并積極尋找和開發(fā)替代方案。

至于非標(biāo)準(zhǔn)加密類（non-standard cryptography）開源軟件的出口管制限制，鑒于目前尚未見到此類軟件在AIGC領(lǐng)域的具體應(yīng)用，故暫不贅述。

三、結(jié)語

在AIGC蓬勃發(fā)展并帶來新的機(jī)遇與挑戰(zhàn)時，在全世界都在構(gòu)建開源開放的AI創(chuàng)新生態(tài)和向善可信的科技治理體系時，我們愿以此AIGC合規(guī)系列文章做為契機(jī)，拋磚引玉，為行業(yè)提供一些初步的合規(guī)思考和實踐參考。我們相信，無論是算法治理、隱私與數(shù)據(jù)、安全評估、科技倫理，還是開源體系、知識產(chǎn)權(quán)，甚至資質(zhì)證照等，均是AIGC領(lǐng)域未來發(fā)展道路上所必須謹(jǐn)慎對待的合規(guī)課題。有鑒于此，對于那些志在AIGC賽道上努力奔跑且有長期目標(biāo)的企業(yè)而言，我們建議在積極擁抱監(jiān)管的同時，亦盡早部署并落實具有對應(yīng)性和前瞻性的法律合規(guī)體系，以期為實現(xiàn)健康、可持續(xù)的業(yè)務(wù)發(fā)展創(chuàng)造穩(wěn)固的法律“避風(fēng)港"。

[注]?

[1] 參見https://github.com/openai/gpt-2

[2] 參見https://github.com/THUDM/ChatGLM-6B

上一篇：醫(yī)療行業(yè)商業(yè)賄賂問題初探下一篇：工程總承包模式下的風(fēng)險負(fù)擔(dān)

打印中倫文章

国产无码AV,精品人妻无码一区二区三区淑枝,精品人妻少妇嫩草AV无码专区,久久久无码人妻精品无码

法律報告 >

《資本博弈：對賭、回購與投資人特殊權(quán)利的爭議與演進(jìn)》

出版物 >

【中倫三十周年系列文集】

月度精選 >

中倫深度觀察2024年10月

專業(yè)文章

最新交易

中倫助力腦動極光在香港聯(lián)交所主板上市

中倫助力粒影生物完成近億元A輪融資

最新動態(tài)

最新榮譽(yù)

ARTICLES

跨越AIGC合規(guī)上市之路（四）：知識產(chǎn)權(quán)合規(guī)篇