狠狠色噜噜狠狠狠777米奇_无码超乳爆乳中文字幕_免费无码午夜福利片69_五十路六十路老熟女a片_国产一区二区三区在线播放不卡_1024国产手机在线_中文资源库官网_免费成人黄漫画网页入口_人妻成人动漫av

數(shù)據(jù)行業(yè)

《加州生成式人工智能訓(xùn)練數(shù)據(jù)透明度法案》(AB 2013)

2026-04-13 來(lái)源:網(wǎng)絡(luò)轉(zhuǎn)載 瀏覽:266

  《加州生成式人工智能訓(xùn)練數(shù)據(jù)透明度法案》(AB 2013)是美國(guó)首部專門(mén)針對(duì)生成式人工智能訓(xùn)練數(shù)據(jù)進(jìn)行透明度監(jiān)管的法律。它已于2024年9月28日由州長(zhǎng)簽署成為法律,并將于2026年1月1日正式生效。

  這項(xiàng)法案的核心,是為生成式AI系統(tǒng)的"黑箱"問(wèn)題引入一束光,通過(guò)強(qiáng)制披露訓(xùn)練數(shù)據(jù)的來(lái)源和構(gòu)成,賦予公眾、消費(fèi)者和創(chuàng)作者前所未有的知情權(quán)。

  一、核心內(nèi)容:強(qiáng)制披露訓(xùn)練數(shù)據(jù)

  AB 2013的核心義務(wù)非常簡(jiǎn)單直接:要求相關(guān)AI開(kāi)發(fā)者在其網(wǎng)站上公開(kāi)其訓(xùn)練數(shù)據(jù)的"高層級(jí)摘要"(high-level summary)。

  (一)適用對(duì)象(誰(shuí)是"開(kāi)發(fā)者"?):法案對(duì)"開(kāi)發(fā)者"的定義非常廣泛,不僅包括從零開(kāi)始設(shè)計(jì)、編碼、生產(chǎn)AI系統(tǒng)的實(shí)體,也包括那些對(duì)現(xiàn)有生成式AI系統(tǒng)進(jìn)行"實(shí)質(zhì)性修改"(substantially modifies)的個(gè)人或組織。這里的"實(shí)質(zhì)性修改"指通過(guò)重新訓(xùn)練或微調(diào)等方式,顯著改變系統(tǒng)功能或性能的新版本或更新。

  (二)適用系統(tǒng):法案適用于所有在2022年1月1日當(dāng)天及之后首次發(fā)布或經(jīng)過(guò)實(shí)質(zhì)性修改,并向加州公眾(無(wú)論免費(fèi)或付費(fèi))提供的生成式AI系統(tǒng)或服務(wù)。

  (三)披露什么?:開(kāi)發(fā)者必須在系統(tǒng)發(fā)布或重大更新前,在其網(wǎng)站上公布文檔,詳細(xì)說(shuō)明訓(xùn)練數(shù)據(jù)。這份"高層級(jí)摘要"必須至少包含以下12項(xiàng)信息:

  1、數(shù)據(jù)來(lái)源/所有者:數(shù)據(jù)集的來(lái)源方或所有者是誰(shuí)。

  2、目的相關(guān)性:數(shù)據(jù)集如何服務(wù)于AI系統(tǒng)的預(yù)期目的。

  3、數(shù)據(jù)量級(jí):數(shù)據(jù)集包含的數(shù)據(jù)點(diǎn)數(shù)量(可用大致范圍或動(dòng)態(tài)數(shù)據(jù)的估算值表示)。

  4、數(shù)據(jù)類型:數(shù)據(jù)點(diǎn)的類型描述(如使用的標(biāo)簽類型或未標(biāo)注數(shù)據(jù)的一般特征)。

  5、知識(shí)產(chǎn)權(quán)狀態(tài):數(shù)據(jù)集是否包含受版權(quán)、商標(biāo)或?qū)@Wo(hù)的數(shù)據(jù),或是否完全屬于公共領(lǐng)域。

  6、獲取方式:數(shù)據(jù)集是否為開(kāi)發(fā)者購(gòu)買或獲得授權(quán)。

  7、個(gè)人信息:數(shù)據(jù)集是否包含《加州消費(fèi)者隱私法案》(CCPA)中定義的"個(gè)人信息"。

  8、聚合信息:數(shù)據(jù)集是否包含"聚合消費(fèi)者信息"。

  9、數(shù)據(jù)修改:開(kāi)發(fā)者是否對(duì)數(shù)據(jù)集進(jìn)行過(guò)清理、處理或其他修改,以及這些工作的目的。

  10、收集時(shí)間:數(shù)據(jù)集中數(shù)據(jù)的收集時(shí)間段,并說(shuō)明數(shù)據(jù)收集是否仍在進(jìn)行。

  11、首次使用時(shí)間:數(shù)據(jù)集在AI系統(tǒng)開(kāi)發(fā)過(guò)程中首次使用的具體日期。

  12、合成數(shù)據(jù)使用:AI系統(tǒng)的開(kāi)發(fā)是否使用或持續(xù)使用"合成數(shù)據(jù)生成"技術(shù)。

  (四)豁免情形:以下三類系統(tǒng)可以免于遵守該法案:

  唯一目的是確保安全和完整性的系統(tǒng)(如網(wǎng)絡(luò)安全防御)。

  唯一目的是操作國(guó)家空域中飛機(jī)的系統(tǒng)。

  為國(guó)家安全、軍事或國(guó)防目的開(kāi)發(fā),且僅提供給聯(lián)邦實(shí)體使用的系統(tǒng)。

  二、具體要求:12項(xiàng)披露內(nèi)容

  法案明確規(guī)定了其必須包含的12項(xiàng)具體內(nèi)容,詳細(xì)列明如下:

  (一)數(shù)據(jù)集的來(lái)源或所有者,明確指出訓(xùn)練所使用的數(shù)據(jù)集來(lái)自哪里,或歸誰(shuí)所有。

  (二)數(shù)據(jù)集如何服務(wù)于AI系統(tǒng)的預(yù)期目的描述,所使用的數(shù)據(jù)集與系統(tǒng) intended purpose 之間的關(guān)聯(lián)性。

  (三)數(shù)據(jù)集包含的數(shù)據(jù)點(diǎn)數(shù)量可以用大致范圍表示,如果是動(dòng)態(tài)數(shù)據(jù)集,則提供估算數(shù)字。

  (四)數(shù)據(jù)集中數(shù)據(jù)點(diǎn)類型的描述,對(duì)于有標(biāo)簽的數(shù)據(jù)集,說(shuō)明標(biāo)簽的類型;對(duì)于無(wú)標(biāo)簽的數(shù)據(jù)集,說(shuō)明其一般特征。

  (五)數(shù)據(jù)集的知識(shí)產(chǎn)權(quán)狀態(tài),明數(shù)據(jù)集是否包含受版權(quán)、商標(biāo)或?qū)@Wo(hù)的數(shù)據(jù),或者是否完全屬于公共領(lǐng)域。

  (六)數(shù)據(jù)集是否由開(kāi)發(fā)者購(gòu)買或獲得授權(quán),披露訓(xùn)練數(shù)據(jù)的獲取方式是否涉及購(gòu)買或授權(quán)。

  (七)數(shù)據(jù)集是否包含"個(gè)人信息",此處"個(gè)人信息"的定義與《加州消費(fèi)者隱私法案》(CCPA)中的定義一致。

  (八)數(shù)據(jù)集是否包含"聚合消費(fèi)者信息" ,同樣遵循CCPA中的定義。

  (九)開(kāi)發(fā)者對(duì)數(shù)據(jù)集的修改情況,說(shuō)明是否對(duì)數(shù)據(jù)集進(jìn)行過(guò)清理、處理或其他修改,并闡述這些工作的目的。

  (十)數(shù)據(jù)收集的時(shí)間段,說(shuō)明數(shù)據(jù)集中數(shù)據(jù)的收集時(shí)間跨度,如果數(shù)據(jù)收集仍在進(jìn)行中,也需注明。

  (十一)數(shù)據(jù)集首次使用的時(shí)間,披露在AI系統(tǒng)開(kāi)發(fā)過(guò)程中,首次使用該數(shù)據(jù)集的具體日期。

  (十二)是否使用或持續(xù)使用合成數(shù)據(jù),說(shuō)明AI系統(tǒng)的開(kāi)發(fā)是否使用了"合成數(shù)據(jù)生成"技術(shù)。

  三、重點(diǎn)關(guān)注:法律的不確定性與潛在挑戰(zhàn)

  盡管AB 2013的意圖明確,但其法律文本中存在一些模糊地帶,成為業(yè)界和法律界關(guān)注的焦點(diǎn):

  (一)"高層級(jí)摘要"的尺度:這是最大的爭(zhēng)議點(diǎn)。開(kāi)發(fā)者究竟需要披露多詳細(xì)的信息?是一份籠統(tǒng)的匯總,還是需要細(xì)化到每個(gè)數(shù)據(jù)集的層面?例如,是僅僅列出"我們從某個(gè)數(shù)據(jù)經(jīng)紀(jì)商那里購(gòu)買了數(shù)據(jù)",還是需要說(shuō)明從該經(jīng)紀(jì)商處獲得了哪些具體類型的數(shù)據(jù)?這個(gè)尺度將直接決定法案的效力。

  (二)商業(yè)秘密與知識(shí)產(chǎn)權(quán)的沖突:法案沒(méi)有為商業(yè)秘密提供明確的豁免。訓(xùn)練數(shù)據(jù)的構(gòu)成、來(lái)源和清洗方式,往往是AI公司的核心商業(yè)機(jī)密。強(qiáng)制披露可能導(dǎo)致這些機(jī)密外泄,削弱公司的競(jìng)爭(zhēng)優(yōu)勢(shì)。知名AI公司xAI已于2025年底提起訴訟,主張?jiān)摲ò高`反了憲法第五修正案的"征收條款"和第一修正案,正是這一沖突的集中體現(xiàn)。

  (三)"實(shí)質(zhì)性修改"的門(mén)檻:什么是"實(shí)質(zhì)性修改"?法案定義仍不夠清晰。對(duì)于一個(gè)通過(guò)微調(diào)基礎(chǔ)模型來(lái)提供特定服務(wù)(如客服機(jī)器人)的公司,其修改行為是否達(dá)到了需要遵守AB 2013的程度,有待進(jìn)一步澄清。

  (四)執(zhí)行機(jī)制:法案本身未指定執(zhí)行機(jī)構(gòu)或處罰措施-1-3。但立法分析指出,它很可能通過(guò)加州的《反不正當(dāng)競(jìng)爭(zhēng)法》來(lái)執(zhí)行,這意味著州檢察長(zhǎng)可以提起訴訟,并且可能賦予了私人訴訟的權(quán)利-2-10。這讓企業(yè)面臨潛在的訴訟風(fēng)險(xiǎn)。

  四、立法背后:重點(diǎn)保護(hù)的四大價(jià)值

  AB 2013的出臺(tái),反映了加州立法者在推動(dòng)AI發(fā)展中尋求平衡的深層考量,其核心保護(hù)價(jià)值體現(xiàn)在四個(gè)方面:

  (一)消費(fèi)者知情權(quán)與選擇權(quán):這是最直接的立法目的。法案發(fā)起人表示,旨在讓消費(fèi)者能夠"更好地評(píng)估他們是否對(duì)某個(gè)AI系統(tǒng)或服務(wù)有信心,并在不同的競(jìng)爭(zhēng)系統(tǒng)和服務(wù)之間進(jìn)行比較"。通過(guò)了解訓(xùn)練數(shù)據(jù)的來(lái)源和質(zhì)量,用戶可以判斷一個(gè)AI模型是否可能存在偏見(jiàn)、是否可靠,從而做出更明智的選擇。

  (二)知識(shí)產(chǎn)權(quán)保護(hù):大量AI模型的訓(xùn)練數(shù)據(jù)中包含了受版權(quán)、商標(biāo)等保護(hù)的作品。法案要求開(kāi)發(fā)者明確披露訓(xùn)練數(shù)據(jù)中是否包含受保護(hù)的知識(shí)產(chǎn)權(quán)。這為版權(quán)所有者(如藝術(shù)家、作家、軟件開(kāi)發(fā)者)提供了關(guān)鍵信息,讓他們能夠了解自己的作品是否被用于訓(xùn)練AI,并據(jù)此評(píng)估自身權(quán)利是否受到侵害,為潛在的維權(quán)行動(dòng)提供了基礎(chǔ)。

  (三)個(gè)人隱私保護(hù):通過(guò)要求開(kāi)發(fā)者聲明訓(xùn)練數(shù)據(jù)中是否包含CCPA定義的"個(gè)人信息"或"聚合消費(fèi)者信息",法案將AI訓(xùn)練與既有的消費(fèi)者隱私保護(hù)框架聯(lián)系起來(lái)。這使得隱私權(quán)倡導(dǎo)者和監(jiān)管機(jī)構(gòu)能夠監(jiān)督,AI公司是否在未經(jīng)授權(quán)的情況下,使用個(gè)人數(shù)據(jù)訓(xùn)練模型。

  (四)促進(jìn)負(fù)責(zé)任的創(chuàng)新:雖然增加了合規(guī)成本,但法案的根本目標(biāo)并非阻礙創(chuàng)新。通過(guò)提高透明度,立法者希望建立一個(gè)更具信任度的AI發(fā)展環(huán)境。當(dāng)公眾對(duì)AI的工作原理有更清晰的認(rèn)識(shí)時(shí),可能會(huì)更愿意接受和使用它。同時(shí),透明度也能促使開(kāi)發(fā)者更審慎地選擇訓(xùn)練數(shù)據(jù),從源頭減少偏見(jiàn)、歧視等問(wèn)題的產(chǎn)生,推動(dòng)AI向更公平、更可靠的方向發(fā)展。

  五、法案原文獲取

  您可以訪問(wèn)加州立法信息官方網(wǎng)站查閱AB 2013的最終章節(jié)版法案全文:官方鏈接:https://leginfo.legislature.ca.gov/faces/billNavClient.xhtml?bill_id=202320240AB2013

  在該頁(yè)面選擇 "10/07/24 - Enrolled" 或 "09/28/24 - Chaptered" 版本,即為最終通過(guò)的法律文本。

  AB 2013代表了AI監(jiān)管從結(jié)果導(dǎo)向到過(guò)程透明的重要轉(zhuǎn)變。它像是給每個(gè)AI模型建立了一份"成分表",雖然目前還存在一些爭(zhēng)議和不確定性,但其揭示的趨勢(shì)非常明確:透明度將成為未來(lái)可信AI的基石。

免責(zé)聲明:本網(wǎng)部分文章和信息來(lái)源于互聯(lián)網(wǎng),轉(zhuǎn)載出于傳遞更多信息和學(xué)習(xí)之目的。如轉(zhuǎn)載稿涉及版權(quán)等問(wèn)題,請(qǐng)立即聯(lián)系我們,我們會(huì)予以更改或刪除相關(guān)文章,保證您的權(quán)利。

留言咨詢

北京市東城區(qū)永定門(mén)外大街64號(hào)金隅龍順成文化創(chuàng)意產(chǎn)業(yè)園501B

電話:13911525319、010-67231399

E-mail:[email protected]

Copyright 2020 北京知寰律師事務(wù)所 網(wǎng)站備案號(hào):京ICP備20007375號(hào)-1 技術(shù)支持:律品科技

139-1152-5319