算法治理第一關(guān):算法備案監(jiān)管現(xiàn)狀與實(shí)務(wù)解讀(下)
【前言】
隨著算法備案逐步進(jìn)入合規(guī)視野,許多企業(yè)都面臨著算法備案的合規(guī)需求。但實(shí)際上大量企業(yè)尚未著手準(zhǔn)備算法備案的相關(guān)程序,一方面是由于關(guān)于算法備案的合規(guī)義務(wù)仍未普及,一部分企業(yè)對(duì)于算法備案的認(rèn)識(shí)存在不足或偏差,另一方面,企業(yè)對(duì)于算法備案的具體流程難以把控。本文上篇主要解讀了算法備案的整體監(jiān)管狀況、實(shí)務(wù)流程,下篇?jiǎng)t針對(duì)“具有輿論屬性或者社會(huì)動(dòng)員能力”展開(kāi)分析與探討,從實(shí)踐視角展開(kāi),以算法備案為抓手,通過(guò)對(duì)算法備案現(xiàn)狀進(jìn)行分析、統(tǒng)計(jì),以期為企業(yè)提供算法備案的合規(guī)參考與實(shí)務(wù)幫助。
目前,對(duì)于算法備案義務(wù)作出明確規(guī)定的規(guī)范性文件主要有《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》(以下簡(jiǎn)稱《算法推薦規(guī)定》)、《互聯(lián)網(wǎng)信息服務(wù)深度合成管理規(guī)定》(以下簡(jiǎn)稱《深度合成規(guī)定》)、以及《生成式人工智能服務(wù)管理暫行辦法》(以下簡(jiǎn)稱《暫行辦法》),算法備案的義務(wù)主體范圍則界定為“具有輿論屬性或者社會(huì)動(dòng)員能力的算法推薦服務(wù)/深度合成服務(wù)提供者”。
主體范圍:
“具有輿論屬性或者社會(huì)動(dòng)員能力”關(guān)注誰(shuí)?
這一表述容易使人產(chǎn)生誤解之處在于,“具有輿論屬性或者社會(huì)動(dòng)員能力”究竟形容“算法服務(wù)”還是“算法服務(wù)提供者”?
最新出臺(tái)的《暫行辦法》對(duì)這一問(wèn)題作出了相對(duì)確切的解答。不同于《生成式人工智能服務(wù)管理辦法(征求意見(jiàn)稿)》中只是要求“利用生成式人工智能產(chǎn)品向公眾提供服務(wù)”的提供者按照相關(guān)條款履行算法備案義務(wù)。《暫行辦法》進(jìn)一步明確履行算法備案義務(wù)的主體為“提供具有輿論屬性或者社會(huì)動(dòng)員能力的生成式人工智能服務(wù)的”提供者,也就是說(shuō),“具有輿論屬性或者社會(huì)動(dòng)員能力”應(yīng)指向算法服務(wù),而非提供算法服務(wù)的主體。這將在很大程度上為企業(yè)減負(fù),緩解算法備案的壓力。
主體特征:
何為“具有輿論屬性或者社會(huì)動(dòng)員能力”?
(一)現(xiàn)行規(guī)范的模糊性
企業(yè)主要填寫的內(nèi)容包括主體基本信息、證件
在算法備案的主體方面,更重要的問(wèn)題是如何理解“具有輿論屬性或者社會(huì)動(dòng)員能力”?“具有輿論屬性或者社會(huì)動(dòng)員能力”是判定相關(guān)主體所提供的算法服務(wù)是否需要履行算法備案義務(wù)的一個(gè)關(guān)鍵性因素,但其確切含義始終含糊不清。
《算法推薦規(guī)定》《深度合成規(guī)定》均未對(duì)此有所界定,2018年11月30日施行的《具有輿論屬性或社會(huì)動(dòng)員能力的互聯(lián)網(wǎng)信息服務(wù)安全評(píng)估規(guī)定》第二條則規(guī)定,“具有輿論屬性或社會(huì)動(dòng)員能力”的互聯(lián)網(wǎng)信息服務(wù)包括以下情形:
(一)開(kāi)辦論壇、博客、微博客、聊天室、通訊群組、公眾賬號(hào)、短視頻、網(wǎng)絡(luò)直播、信息分享、小程序等信息服務(wù)或者附設(shè)相應(yīng)功能;
(二)開(kāi)辦提供公眾輿論表達(dá)渠道或者具有發(fā)動(dòng)社會(huì)公眾從事特定活動(dòng)能力的其他互聯(lián)網(wǎng)信息服務(wù)。
由于法律規(guī)范存在較大的可解釋空間,我們不妨把視角轉(zhuǎn)向算法備案實(shí)踐,對(duì)目前已經(jīng)完成算法備案的算法進(jìn)行統(tǒng)計(jì)分析,盡可能找出各算法類型的共通性,希望能夠?yàn)槊媾R算法備案問(wèn)題的企業(yè)提供幫助。
(二)算法備案實(shí)踐統(tǒng)計(jì)
1. 總體概況
對(duì)目前已完成備案的算法進(jìn)行數(shù)據(jù)統(tǒng)計(jì)后,我們認(rèn)為在算法備案中,“具有輿論屬性或者社會(huì)動(dòng)員能力”的認(rèn)定范圍極其廣泛,具體而言,如果企業(yè)提供的算法最終面向的服務(wù)對(duì)象為社會(huì)公眾,則該算法便會(huì)被認(rèn)定為“具有輿論屬性或者社會(huì)動(dòng)員能力”,企業(yè)需要承擔(dān)算法備案義務(wù)以滿足合規(guī)要求。針對(duì)算法備案中的個(gè)性化推送類、深度合成類等典型算法類型,我們根據(jù)算法備案現(xiàn)狀,從中抽象出各個(gè)類型算法的常見(jiàn)應(yīng)用、典型適用場(chǎng)景、常用技術(shù)、算法運(yùn)行邏輯等內(nèi)容,為企業(yè)提供參考。
目前,算法備案主要適用于算法推薦技術(shù)與深度合成技術(shù),其中,算法推薦技術(shù)已經(jīng)有四批、262個(gè)算法完成備案程序,深度合成技術(shù)則是在6月完成第一批、41個(gè)算法的備案程序。具體的數(shù)據(jù)統(tǒng)計(jì)如下表(表一、二)所示。
如圖一所示,針對(duì)算法推薦類服務(wù),我們統(tǒng)計(jì)了個(gè)性化推送類、檢索過(guò)濾類、排序精選類、以及調(diào)度決策類的數(shù)量與占比,在《深度合成規(guī)定》生效以后,生成合成類與深度合成類算法歸并,因此,生成合成類一并納入深度合成類算法進(jìn)行統(tǒng)計(jì)。
對(duì)于深度合成類算法,《深度合成規(guī)定》中則列舉了六種典型的深度合成技術(shù)類型:
? 篇章生成、文本風(fēng)格轉(zhuǎn)換、問(wèn)答對(duì)話等生成或者編輯文本內(nèi)容的技術(shù);
? 文本轉(zhuǎn)語(yǔ)音、語(yǔ)音轉(zhuǎn)換、語(yǔ)音屬性編輯等生成或者編輯語(yǔ)音內(nèi)容的技術(shù);
? 音樂(lè)生成、場(chǎng)景聲編輯等生成或者編輯非語(yǔ)音內(nèi)容的技術(shù);
? 人臉生成、人臉替換、人物屬性編輯、人臉操控、姿態(tài)操控等生成或者編輯圖像、視 頻內(nèi)容中生物特征的技術(shù);
? 圖像生成、圖像增強(qiáng)、圖像修復(fù)等生成或者編輯圖像、視頻內(nèi)容中非生物特征的技術(shù);
? 三維重建、數(shù)字仿真等生成或者編輯數(shù)字人物、虛擬場(chǎng)景的技術(shù)。
我們根據(jù)理解將已經(jīng)完成備案的深度合成類算法按上述六類進(jìn)行歸類統(tǒng)計(jì),如圖二所示。其中,有多個(gè)算法的生成結(jié)果包含文本、語(yǔ)音內(nèi)容、圖片等多種形式,占深度合成類算法總備案數(shù)的17%,此類包含多種形式的內(nèi)容生成、編輯技術(shù)的模型多應(yīng)用于智能客服場(chǎng)景、多視頻制作場(chǎng)景等。例如,在智能客服場(chǎng)景下,算法運(yùn)行的大模型能夠根據(jù)用戶咨詢內(nèi)容,生成文本或語(yǔ)音智能回答。
2. 個(gè)性化推送類算法
個(gè)性化推薦類算法的主要功能在于通過(guò)對(duì)用戶興趣和需求進(jìn)行分析和預(yù)測(cè),為用戶提供個(gè)性化的商品或服務(wù)推薦。在已完成備案的算法推薦服務(wù)類別中,合計(jì)136個(gè)算法均為個(gè)性化推送類,占比54%,如表三所示,本文將列舉十個(gè)涉及不同行業(yè)領(lǐng)域的典型示例以供參考。
通過(guò)對(duì)收集淘寶、美團(tuán)、微信等企業(yè)公示的算法備案信息進(jìn)行分析,此類算法的適用場(chǎng)景多為內(nèi)容推薦,基于用戶的歷史行為、用戶基礎(chǔ)信息、設(shè)備服務(wù)日志等相關(guān)數(shù)據(jù),通過(guò)內(nèi)容標(biāo)簽系統(tǒng)、用戶畫像系統(tǒng)、以及推薦引擎等系統(tǒng),使用召回、過(guò)濾、排序等一系列的技術(shù)手段,最終為用戶提供其可能感興趣的信息。
3. 檢索過(guò)濾類算法
檢索過(guò)濾類算法的典型適用場(chǎng)景為搜索推薦和內(nèi)容審查兩種,該算法通過(guò)一系列技術(shù)手段,對(duì)內(nèi)容進(jìn)行檢索、過(guò)濾,實(shí)現(xiàn)內(nèi)容安全的風(fēng)險(xiǎn)識(shí)別,或滿足用戶搜索需求。具體示例如表四所示。
在搜索推薦場(chǎng)景下,算法運(yùn)行邏輯通常為:
(1)對(duì)搜索詞進(jìn)行分詞與意圖識(shí)別;
(2)基于用戶在功能界面所選擇的內(nèi)容標(biāo)簽、內(nèi)容畫像以及用戶自身在平臺(tái)內(nèi)的行為畫像,匹配符合要求的搜索結(jié)果;
(3)去除部分無(wú)需推薦的內(nèi)容,減少排序模型壓力,完成過(guò)濾步驟;
(4)按照算法模型計(jì)算內(nèi)容得分,通過(guò)排序機(jī)制優(yōu)化用戶使用體驗(yàn);
(5)在排序過(guò)程中引入多樣性打散機(jī)制,拓展展示內(nèi)容,避免同類型內(nèi)容過(guò)度集中。
內(nèi)容安全風(fēng)險(xiǎn)識(shí)別場(chǎng)景下,算法則通過(guò)深度學(xué)習(xí)等風(fēng)險(xiǎn)分類模型對(duì)平臺(tái)上文本、圖片、音頻、視頻等信息進(jìn)行安全風(fēng)險(xiǎn)識(shí)別,形成不同的風(fēng)險(xiǎn)置信度等級(jí),對(duì)于高置信度的信息通常由算法直接完成審核,對(duì)于低置信度的信息則將引入人工審核,最后完成對(duì)違規(guī)信息的處置決策。
4. 排序精選類算法
排序精選類算法通過(guò)特定的算法因式將數(shù)據(jù)按照既定的模式或規(guī)則進(jìn)行重新排序,在用戶訪問(wèn)產(chǎn)品內(nèi)相應(yīng)功能界面時(shí),算法首先根據(jù)用戶在功能界面所選擇的內(nèi)容標(biāo)簽,匹配符合要求的內(nèi)容;其次以用戶的點(diǎn)擊率/閱讀率/閱讀時(shí)長(zhǎng)等作為優(yōu)化目標(biāo),使用統(tǒng)計(jì)口徑計(jì)算內(nèi)容得分;最終,根據(jù)運(yùn)營(yíng)或者策略需求,通過(guò)重排機(jī)制調(diào)整結(jié)果列表的順序,并最終以排行榜等形式向用戶呈現(xiàn)各類清單。具體示例如表五所示。
5. 調(diào)度決策類算法
目前,調(diào)度決策類已經(jīng)完成算法備案的較少,共計(jì)由5家企業(yè)為7個(gè)算法完成備案手續(xù),具體如下表六所示。此類算法所適用的典型場(chǎng)景為派單與配送兩種,通過(guò)智能調(diào)度模型、配送市場(chǎng)預(yù)估模型,在外賣、快遞的配送,網(wǎng)約車的派單等情境中實(shí)現(xiàn)效率提高。
6. 深度合成類(生成合成類)
深度合成類算法的應(yīng)用場(chǎng)景更為多元化,在不同的應(yīng)用場(chǎng)景中,各類APP運(yùn)用前述不同種類的深度合成技術(shù)為其功能實(shí)現(xiàn)賦能,以滿足用戶需求。如下表所示,我們選取了十類典型場(chǎng)景,通過(guò)應(yīng)用場(chǎng)景、適用APP、使用技術(shù)、以及主要功能的一一對(duì)應(yīng),為提供類似產(chǎn)品、服務(wù)的企業(yè)提供參照。
算法的應(yīng)用在給經(jīng)濟(jì)、社會(huì)發(fā)展注入新動(dòng)能的同時(shí),其不合理應(yīng)用所導(dǎo)致的算法歧視等問(wèn)題也深刻影響著正常的傳播秩序、市場(chǎng)秩序和社會(huì)秩序,給維護(hù)意識(shí)形態(tài)安全、社會(huì)公平公正和網(wǎng)民合法權(quán)益帶來(lái)挑戰(zhàn)?;ヂ?lián)網(wǎng)信息服務(wù)領(lǐng)域出臺(tái)的具有針對(duì)性的算法備案等規(guī)范性制度,是互聯(lián)網(wǎng)關(guān)聯(lián)企業(yè)在當(dāng)前的發(fā)展環(huán)境下所不能忽略的合規(guī)焦點(diǎn)。切實(shí)履行合規(guī)義務(wù),方為企業(yè)健康發(fā)展的基石。
作者:王渝偉 陸釔潼