捧起她娇臀猛烈冲刺h,久久亚洲精品无码网站,公与媳系列100小说,欧美大片18禁aaa片免费,国产成人无码a区视频,xxxx欧美丰满大屁股 free,韩国在线无码中文字幕,2021年精品国产福利在线,日本成年片黄网站色品善网

版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

數(shù)字人產(chǎn)業(yè)化瓶頸:如何用壓縮標(biāo)準(zhǔn)破解高保真數(shù)據(jù)傳輸難題?

中移科協(xié)
原創(chuàng)
有用的科技知識(shí)又增加了
收藏

數(shù)字人技術(shù)作為元宇宙、虛擬現(xiàn)實(shí)等領(lǐng)域的核心交互載體,其高保真模型的存儲(chǔ)與傳輸效率成為產(chǎn)業(yè)化落地的關(guān)鍵瓶頸。目前,國際標(biāo)準(zhǔn)化組織ISO/IEC MPEG已推出點(diǎn)云與動(dòng)態(tài)網(wǎng)格壓縮標(biāo)準(zhǔn),國內(nèi)AVS(數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn))工作組亦在2024年發(fā)布點(diǎn)云壓縮標(biāo)準(zhǔn)。然而,數(shù)字人多模態(tài)數(shù)據(jù)兼容性差、動(dòng)態(tài)序列處理效率低等問題仍待突破。在此背景下,2024年6月AVS第89次會(huì)議上,北京大學(xué)聯(lián)合中國移動(dòng)等機(jī)構(gòu)正式提出數(shù)字人數(shù)據(jù)壓縮需求。經(jīng)過多輪專家論證,在2025年3月AVS第92次會(huì)議期間,AVS成立了數(shù)字人壓縮標(biāo)準(zhǔn)探索組,致力于構(gòu)建面向2D及3D數(shù)字人的高效壓縮標(biāo)準(zhǔn)體系,推動(dòng)技術(shù)產(chǎn)業(yè)化進(jìn)程。本文梳理了數(shù)字人壓縮背景、表征形式與技術(shù)需求,并分析了標(biāo)準(zhǔn)化進(jìn)展。1、背景

隨著元宇宙、虛擬現(xiàn)實(shí)(VR/AR)、遠(yuǎn)程交互等技術(shù)的快速發(fā)展,數(shù)字人在娛樂、教育、醫(yī)療等領(lǐng)域的應(yīng)用場景不斷擴(kuò)展。然而,高保真數(shù)字人模型依賴海量數(shù)據(jù)支持,其存儲(chǔ)與傳輸成本高昂,成為產(chǎn)業(yè)化落地的關(guān)鍵瓶頸。以動(dòng)態(tài)三維數(shù)字人為例,未經(jīng)壓縮的人體3D網(wǎng)格數(shù)據(jù)(幀率為60 FPS)需超過1 Gbps帶寬,遠(yuǎn)超普通網(wǎng)絡(luò)承載能力。而基于高斯噴濺的數(shù)字人模型雖能實(shí)現(xiàn)實(shí)時(shí)渲染,但原始數(shù)據(jù)規(guī)模龐大,導(dǎo)致移動(dòng)設(shè)備與邊緣計(jì)算場景下的傳輸效率低下。因此,研究高效的數(shù)字人壓縮技術(shù),降低數(shù)據(jù)量,提升渲染與傳輸效率,具有至關(guān)重要的意義。

為應(yīng)對(duì)這一挑戰(zhàn),國際與國內(nèi)標(biāo)準(zhǔn)化組織加速推進(jìn)3D數(shù)據(jù)壓縮技術(shù)的研發(fā)與標(biāo)準(zhǔn)制定。國際上,ISO/IEC MPEG推出點(diǎn)云壓縮標(biāo)準(zhǔn)(G-PCC、V-PCC)和動(dòng)態(tài)網(wǎng)格壓縮標(biāo)準(zhǔn)(V-DMC);國內(nèi)AVS工作組于2024年發(fā)布了首版點(diǎn)云壓縮標(biāo)準(zhǔn)。然而,數(shù)字人技術(shù)融合圖像、視頻、三維數(shù)據(jù)及語音等多模態(tài)信息,現(xiàn)有標(biāo)準(zhǔn)分散,跨平臺(tái)兼容性差,數(shù)據(jù)轉(zhuǎn)換易導(dǎo)致信息丟失或畸變。以2D數(shù)字人為例,其依賴JPEG、PNG等圖像編碼和H.266、AVS3等視頻編碼標(biāo)準(zhǔn)。3D數(shù)字人需處理沉浸式數(shù)據(jù)表示,盡管IEEE 1857.9和AVS VRU標(biāo)準(zhǔn)針對(duì)VR/AR場景優(yōu)化了傳輸效率,但現(xiàn)有三維編碼格式(如OBJ、GLTF)標(biāo)準(zhǔn)分散,難以實(shí)現(xiàn)高效傳輸。因此,構(gòu)建高效壓縮標(biāo)準(zhǔn)體系成為數(shù)字人產(chǎn)業(yè)化的核心議題。

在此背景下,2024年6月AVS第89次會(huì)議上,北京大學(xué)聯(lián)合中國移動(dòng)等機(jī)構(gòu)正式提出數(shù)字人數(shù)據(jù)壓縮需求。經(jīng)過多輪專家論證,在2025年3月AVS第92次會(huì)議期間,AVS成立了數(shù)字人壓縮標(biāo)準(zhǔn)探索組,致力于構(gòu)建面向2D及3D數(shù)字人的高效壓縮標(biāo)準(zhǔn)體系,推動(dòng)技術(shù)產(chǎn)業(yè)化進(jìn)程。

2、數(shù)字人表征方式及現(xiàn)有編碼標(biāo)準(zhǔn)

目前,探索組主要圍繞數(shù)字人的幾種主流表征形式展開研究,包括3D點(diǎn)云、網(wǎng)格及新興的高斯噴濺(Gaussian Splatting)模型。

2.1 點(diǎn)云與網(wǎng)格

點(diǎn)云:通過離散的三維坐標(biāo)點(diǎn)及其屬性(如顏色、法向量等)表示物體表面,具有高精度、靈活性強(qiáng)等優(yōu)勢,但數(shù)據(jù)無序性導(dǎo)致壓縮難度大。

MPEG的G-PCC采用八叉樹分割與熵編碼,V-PCC通過投影技術(shù)結(jié)合視頻編碼器來壓縮紋理與幾何信息;國內(nèi)AVS也推出了基于幾何的點(diǎn)云壓縮標(biāo)準(zhǔn)及參考軟件PCRM。在基于AI的點(diǎn)云壓縮方面,MPEG已初步完成AI-PCC標(biāo)準(zhǔn)框架的定義,計(jì)劃通過多輪技術(shù)驗(yàn)證與性能比對(duì),逐步確立兼顧壓縮效率與計(jì)算復(fù)雜度的標(biāo)準(zhǔn)化方案,為自動(dòng)駕駛、元宇宙等場景的高效三維數(shù)據(jù)傳輸?shù)於ɑA(chǔ)。

網(wǎng)格:由頂點(diǎn)和面片構(gòu)成的結(jié)構(gòu)化模型,適合高效渲染。

MPEG推出V-DMC,旨在對(duì)連接性信息隨時(shí)間變化的動(dòng)態(tài)網(wǎng)格進(jìn)行壓縮;國內(nèi)AVS提出了基于Draco和HPM的靜態(tài)網(wǎng)格編碼基礎(chǔ)框架和參考軟件(MCEM 0.1)。

2.2 高斯噴濺

基于高斯噴濺的數(shù)字人模型因其高保真與實(shí)時(shí)性成為研究熱點(diǎn)[3]。該方法通過顯式的3D高斯點(diǎn)云表示人體幾何與紋理,支持每秒數(shù)百幀的渲染速率(如SplattingAvatar[4] 在 NVIDIA RTX 3090 G上可達(dá)300 FPS,在移動(dòng)設(shè)備上達(dá)30 FPS),且訓(xùn)練時(shí)間從傳統(tǒng)NeRF的數(shù)小時(shí)縮短至1-2分鐘。此外,高斯噴濺的顯式表示增強(qiáng)了編輯能力,允許實(shí)時(shí)修改和定制。綜上,基于高斯的數(shù)字人表示以其實(shí)時(shí)性能、數(shù)據(jù)效率和高質(zhì)量細(xì)節(jié),展現(xiàn)出顯著優(yōu)勢,特別適合交互式應(yīng)用。然而,未壓縮的高斯點(diǎn)云數(shù)據(jù)量極大,例如單模型可能包含數(shù)百萬高斯點(diǎn),每個(gè)點(diǎn)需存儲(chǔ)位置、協(xié)方差、顏色等屬性,導(dǎo)致存儲(chǔ)與傳輸成本激增。

目前,ITU-T、MPEG等國際組織,以及工信部、信通院等國內(nèi)機(jī)構(gòu),已在三維點(diǎn)云和骨骼動(dòng)畫領(lǐng)域推進(jìn)標(biāo)準(zhǔn)化進(jìn)程,為高斯數(shù)字人的表示與壓縮奠定基礎(chǔ)。然而,現(xiàn)有標(biāo)準(zhǔn)仍未充分覆蓋高斯數(shù)字人的顯式特性與實(shí)時(shí)渲染需求。

3、數(shù)字人壓縮技術(shù)需求

在2025年3月AVS第92次會(huì)議期間,圍繞數(shù)字人壓縮,領(lǐng)域?qū)<姨岢隽艘幌盗屑夹g(shù)需求。

3.1 點(diǎn)云與網(wǎng)格

需突破幾何與屬性聯(lián)合編碼瓶頸,探索基于深度學(xué)習(xí)的點(diǎn)云及網(wǎng)格壓縮。

數(shù)據(jù)集及評(píng)估:建立覆蓋高動(dòng)態(tài)動(dòng)作、復(fù)雜光照/服飾的多模態(tài)數(shù)據(jù)集,集成骨架參數(shù)、材質(zhì)屬性等語義信息。制定融合幾何失真(對(duì)稱PSNR)、屬性失真(YUV色差)、主觀質(zhì)量(PCQM)及渲染質(zhì)量(邊緣保真度、光照一致性)的復(fù)合指標(biāo)。

推動(dòng)感知驅(qū)動(dòng)的聯(lián)合優(yōu)化設(shè)計(jì):開發(fā)幾何與屬性同步優(yōu)化模型,強(qiáng)化面部、手勢等關(guān)鍵區(qū)域細(xì)節(jié)保留。針對(duì)AR/VR,2D平面顯示設(shè)備特性(如視場角、分辨率),動(dòng)態(tài)調(diào)整量化策略與碼率分配,優(yōu)化壓縮數(shù)據(jù)在紋理映射、光照計(jì)算等渲染環(huán)節(jié)的重建效率,降低端側(cè)延遲。

3.2 高斯噴濺

表示標(biāo)準(zhǔn):構(gòu)建統(tǒng)一的高斯點(diǎn)云格式,強(qiáng)化跨平臺(tái)兼容性。

渲染標(biāo)準(zhǔn):規(guī)范高斯點(diǎn)渲染流程,確保不同設(shè)備上的視覺一致性。明確光照模型、分辨率支持及幀率要求,以保證渲染效果的穩(wěn)定性。

交互標(biāo)準(zhǔn):定義高斯數(shù)字人與用戶的交互協(xié)議,涵蓋動(dòng)作捕捉、表情驅(qū)動(dòng)及語音反饋等接口。

4、結(jié)語

數(shù)字人壓縮技術(shù)的標(biāo)準(zhǔn)化進(jìn)程正邁向關(guān)鍵階段。當(dāng)前,AVS工作組在點(diǎn)云與網(wǎng)格壓縮領(lǐng)域取得階段性突破,下一步需針對(duì)數(shù)字人應(yīng)用場景開展算法適配及優(yōu)化。同時(shí),基于高斯噴濺模型的新型表征壓縮技術(shù)亟需探索,從而實(shí)現(xiàn)壓縮效率與渲染保真的雙重提升。后續(xù),AVS數(shù)字人壓縮標(biāo)準(zhǔn)探索組將圍繞上述方向展開標(biāo)準(zhǔn)研制工作,推動(dòng)實(shí)現(xiàn)數(shù)字人技術(shù)從“實(shí)驗(yàn)室原型”到“規(guī)?;瘓鼍皯?yīng)用”的跨越,為元宇宙、數(shù)字孿生、智慧教育、醫(yī)療等新興領(lǐng)域注入變革動(dòng)力。

【參考文獻(xiàn)】

[1] 易千喜,謝良,王誠威,鄭凱予,李革,高偉. 基于點(diǎn)云和網(wǎng)格的數(shù)字人壓縮需求調(diào)研,AVS M8815,長沙,2025.

[2] 顏若珂, 尹茜, 唐浩程, 翟英震, 賈川民, 王苫社, 馬思偉. 面向高斯數(shù)字人的壓縮標(biāo)準(zhǔn)化建議提案,AVS M8862,長沙,2025.

[3] Chen, Yufan, Lizhen Wang, Qijing Li, Hongjiang Xiao, Shengping Zhang, Hongxun Yao, and Yebin Liu. "Monogaussianavatar: Monocular gaussian point-based head avatar." In ACM SIGGRAPH 2024 Conference Papers, pp. 1-9. 2024.

[4] Shao, Zhijing, Zhaolong Wang, Zhuang Li, Duotun Wang, Xiangru Lin, Yu Zhang, Mingming Fan, and Zeyu Wang. "Splattingavatar: Realistic real-time human avatars with mesh-embedded gaussian splatting." In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, pp. 1606-1616. 2024.

作者:趙麗麗、郭勐、顏若珂、尹茜、賈川民、馬思偉

單位:中國移動(dòng)研究院

評(píng)論
、? !
太師級(jí)
2025-05-30