寫在前面:
當今正處在科技迅猛發(fā)展的時代,人工智能技術的應用與創(chuàng)新已經(jīng)滲透到各個領域,并為人類的生活與工作帶來了深遠的影響。“具身智能”是人工智能與物理實體結合的產(chǎn)物,正逐漸成為推動科技發(fā)展和產(chǎn)業(yè)變革的重要力量。今天是世界電信日,科普中國聯(lián)合中國移動科學技術協(xié)會特別策劃“具身智能”系列內容,為您詳細解讀。
(四) 展望篇
寫在前面:從市場規(guī)模的持續(xù)攀升到產(chǎn)業(yè)鏈的不斷完善,再到各領域應用場景的深度拓展,具身智能正以蓬勃之勢重塑行業(yè)格局。隨著技術迭代與市場需求的雙向驅動,其未來發(fā)展前景令人充滿期待。
具身智能將會引領下一波人工智能的浪潮,因為大模型解決了最重要的具身智能大腦問題,具身智能展現(xiàn)出了廣闊的應用前景,但它仍面臨物理仿真、物理時空認知和任務規(guī)劃等能力不足、數(shù)據(jù)短缺、工程實現(xiàn)復雜等挑戰(zhàn)。這些問題的解決可以在很大程度上促進具身智能商業(yè)化的普及。
技術挑戰(zhàn)
復雜環(huán)境中的實時感知與決策
具身智能體需要在動態(tài)、復雜的環(huán)境中實時感知和處理信息,并做出相應的決策。這對算法的實時性和計算能力提出了極高的要求。如何在不犧牲精度的情況下,提高算法的運行效率,是一個亟待解決的問題。
跨模態(tài)數(shù)據(jù)的融合與處理
具身智能體通常需要處理來自多種傳感器(如視覺、聽覺、觸覺等)的多模態(tài)數(shù)據(jù)。如何有效地融合這些數(shù)據(jù),并從中提取有用的信息,是一個關鍵的技術挑戰(zhàn)??缒B(tài)數(shù)據(jù)的融合不僅能提高感知的準確性,還能增強智能體的環(huán)境適應能力。
具身智能體的能源效率與可持續(xù)性
具身智能體大多依賴于電池或外部能源供應,如何在保證性能的同時,降低能源消耗,提高能源效率,是一個重要的技術問題。此外,智能體的材料和制造過程也需要考慮可持續(xù)性,減少對環(huán)境的影響
缺乏統(tǒng)一評估基準
盡管有許多基準用于評估低級控制策略,但它們在評估技能方面常常存在顯著差異。此外,這些基準中包含的物體和場景通常受到模擬器限制。為了全面評估具身模型,需要使用逼真的模擬器涵蓋多種技能的基準。社會倫理挑戰(zhàn)
具身智能體的責任與隱私問題
隨著具身智能體在生活中的廣泛應用,誰該為智能體的行為負責成為一個重要的問題。特別是當智能體在無人監(jiān)督的情況下做出錯誤決策時,責任的歸屬難以界定。此外,智能體在處理用戶數(shù)據(jù)時,如何保護隱私也是一個亟待解決的倫理問題。
人機共存的倫理規(guī)范
具身智能體越來越多地融入人類社會,如何制定合理的倫理規(guī)范,確保智能體與人類和諧共存,是一個復雜的社會問題。這不僅涉及到技術層面的設計,還需要跨學科的合作,包括社會學、倫理學和法律等領域的專家共同參與。
未來發(fā)展方向
具身智能與腦機接口的結合
腦機接口(BCI)技術的發(fā)展為具身智能提供了新的可能性。通過將智能體與人類的神經(jīng)信號直接連接,可以實現(xiàn)更為直觀和高效的人機交互。未來,具身智能與腦機接口的結合有望在醫(yī)療、康復等領域發(fā)揮重要作用。
具身智能在元宇宙中的應用
元宇宙作為一個虛擬與現(xiàn)實融合的數(shù)字空間,為具身智能提供了廣闊的應用場景。智能體可以在元宇宙中作為虛擬化身,與人類或其他智能體進行交互。通過具身智能,元宇宙中的虛擬世界可以變得更加真實和沉浸式。
具身智能推動通用人工智能(AGI)的發(fā)展
具身智能的研究不僅限于特定任務,還涉及通用智能的理論與實踐。通過研究智能體在物理環(huán)境中的學習和適應能力,具身智能有望為通用人工智能(AGI)的發(fā)展提供新的思路和方法。具身智能與AGI的結合,可能最終實現(xiàn)具有類人智能的機器。
具身智能作為一個跨學科的領域,面臨著技術、理論和倫理等多方面的挑戰(zhàn)。未來,隨著技術的進步和理論框架的完善,具身智能有望在多個領域實現(xiàn)突破,并推動人工智能向更高層次的通用智能發(fā)展。同時,社會也需積極應對倫理問題,確保具身智能技術的發(fā)展能夠造福人類。
【參考資料】
[1] 莫里斯·梅洛-龐蒂. 知覺現(xiàn)象學. 姜志輝, 譯. 北京: 商務印書館, 2001[2] 中國計算機學會,《具身智能》,2023[3] Merleau-Ponty, M. (1945). Phénoménologie de la perception. Gallimard.Pfeifer, R., & Bongard, J. (2006). [4] Liu, Yang, et al. “Aligning Cyber Space with Physical World: A Comprehensive Survey on Embodied AI.” arXiv preprint arXiv:2407.06886, 2024.[5]《科技熱詞“具身智能”到底是什么?》,中科院物理所[6]《具身智能時代來了?》,中國報道[7] Brooks, R. A. (1991). Intelligence Without Representation. Artificial Intelligence, 47(1-3), 139–159.
[8] Lakoff, G., & Johnson, M. (1999). Philosophy in the Flesh: The Embodied Mind and Its Challenge to Western Thought. Basic Books.
[9] Pfeifer, R., & Bongard, J. (2006). How the Body Shapes the Way We Think. MIT Press.
[10] How the Body Shapes the Way We Think: A New View of Intelligence. MIT Press.Shapiro, L. (2010). Embodied Cognition. Routledge.
[11] Varela, F. J., Thompson, E., & Rosch, E. (1991). The Embodied Mind: Cognitive Science and Human Experience. MIT Press.
[12]《2024年具身智能產(chǎn)業(yè)發(fā)展研究報告》,36氪研究院
[13]《具身智能發(fā)展報告(2024年)》,中國信息通信研究院
[14]《具身智能行業(yè)發(fā)展研究報告 系列報告之一:具身智能技術發(fā)展與行業(yè)應用簡析》,甲子光年智庫
[15]《中國具身智能創(chuàng)投報告》,量子位智庫
[16] L. Londono, J. V. Hurtado, N. Hertz, P. Kellmeyer, S. Voeneky, and A. Valada, “Fairness and bias in robot learning,” Proceedings of the IEEE, 2024.
[17] J. Duan, S. Yu, H. L. Tan, H. Zhu, and C. Tan, “A survey of embodied ai: From simulators to research tasks,” IEEE Transactions on Emerging Topics in Computational Intelligence, vol. 6, no. 2, pp. 230–244, 2022.
[18] Z. Xu, K. Wu, J. Wen, J. Li, N. Liu, Z. Che, and J. Tang, “A survey on robotics with foundation models: toward embodied ai,” arXiv preprint arXiv:2402.02385, 2024.
作者:畢蕾 中國移動咪咕公司北京研究院 系統(tǒng)開發(fā)總監(jiān)
審核:
單華琦 中國移動咪咕公司北京研究院 技術標準總監(jiān)
邢剛 中國移動咪咕公司北京研究院 技術項目總監(jiān)
徐嵩 中國移動咪咕公司北京研究院 資深系統(tǒng)架構與分析專家
出品:科普中國×中國移動科學技術協(xié)會