捧起她娇臀猛烈冲刺h,久久亚洲精品无码网站,公与媳系列100小说,欧美大片18禁aaa片免费,国产成人无码a区视频,xxxx欧美丰满大屁股 free,韩国在线无码中文字幕,2021年精品国产福利在线,日本成年片黄网站色品善网

版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

具身智能如何“有用”?加州大學(xué)伯克利分校博士后羅劍嵐 | 悅見(jiàn)·青年說(shuō)

上海市科學(xué)技術(shù)協(xié)會(huì)

作者:藍(lán)悅

他是讓機(jī)器人“用手做事”的中國(guó)面孔,是讓“真機(jī)強(qiáng)化學(xué)習(xí)”成為現(xiàn)實(shí)的破局者。他是入選2024年《麻省理工科技評(píng)論》“35歲以下科技創(chuàng)新35人”(TR35)榜單的加州大學(xué)伯克利分校博士后、人工智能與機(jī)器人專家羅劍嵐。

在一段操作看似流暢的視頻中,一只機(jī)器人手持鞭狀工具,從層層疊放的積木堆中精準(zhǔn)抽出指定積木塊。它動(dòng)作柔順、位姿穩(wěn)定,完成了高度精密的操作任務(wù)。對(duì)人類來(lái)說(shuō),這不僅需要肌肉控制的極度細(xì)膩,還要在毫厘之間掌控物理世界的不確定性。而HIL-SERL系統(tǒng)中的機(jī)器人,在短短兩小時(shí)訓(xùn)練后,就實(shí)現(xiàn)了100%的成功率。

01

操控優(yōu)先,

突破“大腦”短板

當(dāng)前多數(shù)機(jī)器人“會(huì)走會(huì)跳”,卻難以完成操作任務(wù),暴露出“重運(yùn)動(dòng)、輕操控”的結(jié)構(gòu)性短板。羅劍嵐并非“讓機(jī)器人跳舞更流暢”,而是“讓它學(xué)會(huì)用手做事”。

“操控能力是目前最短缺的能力,這一直是機(jī)器人行業(yè)皇冠上的明珠?!绷_劍嵐指出。他強(qiáng)調(diào),當(dāng)前許多機(jī)器人系統(tǒng)仍停留在“運(yùn)動(dòng)能力”展示階段,但真正推動(dòng)生產(chǎn)力的,是具身智能系統(tǒng)的“操作力”,即應(yīng)對(duì)不確定環(huán)境的靈巧反應(yīng)能力。

“當(dāng)機(jī)器人必須識(shí)別不同材質(zhì)、抓取不同形狀并組裝部件時(shí),面對(duì)的是一個(gè)高度不確定、動(dòng)態(tài)變化的開(kāi)放系統(tǒng)。”羅劍嵐說(shuō),這種區(qū)別,決定了技術(shù)價(jià)值是否真正落地。

羅劍嵐便投身于機(jī)器人控制與強(qiáng)化學(xué)習(xí)的交叉研究已有10年。在UC Berkeley讀博期間,他便系統(tǒng)性構(gòu)建了面向真實(shí)物理世界的學(xué)習(xí)框架。2022年博士后回歸伯克利人工智能實(shí)驗(yàn)室(BAIR)后,他帶領(lǐng)團(tuán)隊(duì)開(kāi)發(fā)出全球首個(gè)在多任務(wù)上達(dá)到或超越人類水平的真機(jī)RL系統(tǒng)HIL-SERL(參考模仿學(xué)習(xí)基線)。

該系統(tǒng)突破性地實(shí)現(xiàn)了機(jī)器人在復(fù)雜操作任務(wù)中的全面泛化能力,完成抽取積木、安裝皮帶輪、電腦主板裝配等一系列高精度、多約束動(dòng)作任務(wù),且任務(wù)成功率達(dá)100%。

HIL-SERL最大的不同,是“以真機(jī)數(shù)據(jù)為核心”,放棄對(duì)仿真的依賴。這意味著每一次操作反饋都來(lái)自真實(shí)世界,機(jī)器人必須在極高的不確定性下迅速建模和反應(yīng)。這正是“操控”在具身智能中所代表的技術(shù)核心——不僅僅是能動(dòng),更是能理解物理世界并精準(zhǔn)交互。

“仿真器無(wú)法模擬真實(shí)世界的復(fù)雜性,唯有直面物理交互數(shù)據(jù),才能實(shí)現(xiàn)真正的智能進(jìn)化?!绷_劍嵐說(shuō)。他相信,唯有技術(shù)與場(chǎng)景共生,才能真正打開(kāi)未來(lái)的智能系統(tǒng)之門。

02

科研與產(chǎn)業(yè)

形成正向飛輪

從UC Berkeley到Google X、再回到Berkeley,羅劍嵐幾乎橫跨了機(jī)器人領(lǐng)域最頂尖的學(xué)術(shù)與工業(yè)場(chǎng)域。他始終強(qiáng)調(diào):科研與產(chǎn)業(yè)之間不是兩條獨(dú)立的路徑,而是一個(gè)可以彼此賦能、持續(xù)反饋的正向飛輪,“場(chǎng)景錘煉算法,算法反哺場(chǎng)景?!?/p>

在伯克利,他聚焦算法機(jī)制創(chuàng)新,用強(qiáng)化學(xué)習(xí)解決“樣本效率”“任務(wù)泛化”等基礎(chǔ)難題;而在谷歌,他親歷工業(yè)界對(duì)系統(tǒng)可靠性、可部署性與硬件耦合性的極致要求。

“我建議青年研究者,不要只關(guān)注能否發(fā)頂刊論文,更要思考問(wèn)題本身是否值得花時(shí)間。”他說(shuō),只有將科研問(wèn)題放入實(shí)際系統(tǒng)中運(yùn)行,經(jīng)歷反饋、修正、再提升,才能真正形成技術(shù)飛輪。

盡管當(dāng)前多個(gè)機(jī)器人平臺(tái)已在實(shí)驗(yàn)室中展現(xiàn)驚艷表現(xiàn),但距離真正應(yīng)對(duì)工業(yè)級(jí)復(fù)雜環(huán)境,仍面臨魯棒性、實(shí)時(shí)性與自適應(yīng)能力的嚴(yán)峻挑戰(zhàn)。

通用人形機(jī)器人距離真正“有用”還缺哪些技術(shù)拼圖?羅劍嵐的答案是“閉環(huán)能力”,即機(jī)器人系統(tǒng)不僅能執(zhí)行任務(wù),還能從每一次交互中學(xué)習(xí)、改進(jìn)。他提出,未來(lái)10年,真正的通用具身智能系統(tǒng),必須具備這種“帶記憶”的學(xué)習(xí)能力——不是靠硬編碼或海量標(biāo)注數(shù)據(jù),而是靠自身交互中不斷獲得經(jīng)驗(yàn)。

“這是一種能從過(guò)去的失敗和成功中提煉策略的能力?!彼f(shuō)。比如一個(gè)機(jī)器人在初次嘗試裝配零件失敗后,不是回到仿真重頭再來(lái),而是能立即理解偏差并調(diào)整策略,這種動(dòng)態(tài)學(xué)習(xí),是工業(yè)落地的必要前提。

“在谷歌期間,我深刻體會(huì)到工程可靠性的重要性;在伯克利,我敢于突破基礎(chǔ)科學(xué)。這種雙重歷練,構(gòu)成了我今天理解技術(shù)的方式?!绷_劍嵐說(shuō)。

03

從Demo到部署

走出實(shí)驗(yàn)室

隨著通用機(jī)器人研發(fā)逐步進(jìn)入深水區(qū),如何從演示級(jí)技術(shù)走向工程部署,成為評(píng)判技術(shù)成熟度與產(chǎn)業(yè)價(jià)值的關(guān)鍵尺度。

對(duì)羅劍嵐而言,TR35不僅是榮譽(yù),更是一份責(zé)任?!拔蚁M堰@個(gè)榮譽(yù)化作一種推動(dòng)力?!彼f(shuō),“過(guò)去10年,我們讓強(qiáng)化學(xué)習(xí)在真實(shí)機(jī)器人上跑起來(lái);接下來(lái)的10年,我們要讓它真正產(chǎn)生價(jià)值。”

幾個(gè)月前,羅劍嵐正式加入智元機(jī)器人,擔(dān)任首席科學(xué)家。他牽頭組建的“具身智能研究中心”專注于“大小腦一體”的系統(tǒng)研究與落地。這一研究方向,聚焦“場(chǎng)景驅(qū)動(dòng)的具身智能數(shù)據(jù)采/訓(xùn)/推一體化綜合平臺(tái)”“多模感知仿人靈巧手及具身交互控制技術(shù)研究與驗(yàn)證”等核心課題,得到了上海市科委“科技創(chuàng)新行動(dòng)計(jì)劃-新一代信息技術(shù)領(lǐng)域技術(shù)攻關(guān)(第一批)項(xiàng)目”的支持。

“我們的目標(biāo),是讓機(jī)器人24×7地在真實(shí)世界中工作,不再只是Demo?!彼f(shuō)。他相信,機(jī)器人走出實(shí)驗(yàn)室進(jìn)入現(xiàn)實(shí)世界的“窗口期”正在到來(lái)。

“我希望未來(lái)的具身智能系統(tǒng),可以真正在工廠中裝配產(chǎn)品,在無(wú)人便利店里搬運(yùn)貨架,甚至在危險(xiǎn)區(qū)域中代替人類作業(yè)?!边@是他正著手構(gòu)建的“閉環(huán)”。

“讓機(jī)器人成為現(xiàn)實(shí)世界的一員”,這不僅是他的科研方向,更是他對(duì)未來(lái)技術(shù)與社會(huì)的承諾。

評(píng)論
汪建國(guó)
太師級(jí)
2025-06-01
汨羅鎮(zhèn)徐志雄
太傅級(jí)
已閱
2025-05-31
、? !
太師級(jí)
2025-05-31