http://www.moduwu.com 2026-04-17 16:09 來源:澎湃新聞
如果說大語言模型是讓人工智能學會了人類的語言與邏輯,那么“具身智能”則是要讓人工智能穿上物理的軀殼,走進真實的世界。然而,當一個“初出茅廬”的機器人嘗試拿起水杯或邁出第一步時,現實世界的高昂試錯成本成為了橫亙在產業(yè)面前的最大阻礙。
要想讓機器人真正在物理世界中游刃有余,要先為它們建造“健身房”與“訓練場”。4月13日,在由上海市發(fā)展和改革委員會、上海市科學技術委員會指導,上海市經濟信息中心、上海張江(集團)有限公司承辦,上海市經濟信息中心未來產業(yè)高端智庫智力支持的“上海市重大科技基礎設施用戶戰(zhàn)略咨詢委員會第二期產業(yè)創(chuàng)新沙龍”上,科研學者、行業(yè)專家與投資人齊聚一堂,圍繞“重大科技基礎設施賦能人形機器人產業(yè)”這一主題展開探討。
資本狂熱與數據缺口
在資本端,具身智能正處于空前的“狂熱期”。上海孚騰私募基金管理有限公司執(zhí)行董事嚴祎祎表示,行業(yè)已進入從技術驗證邁向規(guī)模化落地的關鍵階段,資本市場對具身智能賽道的關注度顯著提高。她提到,2026年開年至今,國內具身智能已披露融資超30起,融資總金額約200億,遠超2024年同期的70億和2025年同期的126億。
張江集團產業(yè)促進中心研究員彭澤州說,根據2025年投融資事件數據,生物醫(yī)藥行業(yè)漲幅6%,人工智能行業(yè)漲幅約60%,而具身智能漲幅達到了206%。“一個具身智能公司融到資的幾率是非常高的。”他說。
嚴祎祎指出,政策紅利、“國家隊”等戰(zhàn)略資本的入場以及本土模型性能提升帶來的技術溢價等因素共同推高了市場對具身智能的期待,但與此同時,行業(yè)仍面臨著技術復雜度極高、核心零部件國產替代以及市場接受度等嚴峻挑戰(zhàn)。
在彭澤州看來,現在具身智能并不缺錢,真正缺的是數據,而且是“非常大”的數據缺口。在他看來,算法人才可以高薪爭奪,算力也可以通過投入獲得,但真實世界的數據并不是簡單花錢就能買來的。尤其是高價值、強專業(yè)、強場景約束的數據,更加稀缺。
他認為,如果把具身智能和智能駕駛類比,當前行業(yè)擁有的數據量距離真正成熟所需的規(guī)模仍有巨大差距。哪怕把目前企業(yè)手里的數據都匯總起來,和未來產業(yè)真正需要的數據總量相比,可能還差百倍以上。
正因如此,圍繞數據采集、數據標注、仿真生成和場景開放的基礎設施,正在變成具身智能產業(yè)鏈中越來越關鍵的一環(huán),也是“訓練場”的價值凸顯的原因。
過去,人們更容易把重大科技基礎設施理解為面向前沿科學問題的“國之重器”,而不一定將其與機器人產業(yè)直接聯系起來。但在具身智能時代,基礎設施不只是做科研的地方,也可能成為訓練數據的來源、模型驗證的平臺和產業(yè)協同的節(jié)點。幾名與會嘉賓呼吁,應當加強各方合作,讓更多基礎設施能夠賦能行業(yè)。
機器人“健身房”
具身智能的“進化”高度依賴試錯與交互。如果在真實物理世界中讓一臺造價高昂的人形機器人去學習開門、倒水或穿越障礙,不僅跌倒損毀的成本極高,數據采集的效率也很低。因此,構建各類虛擬與現實交織的訓練場,成為了產業(yè)破局的關鍵。
上海人工智能實驗室主任助理、領軍科學家、上海創(chuàng)智學院副院長喬宇在分享中指出,解決數據少、訓練難的有效途徑之一,是構建一個具身仿真環(huán)境和數據生成體系,并與真實數據相融合。研究人員在虛擬世界中建立起包含各類材質、力學屬性和三維結構等的虛擬環(huán)境,將數字機器人放入其中進行成千上萬次的演練。這如同為機器人打造了一個“黑客帝國”般的“數字母體”,讓機器人在接入現實軀體前,就已經在虛擬工廠或家庭中完成了海量長程任務的試錯與學習。
純虛擬的數據始終與真實物理世界存在差異,機器人最終還是要雙腳落地。上海傅利葉智能科技股份有限公司副總裁戴志輝展示了一種半實物物理訓練設施。
這套系統(tǒng)類似于一個專為機器人打造的“5D沉浸式影院”。其中,機器人的面前是一塊巨大的環(huán)幕,播放著公交車、地鐵或喧鬧街市的實景視頻。與此同時,機器人腳下踩著的并非普通地面,而是可以動態(tài)模擬各種顛簸、傾斜路況的六自由度平衡平臺。在這套設施中,研發(fā)人員可以精準監(jiān)測機器人在面對復雜視覺干擾和腳下動態(tài)變化時的平衡能力與動力學數據。
落地場景:介于標準自動化和高價值任務之間
科技基礎設施不僅能提供數據和新材料,本身也有望成為機器人的落地場景。喬宇在演講中舉例,在核聚變設施的建設與維護中,環(huán)境中充斥著高輻射與極端溫度,這是人類肉身難以承受的禁區(qū)。如果具備空間理解和精細操作能力的機器人集群能在此替代人類進行零部件搬運與檢測,將是產業(yè)落地的重大突破。
然而,彭澤州指出,高價值場景往往伴隨著極低的容錯率。無論是造價昂貴的同步輻射光源,還是動輒損失百萬美金的半導體晶圓制造車間,當前的具身智能都難以進入。因為目前的人形機器人系統(tǒng)尚缺乏絕對的穩(wěn)定性和基于實時操作系統(tǒng)的確定性。在這些零容錯的極端場景中,任何一次輕微的小腦控制延遲,都可能導致災難性的財產損失。
在此次討論中,嘉賓們對落地場景的判斷雖然不完全一致,但有一個共同傾向:機器人率先落地的場景,大多會出現在介于“完全標準化自動化”與“高風險、高價值人工任務”之間的區(qū)域。
在工業(yè)制造中的部分環(huán)節(jié),尤其是柔性裝配、搬運和協同操作,被認為仍有較大空間。與傳統(tǒng)工業(yè)機器人相比,具身智能并不擅長替代那些高度固定、流程已優(yōu)化到極致的工作;相反,它更適合進入那些變化較多、還依賴人工經驗的環(huán)節(jié)。華東師范大學國家可信嵌入式軟件工程技術研究中心副主任王江濤提到,未來幾年,制造業(yè)、物流業(yè)以及部分醫(yī)療和陪護場景,可能會更快看到落地。
有與會者表示,相較于高度自動化的成熟工業(yè),農業(yè)反而可能是值得關注的方向。農業(yè)場景天然具有更強的柔性和更大的人工依賴,同時一些現代設施農業(yè)已經具備較好的環(huán)境可控性。