繼大模型后,“具身智能”成為今年科技界的新熱點,被認為是新一波人工智能(AI)浪潮中的重點方向。眾多初創(chuàng)公司涌現(xiàn)、融資屢創(chuàng)新高、技術不斷突破……人形機器人作為該領域最具代表性的實體,正在大模型催化下加速產(chǎn)業(yè)化落地。
如果將大模型視為“有趣的靈魂”,“具身智能”賦能的人形機器人則有了“好看的皮囊”,已在多個領域成為人類的有力助手。
重新定義機器人
作為連接虛擬空間和現(xiàn)實空間的橋梁,“具身智能”是指將AI融入機器人等物理實體,賦予它們像人一樣感知、學習和與環(huán)境動態(tài)交互的能力。
“具身智能”一詞本身具有濃厚的技術哲學色彩。1945年,法國哲學家莫里斯·梅洛-蓬蒂提出“具身性”概念,認為人類需通過身體與周圍環(huán)境進行互動和感知,進而理解世界。1950年,被稱為“AI之父”的英國計算機科學家圖靈在論文《計算機器與智能》中首次提出“具身智能”這一概念。
事實上,智能化水平相對較低的工業(yè)機器人(機械臂)早已在制造業(yè)廣泛應用,帶來質效提升。但傳統(tǒng)工業(yè)機器人是“固定程序+機械臂”的組合,而“具身智能”賦能的機器人則是“多模態(tài)感知+大腦決策”的迭代。
清華大學交叉信息研究院助理教授許華哲認為,未來機器人將呈現(xiàn)多姿多彩的形態(tài):雙足、四足、輪式,機械狗、智能無人機甚至機械小蜜蜂,但人形機器人對人類社會適配性最佳,將成為最能夠幫助人類的機器人。
人形機器人可解決生產(chǎn)線“最后一公里”的問題。很多個性化、定制化的產(chǎn)品無法靠流水線統(tǒng)一組裝,這就需要具有泛化能力的人形機器人來“幫忙”,把批量生產(chǎn)的零部件按客戶的定制需求組裝成產(chǎn)品。在家庭服務、公共服務等更復雜多變的場景中,人形機器人也更具優(yōu)勢,可適應不同的環(huán)境和需求完成多種任務。
三大難點待突破
人形機器人研發(fā)始于對人類的學習與模仿,其研發(fā)難點也可以比照人類的大腦、小腦和本體來理解。“大腦”主要是機器人負責自主學習、規(guī)劃和決策的中樞;“小腦”負責運動控制,包括從行走到跑跳,以及從簡單抓取到復雜的手部動作等;而“本體”部分則包括軀干四肢結構和靈巧手設計。
優(yōu)必選科技副總裁、研究院院長焦繼超告訴記者,目前這三大領域都有較多技術難點有待突破:“大腦”方面,云邊端一體計算架構、多模態(tài)感知與環(huán)境建模等是近年技術焦點,“仿人最大難點在于對人腦的模仿,現(xiàn)有科學理論對人腦的研究遠遠不足”;“小腦”方面,人機交互能力、復雜地形通過、全身協(xié)同精細作業(yè)等是重要方向;“本體”方面,剛柔耦合仿生傳動機構、高緊湊機器人四肢結構與靈巧手設計等關鍵技術,是人形機器人靈活運動所需的重要硬件基礎。
大模型的出現(xiàn)讓機器人“大腦”顯著“進化”,大大提升了機器人的通用性和泛化性,有望降低人形機器人開發(fā)成本,加速其走入千家萬戶。
據(jù)優(yōu)理奇機器人科技公司創(chuàng)始人兼首席執(zhí)行官楊豐瑜介紹,現(xiàn)在業(yè)界主要使用預訓練大模型對機器人進行預訓練,讓其具備更強學習能力;大模型可將特定任務的學習遷移到機器人任務上,提高其適應能力;另外還可利用大模型的多模態(tài)處理能力,結合視覺、聽覺、觸覺等各種輸入,提升機器人對復雜場景的理解。
中國起跑不落后
環(huán)顧全球,人形機器人已進入產(chǎn)業(yè)化落地初期階段,在工業(yè)制造、商用服務和家庭陪伴領域開始“試水”。無論是技術突破、落地進展還是融資規(guī)模,人形機器人研發(fā)競賽基本以中美為主導。
優(yōu)必選人形機器人Walker今年聚焦汽車、消費電子等制造業(yè)重點領域,已進入多家車廠實訓;宇樹科技的機器人實現(xiàn)了完全仿人的自然行走;優(yōu)理奇機器人正在醞釀“進家”計劃;波士頓動力的新版Atlas機器人實現(xiàn)了在工廠中不同儲物柜之間靈活搬動零件;特斯拉人形機器人“擎天柱”計劃2025年開始量產(chǎn)……
焦繼超說:“如果把人形機器人行業(yè)比喻成一場馬拉松,中國和歐美國家,目前幾乎都處在前面1000米的起跑階段。”
楊豐瑜持同樣觀點,大模型研發(fā)能力、感知技術的領先使美國企業(yè)在機器人決策系統(tǒng)和復雜任務處理方面具有更強競爭力。而中國的優(yōu)勢更多體現(xiàn)在工業(yè)機器人領域,特別是在制造業(yè)中的應用較為成熟。在人形機器人技術專利方面,中國也已走在前列。
雖然機器人“大腦”的核心算法和高端芯片仍存在挑戰(zhàn),但中國機器人行業(yè)擁有豐富的應用場景和龐大的潛在用戶人口,數(shù)據(jù)是最大競爭優(yōu)勢之一。
如何在真實世界場景中采集大量數(shù)據(jù),并將數(shù)據(jù)統(tǒng)籌流通和供給人形機器人行業(yè)是關鍵。許華哲介紹說,真實世界的數(shù)據(jù)一般都靠各家機器人公司自己采集。北京人形機器人創(chuàng)新中心有限公司正計劃打造一個開源數(shù)據(jù)集供學界和業(yè)界使用。未來,高質量的共享數(shù)據(jù)集將大大助力行業(yè)發(fā)展。