国产在线拍揄自揄视精品一区|求快播网站你们懂得|好老师的小兔子好软水好多|夫妻性全过程实拍|s8视频网站|精品一区二区传媒公司|男女生的节日对比

Nature封面:機(jī)器人乒乓球干翻人類職業(yè)選手

henry 發(fā)自 凹非寺
量子位 | 公眾號(hào) QbitAI

要說也真夠逗的封面,索尼的機(jī)器機(jī)器人又開始找畫面了。

搭了個(gè)乒乓球臺(tái)子,人乒人類投票反超技巧直接找職業(yè)選手開干。乓球



一臺(tái)8自由度的機(jī)械臂,對(duì)戰(zhàn)日本elite級(jí)選手5場(chǎng)3勝2負(fù)。職業(yè)

后面半年,選手陸續(xù)打贏了幾位日本職業(yè)選手,封面包括2019年美國公開賽女單亞軍平真由香(GPT說相當(dāng)于國內(nèi)省隊(duì)主力),機(jī)器以及WTT世界排名第25位的人乒人類木原美悠。

它打起來畫面大概是乓球這樣的。

背后研究嘛,干翻Nature也相當(dāng)賞臉,職業(yè)直接給了個(gè)封面。選手



雖說伯克利去年就能讓宇樹G1和人類連拍106板了,港大Smash也能讓G1在室外打乒乓球。

不過這里得老實(shí)說一句,HITTER和SMASH都不處理球的旋轉(zhuǎn),打的投票反超技巧是陪練配合的平球,真扛不住職業(yè)選手那種旋轉(zhuǎn)。Ace正經(jīng)實(shí)打的,這個(gè)硬功夫人家確實(shí)做到了。

(完整幕后比賽視頻可參考:https://www.youtube.com/watch?v=FrGq8ltb-_E)

這場(chǎng)球是怎么打的

規(guī)則全按國際乒聯(lián)(ITTF)標(biāo)準(zhǔn)來,先到11分贏,場(chǎng)地都是正規(guī)比賽場(chǎng)地。

對(duì)手則分兩檔。

第一檔是elite級(jí),定義為至少10年訓(xùn)練、每周20小時(shí)以上的業(yè)余精英,5位(3女2男)。

第二檔是職業(yè),日本T聯(lián)賽現(xiàn)役的兩位,Minami Ando和曾根翔。

這些球員此前全都沒見過Ace。沒有針對(duì)性錄像訓(xùn)練,沒有定制策略,上場(chǎng)就打。

結(jié)果,2025年4月在東京打的那一輪。Ace對(duì)elite 3勝2負(fù),13局里贏7局。

對(duì)職業(yè)選手0勝2負(fù),7局里搶下1局。

還算不錯(cuò)。



論文提交之后,索尼沒停手。

2025年12月又打了一輪,這次Ace贏下了平真由香。2026年3月又打了一輪,Ace贏下包括木原美悠在內(nèi)的三位職業(yè)選手。

據(jù)SonyAI DirectorPeter Dürr說,這次Ace的出球更快、落點(diǎn)更貼近球臺(tái)邊緣、回合節(jié)奏也更緊湊。

Ace從看見球到揮出拍,端到端20.2毫秒。頂級(jí)人類球員,230毫秒。

相差十倍。

這是怎么做到的

Ace的整套系統(tǒng)拆成三塊,看、想、做。

看這一塊,9臺(tái)APS相機(jī)擺在球臺(tái)四周,每臺(tái)配一塊FPGA芯片,相機(jī)本地先做二維小球檢測(cè),只把壓縮后的結(jié)果傳到中央服務(wù)器,再做三維定位。

整套跑完10.2毫秒,空間誤差3毫米。



但知道球在哪還不夠,還得知道球怎么轉(zhuǎn)。旋轉(zhuǎn)決定球落臺(tái)后會(huì)怎么反彈,決定你要怎么揮拍。

索尼的辦法是用自家的事件相機(jī)(event-basedvisionsensor),傳統(tǒng)相機(jī)像連拍,事件相機(jī)只在畫面有變化的像素上報(bào)數(shù)據(jù),天然低延遲。

配一套叫g(shù)aze control system的裝置,三塊可轉(zhuǎn)鏡片追著球走,一顆可電控變焦的長焦鏡頭讓球一直清晰,三套從不同角度盯球上的logo怎么翻,算出角速度。

刷新率400到700Hz,平均誤差24.8弧度/秒。

想這一塊,是一個(gè)深度強(qiáng)化學(xué)習(xí)策略,每32毫秒(31.25Hz)讀一次球和機(jī)械臂狀態(tài),輸出動(dòng)作。



訓(xùn)練算法是SAC(Soft Actor-Critic),很古典。

但有一個(gè)關(guān)鍵設(shè)計(jì)叫privileged critic,訓(xùn)練時(shí)給critic(評(píng)判者)喂仿真里的真值,給policy(決策者)只喂帶噪聲的傳感器歷史。

讓老師看參考答案,讓學(xué)生只能看模糊照片解題。學(xué)生被迫學(xué)會(huì)自己做傳感器融合和軌跡預(yù)測(cè),沒人教它,它自己摸出來。

整套策略完全在仿真里訓(xùn)練,沒碰過一個(gè)真球。部署到真機(jī)上直接就能用。

作者Peter Dürr自己承認(rèn)這個(gè)路徑他一開始不信,后來被結(jié)果打臉。

做這一塊,機(jī)械臂是定制的,8個(gè)自由度(2個(gè)直線關(guān)節(jié)負(fù)責(zé)沿球臺(tái)前后左右平移,6個(gè)旋轉(zhuǎn)關(guān)節(jié)負(fù)責(zé)球拍姿態(tài)和速度),Scalmalloy合金3D打印,做了拓?fù)鋬?yōu)化,又輕又穩(wěn)。



末端是一片蝴蝶D05膠皮配VICTASZX-GEAROUT底板,跟日本職業(yè)選手用的套膠一個(gè)級(jí)別。球拍旁邊還掛了個(gè)小杯子,單臂發(fā)球的時(shí)候托球用。

所有電機(jī)1毫秒同步一次,位置跟蹤延遲不到5毫秒,最大揮拍速度對(duì)標(biāo)職業(yè)選手正手強(qiáng)攻時(shí)的20米/秒。

看+想+做,加起來20.2毫秒。

One more thing

實(shí)話說,看到這篇Nature的時(shí)候,第一反應(yīng)不是「好厲害」,是「索尼還在做機(jī)器人啊」。

二十年前,機(jī)器人的第一梯隊(duì)毫無疑問是日本。

1999年索尼出AIBO機(jī)器狗,3000美元一只,20分鐘賣光,賣了15萬只。



2003年索尼又出QRIO,全球第一款能雙足奔跑的人形機(jī)器人。本田的ASIMO跟各國政要握手敲鐘,豐田的機(jī)器人會(huì)吹小號(hào)。

那時(shí)候美國人要看機(jī)器人,得飛東京。

然而,好景不長。

那會(huì)兒的機(jī)器人只能表演,不能干活。表演沒法撐起研發(fā)成本,做成了科技花瓶,長此以往,自然是賣不動(dòng)就砍。

2006年1月26日,索尼一天之內(nèi)砍了AIBO和QRIO兩個(gè)項(xiàng)目。

2018年ASIMO也停產(chǎn)。日本千葉縣的光福寺,每年給報(bào)廢的AIBO辦超度法事,一次800只。

快進(jìn)到2025年,全球人形機(jī)器人出貨1.3萬臺(tái),中國占90%以上,前六名全是中國公司,日本沒有一家上榜。

機(jī)器人這件事,已經(jīng)是中美的游戲了。

Ace的共同作者里,有一個(gè)人叫Hiroaki Kitano(北野宏明),索尼計(jì)算機(jī)科學(xué)實(shí)驗(yàn)室的CEO。



他正是當(dāng)年AIBO的發(fā)起人,人稱AIBO之父,QRIO也是他帶出來的,RoboCup也是他搞的。

兩個(gè)項(xiàng)目2006年被砍,他沒走,熬了快二十年,熬到這篇Nature。

雖然形態(tài)上還是一臺(tái)不會(huì)動(dòng)的機(jī)械臂,雖然窗外的中國人形機(jī)器人已經(jīng)在春晚上扎堆跑武術(shù)。

但能回到牌桌,可能已經(jīng)很好了吧?

[1]https://www.nature.com/articles/s41586-026-10338-5#MOESM1

[2]https://scholar.google.com/citations?user=027fc-oAAAAJ&hl=ja

鄂ICP備2025167458號(hào)-1