Gate 廣場創作者新春激勵正式開啟,發帖解鎖 $60,000 豪華獎池
如何參與:
報名活動表單:https://www.gate.com/questionnaire/7315
使用廣場任意發帖小工具,搭配文字發布內容即可
豐厚獎勵一覽:
發帖即可可瓜分 $25,000 獎池
10 位幸運用戶:獲得 1 GT + Gate 鸭舌帽
Top 發帖獎勵:發帖與互動越多,排名越高,贏取 Gate 新年周邊、Gate 雙肩包等好禮
新手專屬福利:首帖即得 $50 獎勵,繼續發帖还能瓜分 $10,000 新手獎池
活動時間:2026 年 1 月 8 日 16:00 – 1 月 26 日 24:00(UTC+8)
詳情:https://www.gate.com/announcements/article/49112
2025年,机器人領域教給我的3件事 @DrJimFan
1⃣️硬體走在軟體前面,但硬體可靠性嚴重限制了軟體迭代速度我們已經看到了極其精妙的工程傑作:Optimus、e-Atlas、Figure、Neo、G1等等。但問題是,我們最好的AI還遠沒有把這些前沿硬體的潛力榨乾。(機器人)身體的能力,明顯強過大腦目前能發出的指令。然而,要“伺候”這些機器人,往往需要一整個運維團隊。機器人不像人類那樣會自我修復:過熱、馬達損壞、詭異的韌體問題,幾乎是日常噩夢。錯誤一旦發生,就是不可逆、也不寬容的。真正被scaling的,只有我的耐心。
2⃣️機器人領域的基準測試,依然是一場史詩級災難在大模型世界裡,人人都知道MMLU、SWE-Bench是怎麼回事。但在機器人領域沒有任何共識:用什麼硬體平台、任務如何定義、評分標準是什麼、用哪種模擬器,還是直接上真實世界?按定義來說,每個人都是SOTA——因為每次發新聞,都会臨時定義一個新的benchmark。每個人都會從100次失敗裡,挑出那次最好看的demo。到2026年,我們這個領域必須做得更好,不能再把可復現性和科學規範當成二等公民。
3⃣️基於VLM的VLA路線,总感觉不太对VLA指的是Vision-Language-Action(視覺-語言-動作)模型,目前這是機器人大腦的主流範式。配方也很簡單:拿一個預訓練好的VLM checkpoint,在上面“嫁接”一個動作模塊。但仔細想想就會發現問題。VLM 本質上是被高度優化用來爬諸如視覺問答這類benchmark的,這直接帶來兩個後果:VLM的大多數參數,都服務於語言和知識,而不是物理世界;視覺編碼器被主動訓練去丟棄低層細節,因為問答任務只需要高層理解,但對機器人來說,微小細節對靈巧操作至關重要。因此,VLA 的性能沒有理由隨著VLM參數規模的增長而線性提升。問題出在預訓練目標本身就不對齊。 #AI #Robtics