Gate 廣場創作者新春激勵正式開啟,發帖解鎖 $60,000 豪華獎池
如何參與:
報名活動表單:https://www.gate.com/questionnaire/7315
使用廣場任意發帖小工具,搭配文字發布內容即可
豐厚獎勵一覽:
發帖即可可瓜分 $25,000 獎池
10 位幸運用戶:獲得 1 GT + Gate 鸭舌帽
Top 發帖獎勵:發帖與互動越多,排名越高,贏取 Gate 新年周邊、Gate 雙肩包等好禮
新手專屬福利:首帖即得 $50 獎勵,繼續發帖还能瓜分 $10,000 新手獎池
活動時間:2026 年 1 月 8 日 16:00 – 1 月 26 日 24:00(UTC+8)
詳情:https://www.gate.com/announcements/article/49112
強化學習曾經真的很困難——評估代理人的行動、確定適當的獎勵與懲罰、將結果歸因於特定的組件。這一切都很混亂。
如今情況已經大為改變。大型語言模型(LLMs)現在負責評估任務的繁重工作。有了LLMs來管理評估與反饋循環,曾經需要費盡心思的手動設計變得可以用演算法實現。瓶頸被打破了。