2025-09-06 21:21:32

RL的剃刀：在线策略RL的遗忘程度小于SFT。

即使在匹配的准确性下，RL显示出较少的灾难性遗忘

主要发现：
1) RL 比 SFT 更倾向于 "忘记"
2) 在策略 RL (PPO) 的遗忘程度低于离策略 RL (DQN)
3) 即使在匹配的准确率下，RL显示出较少的灾难性遗忘

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

9人点赞了这条动态

赞赏
9
4
转发
分享

0/400

ZKSherlock

· 4小时前

从信息论的角度来看，实际上非常迷人……较少的遗忘意味着更好的熵保持，老实说。

查看原文回复0

BrokenYield

· 09-06 21:51

终于有些东西不会像我在2022年崩盘中的多头那样被遗忘

查看原文回复0

PumpDoctrine

· 09-06 21:41

SFT能不能长长记性啊

话题
#Gate广场创作点亮中秋
14k 热度
#我最看好的AI代币
9k 热度
#山寨币市场回暖
24k 热度
#Gate Alpha 上新
34k 热度
#美联储降息预期
66k 热度

置顶
🌕 Gate 广场 · 中秋创作激励限时开启！
创作点亮中秋，带热门话题发帖，瓜分 $5,000 中秋好礼！🎁
立即报名查看详情 👉 https://www.gate.com/campaigns/1953
💝 新用户首次发帖并完成互动任务，即可瓜分 $600 新人奖池！
🔥 今日热门话题： #我最看好的AI代币#
山寨季蓄势待发，AI板块代币普涨， #WLD# 、 #KAITO# 领涨，龙头 WLD 单日暴涨近48%，AI、IO、VIRTUAL 顺势跟上。近期你计划布局哪些潜力 AI 币？快来分享你的投资心得吧！
发帖建议：
1️⃣ AI 板块未来发展你怎么看？
2️⃣ 你最近看好哪些 AI 币向大家推荐？理由是什么？
3️⃣ 你最近的 AI 币种交易策略如何？
快带上 #我最看好的AI代币# 和 #Gate广场创作点亮中秋# 发帖，内容越多越优质，越有机会赢取 $5,000 中秋好礼！
🌕 桂花香，月儿圆～
Gate 广场 · 中秋创作激励限时开启！
创作点亮中秋，带上热门话题发帖，就有机会瓜分 $5,000 中秋好礼！ 🎁
立即报名参与 👉 https://www.gate.com/campaigns/1953
💡 参与攻略
1️⃣ 在广场发帖并带上话题 #Gate广场创作点亮中秋#
2️⃣ 内容需围绕广场官号（Gate广场_Official）每日发布的热点话题进行创作，并确保带上该热点话题及 #Gate广场创作点亮中秋# 标签
3️⃣ 发帖数量越多，内容越优质，互动量越高，奖励越丰厚！
💰 创作者专属奖励
🏆 Top 1：宝格丽中秋限定礼盒 + $100 合约体验券 + $100 GT
🥈 Top 2：宝格丽中秋限定礼盒 + $80 合约体验券 + $60 GT
🥉 Top 3：宝格丽中秋限定礼盒 + $60 合约体验券 + $30 GT
Top 4-10：宝格丽中秋限定礼盒 + $50 合约体验券
Top 11-20：多功能充电器 + $30 合约体验券
幸运奖（30 位）：每人 $20 合约体验券
除此之外每位获奖者都将获得相应的社区流量扶持，增加您的社区影响力！
🍀 新用户特别福利：
第一次在活动期间发帖？恭喜你，还有机会冲击 $600 中秋赏月奖池！
完成任务（完善资料+关注5人+点赞/评论/转发5帖+带话题发首帖），30 位幸运用
🎉【Gate 新加坡旗舰活动 · 广场趣味答题 Day1】
‍ #TOKEN2049# 马上拉开序幕，Gate 也要在新加坡放大招啦！
Token of Love 音乐节、 Gate x Oracle Red Bull Racing 招待会、 F1 观赛派对统统来袭！
现在参与广场【趣味答题挑战】，来测测你对活动了解多少，瓜分$100 BTC！
参与方式：评论区留下答案（格式：1B 2A 3B 4B）
🎁 奖励：每天抽 3 名幸运用户 → 每人 $10 BTC
🎁 终极彩蛋：三天全对的幸运超级答题王 → 再送 $10 BTC！
📖 Day1 · Quiz 单选题
Q1
Gate 新加坡旗舰活动在哪五天举行？
A. 9月30日-10月4日
B. 10月1日-5日
C. 10月5日-9日
Q2
“TOKEN OF LOVE” 音乐节的举办地点是？
A. 滨海湾花园
B. 圣淘沙
C. 新加坡体育馆
Q3
Gate x Oracle Red Bull Racing 招待会特别关注的三个主题是？
A. 体育、旅游、时尚
B. 加密市场趋势、全球经济展望、Web3
C. 游戏、NFT、元宇宙
Q4
在10月2日举行的 F1 赛车模拟挑战中，胜出者获得的奖励是什么？
A. 音乐节 VVIP 门票
B. Gate 精美周边
C. F1 观赛盛宴门票
💡 小Tips：不确定答案？偷偷翻一下
💥 Gate广场活动： #SOMI创作大赛# 💥
在 Gate广场发布与 SOMI 或 CandyDrop 第76期相关的原创内容，即有机会瓜分 180 SOMI 奖励！
CandyDrop 第76期：CandyDrop x Somnia (SOMI) 👉 https://www.gate.com/announcements/article/46912
📅 活动时间：2025年9月8日 – 9月15日
📌 参与方式：
发布原创内容，主题需与 SOMI 或 CandyDrop 活动相关
内容不少于 80 字
帖子添加话题： #SOMI创作大赛#
附上 CandyDrop 参与截图
🏆 奖励设置：
🥇 一等奖（1名）：60 SOMI
🥈 二等奖（3名）：30 SOMI/人
🥉 三等奖（6名）：10 SOMI/人
（合计：180 SOMI）
📄 注意事项：
内容必须原创，禁止抄袭或刷量
获奖者需完成 Gate 广场身份认证
活动最终解释权归 Gate 所有
🚗 #Gate广场全民挑战# 第一期 — 谁会率先 To The Moon？
脑力大比拼，猜一猜赢奖励
💰 5 位幸运用户将瓜分 $50 GT 奖励！
👉 参与方式：
1️⃣ 关注 Gate广场_Official
2️⃣ 点赞此条广场贴文
3️⃣ 在评论中留下你的答案
🗓️ 截止至 2025 年 9 月 17 日 24:00（UTC+8）