広場
最新
注目
ニュース
プロフィール
ポスト
Gateアプリをダウンロードするにはスキャンしてください
その他のダウンロードオプション
今日はこれ以上表示しない
CoinProphet_ETH
2025-11-27 00:27:10
フォロー
Grokの最新のイテレーションは、いくつかの興味深い数字をドロップしました。推論能力を備えた4.1ファストバージョンは、Extended NYT Connectionsベンチマークで93.5を記録しました。これは、92.1をスコアした以前の4ファスト推論モデルから1.4ポイントの堅実なジャンプです。
その間、非推論版の4.1ファストは25.8で、前モデルの24.9よりもほぼ1ポイント高かった。漸進的な向上だが、パフォーマンスの限界を押し上げるときにはそれが積み重なる。
ここで注目すべき点は何ですか?推論モデルが引き続き支配しています—推論モードと非推論モードの間には依然として大きなギャップがあります。その93.5対25.8の割合は、計算能力が本当に重要な場所を示しています。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については
免責事項
をご覧ください。
8 いいね
報酬
8
4
リポスト
共有
コメント
0/400
コメント
ThatsNotARugPull
· 5時間前
grokはまたデータを更新していますが、そのギャップはあまりにも大きいですね。93.5対25.8は本当に天と地の差です。なぜreasoningバージョンがこんなに違うのか、説明してもらえますか?
原文表示
返信
0
GateUser-e51e87c7
· 5時間前
93.5点は見た目は悪くないが、大きな驚きはない。reasoningと非reasoningの差がそんなに大きいのは、コンピューティングパワーの積み重ねが違うからだろう...
原文表示
返信
0
BearHugger
· 6時間前
93.5点はどうでもいい、結局は実戦を見なければならない。
原文表示
返信
0
GasFeeCrier
· 6時間前
reasoningモードと非reasoningの違い、93.5対25.8...これがひどすぎる、非reasoningは全く役に立たない感じがする
原文表示
返信
0
人気の話題
もっと見る
#
JoinGrowthPointsDrawToWiniPhone17
150.22K 人気度
#
DecemberRateCutForecast
64.06K 人気度
#
ReboundTokenstoWatch
73.99K 人気度
#
CryptoMarketRebounds
22.46K 人気度
#
GateChristmasGiveaway
98.54K 人気度
人気の Gate Fun
もっと見る
最新
ファイナライズ中
リスト済み
1
PENGU
PENGU
時価総額:
$3.92K
保有者数:
2
1.04%
2
WOJAK
Wojak Coin
時価総額:
$3.62K
保有者数:
1
0.00%
3
GTCAT
GATE CAT
時価総額:
$3.61K
保有者数:
1
0.00%
4
Sol
Sol
時価総額:
$3.51K
保有者数:
1
0.00%
5
lion
lion
時価総額:
$3.49K
保有者数:
1
0.00%
ピン
サイトマップ
Grokの最新のイテレーションは、いくつかの興味深い数字をドロップしました。推論能力を備えた4.1ファストバージョンは、Extended NYT Connectionsベンチマークで93.5を記録しました。これは、92.1をスコアした以前の4ファスト推論モデルから1.4ポイントの堅実なジャンプです。
その間、非推論版の4.1ファストは25.8で、前モデルの24.9よりもほぼ1ポイント高かった。漸進的な向上だが、パフォーマンスの限界を押し上げるときにはそれが積み重なる。
ここで注目すべき点は何ですか?推論モデルが引き続き支配しています—推論モードと非推論モードの間には依然として大きなギャップがあります。その93.5対25.8の割合は、計算能力が本当に重要な場所を示しています。