oui. mais je ne pense pas que cela aboutisse au même modèle. la politique que sonnet 3.6 a apprise par RL est optimisée pour sa propre architecture/initialisation
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
20 J'aime
Récompense
20
8
Reposter
Partager
Commentaire
0/400
LiquidatedAgain
· Il y a 4h
Voir clair sans le dire, je veux encore acheter le dip et être liquidé.
Voir l'originalRépondre0
MeltdownSurvivalist
· Il y a 14h
L'initialisation du modèle est vraiment trop ésotérique.
Voir l'originalRépondre0
down_only_larry
· Il y a 15h
La compatibilité de l'architecture est vraiment difficile à dire.
Voir l'originalRépondre0
CryptoSourGrape
· 08-15 05:04
Si j'avais su que je pouvais optimiser à ce point, ça aurait été super, ouin.
Voir l'originalRépondre0
ArbitrageBot
· 08-15 05:03
Optimiser pour qui, hein ? C'est un échec.
Voir l'originalRépondre0
alpha_leaker
· 08-15 04:53
Les initialisations sont toutes différentes, je n'ai pas vraiment compris.
oui. mais je ne pense pas que cela aboutisse au même modèle. la politique que sonnet 3.6 a apprise par RL est optimisée pour sa propre architecture/initialisation