La última iteración de Grok acaba de soltar algunos números interesantes. La versión 4.1 Fast con capacidades de razonamiento alcanzó 93.5 en el benchmark Extended NYT Connections, un sólido aumento de 1.4 puntos respecto al modelo 4 Fast Reasoning anterior que obtuvo 92.1.
Mientras tanto, la variante no razonadora de 4.1 Fast marcó 25.8, que es casi un punto completo más alto que el 24.9 de su predecesor. Ganancias incrementales, pero se suman cuando estás llevando los límites de rendimiento al máximo.
¿Qué vale la pena destacar aquí? El modelo de razonamiento sigue dominando—todavía hay una gran diferencia entre los modos de razonamiento y no razonamiento. Esa división de 93.5 frente a 25.8 te dice dónde realmente importa la potencia computacional.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
8 me gusta
Recompensa
8
4
Republicar
Compartir
Comentar
0/400
ThatsNotARugPull
· hace10h
grok está repasando los datos otra vez, pero esa brecha es demasiado absurda, 93.5 contra 25.8 es realmente un abismo, ¿puedes explicar por qué la versión no razonada es tan diferente?
Ver originalesResponder0
GateUser-e51e87c7
· hace10h
93.5 puntos parecen buenos pero no hay grandes sorpresas, la gran diferencia entre razonamiento y no razonamiento es porque la potencia computacional es diferente...
Ver originalesResponder0
BearHugger
· hace10h
¿Y qué si tiene 93.5 puntos? Lo que realmente importa es la práctica.
Ver originalesResponder0
GasFeeCrier
· hace10h
la diferencia entre el modo de razonamiento y el no razonamiento, 93.5 frente a 25.8... es una diferencia absurda, siento que el no razonamiento no sirve para nada
La última iteración de Grok acaba de soltar algunos números interesantes. La versión 4.1 Fast con capacidades de razonamiento alcanzó 93.5 en el benchmark Extended NYT Connections, un sólido aumento de 1.4 puntos respecto al modelo 4 Fast Reasoning anterior que obtuvo 92.1.
Mientras tanto, la variante no razonadora de 4.1 Fast marcó 25.8, que es casi un punto completo más alto que el 24.9 de su predecesor. Ganancias incrementales, pero se suman cuando estás llevando los límites de rendimiento al máximo.
¿Qué vale la pena destacar aquí? El modelo de razonamiento sigue dominando—todavía hay una gran diferencia entre los modos de razonamiento y no razonamiento. Esa división de 93.5 frente a 25.8 te dice dónde realmente importa la potencia computacional.