todos hablan de @karpathy autoresearch y la mayoría de ustedes no tiene idea de lo que realmente hace.


hay un script de entrenamiento (train(dot)py) que entrena un modelo de lenguaje pequeño, básicamente un GPT bebé. y hay un archivo de instrucciones (program(dot)md) que le dice a un agente de IA qué hacer.
presionas comenzar. el agente ajusta el script de entrenamiento, entrena durante 5 minutos, revisa la puntuación. ¿mejor? mantener. ¿peor? revertir. repetir 100 veces durante la noche mientras duermes.
eso es literalmente todo.
lo que realmente está optimizando: la ARQUITECTURA DEL MODELO. no las predicciones. no las operaciones. no tu portafolio.
cosas como:
→ ¿4 capas o 8?
→ ¿mejor tasa de aprendizaje?
→ ¿AdamW o optimizador Muon?
→ ¿qué tamaño de lote funciona mejor en ESTA GPU específica?
la arquitectura óptima depende de tu hardware. una H100 quiere un modelo completamente diferente al de tu MacBook. autoresearch encuentra la mejor configuración para tu máquina automáticamente.
lo que puedes hacer con ello:
> construir un pequeño LLM que escribe código, autoresearch encuentra la mejor arquitectura, entrenas en tu conjunto de datos
> crear un chatbot ligero que funcione sin conexión en tu teléfono
> entrenar un modelo con tu propia escritura para que suene como tú
> probar "¿RoPE supera a ALiBi en modelos pequeños?" 100 variaciones en una noche en lugar de 3 semanas de trabajo de doctorado
> optimizar un modelo para una Raspberry Pi o un dispositivo edge
lo que NO puedes hacer:
> predecir precios de acciones
> encontrar ventajas en trading
> analizar hojas de cálculo
> predecir resultados deportivos
autoresearch es una herramienta para personas que quieren CONSTRUIR modelos de lenguaje, no USARlo. Karpathy creó un ciclo autónomo donde la IA mejora a la IA. realmente brillante. pero resuelve un problema muy específico.
y ese problema probablemente no sea el tuyo. lo cual está bien, solo deja de pretender que es algo que no es.
Ver originales
post-image
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
0/400
Sin comentarios
  • Gate Fun en tendencia

    Ver más
  • Cap.M.:$0.1Holders:1
    0.00%
  • Cap.M.:$0.1Holders:1
    0.00%
  • Cap.M.:$0.1Holders:1
    0.00%
  • Cap.M.:$2.41KHolders:1
    0.00%
  • Cap.M.:$2.46KHolders:2
    0.23%
  • Anclado