Mistral AI lanza Leanstral: el primer Agente de código abierto Lean 4, capaz de generar automáticamente pruebas formales

Gate News informa, el 17 de marzo, Mistral AI anunció hoy el lanzamiento de Leanstral, el primer agente de código abierto diseñado específicamente para la herramienta de verificación formal Lean 4. La innovación principal de este modelo radica en que, además de generar código, puede producir pruebas formales verificables automáticamente por Lean 4, lo que evita el cuello de botella de la revisión manual en la generación de código por IA.

Leanstral utiliza una arquitectura sparse MoE, con un total de 120 mil millones de parámetros y 6 mil millones de parámetros activos, y se ha abierto bajo la licencia Apache 2.0. Además, ha sido optimizado para entrenamiento específico en lean-lsp-mcp. Los usuarios pueden iniciarlo sin configuración previa en Mistral Vibe mediante el comando /leanstall, o acceder a través del endpoint API gratuito labs-leanstral-2603, y también es posible descargar los pesos para desplegarlo por cuenta propia.

Mistral también lanzó simultáneamente un nuevo estándar de evaluación, FLTEval, que utiliza el proyecto de formalización del teorema de Fermat en la comunidad de Lean 4 como escenario de prueba. Los resultados comparativos muestran que: Leanstral pass@2 con un costo de 36 dólares obtiene una puntuación de 26.3, superando a Claude Sonnet 4.6, que cuesta 549 dólares y obtiene 23.7; en la prueba pass@16, con un costo de 290 dólares, alcanza 31.9 puntos, 8 puntos por encima de Sonnet; mientras que Claude Opus 4.6, que cuesta 1,650 dólares, logra 39.6. Entre los modelos de código abierto, Qwen3.5-397B-A17B necesita ejecutarse 4 veces para alcanzar 25.4, aún por debajo del rendimiento de Leanstral en pass@2.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

Actualizaciones de Hyperliquid sobre la lógica de comisiones para los tokens de Result de HIP-4, ofreciendo un 20% de descuento y un 50% de bono el 30 de abril

Según PANews, Hyperliquid actualizó su documentación oficial el 30 de abril para aclarar la lógica de comisiones para los tokens de resultados bajo HIP-4. Las posiciones abiertas son gratuitas; las comisiones se aplican solo al cerrar o liquidar. El protocolo cubre seis escenarios, incluyendo la acuñación (sin comisiones), el trading normal, la quema y la configuración

GateNewsHace16m

La leyenda: Electric Capital lidera la ronda de inversión, y el volumen de operaciones de la versión Alpha supera los 80 millones

30 de abril, la plataforma unificada de DeFi Legend anunció la finalización de una ronda semilla de 3.5 millones de dólares, liderada por Electric Capital, con la participación conjunta de GSR, lo que hace que el financiamiento acumulado de Legend supere los 5 millones de dólares. Según el anuncio de Legend, la plataforma lanzó una versión de prueba Alpha pública hace tres semanas, y el volumen de operaciones acumulado ya supera los 8000 millones de dólares.

MarketWhisperHace35m

IOTA Completa una Gran Actualización de Consenso y Cambia su Mainnet de Mysticeti a Starfish

Según ChainCatcher, IOTA completó su importante actualización de consenso, cambiando su mainnet de Mysticeti a Starfish. Starfish, una evolución del motor de consenso Mysticeti, desacopla los procesos de consenso de la sincronización de validadores para mantener la fiabilidad de la red incluso cuando algunos nodos de validadores experimentan retrasos o desconexiones

GateNewshace1h

El token de desbloqueo de la gobernanza de la votación se activa para el desbloqueo de tokens WLFI de la familia de Trump; destrucción permanente máxima del 10%

De acuerdo con la página oficial de gobernanza publicada el 30 de abril por el proyecto de finanzas descentralizadas World Liberty Financial (WLFI), respaldado por la familia de Trump, el equipo ya ha iniciado formalmente la votación de una propuesta de gobernanza de desbloqueo de tokens, que involucra aproximadamente 62.28 mil millones de tokens WLFI; el período de votación es de 7 días y el umbral de quórum es de 1 mil millones de tokens WLFI.

MarketWhisperhace1h

Hana Financial TI, XRPL Korea y Xcela completan una prueba de concepto para una stablecoin en won coreano

Según Xcela, Hana Financial TI, XRPL Korea y Xcela completaron una prueba de concepto (PoC) para una stablecoin basada en won coreano el 30 de abril. La validación probó la emisión, la gestión de la circulación, las transferencias de activos entre cadenas y las estructuras de liquidación en un entorno de institución financiera real

GateNewshace2h

OKX lanza el Protocolo de Pagos de Agentes para ciclos de negocio de IA

El exchange de criptomonedas OKX implementó el Protocolo de Pagos para Agentes (APP) el miércoles, un estándar abierto diseñado para respaldar agentes de IA que realizan ciclos comerciales completos más allá de los simples pagos. Según OKX, el protocolo permite que los bots de IA “paguen por servicios y se paguen entre sí”, mientras gestionan la cotización,

CryptoFrontierhace5h
Comentar
0/400
Sin comentarios