Microsoft open-sources the three-tier Harrier text embedding models; the 27B version tops the multilingual MTEB v2 leaderboard.

BlockBeatNews

2026-03-30 11:07:06

Según el monitoreo de 1M AI News, Microsoft, en la familia de modelos de incrustación (text embeddings) multilingües de código abierto harrier-oss-v1 en Hugging Face, incluye tres versiones: 270M, 0.6B y 27B. La ficha del modelo muestra que esta serie utiliza una arquitectura solo-decodificador (decoder-only), pooling del último token (last-token pooling) y normalización L2; la longitud máxima admitida es de 32768 tokens, y puede usarse para recuperación, clustering, similitud semántica, clasificación, minería bilingüe y re-ranking.

Multilingual MTEB v2 es un punto de referencia de incrustación de texto multilingüe de uso común en la industria; principalmente evalúa tareas como recuperación, clasificación, clustering y similitud semántica. La ficha del modelo de Microsoft afirma que, en este benchmark, las puntuaciones de las tres versiones son 66.5, 69.0 y 74.3, respectivamente, y que la versión de 27B llegó al primer puesto el día de su lanzamiento. Las versiones de 270M y 0.6B también usan adicionalmente un modelo de incrustación más grande para la destilación de conocimiento; los tres modelos se publican bajo la licencia MIT.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Comentar

0/400

Sin comentarios