PANews a rapporté le 27 février que, selon Cointelegraph, le laboratoire d’IA open source Sentient a annoncé le lancement d’Arena, un environnement de test de qualité production pour évaluer les performances des agents IA dans les flux de travail au niveau des entreprises. Les divisions d’actifs numériques de Pantera Capital et Franklin Templeton ont rejoint la première cohorte de test d’Arena.
Sentient a indiqué qu’Arena n’est pas un test statique de modèle, mais teste plutôt l’agent IA sur une tâche standardisée en simulant les conditions d’entreprise avec de longs documents, des informations incomplètes et des sources contradictoires. La plateforme suit les catégories d’échecs telles que les hallucinations, les preuves manquantes, les erreurs de citation et les vulnérabilités de raisonnement afin d’aider les développeurs à diagnostiquer les problèmes. Arena prévoit de publier des indicateurs de performance comparatifs via des classements publics et de publier des rapports de test résumant les schémas de défaillance courants et les correctifs.
Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'
avertissement.
Articles similaires
Tether fait appel à KPMG pour le premier audit USDT des Big Four dans le cadre d'une poussée d'expansion aux États-Unis.
Tether a engagé KPMG pour un audit complet de son stablecoin USDT de 184 milliards de dollars, ainsi que PwC pour préparer le processus. Cela intervient dans le cadre des plans d'enregistrer l'USDT en vertu de la loi GENIUS, répondant aux préoccupations de transparence concernant ses réserves.
DecryptIl y a 12m
478K pionniers se précipitent vers le lancement IRRA Launchpad : la participation est désormais clôturée !
Le lancement d’IRRA sur Pi Network a mis en avant un engagement utilisateur significatif, avec plus de 478 000 participants ayant contribué à l’initiative de test. Cette phase met en évidence des tests pilotés par la communauté, essentiels pour les développements futurs et une infrastructure fiable dans la stratégie de croissance de la plateforme.
CoinfomaniaIl y a 18m
Dernière chance de migrer les jetons BEP2 avant le coucher du soleil de la Beacon Chain !
La mise à jour BEP2 de la chaîne BNB décrit une étape de migration cruciale où les utilisateurs doivent envoyer une transaction de récupération de jetons à la BNB Smart Chain pour accéder à leurs actifs. Le processus met l'accent sur la sécurité et la participation des utilisateurs, avec une date limite de migration qui risque de provoquer une perte de jetons pour ceux qui ne s'y conforment pas. Il vise à améliorer l'efficacité et l'expérience utilisateur en consolidant les activités sur un réseau unifié, rendant la participation plus fluide et plus accessible.
CoinfomaniaIl y a 26m
Bitmine lance MAVAN avec 6,8 milliards de dollars d'Ethereum mis en jeu.
Bitmine a lancé la plateforme MAVAN pour le staking institutionnel d'Ethereum, avec plus de 3,1 millions d'ETH stakés, visant 300 millions de dollars en récompenses annuelles. La plateforme se concentre sur la sécurité et la performance, prévoyant de s'étendre à d'autres réseaux de preuve d'enjeu.
CryptoFrontNewsIl y a 37m
Onyx lance le réseau principal Goliath avec 100K TPS
Onyx a lancé son réseau principal Goliath, permettant des transactions rapides et sécurisées à 100 000 par seconde.
Les utilisateurs peuvent désormais accéder à des fonctionnalités telles que le staking et le swapping directement dans l'application Onyx.
Le lancement renforce le rôle de $XCN et vise à attirer des développeurs et des validateurs pour la croissance de l'écosystème Web3.
CoinfomaniaIl y a 1h
UXLINK dévoile le moteur d’IA social X-AGENT, prévoit un lancement la semaine prochaine et l’ouverture des préinscriptions
Le 28 mars, le projet social Web3 UXLINK a lancé le composant central AI X-AGENT, visant à fournir des solutions d'expansion sociale pour les créateurs et les marques. X-AGENT combine l'automatisation par l'IA et les connexions sociales réelles, aidant les utilisateurs à réaliser une croissance en ligne. Ce système utilise un modèle à double moteur reliant les jetons AI et la valeur sociale, tout en ouvrant prochainement la pré-inscription des utilisateurs.
GateNewsIl y a 1h