17:28
OpenAI та Anthropic тестують моделі на ілюзії та питання безпеки
OpenAI та Anthropic нещодавно оцінили моделі ШІ один одного, щоб виявити потенційні проблеми, такі як безпека та схильність до ілюзій. Цей тест був завершений до випуску OpenAI GPT-5 та Anthropic Opus 4.1.
GPT-8.7%

