
Le PDG et cofondateur d’OpenAI, Greg Brockman, lors d’un entretien accordé au podcast Big Technology, a décrit pour la première fois, de manière complète, l’architecture de l’application super et la feuille de route pour la déployer. Le projet d’application vise à intégrer ChatGPT, la plateforme d’outils de programmation par IA Codex et le navigateur IA Atlas en une seule interface de bureau, avec comme objectif l’AGI (intelligence générale artificielle) personnelle.
Brockman décrit ses produits cibles comme une assistance personnelle qui comprend en profondeur les préférences des utilisateurs et peut se substituer à eux pour exécuter des tâches dans le monde numérique, plutôt qu’un simple outil de questions-réponses. Son architecture centrale repose sur l’intégration de trois produits existants :
ChatGPT : interface de conversation et centre névralgique des tâches
Codex : socle d’Agent généraliste, doté à la fois de capacités d’exécution de la programmation et de travail de connaissance
Atlas : navigateur IA d’OpenAI, chargé d’exécuter les opérations au niveau du web
Brockman explique que le plan d’intégration sera déployé progressivement au cours des prochains mois, sans être achevé en une seule fois. L’application autonome d’action de ChatGPT reste inchangée ; le périmètre d’intégration se limite au bureau. L’objectif est de permettre aux utilisateurs de « demander directement à leur ordinateur de faire tout ce qu’ils veulent ».
Le point de départ de la feuille de route de l’application super est l’extension du périmètre d’utilisation de Codex. Brockman explique que la structure sous-jacente de Codex se compose de deux éléments : un socle d’Agent généraliste, plus un Agent axé sur la programmation. Les limites d’application du premier dépassent largement la programmation elle-même ; elles peuvent s’étendre à des scénarios de travail de connaissance généraliste tels que les tableurs, le traitement de documents et l’agrégation d’e-mails.
À l’intérieur d’OpenAI, des employés ont déjà, de façon spontanée, utilisé Codex pour traiter des tâches non liées à la programmation, notamment des résumés d’e-mails et des travaux d’intégration entre plusieurs outils. Cela montre que la voie de la généralisation est réellement faisable. Cette orientation correspond aussi à la principale opportunité de commercialisation côté entreprises pour OpenAI.
Brockman admet qu’en ce moment, la puissance de calcul d’OpenAI « ne suffit même pas à soutenir simultanément deux lignes, celle des assistants personnels et celle de Codex » ; c’est la raison directe de l’arrêt de Sora et de la contraction de la gamme de produits. Il qualifie cet ajustement de « prise de conscience lucide du niveau de maturité technique et de l’impact immense à venir », plutôt que d’un simple basculement du côté de la consommation vers le côté entreprises.
L’arrêt de Sora a un impact direct sur les partenaires. Selon des articles des médias, Disney (Disney) a signé l’année dernière, en décembre, un accord de coopération d’une valeur de 1 milliard de dollars avec Sora, et à la nuit précédant la publication officielle de la décision de mise à l’arrêt, les deux équipes collaboraient encore jusqu’à environ 19 h 30. L’affaire de Disney est devenue un cas clé utilisé par l’extérieur pour évaluer le rythme d’exécution de la transition d’OpenAI.
En termes de pression concurrentielle, au cours des six derniers mois, OpenAI a modifié deux fois sa feuille de route de l’application super afin de répondre aux menaces concurrentielles provenant de Google et d’Anthropic. Certains acteurs du secteur indiquent que la vitesse de croissance des revenus d’Anthropic pourrait dépasser celle d’OpenAI dans les quelques mois à venir ; ce scénario accélère la décision stratégique d’OpenAI de concentrer ses ressources essentielles sur Codex et sur les outils côté entreprises.
L’application mobile de ChatGPT conservera son fonctionnement indépendant ; le périmètre d’intégration de l’application super se limite au bureau. La différence essentielle est que ChatGPT est actuellement principalement axé sur la conversation, tandis que le projet d’application super, via l’intégration de Codex et d’Atlas, permet aux utilisateurs d’exécuter, à partir d’une interface unifiée, des tâches complexes impliquant plusieurs outils.
Brockman décrit, par « AGI personnelle », l’objectif de positionnement de l’application super : un système d’assistance personnelle qui comprend en profondeur les préférences et les objectifs des utilisateurs et peut traiter activement les tâches du monde numérique à leur place. Cela marque la transition d’OpenAI, passant de la démonstration des capacités des modèles à une stratégie d’intégration d’applications centrée sur l’utilisateur.
Brockman explique que la raison fondamentale est que les ressources de puissance de calcul ne suffisent pas à soutenir simultanément plusieurs lignes de produits. Sora a été évalué comme une direction au potentiel de commercialisation à court terme relativement plus faible ; les ressources ont donc été reconfigurées vers Codex et les outils côté entreprises, afin de consolider les deux principaux produits d’OpenAI offrant le plus grand potentiel de revenus à l’heure actuelle.