Google a discrètement mis en ligne cette semaine sur l’App Store iOS une application gratuite de dictée IA hors ligne, « AI Edge Eloquent », qui utilise un modèle Gemma ASR côté terminal. L’audio ne quitte absolument jamais l’appareil, et, chose rare, elle arrive sur iOS avant même Android.
(Contexte : Google publie le modèle ouvert le plus intelligent Gemma 4 ! Adopte entièrement la licence Apache 2.0, des performances qui rivalisent avec de grands systèmes d’IA propriétaires fermés)
(Complément : briser la domination de Nvidia ? Le modèle d’IA le plus puissant de Google « Gemma 3 » avec 1 H100 bat DeepSeek et OpenAI)
Table des matières
Toggle
Sans conférence de presse ni annonce officielle, Google a simplement, plus tôt cette semaine, mis discrètement « AI Edge Eloquent » sur l’App Store iOS. Cette application de dictée IA entièrement gratuite, axée sur la reconnaissance vocale hors ligne, s’appuie en coulisses sur le modèle Gemma ASR (reconnaissance automatique de la parole) côté terminal de Google : tous les traitements audio sont effectués localement sur l’appareil, sans nécessité de connexion réseau.
La logique de fonctionnement de « AI Edge Eloquent » est très intuitive : une fois l’application lancée, vous parlez face au microphone, et l’écran affiche en temps réel le texte ainsi que le graphique de l’onde sonore. Une fois l’enregistrement arrêté, l’application filtre automatiquement les fillers parlés tels que « euh » et « ah », corrige la ponctuation, restructure le contenu prononcé en un texte propre et directement utilisable, puis le copie automatiquement dans le presse-papiers.
La conception orientée confidentialité est également l’un des principaux arguments de cette application. En mode 100 % hors ligne, les données audio ne quittent pas l’iPhone de l’utilisateur et ne sont envoyées vers aucun serveur. Google propose aussi une option de « mode cloud » : la reconnaissance vocale reste réalisée côté terminal, puis seuls les textes résultants (et non l’audio brut) sont envoyés au modèle cloud Gemini pour un nettoyage supplémentaire, afin d’obtenir une qualité supérieure.
Le service complet est entièrement gratuit : aucun abonnement, aucune limite d’utilisation.
En parallèle, les médias technologiques ont relevé un phénomène rare : dans la plupart des cas, les produits de Google arrivent d’abord sur Android ; en particulier, pour les fonctionnalités d’IA côté terminal, elles sont généralement lancées en priorité avec des appareils Pixel et le modèle Gemini Nano. Cette fois, « AI Edge Eloquent » fait le contraire : dans la description de l’App Store, il est même indiqué directement que la version Android sera bientôt disponible.
Les analystes proposent deux lectures. Première interprétation : il s’agirait d’un test de marché. Google pourrait avoir choisi volontairement iOS, « hors du terrain » principal, pour mener une expérimentation sans perturber l’écosystème Android, afin d’évaluer l’acceptation des consommateurs de la dictée IA côté terminal et leurs habitudes d’utilisation.
Deuxième interprétation : le scénario « technologie prête ». Le modèle Gemma ASR sur iOS pourrait avoir atteint plus tôt le stade d’optimisation permettant une utilisation fiable que la version Android. Google aurait donc choisi de la mettre en ligne sans attendre une synchronisation sur les deux plateformes.
D’un point de vue technique, le sens de « AI Edge Eloquent » ne se limite pas à n’être qu’un outil de dictée. Gemma est une série de modèles IA légers et open source de Google ; son intention de départ est de fonctionner efficacement dans des environnements aux ressources limitées comme les appareils mobiles. Edge AI est le cadre mis en place par Google pour permettre aux développeurs d’exécuter des modèles d’apprentissage automatique directement sur l’appareil.
Cette application revient en fait à transposer les capacités d’inférence côté terminal de Gemma dans le quotidien des utilisateurs.
Pour les développeurs, AI Edge Eloquent est aussi un modèle de référence : il montre comment le modèle Gemma peut être déployé dans des produits grand public, ainsi que comment une architecture hybride hors ligne et cloud peut trouver un équilibre entre confidentialité et qualité.