Google AI Edge Gallery constitue une implémentation technique notable qui déplace l'exécution de modèles de langage génératifs (LLM) directement sur le matériel Android. Ce principe de traitement local, ou "on-device", élimine la nécessité d'un flux de données constant vers des serveurs cloud. L'application, publiée en open-source par Google, fonctionne comme un hub centralisé pour le téléchargement, la gestion et l'interaction avec des modèles d'intelligence artificielle, le tout en mode hors ligne après l'étape initiale de téléchargement du modèle. Son fonctionnement repose sur l'intégration de modèles au format optimisé, comme les versions int4 de la famille Gemma, permettant une exécution viable sur la puissance de calcul mobile.
L'interface principale est organisée autour de la gestion des modèles et de plusieurs modules d'interaction distincts. Le processus initial nécessite de sélectionner et de télécharger un modèle depuis le hub Hugging Face, intégré directement dans l'application ; cette étape requiert une connexion internet et un compte sur la plateforme. Une alternative existe via l'import manuel d'un fichier de modèle préalablement téléchargé et stocké sur le stockage interne de l'appareil. Une fois un modèle chargé en mémoire, l'application déverrouille ses fonctionnalités principales. Le module de vision par ordinateur permet d'analyser des images capturées via l'appareil photo ou importées depuis la galerie. L'utilisateur peut ensuite interroger le modèle sur le contenu de l'image, demander des descriptions détaillées, extraire du texte ou résoudre des problèmes visuels, comme l'analyse d'une facture ou d'une équation mathématique.
Un second module, désigné comme le "Prompt Lab", est conçu pour le traitement avancé de texte. Il héberge des modèles ou des prompts spécialisés pour des tâches telles que la synthèse et le résumé de longs documents, la génération de code dans plusieurs langages de programmation, ou la réécriture et la reformulation de textes selon des tons spécifiques (formel, technique, simplifié). Le troisième pilier est un interface de chat classique, transformant le modèle chargé en un assistant conversationnel local. Cette interaction permet le brainstorming, la recherche d'idées, la planification ou l'assistance générale, sans que les données de la conversation ne quittent l'appareil. L'absence totale de publicité et l'utilisation de bibliothèques d'optimisation comme Turbo contribuent à une expérience technique fluide.
Téléchargez l'application mobile immédiatement pour débloquer la puissance de l'IA générative directement dans votre poche, sans dépendance au réseau.
Note : Une connexion internet est nécessaire pour le téléchargement initial des modèles depuis Hugging Face. Les fonctionnalités avancées dépendent de la puissance de calcul de votre appareil et de la taille du modèle sélectionné.