Google lance Gemini : son IA générative multimodale !
Google a dévoilé le 6 décembre 2023 sa nouvelle arme fatale pour concurrencer GPT-4 : Gemini. Avec ce dernier, Google entend franchir un nouveau cap dans le domaine de l'intelligence artificielle conversationnelle. Cette IA de dernière génération se distingue par sa capacité à comprendre son environnement et les contextes dans lesquels elle évolue. Zoom sur cette annonce et ce qu’elle pourrait augurer à l’avenir.
Des résultats bluffants
D’après ses concepteurs et, contrairement aux chatbots classiques, Gemini saurait faire preuve de raisonnement et saisir les subtilités du langage, y compris les références culturelles.
Ses réponses sont pertinentes et fournies en temps réel. Une démonstration vidéo récemment partagée met en lumière les prouesses de cette technologie :
Gemini: All you need to know in 90 seconds
Les performances de Gemini laissent entrevoir de nouveaux usages passionnants pour l'IA conversationnelle.
En réalité, Gemini est le fruit de plusieurs années de recherche en IA chez Google DeepMind. D'après Eli Collins, vice-président du célèbre laboratoire californien, il s'agit du modèle le plus abouti qu'ils aient créé jusqu'à présent.
Conçu comme multimédia dès l'origine, Gemini posséderait des capacités de raisonnement poussées lui permettant de résoudre des problèmes complexes avec brio. Il serait même capable de coder à un niveau expert.
Par ailleurs, ces performances exceptionnelles lui ont d’ores et déjà permis de surpasser pour la première fois des spécialistes humains lors du test de référence MMLU, qui évalue les aptitudes de raisonnement généraliste des intelligences artificielles dans divers domaines.
Gemini, meilleur que ChatGPT-4 ?
Contrairement aux modèles classiques, Gemini est capable de générer et comprendre différents types de contenus : texte, code, images, vidéos et audio. Cette polyvalence lui confère des capacités inédites pour répondre à des requêtes complexes combinant plusieurs modalités.
Grâce à une optimisation poussée du processus d'entraînement, les performances de Gemini surpassent celles des IA concurrentes sur la majorité des critères d'évaluation de référence du secteur.
Sa version la plus aboutie, Gemini Ultra, affiche notamment des résultats supérieurs à ceux de GPT-4 sur 18 des 32 tests standards utilisés pour le développement de grands modèles linguistiques.
Avec Gemini, l'état de l'art en matière d'IA conversationnelle est repoussé dans quasiment tous les domaines.
Gemini ne comprend pour l'instant que l’anglais. Sa version la plus performante, Gemini Ultra, ne sera d'ailleurs pas commercialisée avant 2024. Ajoutons enfin que les pays de l’Union européenne ne sont, pour l’heure, pas concernés par son déploiement…
Vers une AGI ?
Pour autant, Gemini sera bientôt accessible aux clients cloud de Google. Dès le 13 décembre, certains partenaires et clients sélectionnés qui utilisent Vertex AI, la plateforme de Google Cloud dédiée à l'IA, pourront expérimenter cette technologie prometteuse. Google entre ainsi en concurrence frontale avec Microsoft, qui mise également sur l'IA générative via son partenariat avec OpenAI.
Ces deux géants américains n'ont eu de cesse d'intégrer des outils d'IA à leurs offres respectives en 2023, qu'il s'agisse de moteurs de recherche, de suites bureautiques ou de services cloud. Selon Sundar Pichai, directeur général de Google, « cette nouvelle ère de modèles représente l'un des plus grands efforts scientifiques et techniques que nous ayons entrepris en tant que société ». Un signe que la course à l'IA bat son plein.
Commentaire
Connectez-vous ou créez votre compte pour réagir à l’article.