Blogue

Google I/O 2023 : l’IA au service du développement numérique

30 mai — 2023

Renato Freire Ricardo

Développeur logiciel

L'Intelligence artificielle agit comme un véritable accélérateur pour les équipes de développement et les initiatives numériques. Capable de nous faire économiser des heures de débogage, de nous fournir des insights sur le comportement des utilisateurs·trices, d’optimiser nos interactions avec les client·e·s grâce à des outils tels que les chatbots et de nous permettre de rester à l'avant-garde de la technologie. L'IA n'est pas simplement un terme à la mode, c’est un outil essentiel pour améliorer nos produits et rester compétitif dans un univers numérique en perpétuelle mutation.

Lors de la dernière conférence Google I/O, les expert·e·s de Google ont dévoilé plusieurs nouveaux outils qui facilitent et accélèrent l'intégration de modèles d'IA dans des projets numériques, sans nécessiter d'importants investissements dans le développement et la formation de modèles. En intégrant l'IA dans de nombreux produits et services, Google promet de nouvelles avancées qui faciliteront la tâche des développeurs et développeuses et des organisations.

Dans cet article, nous nous penchons sur les diverses annonces d’intégration de l’IA dans les solutions Google Cloud et les outils pertinents pour développer de nouvelles fonctionnalités ou pour améliorer des fonctionnalités existantes dans des produits numériques.

L’IA générative : Le nouveau compagnon des développeurs·euses

L'Intelligence artificielle générative constitue une véritable révolution dans le domaine des produits numériques. Elle modifie en profondeur notre manière de concevoir et d'interagir avec le contenu numérique. Dotée de la capacité de créer de manière autonome divers types de contenus - images, textes ou musique - en fonction de son apprentissage, elle offre des possibilités immenses en termes de personnalisation et de scalabilité pour les produits numériques. Grâce à elle, on peut personnaliser le contenu pour chaque utilisateur·trice, générer des designs uniques, rédiger des descriptions de produits ou même créer de la musique pour des publicités. L'ampleur des innovations qu'elle peut engendrer est considérable, ce qui fait de l'IA générative un véritable levier de transformation dans l'univers numérique.

L'association du code traditionnel et des modèles d'IA générative peut conduire à des résultats remarquables dans le développement de fonctionnalités innovantes. Ces avancées, tant pour les applications web que mobiles, ont le potentiel de transformer l'interaction des utilisateurs·trices avec ces produits.

Des outils qui démocratisent l’IA pour le développement

Gen App Builder : Conception d’apps génératives pour la conversation et la recherche

Dévoilé un peu plus tôt cette année, le Gen App Builder offre aux développeurs·euses, y compris ceux et celles dont l'expérience en machine learning est limitée, la possibilité de concevoir de manière rapide et simple des applications génératives pour le chat et la recherche. C'est un outil idéal pour mener des expériences ou construire rapidement des prototypes, comme par exemple un pendant du ChatGPT, mais utilisant nos propres données.

Source : Google Cloud Blog

Quatre nouveaux modèles disponibles sur Vertex AI

Vertex AI est l'outil phare de Google pour la recherche, la création, le test, le déploiement et l'évaluation de modèles d'IA. L'introduction de modèles d'IA générative enrichit le choix de modèles qui peuvent être intégrés à nos projets via des API. Cet outil facilite et démocratise l'intégration et l'adoption de modèles intelligents personnalisés dans les applications.

1. PaLM 2 pour le texte et le chat

PaLM 2, la version actualisée d’un des modèles d'IA de base de Vertex AI, sert de fondement à plusieurs autres outils. Un modèle de base de cette nature est plus polyvalent et peut être ajusté pour accomplir une multitude de tâches différentes. Cette version améliorée de PaLM est notamment conçue pour comprendre, générer et traduire plus de 100 langues, pour résoudre des problèmes mathématiques complexes et pour rédiger du code dans divers langages de programmation. PaLM 2 est la technologie qui alimente plus de 25 fonctionnalités et produits de l'écosystème Google.

2. Codey pour la complétion de code

Codey est un modèle d'IA conçu pour convertir le texte en code. Il soutient les développeurs·euses dans leur écriture de code en proposant des fragments de celui-ci basés sur les commentaires et d'autres formes d'analyse. Il peut être adapté au code spécifique de divers projets. Sa capacité à accélérer le développement de nouvelles fonctionnalités est un atout majeur, tout comme sa contribution potentielle à la mise en place de tests automatisés.

Source : Google Cloud Blog

3. Imagen pour la conversion de texte en image

Imagen est un modèle texte-image qui permet la génération d'images à partir d'un texte, cela permet la création d'images de manière automatisée. Il permet également d'éditer des images préexistantes ou de les utiliser comme base pour générer de nouvelles images. Ce modèle permet diverses utilisations pertinentes:

En se basant sur l'image originale d'un produit, Imagen est capable de générer des images du même produit dans d'autres couleurs alternatives.
Le modèle permet de faire du upscaling et convertir une image pour obtenir une meilleure définition.
Imagen est capable de créer automatiquement une légende pour les images, facilitant l'intégration de descriptions, d'étiquettes et de balises dans les images. Cette utilisation permet d'améliorer l’accessibilité d’un site Web ou d’une application.
En s’intégrant à des outils de modération de contenu, il permet d’augmenter la sécurité d'utilisation dans les environnements de production.
Toutes les images générées par Imagen peuvent être téléchargées pour générer du contenu marketing et pour être partagées publiquement. De plus, les images de base téléversées dans le modèle afin d’en générer d'autres sont protégées par les contrôles de gouvernance de Google et ne peuvent pas être utilisées et partagées par les autres utilisateurs·trices de Imagen.

4. Chirp pour la reconnaissance vocale

Chirp est un modèle de synthèse vocale qui favorise la création de fonctionnalités où l'utilisateur·trice interagit vocalement avec le site web ou l'application. Les développeurs·euses peuvent alors exploiter ce texte comme input pour un modèle de "chat", par exemple. Il peut également servir à ajouter des sous-titres à des vidéos. Les instructions vocales qu'il génère peuvent aussi être employées pour dialoguer avec un assistant·e virtuel·le ou pour exécuter des commandes vocales.

Source : Google Cloud Blog

Des APIs d'intégration pour le texte et les images

Accessibles via le jardin de modèles de Vertex AI, les nouvelles API d'intégration de Google Cloud pour le texte et les images offrent la possibilité de développer des fonctionnalités telles que des moteurs de recommandation, des classificateurs, des chatbots Q&A, des analyseurs de sentiments et d'autres fonctionnalités nécessitant une compréhension sémantique des textes ou des images. Chacune de ces fonctionnalités peut être paramétrée pour utiliser les données d'un projet spécifique, permettant ainsi d'obtenir des résultats davantage personnalisés.

Le RLHF (Reinforcement Learning from Human Feedback - apprentissage par renforcement)

La nouvelle fonctionnalité de RLHF dans Vertex AI facilite l'intégration de la rétroaction humaine dans l'optimisation des modèles d'IA. Lorsqu'un modèle est déployé dans une fonctionnalité, la collecte, le filtrage et la préparation des retours humains sur les résultats générés par le modèle sont des processus complexes. Les nouveaux outils intégrés à Vertex AI simplifient ces processus, permettant des améliorations plus rapides. En dépit des protections automatisées, la rétroaction humaine reste un outil précieux pour prévenir le discours de haine, les biais et les contenus restreints.

Mediapipe : Solutions low-code de machine learning

MediaPipe est un autre outil développé pour intégrer l'IA dans notre vie quotidienne. Il s'agit de frameworks qui permettent d'exécuter et déployer des modèles de Machine Learning directement sur des appareils mobiles, sur le Web, sur des objets connectés et autres appareils, sans devoir passer par le cloud. Ces modèles sont notamment capables d’analyser des images, de comprendre la sémantique de textes et d’entendre et reconnaître des sons.

Source : Google - MediaPipe

Il convient de souligner que malgré l'optimisation des modèles exécutés directement sur des appareils mobiles, ceux-ci restent plus rudimentaires et moins précis que les modèles plus sophistiqués présentés précédemment qui opèrent sur des machines dans le cloud.

L’utilisation responsable et éthique de l’IA

L'importance du développement responsable de l'IA et de la protection des données – tant celles utilisées pour affiner les modèles que celles générées par les utilisateurs·trices – a été mise en évidence lors des présentations. Ces principes fondamentaux se retrouvent dans toutes les annonces des nouveaux produits de Google pour l'IA.

Pour garantir le respect de ces principes et l'utilisation éthique de l'IA en conformité avec les dernières normes en vigueur, il est judicieux de faire appel à une équipe de spécialistes en développement de produits numériques comme celle de Mirego. Notre équipe est prête à vous conseiller afin que vous offriez à vos utilisateurs·trices un produit numérique éthique, innovant et durable.

Mirego et IA : un duo dynamique !

Toutes ces nouvelles avancées et fonctionnalités constituent des outils puissants pour concevoir de nouvelles solutions ou améliorer les fonctionnalités existantes. Cependant, elles ne sont pas une solution miracle qui pourrait être utilisée dans tous les contextes. Chaque outil a une portée spécifique, optimisée pour exceller dans une tâche précise. Des modèles de base plus génériques, tels que les modèles de "chat", excellent dans la communication avec les utilisateurs·trices, mais nécessitent souvent le soutien d'autres modèles spécialisés pour des tâches plus spécifiques.

Une chose est certaine : l'avenir de l'IA est incroyablement prometteur. Pour les aficionados de la technologie comme nous, ces innovations et outils inédits sont non seulement stimulants, mais ils ouvrent également un univers d'opportunités pour la création de nouvelles solutions numériques exceptionnelles. Chez Mirego, nos équipes de design, de stratégie et de développement continuent de travailler de pair avec nos clients afin de trouver les façons les plus efficaces d’intégrer l’IA dans leurs produits numériques.

Article suivant

Swift 6 et Apple Intelligence : l’impact des nouveautés Apple pour les développeur·euses

Blogue