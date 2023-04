Amazon se lance vraiment sur le marché de l'IA générative avec plusieurs outils propulsés par AWS via son projet Bedrock, qui donne accès à plusieurs modèles de génération de texte et d'images. L'entreprise lève aussi le voile sur Titan, un double modèle de langage qui permet de générer du texte à la manière de GPT-4. Enfin, elle lance officiellement CodeWhisperer, un assistant de développement informatique.

Google s’est lancé dans l’IA avec Bard, Microsoft avec Bing et Copilot et Meta avec LLaMA. Parmi les Gamam, il en manquait deux : Apple pourrait se lancer dans l’IA générative, notamment avec une amélioration significative de Siri, Amazon faisait partie des absents. Faisait oui, puisque l’entreprise vient de faire plusieurs annonces importantes au sujet de l’intelligence artificielle principalement à destination des entreprises utilisant AWS, le tout résumé dans un billet de blog.

Amazon Bedrock : plusieurs modèles de langage accessible avec AWS

Le premier constat d’Amazon, c’est que ses clients « ont besoin d’un moyen simple de trouver et d’accéder à des modèles performants », qu’ils « souhaitent une intégration transparente à leurs applications, sans avoir à gérer d’énormes grappes d’infrastructures ou à supporter des coûts élevés », mais aussi qu’ils « veulent qu’il soit facile de prendre le modèle de base et de construire des applications différenciées en utilisant leurs propres données ».

C’est pourquoi la multinationale lance Amazon Bedrock, un service qui permet d’utiliser plusieurs modèles de langage (ou LLM pour large language model en anglais) d’intelligence artificielle :

Jurassic-2 d’AI21 Labs, qui permet de suivre des instructions en espagnol, français, allemand, portugais, italien et néerlandais ;

Claude d’Anthropic, un modèle de langage par chatbot qui se veut honnête et inoffensif. Google aurait injecté plus de 400 millions de dollars dans cette start-up. Ce modèle sert entre autres au résumé de texte, à l’écriture, au codage et à réponse à des questions ;

Stable Diffusion de Stability AI, un modèle permettant de générer des images, l’un des plus populaires du genre avec Dall-E et Midjourney. Il peut servir à créer de l’art, des logos, ou des images (qui se veulent) réalistes ;

Amazon Titan : le double modèle de langage pour générer du texte et des images ;

Ces différents outils permettent aux entreprises de développer des applications de génération automatique de texte et/ou d’image à partir de technologies d’intelligence artificielle. Ce qu’Amazon permet, c’est aussi de mettre à disposition sa puissance de calcul, grâce à AWS, son service de cloud computing, utilisé massivement par les grandes entreprises du numérique. Par exemple, si vous regardez Netflix, vous utilisez les serveurs d’Amazon. Via une API, tout client pourra avoir recours aux services de Bedrock, qui est selon Amazon, « le moyen le plus simple » de concevoir des applications d’IA génératives.

En plus de tout ça, Amazon entend permettre à ses clients de paramétrer ces différents LLM : « le service peut affiner le modèle pour une tâche particulière sans avoir à annoter de grands volumes de données (20 exemples suffisent). » Dans son communiqué, l’entreprise prend l’exemple d’un responsable marketing d’une marque de mode qui travaille sur une nouvelle campagne. En fournissant à Bedrock quelques exemples de slogans des campagnes passées et des détails sur leurs produits, « Bedrock commencera automatiquement à générer des médias sociaux efficaces, des annonces publicitaires et des textes web ».

Du côté de la protection des données, la firme précise « qu’aucune donnée du client n’est utilisée pour former les modèles sous-jacents, et comme toutes les données sont chiffrées et ne quittent par le Virtual Private Cloud (VPC) du client, les clients peuvent être sûrs que leurs données resteront privées et confidentielles ». De quoi tenter d’atténuer les peurs autour des IA génératives et de la manière dont elles se nourissent des données qu’on leur donne. On sait que certains employés de Samsung ont entré des données confidentielles dans des requêtes faites à ChatGPT, ce qui peut avoir d’importantes conséquences. La protection des données, ou plutôt sa non-protection, est aussi ce qui a poussé l’Italie à interdire ChatGPT dans le pays. Pour le moment, Amazon Bedrock est disponible en prévisualisation limitée, seuls certains clients peuvent expérimenter le service.

Amazon Titan : un géant d’IA qui veut faire du texte et des images

Dans le même temps, Amazon lance Titan : son propre modèle de langage par IA capable de comprendre du texte. Il s’agit plus précisément de deux modèles distincts développés par Amazon. Ils ont été testés en avant-première auprès de quelques clients et Titan devrait être déployé plus largement dans les mois à venir.

Titan est donc une IA dédiée au texte, sorte d’équivalent à GPT-4 « pour des tâches telles que le résumé, la génération de texte (par exemple, la création d’un article de blog), la classification, les questions-réponses ouvertes et l’extraction d’informations. » De l’autre côté, Titan permet de traduire du texte en « représentations numériques […] qui contiennent la signification sémantique du texte. » Un LLM qui ne sert pas directement à générer du texte, mais qui selon Amazon se révèle « utile pour des applications telles que la personnalisation et la recherche. » C’est à peu près le même système qui est utilisé dans la recherche de produits sur son site de vente en ligne.

Pour répondre aux dérives d’OpenAI dénoncées comme des textes générés qui posent problème, Amazon aborde la question dans sa communication. L’entreprise déclare que les modèles de Titan « sont construits pour détecter et supprimer le contenu nuisible dans les données, rejeter le contenu inapproprié dans l’entrée de l’utilisateur et filtrer les sorties des modèles qui contiennent du contenu inapproprié tel que le discours haineux, le blasphème et la violence. » Pourtant, en France, le délit de blasphème n’existe plus, bien que tout discours de provocation de haine soit répréhensible.

CodeWhisperer : l’assistant de développement informatique d’Amazon

En plus de tout cela (ce n’est pas fini !), Amazon lance CodeWhisperer, un outil d’IA générative qui assiste les développeurs dans leur travail. La programmation informatique est un domaine dans lequel l’entreprise dit prévoir « une croissance rapide de l’utilisation de l’IA générative ». Pour Amazon, les développeurs peuvent perdre du temps à se tenir au courant des nouveautés des outils et des technologies, mais aussi à copier du code trouvé sur Internet, « ce qui peut les amener à copier par inadvertance un code qui ne fonctionne pas, qui contient des failles de sécurité ou qui ne permet pas de suivre l’utilisation des logiciels libres. »

D’ailleurs, CodeWhisperer se veut davantage sécurisé que d’autres assistants, puisqu’il est « doté d’une analyse de sécurité intégrée (alimentée par un raisonnement automatisé) ». Aussi, il peut détecter si du code est open source, mais ne peut pas être utilisé dans un but commercial.

Avec CodeWhisperer, Amazon veut donc aider les développeurs à aller plus vite en écrivant à leur place du code, mais aussi en donnant des suggestions de code en temps réel. Jusqu’à maintenant, l’outil était disponible pour certains utilisateurs seulement : désormais l’assistant de programmation est accessible à tous les développeurs. La société met l’accent sur la productivité en déclarant que lors d’un défi organisé avec des développeurs, « les participants qui ont utilisé CodeWhisperer ont terminé les tâches 57 % plus rapidement en moyenne, et avaient 27 % plus de chances de les terminer avec succès » que les autres.

L’assistant fonctionne pour plusieurs langages : Python, Java, JavaScript, TypeScrypt, C#, Go, Kotlin, Rust, PHP ou encore SQL. Il est disponible sur plusieurs interfaces de développement comme Visual Studio Code, IntelliJ IDEA, AWS Cloud9 et autres.

CodeWhisperer est utilisable gratuitement pour les utilisateurs individuels, « sans qualification ni limite de temps pour la génération de compte. » Toutefois, on ignore à quel point les données qu’on lui confie servent à Amazon ni comment elles sont exploitées. L’utiliser rend aussi service à Amazon (rappelez-vous de l’adage : si c’est gratuit, c’est vous le produit), une forme de digital labor, à savoir une pratique numérique qui produit de la valeur pour une entreprise du numérique proposant un service, au sens des chercheurs Dominique Cardon et Antonio Casilli.

Amazon se positionne face à Microsoft sur l’intelligence artificielle

Mais ces annonces ne sont pas les seules faites à propos d’AWS. Amazon en profite pour présenter de nouvelles instances pour ses machines : Trn1n et Inf2, rappelant qu’il « a investi dans son propre silicium pour repousser les limites de la performance et du prix pour les charges de travail exigeantes telles que l’entraînement et l’inférence ML (machine learning), et nos puces AWS Trainium et AWS Inferentia offrent le coût le plus bas. » La multinationale dit miser sur des architectures optimisées non pas pour l’entraînement des IA, mais davantage pour leur exécution, prédisant un futur ou ce sera ce qui demandera le plus de puissance de calcul, le tout avec une faible latence et un haut débit.

Pourtant, c’est la crise chez Amazon et notamment chez AWS. Certains clients se tournent désormais vers des infrastructures auto-hébergées, particulièrement les plus gros. Il y a quelques semaines, on apprenait que l’entreprise Ahrefs, spécialisée dans le SEO, a pu économiser 400 millions de dollars en trois ans, en ne recourant pas à AWS.

Moins qu’une perte sèche pour AWS, c’est plutôt un ralentissement de sa croissance qui est observé. Mais les conséquences économiques sont là : depuis fin décembre, ce sont environ 27 000 employés d’Amazon qui ont été licenciés, soit de 7 à 8 % de sa masse salariale. Avec ses projets Bedrock et Titan, Amazon espère voir AWS croître davantage.

En fait, la firme s’affiche en concurrente de Microsoft, bien avancé dans l’IA, y compris sur le secteur du cloud computing à destination des entreprises. Il ne faut pas oublier que Microsoft, c’est aussi Azure, sa propre solution, qui intègre désormais des outils pour développer des applications d’IA génératives. La firme va à ce propos tenir une conférence ce 23 mai et de nouvelles annonces pourraient être faites. En plus de cela, on s’attend à ce que Microsoft sorte un support de plug-in pour Bing Chat, ce qui pourrait permettre à des services web d’utiliser son outil d’IA.

