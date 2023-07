Microsoft présente une nouvelle évolution de son moteur de recherche basé sur l'intelligence artificielle générative. Un nouvel outil qui vient concurrencer Google Lens et sa recherche multimodale.

L’arrivée de ChatGPT et plus globalement de l’intelligence artificielle générative a lancé une nouvelle révolution sur le Web. L’acteur ayant le plus à perdre est Google avec son moteur de recherche éponyme. Pourtant, avant cela, le géant de Mountain View avait une autre arme dans sa poche pour se renouveler : la recherche multimodale. Une idée reprise par Microsoft pour aller encore plus loin que ChatGPT.

MUM et la recherche multimodale

En 2021 déjà, Google dévoilait MUM (pour Multitask Unified Model), son nouvel algorithme mêlant recherche visuelle et textuelle. L’idée ? Demander au moteur de recherche de s’appuyer sur une image pour une réponse plus complète.

Imaginez plutôt : vous appréciez le motif de la chemise de votre meilleur ami et apprécieriez des chaussettes semblables. Il suffit de pointer votre smartphone dans sa direction, d’expliciter que vous souhaitez pareil en chaussettes et MUM va vous chercher le St-Graal de vos petons. Bien sûr, cela peut prendre de nombreuses formes et se montrer particulièrement utile lorsque l’on ne connait pas le nom d’un objet précis. La simple requête « comment réparer ça ? » par exemple, en photographiant l’objet en question, pourrait apporter une réponse.

Microsoft dame le pion

Dans les starting-blocks, Google se voit dépassé par les annonces du jour de Microsoft. Dans un article de blog, le créateur de Windows dévoile trois nouveautés pour Bing : Bing Chat pour entreprise, le prix de Copilot dans Microsoft 365 pour les particuliers et l’utilisation de recherche visuelle dans Bing Chat.

Le moteur de recherche utilisant GPT-4 peut désormais s’appuyer sur des images pour vous répondre. Les exemples montrés par Microsoft parlent d’eux-mêmes.

Un schéma à main levée mal dessiné et le bon prompt permet ainsi d’obtenir le code HTML et CSS d’une page web complète. Autre exemple : une photo avec plusieurs adaptateurs secteur et le prompt « lequel dois-je emporter au Royaume-Uni » donne une réponse correcte.

Clairement, nous assistons actuellement au renouveau du marché des moteurs de recherche, monopolisé par Google depuis plus d’une décennie. Un moment historique qui pourrait bien voir Microsoft tirer son épingle du jeu.

