OpenAI serait sur le point de dévoiler GPT-4, une nouvelle version majeure de son IA, d'après Microsoft. L'une des nouveautés serait la possibilité de traiter des vidéos.

Depuis le lancement de GPT-3 en 2020 par OpenAI, le modèle de langage a rencontré un énorme succès dans l’industrie tech et a su imposer l’intelligence artificielle comme le nouveau domaine à conquérir pour les géants.

Après un passage par GPT-3.5 qui propulse ChatGPT, OpenAI serait prête à lever le voile sur son modèle de nouvelle génération GPT-4. La source est plutôt crédible puisqu’il s’agit de Microsoft, partenaire historique de la startup.

Cap sur la vidéo et l’audio

C’est plus précisément Andreas Braun, un cadre de Microsoft Allemagne, qui a déclaré : « la semaine prochaine, nous présenterons le GPT-4, qui proposera des modèles multimodaux offrant des possibilités totalement différentes, par exemple des vidéos ». Il faut noter que ni la branche américaine de Microsoft ni OpenAI n’ont confirmé ces propos. Il est déjà arrivé par le passé qu’une branche nationale de Microsoft en dise trop, ou se trompe complètement dans son sujet. Reste qu’il s’agit ici d’une parole officielle que l’on ne peut pas écarter.

Aujourd’hui, l’une des grandes limites de GPT-3 est de ne fonctionner qu’avec du texte. C’est pour cela que OpenAI et Microsoft en ont fait émerger des assistants à l’écrit comme Bing ou ChatGPT.

Microsoft n’est pas rentrée dans le détail concernant cette nouveauté qui devrait être dévoilé dès la semaine prochaine. On croit comprendre qu’il sera possible de générer des vidéos comme Midjourney ou Dall-E peuvent générer des images aujourd’hui.

Mais le plus intéressant avec des modèles multimodaux est la possibilité de mélanger des commandes de types différents pour une IA. On peut imaginer une future version de ChatGPT qui serait capable d’analyser des images ou des vidéos pour répondre à une question. Par exemple poser la question suivante « peux-tu me dire à quelle minute de cette vidéo YouTube, l’intervenant entre dans sa conclusion ? » en proposant un lien vers la vidéo en question. On imagine aussi pouvoir demander des résumés de longues vidéos.

Microsoft devrait à terme intégrer la puissance de GPT-4 à son moteur de recherche Bing. Rien n’a été toutefois annoncé en ce sens pour le moment. Il faudra donc se montrer patient.

Utilisez-vous Google News (Actualités en France) ? Vous pouvez suivre vos médias favoris. Suivez Frandroid sur Google News (et Numerama).