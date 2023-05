Avec le nouveau prototype de Project Starline, Google a peut-être trouvé comment révolutionner les appels vidéo grâce à une savante combinaison d'IA et de modélisation 3D. On a pu essayer et c'est bluffant.

L’homme en face de moi me tend une pomme. Elle semble être à portée, à 30 centimètres environ. Je tends la main… mais impossible de me saisir du fruit. Je sais parfaitement pourquoi et pourtant, mon cerveau a du mal à tout appréhender. Je suis face au dernier prototype de Project Starline de Google et c’est simplement dément.

En marge de la Google I/O 2023, le géant américain a en effet dévoilé une nouvelle version de Project Starline. Une technologie encore expérimentale qui promet de révolutionner nos appels vidéo.

Un appel vidéo des plus surprenants

Invité à tester cette expérience, je me retrouve dans une petite pièce d’un des multiples buildings de Google éparpillés dans Mountain View. J’y avise une chaise, une table et, surtout, une espèce de gros téléviseur de 65 pouces (et une très grosse barre de son) devant lequel je suis prié de prendre place.

Le porte-parole de Google ferme la porte derrière moi, s’installe dans une autre pièce plus loin avec le même dispositif. Il lance un appel vidéo avec moi par écrans interposés. Rien de bien extraordinaire… a priori.

Mon interlocuteur, Jason Lawrence, cofondateur du projet, semble vraiment assis de l’autre côté de la table. Quelque chose au fond de moi n’arrive pas à assimiler le fait que Jason n’est pas dans la même pièce que moi.

Je me penche à gauche, à droite, et je distingue parfaitement bien les côtés de son visage, comme je pourrais le faire s’il était vraiment à un mètre de moi. Il me tend la fameuse pomme et j’ai l’impression que, s’il la jetait, elle me frapperait au visage. Il me propose un check, poing fermé contre poing fermé, et me voilà presque surpris de ne rien toucher.

« Une fenêtre magique »

L’effet 3D est bluffant, ni plus ni moins. D’autant plus que les bords du téléviseur semblent avoir disparu et ce sont les différentes caméras qui l’encadrent qui me permettent de deviner ses contours. L’immersion est très bonne et il faut quelques artefacts dans l’image — la silhouette de Jason ondule par moment — pour me rappeler que je ne vois qu’une projection 3D de lui.

Hélas, la prise de photo et les enregistrements vidéo sont interdits. Une personne chez Google nous explique officieusement que nos caméras et smartphones ne peuvent pas retranscrire correctement l’expérience 3D de Project Starline. Il faut donc se contenter des visuels officiels et me croire sur parole.

Une question se pose forcément : comment fonctionne Project Starline ? Google décrit une technologie qui se comporte « comme une fenêtre magique ». On pourrait croire que la magie est un simple hologramme. Cependant, on a en réalité affaire à de l’intelligence artificielle, de la modélisation photoréaliste en 3D et un traitement en temps réel ultra efficace.

L’objectif : améliorer la qualité des échanges en les rendant plus naturelles même quand deux personnes sont dans deux villes différentes.

La première version de Project Starline date en réalité de 2021. Mais à l’époque, le système nécessitait un matériel bien plus imposant ayant la même taille qu’une « cabine de restaurant ». Entendez par là les boxes de diners à l’Américaine comprenant deux larges banquettes et une table.

Le tout nouveau prototype que j’ai pu essayer est bien plus compact et promet d’être bien plus facile à installer dans une salle de réunion par exemple, voire à la maison dans un avenir plus lointain.

Une conversation naturelle

Les caméras autour de l’écran capturent mes mouvements et la direction de mon regard. Une intelligence artificielle concoctée par Google récupère en temps réel ces données. Elle peut ainsi reconstituer une image photoréaliste en 3D de ma personne pour la montrer à Jason tout en me proposant une perception de mon interlocuteur fidèle à celle que j’aurais eue s’il était bel et bien physiquement devant moi. Tous les effets de profondeur sont parfaitement retranscrits.

C’est d’ailleurs ce qui me chamboule le plus. Techniquement, je ne voyais pas une vraie vidéo de Jason. Je voyais une reconstitution 3D en direct. En outre, cette notion de temps réel est primordiale. L’immersion serait totalement rompue s’il y avait une latence.

Google se targue donc de réussir à compresser les données et les interpréter en un clin d’œil pour que la discussion reste très naturelle. Les artefacts évoqués plus haut dans cet article sont sans doute dus à des petits soubresauts dans le processus.

Un produit expérimental

Enfin, notons que lorsque je me penchais trop sur le côté, une notification sur le téléviseur me demande de me recentrer.

Aucun prix ou date de commercialisation n’a été communiqué pour le moment. À l’heure actuelle, Project Starline est encore un produit expérimental un peu fou qui ambitionne de faire grand bruit dans les années à venir. En attendant, je n’ai toujours pas réussi à attraper la pomme.

NB. Notre journaliste Omar participe à la Google I/O à Mountain View dans le cadre d’un voyage de presse organisé par Google.

