Pour améliorer la précision des services proposés par Maps, Google travaille sur un projet d’apprentissage profond qui permet à son système de lire des noms de rues grâce aux photos de Street View. Et ce, même dans des conditions difficiles.

Le monde change perpétuellement. Affirmer cela revient à enfoncer des portes ouvertes, mais il est bon de le rappeler pour se rendre compte à quel point Google Maps a tout intérêt à rester à jour constamment. Et cela représente un sacré défi. Partout sur Terre, de nouvelles rues sont construites, d’autres modifiées et les paysages urbains se transforment.

Ainsi, pour optimiser Maps, Google travaille sur un procédé de deep learning — apprentissage profond — pour que son système apprenne à lire tout seul les noms de rues indiqués sur les panneaux, même quand les photos sont très compliquées à déchiffrer. La firme de Mountain View a en effet publié une étude à ce sujet et le code est disponible au public.

Google affirme ainsi vouloir automatiser l’analyse des 80 milliards d’images collectées par ses voitures Street View (plusieurs millions par jour) qui permet de trouver des informations nouvelles ou mises à jour pour Google Maps. Le but est évidemment d’en améliorer la précision.

Grâce à ces quatre photos, l’avenue des sapins a bien été enregistrée par le système.

Apprendre à lire des panneaux

Google a ainsi créé la French Street Name Signs, une banque de données regroupant plus d’un million de panneaux rédigés en français. À force d’entraînement, le système a été capable d’atteindre un taux de précision de 84,2 %. D’après l’entreprise, il dépasse largement tous les autres systèmes actuels.

Pour y arriver, Google a orienté sa technologie de reconnaissance d’image vers la détection de texte dans les environnements en extérieur alors que la plupart des procédés se concentrent essentiellement à extraire du texte depuis un document scanné. Dans un environnement naturel, la tâche est plus ardue puisqu’il y a plus de détails perturbateurs dans l’image. Par ailleurs, plusieurs clichés du même panneau doivent parfois être utilisés pour pouvoir recueillir suffisamment de données.

Malgré des photos de mauvaise qualité, le système a su reconnaître le panneau.

Des efforts de longue date

Les premiers efforts dans ce domaine-là ont été menés en 2008 pour flouter automatiquement toutes les plaques d’immatriculation des voitures que l’on aperçoit sur Street View. Ensuite, toujours grâce au machine learning, Google Maps a pu affiner sa précision pour lire les numéros de voie qui facilite la recherche d’une adresse.

Google explique que l’étape suivante était forcément d’étendre ces techniques à la reconnaissance des panneaux de route avant de s’attaquer aux enseignes des magasins et commerces en tout genre. Google n’indique malheureusement pas quand ces techniques de deep learning pourront être déployées sur Google Maps.