Loupe

L’intelligence artificielle avec les Microsoft Cognitive Services

Temps de lecture estimé : 4 min

Depuis que le rapport Villani a été remis au gouvernement français en mars, l’Intelligence Artificielle fait la une de nos journaux et laisse rarement indifférent, pour le meilleur et pour le pire.

Pour le meilleur, on citera les avancées indéniables permises dans le domaine de la santé comme la prédiction des cancers ou encore dans la préservation de l’environnement comme évoqué lors de l’événement Tech For Planet. Pour le pire, on garde tous en tête Tay, le bot Twitter devenue raciste et sexiste en 24 heures seulement.

Le but dans cet article n’est pas de débattre sur les risques liés à l’Intelligence Artificielle mais de vous présenter comment et dans quel contexte elle peut être mise en place avec les Cognitive Services de Microsoft.

logo-microsoft-cognitive-services.png

Qu’est-ce que l’IA ?

Mais d’abord, revenons sur les basiques. Comment définir l’Intelligence Artificielle ? Il s’agit d’un ensemble de techniques mises en œuvre pour permettre aux machines d’imiter les mécanismes du cerveau humain. Le but n'est pas seulement de réussir à imiter l'intelligence humaine mais bien de la surpasser en éliminant les erreurs au maximum.

Par exemple, une application dotée d’intelligence artificielle va pouvoir imiter notre capacité à apprendre, c’est ce qu’on appelle depuis des années le Machine Learning et qui sert traditionnellement à Google pour améliorer l’efficacité de son moteur de recherche. Plus nous l’utilisons, plus il apprend et plus il pourra répondre de façon pertinente à nos demandes. Plus récemment, lors de la Google I/O, Google a annoncé que son Assistant pourrait même passer des appels à votre place, pour réserver un restaurant par exemple.

Le concept d’Intelligence artificielle n’est pas nouveau puisqu’il est déjà évoqué par Alan Turing, le papa des ordinateurs, dans les années 1950. Soixante-dix ans plus tard, la technologie permet la création d’intelligence artificielle et son utilisation dans des machines, des applications, des objets connectés... Dans nos projets chez Infinite Square, lorsque nous avons besoin d’une IA, pour créer un bot par exemple, nous nous appuyons sur les Microsoft Cognitive Services.

Les Microsoft Cognitive Services

Les Microsoft Cognitive Services sont un ensemble de services proposés par Microsoft et s’appuyant sur le Machine Learning afin de rendre les applications intelligentes.

L’idée est de disposer d’API qui comprennent le monde comme les humains le font par la vision, la voix, le langage, les connaissances et expériences accumulées et la capacité de recherche. L’objectif final est de se rapprocher au plus près des capacités de l’intelligence humaine. L’avantage des services Microsoft est qu’ils sont entraînés par Microsoft et utilisables directement dans vos projets à travers des API REST très faciles à consommer. De plus, des SDK (dans plusieurs langages) sont également disponibles ici.

Dans cet article, nous vous proposons de revenir sur les trois groupes d'APIs que nous utilisons le plus :

- Vision, pour le traitement des images comme la reconnaissance faciale

- Speech, pour le traitement et l'analyse des voix 

- Language, pour la compréhension et l'analyse des conversations 

trois-cognitive-services.png

Vision

API-vision-microsoft-cognitive-services.jpg

Les APIs vision permettent avant tout le traitement intelligent des images : reconnaissance faciale, estimation de l’âge d’une personne, détection des émotions, détection des différents éléments d’une image ou du thème d’une vidéo...

Concrètement, nous l’avons utilisé dans des contextes événementiels. Lors d’un événement interne pour l’un de nos clients, les participants pouvaient soumettre leur photo lors de leur inscription par bot. Une fois arrivés sur place, ils n’avaient plus qu’à se présenter devant la webcam de la borne d’accueil pour être reconnus et obtenir leur badge. Imaginez la surprise des participants, arriver et être immédiatement reconnu, sans même avoir à parler ou renseigner leur nom sur une machine ! Effet wahou garanti !

Pour un autre client, Grand Paris Sud, nous avons développé une application de reconnaissance des émotions, toujours lors d'un événement. Lors du passage des visiteurs sur le stand, une estimation de leur humeur était affichée à l'écran ainsi que leur pourcentage de sourire. Cette démonstration des possibilités des Cognitive Services a attiré beaucoup de monde sur le stand de Grand Paris Sud et permis d'engager des conversations avec les visiteurs.

application-detection-sourire-avec-cognitive-services.jpg

Speech

api-speech-microsoft-services.jpg

Les APIs speech permettent de convertir de la parole en texte et vice-versa mais aussi de reconnaître les différentes voix qui interviennent. Cela permet par exemple de prendre en note l'intégralité d'une réunion sans avoir besoin de secrétaire. L'IA est capable de retranscrire en direct ce qui est dit et par qui. Chaque participant est donc vraiment libre d'intervenir et de réfléchir aux idées sans se concentrer sur la tâche de retranscription.

Cela peut aussi devenir un moyen de dévérouiller des appareils et de leur donner des commandes. Nos appareils ne répondront qu'aux voix autorisées et cela évitera ainsi que vos chers collègues programment votre réveil à 5h du matin en commandant votre téléphone par la voix. 

Language

api-language-microsoft-cognitive-services.jpg

Ce groupe d'APIs permet entre autres : la correction orthographique dans vos outils, l'entraînement de vos modèles linguistiques, la compréhension de textes du plus simple au plus complexe par l'IA, incluant l'analyse des sentiments et expressions propres à chaque langue pour les modèles les plus entraînés. Tous ces outils permettent notamment de créer des chatbots de plus en plus efficaces et pouvant répondre (presque) comme un humain aux questions qu'on leur pose. 

Grâce à ces APIs, nous avons pu développer des bots bien plus facilement et rapidement, en nous basant sur des modèles éprouvés. Par exemple, nous avons mis en place un bot d'inscription pour un événement. Les bots ne sont pas révolutionnaires en soi, ils existent depuis de nombreuses années, mais ils sont maintenant capables d'avoir des réponses bien plus élaborées et à propos. L'expérience proposée aux utilisateurs en est donc bien plus agréable et fluide.

Si vous souhaitez approfondir le sujet des bots, vous pouvez consulter notre avis d'expert dans ce livre blanc ici. 

Conclusion

Les cognitive services nous permettent donc d'intégrer facilement de l'intelligence artificielle dans nos applications à travers des APIs complètes et accessibles. Les modèles sont robustes et éprouvés, en perfectionnement perpétuel sur le principe même du machine learning. Nous avons cité quelques exemples d'applications réalisées dans cet article, sachez que nous utilisons aussi ces services dans le développement de notre produit inwink, plateforme de gestion des événements BtoB, notamment pour nos algorithmes de recommandation. 

Dans de prochains articles, nous vous proposerons des méthodes pas à pas pour consommer les cognitive services, à travers l'exemple de la création d'un Bot. 

Photo de profil

Ces billets pourraient aussi vous intéresser

Vous nous direz ?!

Commentaires

comments powered by Disqus