Hello à vous ;-)
Ce matin, je voulais vous présenter un peu le fonctionnement de Siri, l’outil d’interaction vocale d’Apple. Siri est incroyablement facile à utiliser, fonctionne plutôt bien et ne fait que s’améliorer. Les entreprises technologiques essayent depuis très longtemps d’offrir aux ordinateurs des capacités de langage « naturel » avec souvent beaucoup de difficulté, de maladresse et parfois, de la réussite dans leur fonctionnement technique ;-) Nous nous rapprochons donc de l’interaction homme-machine presque sans faille grâce au son mais il manque à mes yeux encore quelque chose de primordial…
Comprendre la voix est une chose mais nous avons encore besoin de franchir un obstacle très délicat : pouvoir transmettre à la machine les caractéristiques émotionnelles et sociales qui sont si importantes dans la parole. Les sciences auditives ont depuis longtemps identifié bon nombre de façon de reconnaître les émotions de la voix mais il est encore difficile de créer un système numérique qui puisse comprendre tout ça et d’y porter de l’intelligence.
Découvrez comment Siri fonctionne
Synthétiser la paralinguistique serait une façon de récupérer les indices sociaux que nous communiquons à travers le langage pour offrir une réponse vraiment plus adaptée et qui sait… les gens se serviraient enfin de Siri ?
LA voix va devenir omniprésente dans le futur dans les outils d’IOT et les réseaux de neurones vont permettre d’accélérer la compréhension de la voix humaine