Blog

Les assistants vocaux

Qu’est-ce que les assistants vocaux ?

Un assistant vocal est un assistant numérique qui utilise la reconnaissance vocale, les algorithmes de traitement du langage et la synthèse vocale pour écouter des commandes vocales spécifiques et renvoyer des informations pertinentes ou exécuter des fonctions spécifiques à la demande de l'utilisateur.

Sur la base de commandes spécifiques, parfois appelées intentions, prononcées par l'utilisateur, les assistants vocaux peuvent renvoyer des informations pertinentes en écoutant des mots clés spécifiques et en filtrant le bruit ambiant.

Bien que les assistants vocaux puissent être entièrement logiciels et s'intégrer à la plupart des appareils, certains assistants sont conçus spécifiquement pour des applications sur un seul appareil, comme l'horloge murale Alexa d'Amazon. 

Aujourd'hui, les assistants vocaux sont intégrés dans de nombreux appareils que nous utilisons quotidiennement, tels que les téléphones portables, les ordinateurs et les haut-parleurs intelligents. En raison de leur large éventail d'intégrations, il existe plusieurs assistants vocaux qui offrent un ensemble de fonctionnalités très spécifiques, tandis que certains choisissent d'être ouverts pour aider dans presque toutes les situations.

Histoire des assistants vocaux

Les assistants vocaux ont une très longue histoire qui remonte en fait à plus de 100 ans, ce qui peut paraître surprenant car des applications comme Siri ne sont sorties que depuis dix ans.

Le tout premier produit à activation vocale est sorti en 1922 sous le nom de Radio Rex. Ce jouet était très simple : un petit chien restait dans une niche jusqu'à ce que l'utilisateur s'exclame "Rex", puis il sautait hors de la niche. Tout cela était fait par un électro-aimant réglé sur une fréquence similaire à la voyelle que l'on trouve dans le mot Rex, et précédait de plus de 20 ans les ordinateurs modernes.

Lors de l'exposition universelle de 1952, Audrey a été annoncée par Bell Labs. L'Automatic Digit Recognizer n'était pas un petit appareil simple, mais son boîtier mesurait six pieds de haut et contenait tout le matériel nécessaire pour reconnaître dix chiffres !

IBM a commencé sa longue histoire d'assistants vocaux en 1962 à l'exposition universelle de Seattle, lorsque la boîte à chaussures IBM a été annoncée. Ce dispositif était capable de reconnaître les chiffres de 0 à 9 et six commandes simples telles que "plus, moins", de sorte que le dispositif pouvait être utilisé comme une simple calculatrice. Son nom faisait référence à sa taille, similaire à celle d'une boîte à chaussures moyenne, et contenait un microphone connecté à trois filtres audio pour faire correspondre les fréquences électriques de ce qui était dit et le faire correspondre aux valeurs déjà assignées pour chaque chiffre.

La technologie derrière les assistants vocaux

Les assistants vocaux utilisent l'intelligence artificielle et la reconnaissance vocale pour fournir avec précision et efficacité le résultat que l'utilisateur recherche. Bien qu'il puisse sembler simple de demander à un ordinateur de régler une minuterie, la technologie qui se cache derrière est fascinante.

Reconnaissance vocale

La reconnaissance vocale fonctionne en prenant un signal analogique de la voix d'un utilisateur et en le transformant en un signal numérique. Après avoir fait cela, l'ordinateur prend le signal numérique et tente de le faire correspondre à des mots et des phrases pour reconnaître l'intention de l'utilisateur. Pour ce faire, l'ordinateur a besoin d'une base de données de mots et de syllabes préexistants dans une langue donnée afin de pouvoir faire correspondre étroitement le signal numérique avec. La vérification du signal d'entrée avec cette base de données est connue sous le nom de reconnaissance des formes et constitue la principale force de la reconnaissance vocale.

Intelligence artificielle

L'intelligence artificielle consiste à utiliser des machines pour simuler et reproduire l'intelligence humaine.En 1950, Alan Turing (l'homonyme de notre société) a publié son article "Computing Machinery and Intelligence" qui posait pour la première fois la question suivante : les machines peuvent-elles penser ? Alan Turing a ensuite développé le test de Turing, une méthode d'évaluation d'un ordinateur pour tester sa capacité à penser comme un humain. Quatre approches ont ensuite été développées, qui définissent l'IA, à savoir Penser humainement / rationnellement et Agir humainement / rationnellement. Alors que les deux premières concernent le raisonnement, les deux autres portent sur le comportement réel. L'IA moderne est généralement considérée comme un système informatique conçu pour accomplir des tâches qui requièrent généralement une interaction humaine. Ces systèmes peuvent s'améliorer grâce à un processus connu sous le nom d'apprentissage automatique.

Les différentes approches de l'assistant vocal

De nos jours, de nombreux assistants de conversation combinent un flux de travail axé sur les tâches et les connaissances pour effectuer presque toutes les tâches que l'utilisateur peut lui confier. Un flux de travail axé sur les tâches peut inclure le remplissage d'un formulaire, tandis qu'un flux de travail axé sur les connaissances inclut la réponse à la question de savoir ce que peut être le capital d'un État ou la spécification des spécifications techniques d'un produit.

Avantages des assistants vocaux

Voici quelques exemples de ce que peut faire un assistant vocal :

  • Vérifier la météo
  • Allumer/éteindre les appareils intelligents connectés
  • Recherche dans les bases de données

L'une des principales raisons de la popularité croissante des interfaces utilisateur vocales (VUI) est due à la complexité croissante des logiciels mobiles sans augmentation de la taille de l'écran, ce qui entraîne un énorme désavantage en utilisant une interface utilisateur graphique (GUI). Au fur et à mesure que les téléphones se multiplient, la taille de l'écran reste relativement la même, ce qui entraîne des interfaces très étroites et crée des expériences utilisateur frustrantes, raison pour laquelle de plus en plus de développeurs passent aux interfaces utilisateur vocales.

Efficacité et sécurité

Si la frappe est devenue beaucoup plus rapide avec l'utilisation de claviers standard, l'utilisation de la voix sera toujours plus rapide, beaucoup plus naturelle et entraînera moins de fautes d'orthographe. Il en résulte un flux de travail intelligent, beaucoup plus efficace et naturel.

Une courbe d'apprentissage rapide

L'un des plus grands avantages des assistants vocaux est la rapidité d'apprentissage. Au lieu de devoir apprendre à utiliser des appareils comme les souris et les écrans tactiles et de s'habituer à utiliser des appareils physiques spécifiques, vous pouvez simplement utiliser vos tendances naturelles de conversation et utiliser votre voix.

Pourquoi et quand utiliser les assistants vocaux

Il existe de nombreux cas d'utilisation d'un assistant vocal dans le monde d'aujourd'hui. Par exemple, lorsque vous avez les mains pleines et que vous ne pouvez pas utiliser un écran tactile ou un clavier, ou lorsque vous conduisez Disons que vous conduisez et que vous devez changer de musique, vous pouvez simplement demander à un assistant vocal de "jouer ma playlist de conduite". Cela permet une conduite plus sûre et évite le risque de distraction au volant.

image a2

Interfaces utilisateur

Pour mieux comprendre les assistants vocaux, il est important d'examiner l'expérience globale de l'utilisateur et de voir ce qu'est une interface utilisateur et en quoi une interface utilisateur virtuelle diffère d'une interface graphique plus traditionnelle que les applications modernes utilisent actuellement.

Siri

Siri est l'assistante vocale la plus populaire aujourd'hui. Créé en 2010 par SRI Inc, et racheté en 2011 par Apple, Siri est rapidement devenu une partie intégrante de l'écosystème Apple en rassemblant tous les appareils et applications Apple pour les utiliser en tandem les uns avec les autres.

Alexa

Créée par Amazon en 2014, Alexa a été nommée en raison de sa ressemblance avec la Bibliothèque d'Alexandrie. Alexa a été à l'origine inspiré par le système de voix conversationnel que l'on trouve à bord de l'U.S.S. Enterprise dans Star Trek. Alexa est sorti en même temps que The Amazon Echo, un haut-parleur intelligent destiné aux consommateurs pour plonger dans le monde de la domotique. La plateforme Alexa permet aux utilisateurs d'interagir avec l'écosystème amazonien et de connecter une pléthore d'appareils intelligents.

Assistant Google

Dévoilé en 2016, Google Assistant était le successeur spirituel de Google Now, la principale amélioration étant l'ajout de conversations à double sens. Là où Google Now renvoyait des réponses sous la forme d'une page de résultats de recherche sur Google, Google Assistant donne des réponses sous la forme de phrases naturelles et renvoie des recommandations sous la forme de Feature cards.

Cortana

Depuis 2009, Cortana de Microsoft a l'une des plus longues visions de donner aux gens l'accès à des assistants vocaux dans leur vie quotidienne. Microsoft a commencé à livrer Cortana avec tous les appareils Windows 10 et Xbox, ce qui a entraîné une augmentation considérable du nombre d'utilisateurs enregistrés de Cortana. En 2018, Cortana comptait plus de 800 millions d'utilisateurs.

Alan

En 2017, Alan a entrepris de faire passer les assistants vocaux au niveau supérieur, en permettant l'IA vocale pour toutes les applications. En utilisant des modèles de langage spécifiques à un domaine et une compréhension contextuelle, Alan se concentre sur la création d'une nouvelle génération d'applications d'IA vocale d'entreprise. En utilisant la plateforme Alan, les développeurs sont en mesure de prendre le contrôle de la voix et de créer un flux de travail efficace qui convient le mieux à leurs utilisateurs à l'aide de commandes vocales.