Une start-up parisienne ouvre sa technologie de traitement du langage naturel
Snips NLU est disponible pour x86_64 et Raspberry Pi

Envie d’intégrer un assistant vocal à votre projet sans avoir à faire transiter vos informations sur le cloud où elles pourraient se retrouver entre les mains de tiers ? Alors, il faudrait peut-être jeter un œil du côté de Snips, une jeune pousse parisienne spécialisée en traitement automatique du langage.

La start-up propose un assistant vocal qu’on peut intégrer à des dispositifs aux antipodes des ordinateurs actuels en termes de ressources. « Avec un Raspberry Pi 3, un microphone et une heure de votre temps, vous pouvez commencer à contrôler votre maison par le biais de votre voix, ce, en gardant le contrôle sur vos données », écrivent les concepteurs du système. Les particuliers peuvent faire usage de l’assistant vocal dans un cadre non commercial. Le tutoriel « concevoir son propre assistant vocal pour la météo avec Snips et un Raspberry Pi en une heure » est un excellent point d’ancrage pour les hobbyistes désireux d’effectuer une prise en main initiale de la plateforme. En quelques étapes simples à suivre, l’assistant vocal peut être installé sur l’ordinateur monocarte qui devient alors capable de : détecter qu’on s’adresse à lui ; transformer l’entrée sonore en texte ; analyser le texte pour en sortir une intention ; agir en accord avec l’intention (provoquer l’extinction ou l’allumage d’une lampe, etc.).

Snips a publié le moteur de traitement du langage naturel (la section de l’assistant vocal qui analyse le texte pour en sortir une intention) sous licence Apache 2.0 au début du mois de mars. La manœuvre, comme l’expliquent ses concepteurs, est destinée à vulgariser « l’intelligence artificielle respectueuse de la vie privée ». Il est disponible sous la forme d’une bibliothèque développée en Python et en Rust et dédiée à l’entraînement des modèles qui serviront à effectuer des prédictions sur de nouvelles requêtes. En substance, il s’agit de créer un modèle et de l’entraîner à l’aide de données tirées d’un dictionnaire Json que la start-up fournit (que le développeur pourra également monter lui-même) ; après quoi le modèle sera capable de généraliser à l’analyse de requêtes qui ne font pas partie de son dico. Snips a publié des aperçus (simplifiés pour des besoins de clarté) de ce que les modèles générés sont capables d’extraire par eux-mêmes comme informations d’un texte.

Code : Sélectionner tout - Visualiser dans une fenêtre à part
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
{
  "input": "What will be the weather in San Francisco next week?",
  "intent": {
    "intentName": "sampleGetWeather",
    "probability": 0.641227710154331
  },
  "slots": [
    {
      "range": {
        "start": 28,
        "end": 41
      },
      "rawValue": "San Francisco",
      "value": {
        "kind": "Custom",
        "value": "San Francisco"
      },
      "entity": "location",
      "slotName": "weatherLocation"
    },
    {
      "range": {
        "start": 42,
        "end": 51
      },
      "rawValue": "next week",
      "value": {
        "type": "value",
        "grain": "week",
        "precision": "exact",
        "latent": false,
        "value": "2018-02-12 00:00:00 +01:00"
      },
      "entity": "snips/datetime",
      "slotName": "weatherDate"
    }
  ]
}
Dans ses versions Python et Rust, la bibliothèque prend l’anglais, le français, l’allemand, l’espagnol et le coréen en charge. Pour ce qui est de la performance et de la précision, la bibliothèque permet de faire jeu égal avec les solutions cloud offertes par les géants du Web (Google, Apple, Facebook, Amazon, Microsoft), voire parfois mieux si l’on se réfère aux chiffres du F1-score publiés par la start-up.

Nom : f1 score.png
Affichages : 2634
Taille : 22,5 Ko

Snips NLU n’est pas sans faire penser à Picroft, une initiative similaire développée par la société Mycroft AI pour lancer un assistant personnel sur un Raspberry Pi. LinTO.ai et SUSI.AI sont d’autres exemples de projet open source qui sont la preuve que l’intelligence artificielle de Google et autres c’est bien, mais on s’en méfie.

Sources

GitHub

Annonce Snips

Tutoriel de prise en main de la plateforme

Et vous ?

Qu’en pensez-vous ?

Quelles solutions de traitement du langage naturel votre entreprise a-t-elle adoptées ? Pourquoi ?

Voir aussi

L'intelligence artificielle est-elle l'arme de la prochaine guerre froide ? Oui, répond un chercheur en informatique

L’IA et l’analyse prédictive permettraient de lutter plus efficacement contre les cyberattaques d’après les entreprises de cybersécurité françaises

Gartner : l'intelligence artificielle va créer plus d'emplois qu'elle ne va en éliminer d'ici 2020