CES 2024 : le rabbit r1 est un gadget alimenté par l'IA qui peut utiliser les applications sur votre smartphone à votre place,
mais qui a besoin d'avoir sa propre carte SIM ou du Wifi pour fonctionner
rabbit r1 (l'entreprise insiste pour que tout soit écrit en minuscule) a été présenté en avant-première au CES 2024. Son objectif ? Éliminer le besoin de naviguer sur son smartphone lorsque vous voulez faire une tâche simple (par exemple pour commander un Lyft), voire relativement complexe (par exemple un voyage et des réservations en fonction de dates et d’un budget). Au lieu de cela, rabbit r1 veut reproduire les interactions humaines avec les applications en les apprenant (les interactions) puis en supprimant les frictions liées à l'utilisation de son téléphone (prendre son téléphone, le déverrouiller, naviguer pour rechercher son application, l'ouvrir, effectuer la tâche - commander un véhicule, rechercher des informations, etc.). Tout cela sans avoir besoin d'appairer son téléphone.
Toutefois, la connectivité cellulaire fait partie de l'ensemble, tout comme le Wi-Fi, pour exécuter des tâches basées sur l'IA dans les applications sans avoir à ouvrir ces dernières sur votre téléphone : le deuxième appareil (rabbit r1), utilisé pour moins manipuler le premier appareil (téléphone), a besoin de se connecter à internet via le Wi-Fi ou la 4G. De plus, la présence d’un écran, nécessaire pour confirmer certaines commandes, prouve que tout n’est pas résolu dans l’élimination de certaines étapes.
Dans la multitude de gadgets boostés à l'intelligence artificielle présentés au CES 2024 figure le rabbit r1, un appareil portable qui utilise l’IA pour apprendre comment vous utilisez les applications et ensuite simplifier le processus pour vous. L'entreprise derrière sa conception espère que vous transporterez un deuxième appareil pour vous éviter d'avoir à ouvrir votre téléphone.
L'idée derrière le r1 à 199 $ est simple : l'appareil vous permet de garder votre téléphone dans votre poche lorsque vous avez besoin d'effectuer une tâche simple, comme commander une voiture pour vous rendre à un emplacement donné, rechercher quelques endroits où manger avec des amis ou trouver des options d'hébergement.
« Nous n'essayons pas de tuer votre téléphone », a déclaré le PDG et fondateur Jesse Lyu lors d'une conférence de presse précédant le salon technologique de Las Vegas. « C’est comme laisser son smartphone à votre assistant. Notre produit ne fait qu’appuyer sur des boutons pour vous », ajoute-t-il. « Le téléphone est un appareil de divertissement, mais si vous essayez de faire quelque chose, ce n'est pas la machine la plus efficace. Pour organiser un dîner avec un collègue, nous avions besoin de quatre à cinq applications différentes pour travailler ensemble. Les grands modèles de langage sont une solution universelle pour le langage naturel, nous voulons une solution universelle pour ces services - ils devraient simplement être capables de vous comprendre ».
Pour utiliser le rabbit r1, il suffit de lui donner un ordre à la voix en appuyant sur un bouton push-to-talk.
Au lieu de sortir votre téléphone, de le déverrouiller, de trouver l'application, de l'ouvrir et de vous frayer un chemin dans l'interface utilisateur, vous sortez le r1 et lui donnez une commande en langage naturel. Par exemple, au lieu de lancer l’application Lyft, rentrer la destination, valider la course, vous pourrez prendre l'appareil et lui dire : « Appelle un Lyft pour nous emmener au musée du Louvre ». Vous pouvez passer d'autres commandes comme « Donne-moi une liste de cinq restaurants bon marché à moins de 15 minutes à pieds de là »; « Donne-moi la liste des meilleurs appartements pour six adultes sur Airbnb en Île-de-France pour 300 euros la nuit au maximum ».
Le rabbit r1 fait ce que vous lui demandez et, quelques secondes plus tard, vous fournit une confirmation et tout le contenu que vous avez demandé.
Une vidéo décrivant des cas d'utilisation était déjà disponible avant le coup d'envoi du CES.
Les limites de rabbit r1
Dans l'esprit, il s'agit d'une idée similaire à Alexa ou Google Assistant. Rabbit OS peut contrôler votre musique, vous commander une voiture, faire vos courses, envoyer des messages et bien plus encore, le tout via une interface unique. Il n'est pas nécessaire d'équilibrer les applications et les connexions - il suffit de demander ce que l'on veut et de laisser l'appareil s'en charger. L'interface à l'écran de rabbit r1 présente une série de cartes basées sur des catégories, pour la musique, les transports ou les chats vidéo, et Lyu explique que l'écran existe principalement pour que vous puissiez vérifier les résultats du modèle par vous-même.
Plutôt que de créer une série d'API et d'essayer de convaincre les développeurs de prendre en charge rabbit R1, l'entreprise a formé son modèle sur la manière d'utiliser les applications existantes. Le grand modèle d'action, ou LAM, a été formé par des humains interagissant avec des applications telles que Spotify et Uber, montrant essentiellement au modèle comment elles fonctionnent. Le LAM a appris à quoi ressemblait l'icône des paramètres, comment savoir si une commande a été confirmée et où se trouvent les menus de recherche. Tout cela, selon Lyu, peut être appliqué à n'importe quelle application, n'importe où.
rabbit r1 dispose également d'un mode d'entraînement dédié, que vous pouvez utiliser pour apprendre à l'appareil à faire quelque chose, et il sera censé être capable de répéter l'action tout seul à l'avenir. Lyu donne un exemple : « Vous pourrez dire : 'Hé, tout d'abord, va sur un logiciel appelé Photoshop. Ouvre-le. Prend des photos. Fais un lasso sur le filigrane et clique sur le filigrane. C'est comme ça qu'on supprime le filigrane ». Selon Lyu, il faut 30 secondes à Rabbit OS pour traiter l'opération, puis il peut supprimer automatiquement tous les filigranes à l'avenir.
La vraie question est de savoir comment tout cela fonctionne en pratique. Vous pourrez faire certaines choses sur rabbit r1 lui-même, et il y a un portail web appelé Rabbit Hole par lequel vous vous connectez à tous vos différents services. Et si vous voulez, par exemple, apprendre à l'appareil à utiliser Photoshop, vous pourrez démarrer l'une des machines virtuelles de Rabbit et lui apprendre plutôt que d'utiliser votre propre appareil et votre propre logiciel. Mais il sera difficile de savoir comment cela fonctionnera avec un grand nombre d'utilisateurs, sur un grand nombre d'appareils et de plateformes.
L'approche de Rabbit est très intelligente. Il n'est pas facile de faire accepter un nouveau système d'exploitation, même si l'on est une grande enseigne de la technologie, et la méthode LAM permet de contourner ce problème en apprenant simplement au modèle à utiliser des applications. De manière plus générale, nous voyons arriver sur le marché une multitude de nouveaux appareils dotés d'une IA, mais trop souvent, ces gadgets ne font que se connecter à un chatbot. rabbit, en revanche, s'apparente davantage à une super-application (une interface unique à travers laquelle vous pouvez faire à peu près n'importe quoi). Ce que ChatGPT pourrait être pour la recherche sur le web, Rabbit OS pourrait l'être pour le magasin d'applications. Il y a bien sûr des milliers de complications et de réserves à ce rêve, mais c'est un rêve que certains pourraient trouver intéressant.
En écoutant Lyu parler de Rabbit OS et de la R1, on ne comprend pas très bien quelle est la vision de l'entreprise pour cet appareil. Il est loin d'être assez puissant pour remplacer votre téléphone, bien qu'il puisse passer des appels vidéo et qu'il dispose d'un emplacement pour une carte SIM. Il s'agit avant tout d'un assistant vocal, mais l'appareil est doté d'un écran et d'un appareil photo. Ce n'est pas seulement un assistant vocal... mais il fait beaucoup de choses avec un assistant vocal. Rabbit affirme avoir conçu Rabbit OS en tenant compte de la sécurité et de la confidentialité, mais il vous demande également de vous connecter à certains de vos services les plus utilisés par le biais de son interface. Selon Lyu, le rabbit r1 est à la fois un accessoire astucieux et l'avenir tout-en-un de presque tout.
Côté technique
rabbit r1 est conçu pour simplifier les tâches numériques en comblant le fossé entre l'intention humaine et l'action de l'appareil. Cet appareil est le premier à être équipé de rabbit OS, un système d'exploitation visant à révolutionner l'expérience en ligne en permettant de naviguer efficacement dans plusieurs applications à l'aide de commandes en langage naturel.
r1, qui s'appuie sur le modèle propriétaire Large Action Model (LAM), rationalise les tâches complexes en apprenant et en reproduisant les actions de l'utilisateur à travers diverses interfaces. Jesse Lyu a déclaré dans un communiqué : « Nous entrons dans une nouvelle ère d'interaction homme-appareil où l'IA ne se contente pas de comprendre le langage naturel ; elle exécute des actions basées sur les intentions de l'utilisateur pour accomplir des tâches ».
Rabbit OS, et le LAM sous-jacent, veulent ajouter une valeur considérable à la vie en ligne des utilisateurs grâce à des "rabbits", des agents d'intelligence artificielle personnels qui exécutent diverses tâches. La plupart des assistants vocaux utilisés dans les maisons intelligentes et les appareils portables ne répondent qu'à des demandes simples telles que l'allumage des lumières ou la vérification du temps qu'il fait. Rabbit OS, en revanche, peut prendre en charge la plupart des courses numériques, qu'il s'agisse de tâches simples comme la recherche d'informations actualisées ou de tâches complexes comme la recherche approfondie et la réservation d'options pour un prochain voyage, ou encore le remplissage d'un panier d'épicerie virtuel et l'exécution des transactions à la caisse.
Le modèle LAM (Large Action Model), propriété d'Atmosic, constitue l'épine dorsale de r1, lui permettant de comprendre et d'exécuter des actions similaires à celles d'un être humain dans divers environnements mobiles et de bureau. En observant et en apprenant les comportements humains, le LAM élimine le besoin d'intégrations complexes telles que les API et les applications, ce qui permet d'exécuter des tâches de manière transparente sur toutes les plateformes sans que les utilisateurs n'aient à télécharger plusieurs applications.
rabbit r1, fruit d'une collaboration avec Teenage Engineering, est doté d'un design intuitif inspiré de gadgets rétro tels que le Tamagotchi. Compact et portable, le r1 comprend un écran tactile de 2,88 pouces, un bouton pour parler, une molette de défilement pour la navigation et une caméra rotative à 360 degrés appelée « œil de lapin » pour les appels vidéo et les applications avancées de vision par ordinateur.
rabbit r1 fonctionne comme un appareil autonome, équipé d'une connectivité Wi-Fi et cellulaire, d'un processeur MediaTek Helio P35, de 4 Go de mémoire, de 128 Go de stockage et d'un port USB-C. Sa conception donne la priorité à la vie privée de l'utilisateur, en veillant à ce que le microphone et la caméra ne s'activent que lorsque l'utilisateur initie des interactions.
Rabbit a levé ses 30 millions de dollars de financement au quatrième trimestre 2023 auprès d'investisseurs tels que Khosla Ventures, Synergis Capital et Kakao Investment.
Source : keynote Rabbit (vidéo dans le texte)
Et vous ?
Que pensez-vous du concept du rabbit R1 ? Est-ce une innovation utile ou une gadget inutile ?
Le rabbit r1, un appareil pour parler à un autre appareil que vous pouvez simplement prendre et utiliser ou plus que ça selon vous ?
Est-il susceptible de faire gagner en temps ? D'ailleurs, ressentez-vous le besoin de gagner en temps lorsque vous utilisez votre smartphone ?
Quelles applications aimeriez-vous utiliser avec le rabbit R1 ? Quels avantages ou inconvénients y voyez-vous ?
Comment le rabbit R1 pourrait-il changer votre façon de travailler, de vous divertir ou de communiquer ?
Partager