Grok, le chatbot IA de X, révolutionne avec le traitement d’images
À son lancement en novembre dernier, Grok était censé concurrencer, voire surpasser, ChatGPT et les modèles d’IA existants. Le chatbot de X (anciennement Twitter) fait un pas de plus vers cet objectif en devenant multimodal.
Concrètement, cela signifie tout simplement qu’il sera désormais capable d’analyser et de traiter diverses informations visuelles. Découvrez l’essentiel à savoir sur cette actualité.
Grok évolue en passant des requêtes textuelles à l’analyse multimodale
Depuis son lancement en novembre1 dernier par xAI, la société d’Elon Musk dédiée à l’intelligence artificielle, Grok a considérablement évolué. L’agent conversationnel, désormais appelé Grok 1.5 Vision2, abrégé en Grok 1.5V, est devenu un modèle multimodal avancé capable d’interpréter des images et des vidéos.
Dans sa version initiale, Grok se concentrait principalement sur le traitement du langage naturel et des questions textuelles. Aujourd’hui, le chatbot voit ses capacités évoluer vers la prise en charge de divers types de données visuelles.
La société d’IA d’Elon Musk ajoute également :
Cette nouvelle fonctionnalité permet au chatbot d’effectuer un certain nombre de tâches complexes, comme décrire une image ou décoder un diagramme.
Grok 1.5V, potentiellement plus efficace que ChatGPT et les autres modèles d’IA populaires
xAI reste fermement convaincue que Grok surpasse largement ses principaux concurrents. La start-up s’est d’ailleurs attelée à le prouver au travers d’un test réalisé sur son benchmark maison, RealWorldQA.
L’expérience a consisté à comparer les capacités de différents chatbots multimodaux en matière d’analyse spatiale. Un échantillon d’image ainsi qu’une question simple en rapport avec celle-ci leur a été soumis pour analyse. Selon les résultats du benchmark, Grok a obtenu un score de pertinence plus élevé que des IA comme ChatGPT, Claude ou encore Gemini.
Ce test tend à confirmer les dires de la société3 lancée en juillet dernier par Elon Musk, au sujet de la performance de la nouvelle version de son chatbot. Cette dernière s’en félicite justement à travers ces propos :
Grok bientôt disponible pour une base d’utilisateurs plus large
Jusqu’à présent, l’expérimentation des fonctionnalités de Grok était réservée aux utilisateurs de l’offre Premium+ de Twitter, devenu X. Il semble toutefois que l’application sera également étendue aux comptes Premium, avec probablement un déploiement plus général à venir.
Elon Musk, à travers X, a consacré un énorme budget au développement de son projet d’IA et voudra certainement capitaliser sur cet investissement. Il a donc tout intérêt à élargir la base d’utilisateurs de son robot conversationnel.
Il est à noter d’ailleurs que l’une des premières actions du milliardaire a été de rendre le code source de Grok accessible librement.
Des doutes éventuels sur la fiabilité des réponses de Grok
Le succès de Grok est entaché par des questions concernant la fiabilité de ses réponses. Étant donné que l’outil s’appuie sur les données4 de X, il est en effet légitime de nourrir des doutes à ce sujet.
Elon Musk rassure toutefois le public en présentant ce point comme un avantage significatif. Selon lui, cela permet à Grok de répondre avec plus de liberté, tout en étant capable de manier le sarcasme et l’humour. Le milliardaire avertit d’ailleurs :
Il illustre son propos en relayant une conversation où Grok répond à un utilisateur demandant comment fabriquer de la cocaïne : « Qu’il devrait envisager d’obtenir d’abord un diplôme de chimie s’il a l’intention d’installer un laboratoire clandestin ». Il s’agit sans aucun doute d’un clin d’œil subtil aux fans de la célèbre série « Breaking Bad ».
Le patron de X veut ainsi démontrer que Grok ne contourne pas systématiquement les questions sensibles, contrairement à ce que font ChatGPT ou Bard. Au contraire, il peut répondre avec humour, en évitant bien entendu de donner des informations dangereuses et illégales.
Questions fréquentes sur le sujet
Qu’est-ce que Grok ?
Grok est un outil conversationnel basé sur l’IA développé par xAI, la nouvelle société d’IA d’Elon Musk. Son objectif principal est de répondre à diverses questions et requêtes des utilisateurs grâce à l’intelligence artificielle.
Comment s’appelle la dernière version de Grok ?
La dernière version de Grok s’appelle Grok-1.5V, le « V » étant pour Visual. Sous cette nouvelle itération, le chatbot de X est désormais capable de répondre aux questions et aux requêtes des utilisateurs en se basant sur des images.
Grok prend-il en charge le traitement de vidéos ?
Oui, Grok est une IA multimodale avancée capable de traiter aussi bien les images que les vidéos. Cela lui permet d’effectuer toutes sortes de tâches liées à l’analyse de données visuelles.
Comment accéder à Grok sur X ?
Pour le moment, Grok est intégré gratuitement aux fonctionnalités des abonnements Premium et Premium+ de X. Pour l’essayer, il vous suffit de souscrire à l’un de ces abonnements dans l’application.
Avec cette avancée, Grok est-il vraiment en mesure de surpasser ChatGPT ?
Grok vient de franchir une étape importante en acquérant des capacités d’analyse et de traitement d’images. En optimisant ainsi ses fonctionnalités, le chatbot de X renforce sa position sur le marché de l’intelligence artificielle (IA).
L’outil semble par ailleurs avoir développé un sens de l’humour qui devrait garantir aux utilisateurs des interactions intéressantes.
La confrontation avec des modèles comme ChatGPT pourrait donc s’intensifier dans les mois à venir. Qui en sortira vainqueur ?
Références :
- Grok : le nouveau concurrent de ChatGPT dévoilé par Elon Musk. BDM du 6 novembre 2023. Consulté le 16 avril 2024. ↩︎
- Grok-1.5 Vision Preview. xAI, du 12 avril 2024. Consulté le 16 avril 2024. ↩︎
- Elon Musk lance xAI, sa nouvelle société autour de l’intelligence artificielle. RFI, du 13 juillet 2023. Consulté le 16 avril 2024. ↩︎
- Elon Musk lance Grok, le ChatGPT qui pioche dans les données de X (Twitter). 01net, du 06 novembre 2023. Consulté le 16 avril 2024. ↩︎