OpenAI o1 : Quand lenteur rime avec génie (ou pas)
18 mois à peine après GPT-4, OpenAI revient avec un nouveau joujou : o1. Pas un, mais carrément une famille de modèles de langage !
Au menu, les versions o1-preview et o1-mini, accessibles en version bêta pour ceux qui mettent la main à la poche (ChatGPT Plus et Entreprise, coucou).
Mais attention, pas question d'une simple mise à jour.
Là, on parle d'une IA qui « raisonne » presque comme un humain… enfin, c'est ce qu'on dit Sam.
Lent comme une tortue, mais pas sans raison
Oui, o1 est plus lent1. Un choix volontaire d'OpenAI, qui préfère la qualité à la quantité.
On dirait presque un cours de yoga de l'IA : « prenez le temps de vous poser, respirez, analysez… ».
En vrai, ça peut valoir le coup pour les tâches vraiment techniques.
Genre, résoudre un problème de maths compliqué ou coder un truc sans bug.
Mais pour les questions bateau, je ne pense pas que ça vaut le coup.
Une IA qui réfléchit… ou qui fait semblant de méditer ?
En gros, o1 ne balance pas ses réponses comme un étudiant qui récite sa leçon par cœur.
Non, il prend son temps, comme un ado face à un devoir le dimanche soir : il réfléchit (enfin, il fait de son mieux), explore des pistes, se trompe, corrige… et finit par sortir une réponse. C'est censé simuler un raisonnement humain.
Mais ne nous y trompons pas, o1 n'est pas devenu le nouveau Descartes ; même s'il fait mine de réfléchir, il ne s'agit que d'une super simulation de raisonnement – pas d'une machine douée de conscience.
Prouesses techniques : o1 fait le malin en maths… mais à quel prix ?
Alors là, o1 claque ses meilleures performances2, avec un score de 83 % à l'Olympiade de maths. Il a même humilié GPT-4o qui est reparti la queue entre les jambes avec ses 13%.
Pour la recherche scientifique, l'ingénierie ou les devs, ça fait rêver.
Mais tout ce génie a un prix : 15 $ par million de jetons d'entrée et 60 $ pour les sorties.
On est bien d'accord, c'est 3 à 4 fois plus cher que GPT-4o.
En gros, c'est comme passer de la bière de supermarché au grand cru millésimé : la qualité est là, mais le portefeuille en prend un coup.
Toujours en mode « coming soon »
Petit hic : o1 n'est pas encore totalement au point.
Certaines fonctionnalités sont encore en chantier, comme l'analyse d'images ou la navigation web.
C'est un peu comme acheter une voiture avec l'option GPS… qui sera activée dans « une prochaine mise à jour ».
En attendant, les utilisateurs doivent aussi se contenter d'un accès limité, avec un nombre restreint de messages par semaine.
Les hallucinations, encore et toujours…
Malgré ses airs de premier de la classe, o1 n'a pas encore totalement éradiqué les fameuses « hallucinations ».
Tu sais, ces moments où l'IA sort des réponses aussi fantaisistes qu'une histoire de pêche.
C'est moins fréquent par rapport aux autres, mais on est encore loin d'une IA qui ne se plante jamais.
Bref, il reste du chemin avant de dire adieu aux erreurs farfelues.
En route vers l'IA de demain… mais sans trop s'emballer
Avec o1, OpenAI montre qu'il est possible de miser sur la réflexion plutôt que sur la vitesse.
C'est une IA qui s'approche de l'humain sans tomber dans le piège du tout rapide, tout bâclé.
Cela dit, entre les coûts élevés, les fonctionnalités en attente et la lenteur assumée, il ne faut pas non plus s'emballer.
Si on cherche un modèle pour réfléchir aux trucs compliqués, on est sur la bonne voie. Pour le reste, on reste encore loin du Saint Graal de l'IA.
Alors, o1, révolution ou petit pas en avant ? Peut-être qu'il faudra justement faire preuve d'un peu de cette fameuse « chaîne de pensée3 » avant de trancher.
En attendant, prends un café, o1 est encore en train de réfléchir à la question !
Et toi, qu'est que tu penses de ce nouveau LLM d'OpenAI? On sera ravi de connaitre ton avis sur le sujet.
Références
- OpenAI's new o1 model is slower, on purpose. Engadget, du 12 septembre 2024.Consulté le 13 septembre 2024.
↩︎ - Forget GPT-5! OpenAI launches new AI model family o1 claiming PhD-level performance. VentureBeat, du 12 septembre 2024.Consulté le 13 septembre 2024. ↩︎
- Learning to Reason with LLMs.OpenAI, du 12 septembre 2024.Consulté le
13 septembre 2024.
↩︎