Elon Musk vient d’annoncer la sortie prochaine de Grok, un système d’IA conversationnel qui « répond aux questions avec esprit, suggère des questions et gère les connaissances en temps réel… ».

Alors que le communiqué de presse qui l’accompagne met en avant une performance remarquable et des méthodes de développement efficaces du modèle Grok-1 sous-jacent, on se demande déjà si l’approche de Musk pour pénétrer le marché des chatbots d’IA peut tenir ses promesses

Rappelons ce que nous savons sur le prochain système d’IA de X et où se situent les problèmes potentiels.

Ce que nous savons sur Grok

Le modèle, dont le nom est tiré de « Stranger in a Strange Land » de Robert A. Heinlein, est actuellement dans une phase bêta précoce et dans une phase de formation de deux mois.

Sur le plan technique, il y a 33 milliards de paramètres (l’une des plus petites catégories de modèles) et les performances de référence montrent qu’il surpasse Llama 2 ou GPT-3.5 – alors que les modèles les plus performants actuellement, tels que GPT-4 et Claude 2, se situent encore dans une autre ligue que Grok.
X travaille encore à l’amélioration de ses capacités de raisonnement et de codage et se montre très optimiste à ce sujet.

Il est intéressant de noter que Grok aurait accès aux connaissances en temps réel via X, (ex- Twitter). L’entreprise est donc activement en train de rechercher et d’entraîner des modèles pour découvrir et récupérer des informations pertinentes (c’est pourquoi la politique de confidentialité de X a été modifiée en septembre 2023 pour permettre à X d’utiliser les données des utilisateurs pour entraîner des modèles d’IA).

Où se situent les problèmes

Malgré l’intérêt considérable que suscite Grok et ses capacités fortement saluées, nous devons nous pencher sur certaines questions importantes. Voici un aperçu des pièges potentiels qui pourraient compromettre le succès de Grok :

Connaissance en temps réel et fiabilité des sources

Alors que Grok se fait une fierté d’accéder aux connaissances en temps réel, sa dépendance à X (ex-Twitter) soulève des questions quant à l’authenticité de l’information. La plateforme est réputée pour être un vivier de « fake news », ce qui pourrait fausser les résultats de Grok.

Performances comparées

Les performances benchmarké avec Llama 2 ou GPT-3.5 présentées par Grok sont admirables, mais il ne faut pas oublier que Grok doit encore concurrencer des géants tels que GPT-4 et Claude 2. Grok semble compétent, mais est-il aussi révolutionnaire qu’annoncé ?

Communiqué de presse de X.ai

Taille et portée du modèle

Avec 33 milliards de paramètres, Grok entre dans la catégorie des petits modèles. Cela pourrait limiter sa capacité à comprendre et à générer des réponses complexes par rapport à des modèles plus grands, ce qui pourrait avoir un impact sur la profondeur et la nuance de ses conversations.

Calendrier des améliorations

La volonté d’améliorer les capacités de raisonnement et de codage est prometteuse, mais l’optimisme ne suffira pas à combler le retard. Le domaine de l’intelligence artificielle évolue rapidement et Grok pourrait ne pas être en mesure de suivre les progrès rapides de ses concurrents.

Comment accéder à Grok

Inscrivez-vous sur la liste d’attente ici.