Un modèle d'intelligence artificielle, après un entraînement partiel sur un ordinateur quantique, a donné des réponses correctes là où il se trompait auparavant.
Des chercheurs de Multiverse Computing ont démontré que l'ajout d'un tout petit nombre de paramètres, exécutés sur une machine quantique, pouvait améliorer significativement la précision d'un grand modèle de langage. Leur travail, publié sur la plateforme
arXiv, constitue une première preuve que l'informatique quantique peut renforcer des IA déjà déployées à grande échelle.
Pour comprendre le mécanisme derrière cette amélioration, il faut s'intéresser à un indicateur clé appelé "perplexité". Plus la perplexité d'un modèle est basse, plus il est capable de prédire correctement le mot suivant dans une phrase. Traditionnellement, pour réduire cette perplexité, on augmentait le nombre de paramètres, ce qui alourdissait l'infrastructure. Mais les chercheurs ont trouvé une alternative: utiliser des blocs quantiques spécialisés, appelés adaptateurs unitaires de Cayley, qui ne nécessitent qu'une augmentation infinitésimale du nombre de paramètres.
Concrètement, les scientifiques ont pris le modèle Llama 3.1 8B de Meta, qui compte 8 milliards de paramètres. Ils ont gelé ses paramètres originaux et y ont inséré les adaptateurs de Cayley, entraînés au préalable sur un ordinateur classique. L'ensemble a été exécuté sur le processeur quantique IBM Quantum System Two, doté de 156 qubits.
Le résultat ? Une baisse de 1,4 % de la perplexité avec seulement 6 000 paramètres supplémentaires, soit une augmentation de 0,000075 %. Un tel niveau de gain avec si peu de modifications est spectaculaire.
Ainsi, les tests ont révélé des améliorations concrètes. Par exemple, le modèle original répondait incorrectement à une question d'astronomie sur les planètes géantes, affirmant que seule Saturne possède des anneaux. Après l'ajout quantique, le modèle hybride a correctement identifié que toutes les planètes joviennes ont des anneaux. De même, en biologie, une question sur les conséquences du flux génétique a été mieux traitée par la version améliorée.
En outre, les auteurs de l'étude expliquent que cette approche ouvre la voie à des systèmes d'IA hybrides, combinant le meilleur du classique et du quantique. L'objectif ultime est d'atteindre une "suprématie quantique", où un ordinateur quantique réalisera des tâches impossibles pour tout ordinateur classique.
Pour l'instant, la principale difficulté dans la production d'ordinateurs quantiques à l'échelle industrielle reste le bruit, c'est-à-dire les erreurs causées par les perturbations environnementales lors des calculs quantiques. Seuls quelques calculs simples sur ordinateur quantique de laboratoire sont pour le moment réalisables.