"Brain2Qwerty v2 de Meta : décoder des phrases entières par l'activité cérébrale, sans chirurgie"

📑 Table of Contents

Meta FAIR a publié Brain2Qwerty v2 le 29 juin 2026 — un décodeur non invasif cerveau-texte qui reconstruit des phrases complètes à partir d’enregistrements de magnétoencéphalographie (MEG) pendant qu’une personne tape. Le participant ne porte rien de plus invasif qu’un casque de capteurs magnétiques. Pas de chirurgie, pas d’implants, pas de puces cérébrales à la Neuralink.

Le système atteint 61 % de précision moyenne au niveau des mots sur neuf volontaires, le meilleur participant atteignant 78 %. Au niveau des caractères, le taux d’erreur sur les mots (WER) est en moyenne de 39 %, tombant à 22 % pour le meilleur performeur. Ces chiffres peuvent sembler modestes comparés à la transcription quasi parfaite que nous attendons des systèmes de reconnaissance vocale, mais le contexte est important : il s’agit d’activité cérébrale brute, capturée de manière non invasive, décodée en temps réel.

Des caractères aux phrases

Le système v1, publié dans Nature Neuroscience le même jour l’année dernière, décodait des caractères individuels — impressionnant mais loin d’une communication utilisable. La v2 fait un bond vers le décodage de phrases complètes, entraînée sur environ 22 000 phrases, soit une multiplication par 10 des données d’entraînement. Le modèle traite les enregistrements MEG continus pendant qu’une personne tape et reconstruit les mots voulus, capturant le sens sémantique plutôt que de simples signaux au niveau des frappes.

L’architecture est de bout en bout : les signaux MEG bruts entrent, les phrases sortent. Le système a été entraîné sur des données provenant de volontaires tapant dans un scanner MEG, le modèle apprenant à mapper les schémas d’activité neuronale distribuée au texte correspondant.

Science ouverte, code source ouvert

À une époque où Meta a recentré une grande partie de ses travaux d’IA de pointe vers la gamme propriétaire Muse Spark, le projet Brain2Qwerty incarne une philosophie différente. Le code et les données sont entièrement open source sur GitHub à l’adresse facebookresearch/brain2qwerty. Meta a également annoncé un fonds de 5 millions de dollars pour la recherche ouverte en neurosciences, signalant que le bras de recherche fondamentale de FAIR reste engagé dans la science ouverte, même si le côté commercial évolue.

Cette publication fait suite à la poussée plus large de Meta dans les neurosciences. Quelques semaines plus tôt, l’entreprise publiait des recherches sur le décodage des représentations visuelles à partir de signaux MEG, construisant une pile complète d’interface cerveau-ordinateur non invasive.

L’avantage non invasif

L’approche de Brain2Qwerty v2 contraste directement avec Neuralink et autres interfaces cerveau-ordinateur basées sur des implants. Ces systèmes atteignent une précision plus élevée — l’implant N1 de Neuralink a démontré une pensée-texte avec des taux d’erreur sur les caractères inférieurs à 5 % — mais nécessitent une chirurgie cérébrale. Le pari de Meta est que les améliorations algorithmiques peuvent combler l’écart sans franchir le seuil chirurgical, rendant la technologie accessible à des millions de personnes plutôt qu’à une poignée prête à subir des procédures invasives.

La population cible principale est constituée de personnes ayant perdu la capacité de parler en raison de maladies neurologiques telles que la SLA, un AVC ou le syndrome d’enfermement. Pour ces personnes, même 61 % de précision au niveau des mots représente un canal de communication là où il n’en existait aucun auparavant.

Prochaines étapes

Le système actuel nécessite encore un scanner MEG — une machine de la taille d’une pièce, coûtant plusieurs millions de dollars, qui ne peut fonctionner que dans des environnements magnétiquement protégés. Le déploiement pratique dépendra soit de matériel de détection cérébrale moins cher et plus portable (Meta a investi dans la technologie MEG portable), soit d’avancées algorithmiques fonctionnant avec des signaux de moindre fidélité provenant de l’EEG ou de la fNIRS. Les deux voies sont des domaines de recherche actifs chez FAIR.

La feuille de route décrite dans l’article de blog qui l’accompagne vise à améliorer la robustesse entre les participants, à réduire la charge de calibration (actuellement, le système nécessite un entraînement par participant) et à étendre l’approche à la parole imaginée — décoder ce que quelqu’un veut dire sans qu’il ait besoin de taper physiquement.