Citation
Catégorie
Tag – étiquette
Auteur
Info
Rechercher par n'importe quelle lettre



nb max de mots
nb min de mots
trier par
Dictionnaire analogique intriqué pour extraits... Recherche mots ou phrases tous azimuts... Outil de précision sémantique et de réflexion communautaire... Voir aussi la rubrique mode d'emploi. Jetez un oeil à la colonne "chaînes". ATTENTION, faire une REINITIALISATION après  une recherche complexe. Et utilisez le nuage de corrélats ... Lire la suite >>
Résultat(s): 5411
Temps de recherche: 0.0401s

innovation théorique

Les scientifiques quantiques ont créé une nouvelle mathématique de cryptographie

En théorie, la physique quantique peut contourner les problèmes mathématiques complexes à l'origine du chiffrement moderne. Une nouvelle preuve montre comment.

Les problèmes complexes ne sont généralement pas les bienvenus. Pourtant, les cryptographes les adorent. En effet, certains problèmes mathématiques complexes sont à la base de la sécurité du chiffrement moderne. Toute astuce pour les résoudre condamnerait la plupart des formes de cryptographie.

Il y a plusieurs années, des chercheurs ont découvert une approche de chiffrement radicalement nouvelle , dépourvue de ce point faible potentiel. Cette approche exploite les caractéristiques particulières de la physique quantique. Mais contrairement aux schémas de chiffrement quantique antérieurs, qui ne fonctionnent que pour quelques tâches spécifiques, cette nouvelle approche permet d'accomplir un éventail de tâches beaucoup plus large. Et elle pourrait fonctionner même si tous les problèmes au cœur de la cryptographie " classique " ordinaire s'avéraient facile à résoudre.

Mais cette découverte remarquable reposait sur des hypothèses irréalistes. Le résultat était " plutôt une démonstration conceptuelle ", a déclaré Fermi Ma, chercheur en cryptographie à l'Institut Simons pour la théorie de l'informatique à Berkeley, en Californie. " Ce n'est pas une affirmation concernant le monde réel. "

Maintenant, un nouvelle étude réalisée par deux cryptographes a ouvert la voie à la cryptographie quantique, débarrassée de ces hypothèses farfelues. " Cet article affirme que si certaines autres conjectures sont vraies, alors la cryptographie quantique doit être possible ", a déclaré Ma.

Le Château dans le ciel

On peut comparer la cryptographie moderne à une tour composée de trois parties essentielles. La première partie est le socle rocheux situé en profondeur sous la tour, constitué de problèmes mathématiques complexes. La tour elle-même constitue la deuxième partie : on y trouve des protocoles cryptographiques spécifiques permettant d'envoyer des messages privés, de signer des documents numériques, de voter à bulletin secret, et bien plus encore.

Entre les deux, la sécurisation de ces applications quotidiennes sur un socle mathématique repose sur des blocs de construction appelés fonctions unidirectionnelles . Elles sont responsables de l'asymétrie inhérente à tout schéma de chiffrement. " C'est unidirectionnel, car on peut chiffrer les messages, mais pas les déchiffrer ", explique Mark Zhandry, cryptographe chez NTT Research.

Dans les années 1980, des chercheurs ont prouvé que la cryptographie basée sur des fonctions unidirectionnelles garantissait la sécurité de nombreuses tâches. Mais des décennies plus tard, ils ne sont toujours pas certains que le socle soit suffisamment solide pour le supporter. Le problème est que ce socle est constitué de problèmes difficiles spécifiques – techniquement appelés problèmes NP – dont la caractéristique principale est qu'il est facile de vérifier si une solution candidate est correcte. (Par exemple, décomposer un nombre en ses facteurs premiers est un problème NP : difficile à réaliser pour les grands nombres, mais facile à vérifier.)

Beaucoup de ces problèmes semblent intrinsèquement difficiles, mais les informaticiens n'ont pas réussi à le prouver. Si quelqu'un découvre un algorithme ingénieux pour résoudre rapidement les problèmes NP les plus complexes, le socle s'effondrera et la tour entière s'effondrera.

Malheureusement, il est impossible de déplacer simplement cette tour ailleurs. Ses fondations – des fonctions unidirectionnelles – ne peuvent reposer que sur un socle de problèmes NP.

Pour construire une tour sur des problèmes plus complexes, les cryptographes auraient besoin d'une nouvelle base, non constituée de fonctions à sens unique. Cela semblait impossible jusqu'à il y a quelques années, lorsque les chercheurs ont réalisé que la physique quantique pouvait leur être utile.

Tout a commencé avec un article de 2021 d'un étudiant diplômé nommé William Kretschmer qui a attiré l'attention sur un étrange problème concernant les propriétés des systèmes quantiques. Les chercheurs ont rapidement démontré que le problème de Kretschmer pouvait remplacer les fonctions à sens unique comme fondement d'une nouvelle tour de cryptographie protocoles. L'année suivante, Kretschmer et d'autres ont prouvé que cette approche alternative pouvait fonctionner même sans problèmes NP complexes. Soudain, il semblait possible de construire une forteresse cryptographique bien plus robuste.

Mais où la construire ? Le problème quantique sur lequel Kretschmer s'est appuyé impliquait des dispositifs informatiques hypothétiques appelés oracles, capables de répondre instantanément à des questions spécifiques. Les oracles peuvent être des outils théoriques utiles, mais ils n'existent pas réellement. Les preuves de Kretschmer étaient comme un plan pour construire ce château dans le ciel. Y avait-il un moyen de le faire descendre sur terre ?

Deuxième Fondation  

À l’automne 2022, cette question a retenu l’attention de Dakshita Khurana, cryptographe à l'Université de l'Illinois à Urbana-Champaign et au sein de NTT Research et son étudiant diplômé Kabir Tomer. Elle s'est lancée dans la construction d'une nouvelle tour de cryptographie. La première étape a consisté à construire une nouvelle fondation en utilisant des blocs de construction quantiques plutôt que des fonctions unidirectionnelles classiques. Elle devait ensuite prouver que cette nouvelle fondation pouvait supporter une tour d'autres protocoles cryptographiques. Une fois cette preuve faite, elle devait trouver un emplacement solide pour l'ensemble : un socle de problèmes concrets, apparemment encore plus complexes que les problèmes NP utilisés en cryptographie classique.

Pour la première étape, Khurana et Tomer se sont concentrés sur une version quantique d'une fonction à sens unique, appelée générateur d'état à sens unique, qui satisfasse aux trois propriétés qui rendent les fonctions unidirectionnelles utiles. Premièrement, la fonction doit s'exécuter rapidement afin de pouvoir générer facilement un verrou cryptographique et la clé correspondante pour l'ouvrir pour chaque message envoyé. Deuxièmement, chaque verrou doit être sécurisé, nécessitant un effort considérable pour être forcé sans la bonne clé. Enfin, chaque verrou doit être facile à ouvrir avec la bonne clé.

La différence fondamentale résidait dans la nature des verrous. Les fonctions unidirectionnelles classiques génèrent des verrous mathématiques composés de bits – les 0 et les 1 qui stockent l'information dans un ordinateur classique. Les générateurs d'états unidirectionnels quantiques généreraient quant à eux des verrous composés d'unités d'information quantique appelées qubits. Ces verrous quantiques pourraient potentiellement rester sécurisés même si tous les verrous classiques sont faciles à briser. Khurana et Tomer espéraient partir de cette nouvelle fondation quantique et y ériger une tour de protocoles cryptographiques. " Cela s'est avéré très difficile ", a déclaré Khurana. " Nous sommes restés bloqués pendant de très nombreux mois. "

En juillet 2023, Khurana était enceinte de près de neuf mois et préparait un congé parental. Tomer était à court d'idées. " Je suis bien plus pessimiste que Dakshita ", dit-il. " C'est toujours elle qui croit que tout va s'arranger. "

Ils firent alors une avancée décisive. L'étape cruciale consistait à définir un autre élément mathématique de base, véritable sous-sol : une structure reliant les fondations des générateurs d'états unidirectionnels à une tour de protocoles cryptographiques. Lorsque Khurana et Tomer déterminèrent les propriétés que cet élément devait posséder, ils découvrirent qu'il ressemblait à une fonction unidirectionnelle présentant un mélange déroutant de caractéristiques quantiques et classiques. Comme dans une fonction unidirectionnelle ordinaire, les verrous et les clés étaient constitués de bits classiques, mais la procédure de génération de ces verrous et clés ne pouvait s'exécuter que sur un ordinateur quantique. Plus étrange encore, le nouveau bloc de base satisfaisait aux deux premières propriétés définissant les fonctions unidirectionnelles, mais pas à la troisième : il était facile de générer des verrous et des clés, et chaque verrou était difficile à casser. En revanche, une clé ne pouvait pas ouvrir facilement sa serrure.

Khurana et Tomer ont baptisé ces nouveaux blocs de construction déroutants " énigmes à sens unique ". Intuitivement, il est difficile d'imaginer leur utilité : à quoi sert une clé inutilisable ? Mais les deux cryptographes ont démontré que les énigmes à sens unique, combinées à d'autres astuces quantiques, permettraient de mettre en œuvre de nombreux protocoles cryptographiques. Si vous pouvez générer des serrures et des clés qui s'assemblent en principe, peu importe que la procédure de déverrouillage soit extrêmement inefficace.

" Le simple fait de savoir qu'il existe un algorithme pouvant être arbitrairement lent suffit »", a déclaré Kretschmer, aujourd'hui chercheur à l'Institut Simons. " C'est très surprenant. "

Une fois cette pièce manquante en place, ils ont rapidement terminé la preuve le 4 août. La fille de Khurana est née quelques jours plus tard.

Dossier permanent

En novembre, Khurana était de retour au travail et prête à s'attaquer à la deuxième phase de son plan. Elle et Tomer avaient démontré que de nombreux types de cryptographie pouvaient être construits sur des énigmes unidirectionnelles, et que ces énigmes unidirectionnelles pouvaient à leur tour être construites sur une nouvelle base quantique constituée de générateurs d'états unidirectionnels. L'étape suivante de leur plan initial consistait à relier cette base quantique à un nouveau socle : un ensemble de problèmes mathématiques relativement inattaquables, encore plus complexes que ceux de la théorie des probabilités.

Mais alors que Khurana et Tomer s'attaquaient à cette tâche, ils ont décidé d'adopter une approche plus directe : oublier les générateurs d'états à sens unique et ancrer à la place les énigmes à sens unique directement au fondement mathématique.

D'un certain point de vue, ce choix semblait étrange. Les énigmes à sens unique étaient des bizarreries mathématiques que Khurana et Tomer avaient utilisées dans une étape intermédiaire de leur démonstration.

Les énigmes unidirectionnelles présentaient néanmoins certains avantages. D'une part, bien que quantiques, les clés et verrous qu'elles génèrent sont classiques. Khurana pensait que cela faciliterait leur rattachement à un socle de mathématiques classiques. De plus, les énigmes unidirectionnelles génèrent des clés trop complexes pour ouvrir les verrous. Cela pourrait faciliter leur rattachement à des problèmes si complexes que même la vérification des solutions semble désespérément difficile.

Mais quels problèmes spécifiques pourraient fonctionner ? Khurana avait un candidat en tête : calculer une combinaison spécifique d'entrées dans une table de nombres appelée matrice. Ce problème, appelé " problème de la matrice permanente ", est notoirement difficile à résoudre pour les grandes matrices, et il n'existe aucun moyen simple de vérifier l'exactitude d'un calcul. Le problème de la matrice permanente présente également d'autres propriétés mathématiques particulières que les cryptographes trouvent intéressantes.

" Ce serait un beau problème sur lequel baser la cryptographie ", a déclaré Khurana.

Le problème de la matrice permanente est également lié à un autre problème que les ordinateurs quantiques peuvent facilement résoudre, mais que les ordinateurs classiques ne semblent pas pouvoir résoudre . Les chercheurs s'efforcent de démontrer cet avantage du calcul quantique de manière théorique précise. Khurana et Tomer ont montré qu'une telle preuve leur permettrait également de construire des énigmes unidirectionnelles sécurisées – et donc toute la tour de la cryptographie quantique – en s'appuyant sur le problème de la matrice permanente.

" Ils ont pu y parvenir à partir d'hypothèses bien étudiées ", a déclaré Kretschmer. " J'étais vraiment ravi de constater cela. "

Grâce à leur nouveau résultat, Khurana et Tomer ont réussi à réduire deux problèmes ouverts à un seul. Si les chercheurs parviennent à prouver que les ordinateurs quantiques surpassent véritablement les ordinateurs classiques dans une tâche spécifique, la cryptographie quantique bénéficiera automatiquement d'une assise théorique bien plus solide que pratiquement toute autre forme de cryptographie classique.

Malheureusement, la nouvelle approche de Khurana et Tomer pour envoyer des messages secrets ne sera pas bientôt utilisable. Malgré les progrès récents , l'informatique quantique n'est pas encore suffisamment mature pour mettre leurs idées en pratique. Parallèlement, d'autres chercheurs ont mis au point des méthodes de cryptographie quantique qui pourraient être utilisées plus rapidement, bien que des travaux supplémentaires soient nécessaires pour établir qu'ils sont véritablement sécurisés.

La cryptographie quantique a déjà révélé de nombreuses surprises, et les chercheurs n'ont commencé que récemment à explorer ses possibilités. " Nous essayons simplement de comprendre ce nouveau paysage qui existait déjà ", a déclaré Zhandry.




 

Auteur: Internet

Info: https://www.quantamagazine.org/, Ben Brubaker, 25 juillet 2025

[ recherche digitale ] [ inviolabilité ] [ irréversibilité ] [ post-quantique ] [ hybridation ]

 

Commentaires: 0

Ajouté à la BD par Le sous-projectionniste

nanomonde

La majeure partie de la vie sur Terre est en sommeil, après avoir activé un " frein d’urgence"

De nombreux microbes et cellules dorment profondément, attendant le bon moment pour s’activer. Les biologistes ont découvert une protéine largement répandue qui arrête brusquement l'activité d'une cellule et la réactive tout aussi rapidement.

(Photo : Lorsque les choses se compliquent, de nombreux microbes entrent en dormance. De nouvelles recherches ont découvert une protéine omniprésente qui arrête instantanément la production de protéines dans une cellule.)

Des chercheurs ont récemment rapporté la découverte d'une protéine naturelle, appelée Balon, qui peut stopper brutalement la production de nouvelles protéines par une cellule. Balon a été trouvé dans des bactéries qui hibernent dans le pergélisol arctique, mais il semble également être fabriqué par de nombreux autres organismes et pourrait être un mécanisme négligé de dormance dans l'arbre de vie.

Pour la plupart des formes de vie, la capacité de s’isoler est un élément essentiel pour rester en vie. Des conditions difficiles comme le manque de nourriture ou le froid peuvent apparaître de nulle part. Dans cette situation désastreuse, plutôt que de s’effondrer et de mourir, de nombreux organismes sont passés maîtres dans l’art de la dormance. Ils ralentissent leur activité et leur métabolisme. Puis, lorsque des temps meilleurs reviennent, ils se réaniment.

Rester assis dans un état de dormance est en fait la norme pour la majorité de la vie sur Terre : selon certaines estimations, 60 % de toutes les cellules microbiennes hibernent à un moment donné. Même dans les organismes dont le corps entier ne se met pas en dormance, comme la plupart des mammifères, certaines populations cellulaires se reposent et attendent le meilleur moment pour s'activer.

"Nous vivons sur une planète endormie", a déclaré Sergey Melnikov , biologiste moléculaire évolutionniste à l'Université de Newcastle. "La vie, c'est avant tout dormir."

Mais comment les cellules réussissent-elles cet exploit ? Au fil des années, les chercheurs ont découvert un certain nombre de " facteurs d’hibernation ", des protéines que les cellules utilisent pour induire et maintenir un état de dormance. Lorsqu’une cellule détecte une condition défavorable, comme la famine ou le froid, elle produit une série de facteurs d’hibernation pour arrêter son métabolisme.

Certains facteurs d’hibernation démantelent la machinerie cellulaire ; d'autres empêchent l'expression des gènes. Les plus importants, cependant, arrêtent le ribosome, la machine cellulaire chargée de fabriquer de nouvelles protéines. La fabrication de protéines représente plus de 50 % de la consommation d’énergie d’une cellule bactérienne en croissance. Ces facteurs d'hibernation jettent du sable dans les engrenages du ribosome, l'empêchant de synthétiser de nouvelles protéines et économisant ainsi de l'énergie pour les besoins de survie de base.

Plus tôt cette année, en publiant dans Nature, des chercheurs ont rapporté la découverte d' un nouveau facteur d'hibernation, qu'ils ont nommé Balon. Une protéine qui est étonnamment courante : une recherche de sa séquence génétique a révélé sa présence dans 20 % de tous les génomes bactériens catalogués. Et cela fonctionne d’une manière que les biologistes moléculaires n’avaient jamais vue auparavant.

(Photo : Karla Helena-Bueno a découvert un facteur d'hibernation courant lorsqu'elle a accidentellement laissé une bactérie arctique sur la glace pendant trop longtemps. " J'ai essayé d'explorer un coin de nature sous-étudié et j'ai trouvé quelque chose ", a-t-elle déclaré.)

Auparavant, tous les facteurs connus d'hibernation perturbant le ribosome fonctionnaient passivement : ils attendaient qu'un ribosome ait fini de construire une protéine, puis l'empêchaient d'en créer une nouvelle. Balon, cependant, tire sur le frein d'urgence. Il s'introduit dans chaque ribosome de la cellule, interrompant même les ribosomes actifs au milieu de leur travail. Avant Balon, les facteurs d'hibernation n'étaient observés que dans les ribosomes vides.

"Ce papier au sujet de Balon est incroyablement détaillé", a déclaré le biologiste évolutionniste Jay Lennon, qui étudie la dormance microbienne à l'Université d'Indiana et n'a pas participé à la nouvelle étude. "Cela enrichira notre vision du fonctionnement de la dormance."

Melnikov et son étudiante diplômée Karla Helena-Bueno ont découvert Balon chez Psychrobacter urativorans, une bactérie adaptée au froid, originaire des sols gelés et récoltée dans le pergélisol arctique. (Selon Melnikov, la bactérie a été découverte pour la première fois dans un paquet de saucisses congelées dans les années 1970, puis redécouverte par le célèbre génomiciste Craig Venter lors d'un voyage dans l'Arctique.) Ils étudient P. urativorans et d'autres microbes inhabituels pour caractériser la diversité des outils de construction de protéines utilisés dans tout le spectre de la vie et pour comprendre comment les ribosomes peuvent s'adapter aux environnements extrêmes.

Parce que la dormance peut être déclenchée par diverses conditions, notamment la famine et la sécheresse, les scientifiques poursuivent ces recherches avec un objectif pratique en tête : " Nous pouvons probablement utiliser ces connaissances pour concevoir des organismes capables de tolérer des climats plus chauds ", a déclaré Melnikov, " et donc résister au changement climatique. "

Présentation : Balon

Helena-Bueno a découvert Balon entièrement par hasard. Elle s'employait à amadouer qour que les P.Urativorans grandissent joyeusement en laboratoire. Au lieu de cela, elle a fait le contraire. Elle a laissé la culture dans un seau à glace pendant trop longtemps et a réussi à la soumettre à un choc froid. Au moment où elle se rappela de sa présence, les bactéries adaptées au froid étaient devenues dormantes.

Ne voulant pas gaspiller la culture, les chercheurs ont quand même poursuivi leurs investigations initiales. Helena-Bueno a extrait les ribosomes des bactéries choquées par le froid et les a soumis à la cryo-EM. Abréviation de microscopie électronique cryogénique, la cryo-EM est une technique permettant de visualiser de minuscules structures biologiques à haute résolution. Helena-Bueno a vu une protéine coincée dans le site A du ribosome bloqué – la " porte " où les acides aminés sont livrés pour la construction de nouvelles protéines.

Helena-Bueno et Melnikov n'ont pas reconnu la protéine. En effet, cela n’avait jamais été décrit auparavant. Elle présentait une similitude avec une autre protéine bactérienne, importante pour le démontage et le recyclage des parties ribosomales, appelée Pelota de l'espagnol pour " balle ". Ils ont donc nommé la nouvelle protéine Balon, un mot espagnol pour " balle ".

"Contrairement à d’autres facteurs d’hibernation, Balon peut être inséré pour bloquer la croissance, puis rapidement éjecté comme une cassette."

La capacité de Balon à arrêter l'activité du ribosome est une adaptation essentielle pour un microbe soumis à un stress, a déclaré Mee-Ngan Frances Yap, microbiologiste à l'Université Northwestern qui n'a pas participé aux travaux. "Lorsque les bactéries se développent activement, elles produisent beaucoup de ribosomes et d'ARN", a-t-elle déclaré. " Lorsqu’elle est confrontée à un stress, une espèce peut avoir besoin d’arrêter la traduction " de l’ARN en nouvelles protéines pour commencer à économiser de l’énergie pendant une période d’hibernation potentiellement longue.

Notamment, le mécanisme de Balon est un processus réversible. Contrairement à d’autres facteurs d’hibernation, il peut être inséré pour bloquer la croissance, puis rapidement éjecté comme une cassette. Il permet à une cellule de se mettre rapidement en veille en cas d’urgence et de se réanimer tout aussi rapidement pour se réadapter à des conditions plus favorables.

Balon peut le faire car il s'accroche aux ribosomes d'une manière unique. Chaque facteur d'hibernation ribosomale découvert précédemment bloque physiquement le site A du ribosome, de sorte que tout processus de fabrication de protéines en cours doit être terminé avant que le facteur puisse s'attacher pour désactiver le ribosome. Balon, en revanche, se lie à proximité mais pas à travers le canal, ce qui lui permet d'aller et venir indépendamment de ce que fait le ribosome.

Malgré la nouveauté mécaniste de Balon, il s’agit d’une protéine extrêmement courante. Une fois identifié, Helena-Bueno et Melnikov ont trouvé des parents génétiques de Balon dans plus de 20 % de tous les génomes bactériens catalogués dans les bases de données publiques. Avec l'aide de Mariia Rybak , biologiste moléculaire à la branche médicale de l'Université du Texas, ils ont caractérisé deux de ces protéines bactériennes alternatives : une provenant du pathogène humain Mycobacterium tuberculosis, responsable de la tuberculose, et un autre chez Thermus thermophilus, qui vit dans le dernier endroit où on pourrait trouver P. urativorans, c'est-à-dire dans des bouches d'aération sous-marines ultra-chaudes. Les deux protéines se lient également au site A du ribosome, ce qui suggère qu'au moins certains de ces gènes apparentés agissent de la même manière que Balon chez d'autres espèces bactériennes.

Balon est notamment absent d' Escherichia coli et de Staphylococcus aureus, les deux bactéries les plus étudiées et les modèles de dormance cellulaire les plus largement utilisés. En se concentrant uniquement sur quelques organismes de laboratoire, les scientifiques ont raté une tactique d'hibernation largement répandue, a déclaré Helena-Bueno. "J'ai essayé d'explorer un coin de nature sous-étudié et j'ai trouvé quelque chose."

Tout le monde hiberne

Chaque cellule a besoin de pouvoir se mettre en veille et d’attendre son moment. La bactérie modèle de laboratoire E. coli possède cinq modes d'hibernation distincts, a déclaré Melnikov, chacun étant suffisant à lui seul pour permettre au microbe de survivre à une crise." La plupart des microbes sont affamés ", explique Ashley Shade, microbiologiste à l'université de Lyon, qui n'a pas participé à la nouvelle étude. " Ils vivent en constant état de manque. Ils ne se dédoublent pas et ne vivent pas leur meilleure vie ".

Mais la dormance est également nécessaire en dehors des périodes de famine. Même chez les organismes, comme la plupart des mammifères, dont le corps entier n’est pas complètement endormi, les populations cellulaires individuelles doivent attendre le meilleur moment pour s’activer. Les ovocytes humains dorment pendant des décennies en attendant d’être fécondés. Les cellules souches humaines naissent dans la moelle osseuse, puis restent au repos, attendant que le corps les appelle pour se développer et se différencier. Les fibroblastes du tissu nerveux, les lymphocytes du système immunitaire et les hépatocytes du foie entrent tous dans des phases dormantes, inactives et sans division et se réactivent plus tard.

"Ce n'est pas quelque chose qui est propre aux bactéries ou aux archées", a déclaré Lennon. " Chaque organisme de l’arbre de vie a une manière de mettre en œuvre cette stratégie. Ils peuvent suspendre leur métabolisme.

Les ours hibernent. Les virus de l'herpès se lysogénisent. Les vers forment un stade Dauer. Les insectes entrent en diapause. Les amphibiens estivent. Les oiseaux entrent en torpeur. Tous ces mots désignent exactement la même chose : un état de dormance que les organismes peuvent inverser lorsque les conditions sont favorables.

"Avant l'invention de l'hibernation, la seule façon de vivre était de continuer à grandir sans interruption", a déclaré Melnikov. "Mettre la vie sur pause est un luxe."

C'est aussi une sorte d'assurance à l'échelle de la population. Certaines cellules poursuivent leur dormance en détectant les changements environnementaux et en réagissant en conséquence. Cependant, de nombreuses bactéries utilisent une stratégie stochastique. "Dans des environnements fluctuant de manière aléatoire, si vous ne vous mettez pas parfois en dormance, il y a un risque que la population entière disparaisse" à la suite de rencontres aléatoires avec des catastrophes, a déclaré Lennon. Même dans les cultures d' E. coli les plus saines, les plus heureuses et à la croissance la plus rapide, entre 5 % et 10 % des cellules seront néanmoins dormantes. Ce sont les survivants désignés qui survivront si quelque chose arrivait à leurs cousins ​​plus actifs et plus vulnérables.

En ce sens, la dormance est une stratégie de survie face aux catastrophes mondiales. C'est pourquoi Helena-Bueno étudie l'hibernation. Elle s'intéresse aux espèces qui pourraient rester stables malgré le changement climatique, à celles qui pourraient se rétablir et aux processus cellulaires, comme l'hibernation assistée par Balon, qui pourraient aider.

Plus fondamentalement, Melnikov et Helena-Bueno espèrent que la découverte de Balon et son omniprésence aideront les gens à recadrer ce qui est important dans la vie. Nous dormons tous fréquemment et beaucoup d’entre nous l’apprécient beaucoup. "Nous passons un tiers de notre vie à dormir, mais nous n'en parlons pas du tout", a déclaré Melnikov. Au lieu de nous plaindre de ce qui nous manque lorsque nous dormons, peut-être pourrions-nous le vivre comme un processus qui nous relie à toute vie sur Terre, y compris les microbes qui dorment au plus profond du pergélisol arctique.

Auteur: Internet

Info: https://www.quantamagazine.org/ - Dan Samorodnitski, 5 juin 2024

[ prudent tâtonnements bayésiens ] [ création de réserves ] [ hivernation ] [ arrêts ] [ répits ]

 

Commentaires: 0

Ajouté à la BD par Le sous-projectionniste

microbiologie

Des scientifiques recréent la danse microbienne qui a donné naissance à la vie complexe

L'évolution a été alimentée par l'endosymbiose, une alliance cellulaire dans laquelle un microbe s'installe de manière permanente à l'intérieur d'un autre. Pour la première fois, des biologistes ont réussi à mettre en œuvre ce processus en laboratoire.

Loin d’être des êtres solitaires, la plupart des microbes unicellulaires entretiennent des relations complexes. Dans l’océan, le sol et votre intestin, ils peuvent se battre et se dévorer, échanger de l’ADN, rivaliser pour les nutriments ou se nourrir des sous-produits des autres. Parfois, ils deviennent encore plus intimes : une cellule peut se glisser à l’intérieur d’une autre et s’y installer confortablement. Si les conditions sont réunies, elle peut rester et être accueillie, ce qui déclenche une relation qui peut durer des générations, voire des milliards d’années. Ce phénomène d’une cellule vivant à l’intérieur d’une autre, appelé endosymbiose, a alimenté l’évolution de la vie complexe.

Les exemples d’endosymbiose sont légion. Les mitochondries, les usines énergétiques de vos cellules, étaient autrefois des bactéries libres . Les plantes photosynthétiques doivent leurs sucres produits par le soleil au chloroplaste, qui était lui aussi à l’origine un organisme indépendant. De nombreux insectes obtiennent des nutriments essentiels des bactéries qui vivent à l’intérieur d’eux . Et l’année dernière, des chercheurs ont découvert le " nitroplaste ", un endosymbiote qui aide certaines algues à traiter l'azote.

La vie repose en grande partie sur des relations endosymbiotiques, mais les scientifiques peinent à comprendre comment elles se produisent. Comment une cellule internalisée échappe-t-elle à la digestion ? Comment apprend-elle à se reproduire à l'intérieur de son hôte ? Qu'est-ce qui fait qu'une fusion aléatoire de deux organismes indépendants se transforme en un partenariat stable et durable ?

Pour la première fois, des chercheurs ont observé la chorégraphie d'ouverture de cette danse microscopique en induisant une endosymbiose en laboratoire. Après avoir injecté des bactéries dans un champignon – un processus qui a nécessité une résolution créative du problème (et une pompe à vélo) – les chercheurs ont réussi à susciter une coopération sans tuer les bactéries ni l’hôte. Leurs observations offrent un aperçu des conditions qui rendent possible le même phénomène dans la nature microbienne.

Les cellules se sont même adaptées les unes aux autres plus rapidement que prévu. " Pour moi, cela signifie que les organismes veulent réellement vivre ensemble et que la symbiose est la norme ", a déclaré Vasilis Kokkoris, un mycologue qui étudie la biologie cellulaire de la symbiose à l'université VU d'Amsterdam et qui n'a pas participé à la nouvelle étude. " C'est donc une grande, grande nouvelle pour moi et pour ce monde. "

Les premières tentatives, qui ont échoué, révèlent que la plupart des liaisons cellulaires sont infructueuses. Mais en comprenant comment, pourquoi et quand les organismes acceptent les endosymbiotes, les chercheurs peuvent mieux comprendre les moments clés de l'évolution et éventuellement développer des cellules synthétiques conçues avec des endosymbiotes surpuissants.

La percée de la paroi cellulaire

Julia Vorholt, microbiologiste à l'École polytechnique fédérale de Zurich, en Suisse, s'interroge depuis longtemps sur les circonstances de l'endosymbiose. Les chercheurs dans ce domaine ont émis l'hypothèse qu'une fois qu'une bactérie s'infiltre dans une cellule hôte, la relation oscille entre infection et harmonie. Si la bactérie se reproduit trop rapidement, elle risque d'épuiser les ressources de l'hôte et de déclencher une réponse immunitaire, entraînant la mort de l'invité, de l'hôte ou des deux. Si elle se reproduit trop lentement, elle ne s'établira pas dans la cellule. Ils pensaient que dans de rares cas seulement, la bactérie atteint un taux de reproduction idéal. Ensuite, pour devenir un véritable endosymbiote, elle doit s'infiltrer dans le cycle de reproduction de son hôte pour se frayer un chemin jusqu'à la génération suivante. Enfin, le génome de l'hôte doit éventuellement muter pour s'adapter à la bactérie, permettant aux deux d'évoluer en tant qu'unité.

" Ils deviennent accros l’un à l’autre ", a déclaré Vorholt.

 Ces idées étaient logiques, mais personne n’avait jamais été témoin des premiers pas de l’endosymbiose microbienne. Vorholt a donc décidé de tenter de mettre en pratique ce phénomène en laboratoire. Plutôt que de réinventer la roue de l’endosymbiose, elle a pensé que son équipe aurait toutes ses chances de réussir en recréant un partenariat qui s’était déjà produit dans la nature.

La brûlure des semis de riz est une maladie causée par le sous-produit toxique d'une relation endosymbiotique sauvage. À un moment donné de son histoire évolutive, le champignon Rhizopus microsporus a adopté la bactérie Mycetohabitans rhizoxinica. La bactérie résidente produit du poison que le champignon utilise pour infecter les plants de riz ; les deux partenaires en profitent en absorbant les nutriments des cellules végétales mortes ou mourantes. Au fil des générations, les deux partenaires sont devenus si étroitement liés que le champignon ne peut plus se reproduire sans son endosymbiote.

Il existe cependant une souche de ce champignon qui vit sans endosymbiote. Vorholt pensait pouvoir l'utiliser pour recréer ce partenariat toxique. Mais avant de passer aux étapes les plus difficiles de la recherche de correspondance cellulaire, son équipe a dû surmonter une contrainte physique de base : comment faire passer physiquement une bactérie à travers la paroi cellulaire rigide d'un champignon ?

Gabriel Giger, auteur principal de l'étude et étudiant diplômé de Vorholt, a commencé par préparer un cocktail d'enzymes pour ramollir la paroi. Il a ensuite utilisé un microscope à force atomique équipé d'une technologie connue sous le nom de FluidFM, réutilisée pour servir de minuscule seringue. Lorsque Giger a percé la cellule fongique avec la micro-aiguille, le cytoplasme s'est précipité à l'extérieur comme l'eau d'un barrage rompu.

" Nous avons eu tellement de reflux ", a déclaré Giger. " [Le liquide cellulaire] arrive directement vers vous. "

Il lui fallait un appareil plus puissant pour résister à la pression intracellulaire et faire pénétrer les bactéries. Giger a bricolé une connexion entre sa pompe à vélo et le microscope. Cela a fonctionné : la pompe à vélo a augmenté la pression et a forcé les bactéries à traverser la paroi cellulaire et à pénétrer dans le cytoplasme.

Après avoir joué avec différentes pressions, ils ont peaufiné le système. " La façon dont ils ont adapté la technologie pour injecter les bactéries dans les champignons est vraiment très intéressante ", a déclaré Thomas Richards, un biologiste évolutionniste qui étudie l'endosymbiose à l'université d'Oxford et qui n'a pas participé à l'étude. " Ils ont dû utiliser des aiguilles spécialement aiguisées et ensuite une pression de pneu trois fois supérieure à celle des pneus de voiture pour pousser les bactéries à l'intérieur. Cela représente un grand pas en avant technologique. "

Giger et Vorholt ont d’abord injecté dans le champignon Escherichia coli , un organisme bactérien standard utilisé en laboratoire. Une fois à l’intérieur, E. coli s’est reproduit rapidement en se nourrissant des nutriments présents dans la cellule. Les bactéries se sont développées si vite que le système immunitaire fongique les a remarquées et les a enfermées pour les éliminer.

Les chercheurs se sont ensuite intéressés à M. rhizoxinica , une bactérie déjà présente dans d’autres souches de R. microsporus . Une fois à l’intérieur, elle s’est divisée à une vitesse agréable et a échappé à la réponse immunitaire. Plus important encore, aucun des deux partenaires n’est mort. " C’était déjà très excitant de voir que le champignon et la bactérie se développaient après l’injection ", a déclaré Giger.

La bactérie  Mycetohabitans rhizoxinica  (ovales verts fluorescents) se déplace à l'intérieur d'une cellule du champignon  Rhizopus  microsporus . Dans cette vidéo, la bactérie ressemble à une infection. Mais comme les deux organismes se reproduisent ensemble au cours de générations successives, chacun s'adaptera à l'autre jusqu'à trouver un équilibre endosymbiotique. Thomas Gassler ; Nature  635, 415-422 (2024)

Au début, le couple s’était accepté, mais ce n’était que la première étape. Giger a patiemment attendu, puis a vu ce qu’il cherchait au microscope : les bactéries s’étaient glissées dans les spores fongiques pour passer à la génération suivante.

" Je devais m'assurer que le signal était authentique, et on ne dort pas tranquille tant qu'on ne le sait pas ", a-t-il déclaré. " L'excitation a duré un bon moment. "

Giger et son équipe ont sélectionné manuellement des spores et ont fait germer 10 générations successives de champignons. Un plus grand nombre de bactéries ont survécu à chaque cycle de reproduction, et les spores sont devenues plus saines et plus efficaces. Pour la première fois, les chercheurs ont observé des microbes endosymbiotiques et hôtes s’adapter les uns aux autres. " Aucun de ces organismes ne s’empoisonne mutuellement, et leurs taux de croissance correspondent à peu près à ce spectre de viabilité pour les deux ", a rappelé Giger. Les bactéries ont survécu, protégées et nourries par le champignon – et le champignon a trouvé un partenaire toxique.

Pour confirmer le partenariat microbien, le laboratoire a isolé les deux parties pour analyser leurs génomes. Le génome du champignon avait déjà subi des mutations pour s'adapter aux bactéries. De toute évidence, ces relations peuvent se stabiliser rapidement, ont constaté les chercheurs. Bientôt, les deux espèces ne pourraient plus vivre l'une sans l'autre.

Trouver le juste équilibre 

En recréant une relation naturelle, Vorholt et Giger ont " rejoué cette séquence de l’évolution ", explique Richards, pour en tirer des leçons sur la manière dont se produit l’endosymbiose. Ils en ont conclu que le processus ne peut pas se produire s’il existe une discordance entre l’hôte et l’endosymbiote à un moment quelconque du processus d’adaptation. " C’est probablement ce qui se passe souvent dans la nature ", explique Vorholt. " Peut-être que leurs points de départ sont réussis, mais d’une manière ou d’une autre, la sélection n’est pas là, ou il y a un coût plutôt qu’un avantage. Et alors, on perd tout simplement le système, et il n’est pas stabilisé. "

Ils ont également découvert que dans les couples qui fonctionnent, les deux partenaires s’adaptent l’un à l’autre, un phénomène jusqu’ici largement négligé. Ce n’est pas seulement la bactérie qui s’adapte à un nouvel environnement ; l’hôte aussi change, même au début. " C’est une question fondamentale que les gens ont ignorée ", a déclaré Richards. " Cela ouvre la voie à de véritables avancées. "

Bien que révélatrice, cette association bactérie-champignon n’est qu’un exemple d’un processus qui peut avoir plusieurs mécanismes ou conditions. " Je peux imaginer que chez les protistes et d’autres groupes qui n’ont pas été bien étudiés, nous trouverons de nombreux nouveaux modèles de soutien de la symbiose ", a déclaré Laila Partida Martínez, qui a découvert l' endosymbiose entre les plantules de riz et le mildiou et est maintenant directeur de Cinvestav Irapuato, un institut de recherche en sciences végétales au Mexique.

D’autres recherches sur divers systèmes endosymbiotiques permettront de déterminer quelles conditions s’appliquent de manière générale et lesquelles sont spécifiques à certaines paires. À terme, ces résultats pourraient conduire à un nouveau type de biologie synthétique, mettant en avant des relations endosymbiotiques développées en laboratoire, ce qui pourrait constituer une " voie fascinante pour explorer l’innovation biologique ", a déclaré Vorholt.

Au lieu de modifier les gènes des organismes pour créer de nouvelles caractéristiques, les laboratoires pourraient concevoir des bactéries pour qu’elles exécutent des fonctions spécifiques et les introduire ensuite dans des hôtes. " De nombreuses nouvelles caractéristiques pourraient être réunies dans un système symbiotique en procédant ainsi et en les faisant évoluer ensemble ", a déclaré Partida Martínez. En induisant l’endosymbiose, les chercheurs pourraient potentiellement concevoir des plantes pour qu’elles métabolisent les polluants ou fabriquent des médicaments. " Il faudra du temps pour concevoir et vraiment régler les systèmes ", a-t-elle ajouté. " Je pense que notre imagination serait en fait la limite. "

Cela signifie-t-il que nous pourrions un jour développer des chloroplastes et devenir photosynthétiques ? Giger pense qu’il serait difficile pour un chloroplaste de se stabiliser à l’intérieur d’une cellule de mammifère. Même si cela fonctionnait, la photosynthèse à elle seule ne suffirait pas à nous alimenter : nos besoins énergétiques sont trop élevés. " Vous pourriez avoir une belle peau verte et fonctionner un peu avec vos propres panneaux photovoltaïques, mais le gain d’énergie que vous pourriez obtenir du soleil serait minime ", a-t-il déclaré. " Vous auriez souvent faim et vous auriez besoin de compléter votre alimentation avec d’autres aliments de base, comme la pizza. "


 

 

Auteur: Internet

Info: https://www.quantamagazine.org/, Molly Hareng, 2 janvier 2025

[ nanomonde ] [ bi-adaptation ] [ bénéfice mutuel ]

 

Commentaires: 0

Ajouté à la BD par miguel

homme-animal

Les insectes et autres animaux ont une conscience, déclarent les experts

Un groupe d'éminents biologistes et philosophes a annoncé un nouveau consensus : il existe " une possibilité réaliste " que les insectes, les poulpes, les crustacés, les poissons et d'autres animaux négligés fassent l'expérience de la conscience.  

En 2022, des chercheurs du Bee Sensory and Behavioral Ecology Lab de l’Université Queen Mary de Londres ont observé des bourdons faire quelque chose de remarquable : ces petites créatures floues se livraient à une activité qui ne pouvait être décrite que comme un jeu. Une fois face à de minuscules boules de bois, les abeilles les poussent et les font tourner. Ce comportement n’avait aucun lien évident avec l’accouplement ou la survie, et n’était pas non plus récompensé par les scientifiques. Apparemment, c'était juste pour s'amuser.

L’étude sur les abeilles joueuses fait partie d’un ensemble de recherches citées aujourd’hui par un groupe d’éminents spécialistes de l’esprit animal, étayant une nouvelle déclaration qui étend le soutien scientifique à la conscience à un plus grand nombre d’animaux que ce qui avait été formellement reconnu auparavant. Depuis des décennies, les scientifiques s’accordent largement sur le fait que les animaux semblables à nous – les grands singes, par exemple – ont une expérience consciente, même si leur conscience diffère de la nôtre. Ces dernières années, cependant, les chercheurs ont commencé à reconnaître que la conscience pourrait également être répandue chez des animaux très différents de nous, notamment des invertébrés dotés d’un système nerveux complètement différent et bien plus simple.

La nouvelle déclaration, signée par des biologistes et des philosophes, adhère formellement à ce point de vue. On y lit notamment : " Les preuves empiriques indiquent au moins une possibilité réaliste d’expérience consciente chez tous les vertébrés (y compris tous les reptiles, amphibiens et poissons) et de nombreux invertébrés (y compris, au minimum, les mollusques céphalopodes, les crustacés décapodes et les insectes). " Inspiré par les résultats de recherches récentes décrivant des comportements cognitifs complexes chez ces animaux et chez d'autres animaux, le document représente un nouveau consensus et suggère que les chercheurs ont peut-être surestimé le degré de complexité neuronale requis pour la conscience.

La Déclaration de New York sur la conscience animale en quatre paragraphes a été dévoilée aujourd'hui, le 19 avril, lors d'une conférence d'une journée intitulée " La science émergente de la conscience animale " qui s'est tenue à l'Université de New York. Menée par la philosophe et spécialiste des sciences cognitives Kristin Andrews de l'Université York en Ontario, le philosophe et spécialiste de l'environnement Jeff Sebo de l'Université de New York et le philosophe Jonathan Birch de la London School of Economics and Political Science, la déclaration a jusqu'à présent été signée par 39 chercheurs, dont les psychologues Nicola Clayton et Irene Pepperberg, les neuroscientifiques Anil Seth et Christof Koch , le zoologiste Lars Chittka et les philosophes David Chalmers et Peter Godfrey-Smith .

La déclaration se concentre sur le type de conscience le plus fondamental, connu sous le nom de conscience phénoménale. En gros, si une créature a une conscience phénoménale, alors c'est " comme quelque chose " qu'être cette créature — une idée énoncée par le philosophe Thomas Nagel dans son essai influent de 1974, " Qu'est-ce que ça fait d'être une chauve-souris ? " Même si une créature est très différente de nous, écrit Nagel, " " Un organisme a fondamentalement des états mentaux conscients qui correspondent à ce qu'est cet organisme, si et seulement si. ... Nous pouvons appeler cela le caractère subjectif de l'expérience. Si une créature est ainsi consciente, elle a la capacité d’éprouver des sentiments tels que la douleur, le plaisir ou la faim, mais pas nécessairement des états mentaux plus complexes comme la conscience de soi.

" J'espère que celà attire une plus grande attention aux problèmes de la conscience non humaine et aux défis éthiques qui accompagnent la possibilité d'expériences conscientes bien au-delà de l'humain", a écrit Seth, neuroscientifique à l'Université du Sussex, dans un e-mail. " J'espère que cela suscitera des discussions, éclairera les politiques et les pratiques en matière de bien-être animal et galvanisera la compréhension et l'appréciation du fait que nous avons beaucoup plus en commun avec d'autres animaux qu'avec des choses comme ChatGPT. "

Une prise de conscience croissante

La déclaration a commencé à prendre forme l’automne dernier, à la suite de conversations entre Sebo, Andrews et Birch. " Nous parlions tous les trois de tout ce qui s'est passé au cours des 10 ou 15 dernières années dans la science de la conscience animale", se souvient Sebo. Nous savons maintenant, par exemple, que les poulpes ressentent de la douleur et que les seiches se souviennent des détails d'événements passés spécifiques. Des études sur les poissons ont montré que les labres (Labroides dimidiatus) semblent réussir une version du " test du miroir ", qui indique un certain degré d'auto-reconnaissance, et que les poissons zèbres montrent des signes de curiosité. Dans le monde des insectes, les abeilles présentent un comportement de jeu apparent, tandis que les mouches des fruits de la drosophile ont des habitudes de sommeil distinctes influencées par leur environnement social. Pendant ce temps, les écrevisses présentent des états de type anxiété – et ces états peuvent être modifiés par des médicaments anti-anxiété.

Ces signes, ainsi que d’autres, d’états de conscience chez des animaux qui ont longtemps été considérés comme moins conscients ont excité et interpellé les biologistes, les spécialistes des sciences cognitives et les philosophes de l’esprit. "Beaucoup de gens acceptent depuis un certain temps que, par exemple, les mammifères et les oiseaux sont soit conscients, soit très susceptibles de l'être, mais moins d'attention a été accordée aux autres taxons de vertébrés et en particulier d'invertébrés", a déclaré Sebo. Lors de conversations et de réunions, les experts ont largement convenu que ces animaux devaient avoir une conscience. Cependant, ce consensus nouvellement formé n’a pas été communiqué au grand public, notamment aux autres scientifiques et décideurs politiques. Les trois chercheurs ont donc décidé de rédiger une déclaration claire et concise et de la faire circuler parmi leurs collègues pour approbation. La déclaration n’est pas censée être exhaustive mais plutôt " indiquer où nous pensons que le domaine se trouve actuellement et où il se dirige ", a déclaré Sebo.

La nouvelle déclaration met à jour les efforts les plus récents visant à établir un consensus scientifique sur la conscience animale. En 2012, des chercheurs ont publié la Déclaration de Cambridge sur la conscience, qui affirmait qu'un grand nombre d'animaux non humains, y compris, mais sans s'y limiter, les mammifères et les oiseaux, ont " la capacité de manifester des comportements intentionnels " et que " les humains ne sont pas les seuls à posséder les substrats neurologiques " qui génèrent la conscience.

La nouvelle déclaration élargit la portée de son prédécesseur et est également rédigée avec plus de soin, a écrit Seth. " Elle n'essaie pas de faire de la science par diktat, mais souligne plutôt ce que nous devrions prendre au sérieux concernant la conscience animale et l'éthique pertinente, compte tenu des preuves et des théories dont nous disposons." Il a écrit qu’il n’était " pas favorable aux avalanches de lettres ouvertes et autres ", mais qu’il était finalement " parvenu à la conclusion que cette déclaration méritait vraiment d’être soutenue ".

Godfrey-Smith, philosophe des sciences à l'Université de Sydney qui a beaucoup travaillé avec les poulpes, estime que les comportements complexes que présentent ces créatures – notamment la résolution de problèmes, l'utilisation d'outils et le comportement de jeu – ne peuvent être interprétés que comme des indicateurs de conscience. "Elles ont cet engagement attentif avec les choses, avec nous et avec de nouveaux objets qui fait qu'il est très difficile de ne pas penser qu'il se passe beaucoup de choses à l'intérieur d'elles", a-t-il déclaré. Il a noté que des articles récents portant sur la douleur et les états oniriques chez les poulpes et les seiches " vont dans la même direction… ".

Même si de nombreux animaux mentionnés dans la déclaration ont un cerveau et un système nerveux très différents de ceux des humains, les chercheurs affirment que cela ne constitue pas nécessairement un obstacle à la conscience. Par exemple, le cerveau d’une abeille ne contient qu’environ un million de neurones, contre environ 86 milliards dans le cas des humains. Mais chacun de ces neurones d’abeille peut être structurellement aussi complexe qu’un chêne. Le réseau de connexions qu’ils forment est également incroyablement dense, chaque neurone en contactant peut-être 10 000 ou 100 000 autres. Le système nerveux d’une pieuvre, en revanche, est complexe à d’autres égards. Son organisation est hautement distribuée plutôt que centralisée ; un bras coupé peut présenter de nombreux comportements de l'animal intact.

(4 photos : Des recherches récentes sur l’esprit des animaux – notamment ceux des écrevisses, des poulpes, des serpents et des poissons – suggèrent que la conscience " peut exister dans une architecture neurale qui semble complètement étrangère " à la nôtre, a déclaré Peter Godfrey-Smith.)

Le résultat, a déclaré Andrews, est que "  nous n’avons peut-être pas besoin d’autant d’équipement que nous le pensions " pour atteindre la conscience. Elle note, par exemple, que même un cortex cérébral – la couche externe du cerveau des mammifères, censée jouer un rôle dans l’attention, la perception, la mémoire et d’autres aspects clés de la conscience – n’est peut-être pas nécessaire pour une conscience phénoménale plus simple comme celle ciblée dans la déclaration.

"Il y a eu un grand débat sur la question de savoir si les poissons sont conscients, et cela était en grande partie dû au fait qu'ils n'avaient pas les structures cérébrales que nous observons chez les mammifères", a-t-elle déclaré. "Mais quand vous regardez les oiseaux, les reptiles et les amphibiens, ils ont des structures cérébrales très différentes et des pressions évolutives différentes - et pourtant certaines de ces structures cérébrales, comme nous le constatons, font le même genre de travail qu'un cortex cérébral chez l'homme. " Godfrey-Smith est d’accord, notant que des comportements révélateurs de conscience " peuvent exister dans une architecture qui semble complètement étrangère à l’architecture des vertébrés ou des humains ".

Relations conscientes

Bien que la déclaration ait des implications pour le traitement des animaux, et en particulier pour la prévention de la souffrance animale, Sebo a noté que l'accent devrait aller au-delà de la douleur. Il ne suffit pas d'empêcher les animaux en captivité de ressentir des douleurs et des inconforts corporels, a-t-il déclaré. " Nous devons également leur offrir le type d’enrichissement et d’opportunités qui leur permettent d’exprimer leurs instincts, d’explorer leur environnement, de s’engager dans les systèmes sociaux et d’être par ailleurs le genre d’agents complexes qu’ils sont. "

Mais les conséquences de l’attribution du label " conscient " à un plus grand nombre d’animaux – en particulier à des animaux dont nous n’avons pas l’habitude de prendre en compte les intérêts – ne sont pas simples. Par exemple, notre relation avec les insectes peut être " inévitablement quelque peu antagoniste ", a déclaré Godfrey-Smith. Certains ravageurs dévorent les récoltes et les moustiques peuvent être porteurs de maladies. " L'idée selon laquelle nous pourrions simplement faire la paix avec les moustiques est une pensée très différente de l'idée selon laquelle nous pourrions faire la paix avec les poissons et les poulpes", a-t-il déclaré.

De même, peu d’attention est accordée au bien-être des insectes comme la drosophile, largement utilisés dans la recherche en biologie. " Dans la recherche, nous pensons au bien-être du bétail et des souris, mais nous ne pensons jamais au bien-être des insectes ", a déclaré Matilda Gibbons , qui étudie les bases neuronales de la conscience à l'Université de Pennsylvanie et a signé la déclaration.

Même si les organismes scientifiques ont créé certaines normes pour le traitement des souris de laboratoire, il n'est pas clair si la déclaration d'aujourd'hui mènera à de nouvelles normes pour le traitement des insectes. Mais les nouvelles découvertes scientifiques suscitent parfois de nouvelles politiques. La Grande-Bretagne, par exemple, a adopté une législation visant à accroître la protection des poulpes, des crabes et des homards après qu'un rapport de la London School of Economics  ait indiqué que ces animaux pouvaient ressentir de la douleur, de la détresse ou être blessés.

Bien que la déclaration ne fasse aucune mention de l’intelligence artificielle, la question d’une éventuelle conscience de l’IA préoccupe les chercheurs en conscience animale. "Il est très peu probable que les systèmes d'IA actuels soient conscients", a déclaré Sebo. Cependant, ce qu’il a appris sur l’esprit animal " me fait réfléchir et me donne envie d’aborder le sujet avec prudence et humilité ".

 

Auteur: Internet

Info: https://www.quantamagazine.org/ - Dan Falk  19 avril 2024

[ entités vivantes ] [ monades ] [ animal-végétal ]

 

Commentaires: 0

Ajouté à la BD par Le sous-projectionniste

Intelligence artificielle

Ce médecin s'efforce de créer une IA scientifiquement informée.

En formant des modèles d'apprentissage automatique avec des exemples de sciences fondamentales, Miles Cranmer espère accélérer le rythme des découvertes scientifiques.

La physique a ébloui Miles Cranmer dès son plus jeune âge, il recevait des livres sur le sujet de la part de son grand-père, professeur de physique à l'université de Toronto, et ses parents l'emmenaient à des journées portes ouvertes dans des universités proches de chez eux, dans le sud de l'Ontario, au Canada. L'Institut Perimeter de physique théorique était l'un de ses préférés. "Je me souviens que quelqu'un parlait de l'infini quand j'étais très jeune, et c'était tellement cool pour moi", a déclaré Cranmer. Au lycée, il a fait un stage à l'Institut d'informatique quantique de l'université de Waterloo, " le meilleur été de ma vie à ce moment-là ". Il a rapidement commencé à étudier la physique en tant qu'étudiant de premier cycle à l'université McGill.

Puis, un soir, au cours de sa deuxième année, Cranmer, alors âgé de 19 ans, a lu une interview de Lee Smolin dans Scientific American. qui disait qu'il faudrait " des générations " pour réconcilier la théorie quantique et la relativité. « Cela a déclenché quelque chose dans mon cerveau », a déclaré Cranmer. " Je ne peux pas accepter cela, il faut que ça aille plus vite. " Et pour lui, le seul moyen d'accélérer la chronologie des progrès scientifiques était d'utiliser l'intelligence numérique artificielle. " Cette nuit-là, j'ai décidé : "Nous devons faire de l'IA pour la science." Il a commencé à étudier l'apprentissage automatique , qu'il a finalement fusionné avec ses recherches doctorales en astrophysique à l'université de Princeton.

Près d'une décennie plus tard, Cranmer (aujourd'hui à l'Université de Cambridge) a vu l'IA commencer à transformer la science, mais pas autant qu'il l'imaginait. Des systèmes à usage unique comme AlphaFold peuvent générer des prédictions. scientifiques avec une précision révolutionnaire, mais les chercheurs manquent toujours de " modèles de base " conçus pour la découverte scientifique générale. Ces modèles fonctionneraient davantage comme une version scientifiquement précise de ChatGPT, générant de manière flexible des simulations et des prédictions dans plusieurs domaines de recherche. En 2023, Cranmer et plus de deux douzaines d'autres scientifiques ont lancé l'initiative IA polymathique visant à commencer à développer ces modèles de fondation.

La première étape consiste à doter le modèle des compétences scientifiques qui échappent encore à la plupart des systèmes d'IA de pointe. "Certaines personnes voulaient créer un modèle de langage pour l'astrophysique, mais j'étais vraiment sceptique à ce sujet", se souvient Cranmer. "Si on simule des systèmes fluides massifs, en étant mauvais en traitement numérique généralisé" - comme le sont sans doute les grands modèles de langage - "ce n'est pas satisfaisant". s'entraînent.

 Pourtant, Cranmer estime que ces obstacles sont surmontables. " Je suis loin d'être aussi intelligent qu'Einstein ou d'autres grands scientifiques ", at-il déclaré. " Donc, si je réfléchis à ce que je peux faire pour accélérer le rythme de la recherche, c'est vraiment en faisant progresser l'apprentissage automatique. C'est ce que je peux apporter. "

Quanta a discuté avec Cranmer de la possibilité de doter l'IA d'une mémoire scientifique, d'extraire des informations à partir de réseaux neuronaux et de ce que les scientifiques et les programmeurs pourraient bientôt avoir en commun. Cet entretien a été condensé et édité pour plus de clarté.

- Les chercheurs en IA ont remporté deux prix Nobel l'année dernière. N'avons-nous pas déjà une "IA pour la science" ? Que manque-t-il ?

Le plus grand défi, si l'on fait abstraction de tout, c'est que l'apprentissage automatique est mauvais pour la prédiction " hors distribution ". Cela signifie que si vous avez un nouveau point de données qui ne ressemble à rien de ce que vous avez vu auparavant, un modèle d'apprentissage automatique aura tendance à mal fonctionner. C'est la principale faiblesse de l'apprentissage automatique, par rapport à la science traditionnelle.

Pensez à la relativité générale d'Einstein. Les médecins n'avaient aucune idée de l'existence d'un trou noir en 1915. Les mathématiques produisent simplement cette prédiction de manière logique. Et nous pouvons voir des preuves qui la confirment plus d'un siècle plus tard. C'est quelque chose que l'apprentissage automatique ne pourrait pas faire – ce genre d'extrapolation est tout simplement hors de question.

J'ai toujours été très intéressé par l'amélioration de cette partie de l'apprentissage automatique, car je pense que c'est la pièce manquante.

- Mais les réseaux neuronaux ne sont eux aussi que des équations. Comment se fait-il que les mathématiques d'Einstein nous donnent des modèles de l'univers, alors que celles de l'IA ne le peuvent pas ?

Je dirais que ce deuxième type de mathématiques, l'apprentissage automatique, n'a pas de mémoire, alors que le premier type en a. Dans les sciences physiques, si vous proposez une nouvelle théorie, toutes les observations précédentes doivent toujours être satisfaites par le nouveau cadre. Nous devons obéir aux mêmes règles que celles que nous avons découvertes auparavant. Alors que dans l'apprentissage automatique, vous repartez de zéro à chaque fois que vous entraînez un modèle.



Comment intégrer la mémoire, dans ce sens abstrait d'"accumulation de connaissances", dans l'apprentissage automatique ? L'une des méthodes consiste à utiliser des règles symboliques, qui nous permettent d'imposer les modèles qui apparaissent dans les cadres physiques. Par exemple, je sais que si j'entre dans une autre pièce, le physique ne change pas. Un modèle d’apprentissage automatique ne sait pas.

- Comment faire pour qu'un réseau neuronal joue selon ces règles ?

- J'ai passé les quatre dernières années à travailler sur un logiciel appelé PySR. Il s'agit d'une bibliothèque de régression symbolique qui apprend des équations correspondantes à un ensemble de données. Plutôt que de cacher une prédiction dans un réseau neuronal, cela permet de traduire le comportement du réseau neuronal en une équation symbolique dans un langage plus familier aux scientifiques. Forcer le modèle d'apprentissage automatique à utiliser des mathématiques symboliques est essentiellement un moyen de lui donner un biais en faveur des idées existantes à partir desquelles nous avons construit le physique.

Ca présente de nombreux avantages. Les équations obtenues sont très interprétables et ont tendance à se généraliser pour vous donner de bonnes prédictions hors distribution. L'inconvénient est que ces algorithmes sont très coûteux en termes de calcul. Si vous disposez de ressources infinies, ce serait parfait.

- Et les " modèles fondamentaux " scientifiques sur lesquels vous travaillez contournent-ils ce problème ?

- Avec la régression symbolique, on donne à un réseau neuronal les symboles que les scientifiques utilisent, comme une bibliothèque de concepts avec laquelle il peut construire des choses. Une autre façon de procéder est beaucoup plus axée sur les données : fournir une bibliothèque d'exemples. Notre approche dans Polymathic AI consiste à prendre un modèle et à l'entraînement sur toutes les données scientifiques qu'on peut obtenir. Vous partez toujours de zéro, mais vous lui avez donné tellement de données que vous ancrez en quelque sorte ses prédictions.

Je pense que c'est la raison pour laquelle les modèles de langage comme ChatGPT semblent efficaces dans les scénarios hors distribution : ils ont en quelque sorte transformé tout en un problème de prédiction dans la distribution, car ils ont été pré-entraînés sur de nombreux éléments différents. Lorsque ChatGPT est sorti, nous étions tous très enthousiastes à l'idée de réfléchir à la manière dont ce type d'outil pourrait être utilisé dans le domaine scientifique. Et au fil de nos discussions, cette idée s'est cristallisée : pré-entraîner un modèle non pas sur le langage, mais sur des ensembles de données numériques scientifiques.

C'était le défi le plus difficile pour nous. Obtenir des données scientifiques de haute qualité, comme des spectres d'étoiles, n'est pas aussi simple que de simplement lancer des robots sur Internet pour extraire des sites Web de données d'entraînement, comme le font les entreprises d'IA. Heureusement, en astronomie, une grande partie des données est accessible au public. Il suffit de les mettre dans un format uniforme. Nous avons publié deux ensembles de données : le Wellpour les simulations de physique numérique et l'univers multimodal pour les observations astronomiques. Ces ensembles de données offrent une quantité massive de données scientifiques comme base pour construire ces modèles fondamentaux.

- Vont-ils " halluciner " – inventer en toute confiance de fausses réponses – comme le font d'autres modèles d'IA ?

La raison principale de cette préformation est de se faire une idée de ce qui est physiquement raisonnable. Si le modèle se retrouve dans une situation nouvelle qu'il n'a jamais vue auparavant, plutôt que de faire une prédiction insensée, il va faire quelque chose de physiquement raisonnable.

(image : Miles Cranmer est assis à un bureau et regarde un tableau noir avec des équations, il utilise des règles symboliques pour inculquer aux machines une meilleure compréhension des découvertes passées, les aidant à traiter de nouvelles données et à produire des résultats plus compréhensibles.)

Ca n'élimine pas le problème, mais on va vers une grande. Je pense que c'est là que la régression symbolique pourrait également intervenir : traduire des parties du modèle en expressions mathématiques analytiques permettant de fournir des garanties.

Que pensez-vous que les scientifiques puissent faire avec ce type de fondation ?

- L'apprentissage automatique est très efficace pour résoudre des problèmes impliquant des volumes de données considérables, mais il est moins efficace pour les problèmes comportant très peu d'exemples. C'est pourquoi je suis vraiment enthousiaste à l'idée d'utiliser ce genre de modèle de base, car il nous permet d'aborder des types de problèmes à faible volume de données. On peut entraîner le modèle sur des simulations, ce qui lui permet d'intégrer la majeure partie du physique. Mais il suffit ensuite d'ajouter quelques expériences pour affiner ses prédictions. Ce ne sera pas parfait, mais ce sera mieux qu'un modèle d'apprentissage automatique formé à partir de zéro. Ainsi, à partir de quelques points de données du monde réel, vous pouvez extraire plus de données scientifiques qu'auparavant. C'est l'idée.

- Cela pourrait-il aboutir à automatiser le travail des scientifiques ?

- Je pense vraiment que ce type d'outil permettra d'automatiser de nombreuses tâches. Mon objectif est de rendre tous les scientifiques capables de faire beaucoup, beaucoup plus. Cela pourrait changer la définition de ce qu'est un scientifique, mais je pense que cette définition a déjà changé au cours de l'histoire.

 C'est pareil avec les modèles de langage. Ils ne remplacent pas les programmeurs, ils modifient simplement la définition de ce qu'est la programmation, de la même manière qu'écrire en Python ne remplace pas quelqu'un qui écrit des compilateurs. Il s'agit simplement de niveaux d'abstraction différents.

En ce sens, je ne crains pas qu'une quelconque forme d'IA remplace les scientifiques. Elle nous permet simplement de faire plus avec le même laps de temps. C'est ce qui m'enthousiasme vraiment. Comprendre l'univers n'a pas vraiment de fin. Cela va continuer et nous allons continuer à en apprendre toujours plus.


 

 

Auteur: Internet

Info: Jean Pavlus, 28 février 2025

[ accélérationnisme ] [ concepts vectorisés ] [ termes univers ] [ réductionnisme sémantique ] [ mathématisation ] [ réduction linguistique ]

 

Commentaires: 0

Ajouté à la BD par miguel

infra-monde

Le physicien qui décode la nature non-binaire du monde subatomique

À l'intérieur du proton, les quarks et les gluons modifient et transforment leurs propriétés d'une manière que les physiciens peinent encore à comprendre. Rithya Kunnawalkam Elayavalli apporte au problème une perspective différente de celle de leurs pairs. De nombreuses découvertes en physique découlent de la théorie à l'expérience. Albert Einstein a théorisé que la masse courbe le tissu de l'espace-temps, puis Arthur Eddington a observé les effets de cette courbure lors d'une éclipse solaire. De même, Peter Higgs a d'abord proposé l'existence du boson de Higgs ; près de 50 ans plus tard, la particule a été découverte au Grand Collisionneur de Hadrons.

L'hadronisation est différente. C'est le processus par lequel les particules élémentaires appelées quarks et gluons s'assemblent pour former des protons et des neutrons - les composants des atomes. Aucune théorie actuelle ne peut décrire avec précision comment ou pourquoi l'hadronisation se produit.

"C'est vraiment l'opposé de la norme", déclare Rithya Kunnawalkam Elayavalli, physicien nucléaire de haute énergie à l'Université Vanderbilt à Nashville, Tennessee.

Kunnawalkam Elayavalli passe ses journées à observer l'hadronisation et à essayer de formuler une théorie qui l'explique. Ils font partie des expériences Sphenix et STAR au Collisionneur d'Ions Lourds Relativistes (RHIC) à New York, ainsi que membre de l'expérience CMS au CERN près de Genève. Leurs recherches étudient le comportement des quarks et des gluons après les collisions, pendant la fraction de milliseconde durant laquelle ces particules se déplacent librement avant de s'hadroniser à nouveau.

Ces expériences ont révélé des détails sur la structure des quarks et des gluons dans cet état intermédiaire, ainsi que sur le moment de l'hadronisation. Pourtant, Kunnawalkam Elayavalli trouve frustrant d'observer sans comprendre davantage.

Le domaine quantique défie les binaires - les gluons en particulier. Ces entités élémentaires peuvent avoir trois charges différentes dans de multiples configurations. Et elles doivent exister en ensembles qui équilibrent ces charges. Pour Kunnawalkam Elayavalli, c'est similaire à la multiplicité des genres qu'ils expérimentent en tant que personne non-binaire. Quanta Magazine s'est entretenu avec eux pour discuter des mystères de la physique nucléaire qui transcende le binaire, ainsi que de leur expérience en tant que personne transgenre - au Tennessee, qui plus est, où la législation anti-trans est parmi les plus régressives du pays - tout en faisant de la science naturelle.

L'interview a été condensée et éditée pour plus de clarté.

Que comprenons-nous des quarks et des gluons ?

Au moment du Big Bang, il devait y avoir une forme de matière qui existait, cette matière primordiale faite de quarks et de gluons avant qu'ils ne se convertissent en hadrons. La meilleure compréhension des quarks et des gluons que nous ayons vient de la théorie de la chromodynamique quantique, qui a été développée dans les années 1970. Nous l'appelons "chromo" parce que nous avons introduit ce nouveau concept appelé charge de couleur. Les quarks et les gluons peuvent avoir trois charges différentes, et les physiciens ont nommé ces trois choses rouge, bleu et vert. Vous pouvez aussi avoir des antiquarks, ce qui signifie que vous avez des anti-couleurs : anti-rouge, anti-bleu et anti-vert.

- Juste pour être clair, cela n'a rien à voir avec la couleur telle que nous la connaissons ?

Il n'y a pas de véritable connexion. Nous avions besoin de quelque chose qui venait par trois et qui, une fois additionné, devient une quantité nulle. La couleur était un terme raisonnable à utiliser. Avec la lumière, quand vous combinez rouge, bleu et vert ensemble, vous obtenez de la lumière blanche, qui est neutre. Et si vous combinez une couleur et son anti-couleur, vous obtenez aussi du blanc. De même, les quarks et les gluons portent par eux-mêmes des charges de couleur, et tous les hadrons sont des combinaisons neutres en couleur de ces quarks et gluons. Tout ce que nous voyons dans le monde est neutre en couleur.

Mais pour compliquer les choses, les gluons ont plusieurs charges de couleur ; une couleur va dans ce sens, l'autre couleur va dans l'autre sens. Les quarks ont trois charges de couleur. Les gluons ont deux charges de couleur.

- Comment savons-nous que cette description est correcte ?

Notre validation de la théorie de la chromodynamique quantique vient des comparaisons avec les données réelles des collisionneurs. Nous faisons entrer en collision un électron et un positron, qui est l'antiparticule de l'électron. Nous savons que lorsque la matière rencontre sa propre antimatière, elle explose. Cette explosion d'énergie se convertit en une paire quark et antiquark. La probabilité que ce processus se produise était bien décrite par la théorie de la chromodynamique quantique.

C'est ainsi que nous savons que cette théorie peut modéliser les quarks et les gluons. Ce qu'elle ne peut pas faire, c'est décrire les quarks et les gluons lorsqu'ils se regroupent en hadrons. À ce moment-là, la théorie s'effondre dans la région que nous appelons non perturbative - physique non calculable. Tous nos calculs explosent. Ils explosent littéralement, dans le sens où les termes tendent vers l'infini. C'est là que notre compréhension théorique nous fait défaut.

- Comment vous et vos collègues utilisez-vous les collisionneurs de particules pour mieux comprendre ce processus ?

Le RHIC fait entrer en collision des noyaux d'atomes d'or. Quand vous faites cela, vous injectez tellement d'énergie dans le système, parce que vous faites entrer en collision plusieurs protons et neutrons avec plusieurs protons et neutrons. Ces gars ont tellement d'énergie que vous recréez en quelque sorte un peu du Big Bang. Nous l'appelons le Petit Bang. Et à partir du Petit Bang, vous obtenez un très court laps de temps, 10−22 secondes - yoctosecondes. Dans ce court laps de temps, un fluide appelé plasma quarks-gluons apparaît, et tous les quarks et gluons communiquent entre eux. C'est une boule de feu. Ensuite, elle évolue. Elle s'expand. Elle refroidit. À un certain point, elle atteint la température à laquelle les quarks et les gluons se convertissent en hadrons.

Donc nous commençons avec des hadrons que nous faisons entrer en collision. Puis nous passons aux quarks et aux gluons, et ensuite nous revenons aux hadrons. L'hadronisation se produit devant nous chaque fois que nous faisons fonctionner nos collisionneurs, sur n'importe quel collisionneur dans l'histoire de la physique. Le fait que nous ne puissions pas le comprendre au niveau quantitatif ou même qualitatif - c'est frustrant ! Une des principales motivations de ma recherche est de l'observer et d'essayer de comprendre ce qui se passe ici.

- Dans ma tête, j'imagine que vous prenez tous une photo avec un petit appareil photo et que vous étudiez l'explosion.

- Eh bien, en gros, oui.

Voici une analogie simple. Disons que vous travaillez dans les tests de sécurité automobile. Vous mettez un mannequin dans la voiture, vous accélérez la voiture, vous heurtez un bloc, et ensuite vous regardez ce qui arrive au corps du mannequin pour déterminer si c'est sûr et si les airbags fonctionnent.

Maintenant imaginez que vous n'avez qu'une photographie du site de test de collision plusieurs années plus tard. Et une photographie de la voiture non endommagée avant la collision. Ce décalage temporel de plusieurs années dans l'analogie reflète le décalage en yoctosecondes entre la collision et votre capacité à la capturer, n'est-ce pas ?

- Oui, cela se produit en un temps très court, et il n'y a aucun moyen de l'arrêter.

Donc vous regardez ces deux photographies, et vous dites : Je sais que la main du mannequin a commencé ici et a fini là. Quels sont les autres indices dans la photographie que je peux utiliser pour recréer le trajet de la main du mannequin ?

Je crée un algorithme de reconstruction. D'ici, la main va revenir par là, et puis je rassemble plus d'informations, et puis je remonte plus loin. Je peux estimer ce qui se passe en théorie grâce à une simulation.

Nous avons un processus itératif où nous apprenons. Nous faisons une prédiction ; les données ne sont pas d'accord. Nous mettons à jour la prédiction ; nous la comparons avec de nouvelles données. Peut-être que ça correspond.

Faire cela aux plus petits niveaux de la matière autour de nous, c'est vraiment ce dont il s'agit en physique des particules et en physique nucléaire de haute énergie.

- Qu'avez-vous découvert ?

Nous mesurons des jets, qui sont des structures en forme de cône composées d'un spray de hadrons et d'autres particules et fragments de particules qui s'échappent d'une collision. Nous reconstruisons et étudions la sous-structure de ces jets. En regardant la distribution des particules dans le jet, si je regarde les particules qui sont éloignées les unes des autres, c'est une région très calculable du jet. À mesure que l'échelle de distance se rapproche, cela entre dans la région incalculable ou non perturbative. Nous avons identifié une échelle spécifique où les quarks et les gluons ne peuvent plus être considérés comme des quarks et des gluons ; ils doivent être considérés comme des hadrons.

Dans notre quête à long terme pour identifier comment se produit l'hadronisation, nous avons découvert avec nos données et nos calculs que l'hadronisation semble se produire à cette échelle de distance fixe, appelée région de transition. Je peux convertir cette distance en temps. Donc nous arrivons enfin au point où nous savons exactement quand l'hadronisation a lieu.

- Est-ce que les propriétés des quarks et des gluons résonnent avec vous en tant que personne non-binaire ?

Oui, je pense que le simple fait que les gluons portent plusieurs charges de couleur signifie qu'ils sont fondamentalement des créatures non-binaires. Et ils sont la pierre angulaire de tout ce qui nous entoure.

C'est un aspect plus coloré de la nature. Cela nous dit qu'il y a quelque chose de plus que la simple charge binaire positive ou négative. Vous avez beaucoup plus de choix de couleurs. Vous avez beaucoup plus de saveurs dans la soupe.

- Que signifie pour vous l'observation de ces particules ?

Je suis dans un voyage de découverte de soi en même temps que mon voyage intellectuel pour comprendre les quarks et les gluons et comment ils évoluent. Tout, selon moi, a un chemin d'évolution.

J'ai commencé dans une société [dans le sud de l'Inde] qui était très binaire dans sa représentation visuelle. Il y avait des rôles de genre clairement définis. Venir aux États-Unis et y passer 15 ans m'a pris beaucoup de temps pour réaliser ce que je pourrais comprendre être moi-même. L'idée du non-binaire, de ne pas appartenir à une certaine représentation - cela a pris beaucoup de temps à réaliser.

Ma première réalisation que c'était une possibilité, que la transition pourrait arriver, c'était au CERN. Mon collègue est simplement apparu en portant une robe. Et je me suis dit : Oh, on peut faire ça !

Dans le monde de la physique, il n'y a pas beaucoup de personnes queer ou trans. La représentation compte beaucoup pour moi, et être présent.e en tant que personne trans ouvertement, représentant mon domaine, mon domaine d'étude - qui est fondamentalement non-binaire dans sa nature - est un aspect très important de mon travail quotidien. Mais c'est difficile. Notre représentant du Tennessee au Congrès vient de déposer un projet de loi qui supprime le financement fédéral de toute institution qui facilite "la dissociation d'un individu de son sexe". C'est le libellé du projet de loi.

Ils s'en prennent à l'assurance. Ils s'en prennent aux universités.

- Comment pouvez-vous penser à la physique quand vous pensez à tout cela ?

Cinquante pour cent de mon cerveau pense à cela, comment je peux survivre, et dans les 50% restants du cerveau, je peux penser à la physique.

Je suis physicien.ne, mais avant cela, je suis une personne. Si quelqu'un veut juste parler physique avec moi, vous ne pouvez pas juste avoir ma physique, vous avez aussi le fait que je suis une personne trans et vous entendez parler de l'environnement dans lequel on me demande de faire ma recherche. 

Auteur: Internet

Info: https://www.quantamagazine.org/, P Louvet, janvier 2025

[ unicité ] [ physique fondamentale ] [ observateur miroir ] [ katoï ] [ transsexualité ]

 

Commentaires: 0

Ajouté à la BD par miguel

addiction

Elle étudie la façon dont la toxicomanie interfère avec l'apprentissage dans le cerveau

Erin Calipari cherche à comprendre comment des drogues comme les opioïdes et la cocaïne modifient les circuits d'apprentissage et la neurochimie dans l'un des épicentres nationaux des troubles liés à la consommation de substances psychoactives et de la toxicomanie.

(Photo : La dopamine est mieux comprise comme une molécule " d’apprentissage " que comme une molécule de " plaisir ", déclare Erin. "Tout le monde doit avoir un neuromodulateur préféré dans le cerveau, et pour moi c'est la dopamine.")

À quoi ressemble l’apprentissage dans le cerveau et comment les drogues interfèrent-elles avec cela ?

Notre cerveau est programmé pour nous aider à voir les choses qui sont importantes et à y réagir. Cela détermine si nous devons refaire quelque chose ou non. Devons-nous déménager ou rester ? Est-ce bon ou mauvais? Est-ce quelque chose auquel je dois faire attention ?

Les drogues convainquent notre cerveau : " Oui, c’est important. C’est quelque chose que nous devons refaire. Les drogues déterminent non seulement les décisions concernant la drogue elle-même, mais également les décisions concernant les stimuli non médicamenteux présents dans notre environnement. Elles modifient la façon dont nous apprenons.

Comment ça marche au niveau moléculaire ?

Les médicaments comme les opioïdes agissent sur la dopamine. La plupart des gens considèrent la dopamine comme une " molécule du plaisir ", mais ce n’est pas tout. Oui, la dopamine est libérée par des stimuli enrichissants comme le chocolat ou le sucre. Mais Elle est également libérée par des stimuli aversifs comme le stress ou la douleur. Elle se déclenche lorsque les choses sont nouvelles ou différentes, qu'elles soient bonnes ou mauvaises. Et de cette façon, la dopamine est essentielle pour vous aider à apprendre.

Les drogues continuent essentiellement à stimuler la dopamine même lorsque les choses ne sont plus nouvelles ou différentes. Le cerveau continue de penser que quelque chose est important, vous signalant ainsi de continuer à y prêter attention. Mais si les drogues augmentent la dopamine sur le moment, leur consommation à long terme la diminue. Ainsi, avec la consommation croissante de drogues, il y a de moins en moins de dopamine dans le cerveau, ce qui signifie que vous avez du mal à apprendre quelque chose de nouveau.

La dopamine doit-elle être redéfinie comme une molécule " d’apprentissage " plutôt que comme une molécule de " plaisir " ?

Oui. Comprendre la dopamine en tant que molécule qui détermine l’efficacité de notre apprentissage est beaucoup plus précis.

Comment étudiez-vous ce système compliqué ?

Dans mon laboratoire, nous utilisons différentes stratégies pour enregistrer et manipuler différentes cellules du cerveau afin d’essayer de déterminer quelles cellules et quels circuits nous aident à prendre des décisions adaptatives. Et puis, une fois que nous avons identifié ces circuits, nous y allons et disons : Comment l'exposition aux drogues change-t-elle le fonctionnement du système ? Nous effectuons ce travail au niveau physiologique et épigénétique. L’objectif est de comprendre la biologie fondamentale – comment les médicaments détournent les circuits – et ensuite de déterminer si nous pouvons inverser le processus. Nous pouvons utiliser les outils CRISPR*, par exemple, pour inverser une partie de la plasticité de cellules cérébrales spécifiques.

Comprendre le fonctionnement de la dopamine peut-il éventuellement nous aider à développer des traitements contre la dépendance ?

Comprendre ce que fait la dopamine pour aider le cerveau à apprendre est vraiment important. Mais ce sera très difficile à cibler. Vous ne pouvez pas simplement bloquer la dopamine : si vous le faites, les gens ne pourront plus bouger, ils ne pourront plus prêter attention à quoi que ce soit. De nombreux travaux sont en cours sur différentes manières d'affiner le système dopaminergique au lieu de simplement l'activer ou le désactiver. Je pense que c'est ce que nous allons devoir faire.

Qu'est-ce que ça fait de travailler en tant que chercheur en toxicomanie dans l'un des épicentres de la toxicomanie ?

Nashville est mauvais. Au plus fort de l’épidémie d’opioïdes, le Tennessee avait l’un des taux de prescriptions d’opioïdes les plus élevés. Ces dernières années, ce chiffre a diminué, mais pas le problème des opioïdes. Et il ne s’agit pas uniquement d’opioïdes pour nous ; la méthamphétamine est également un problème important. Vanderbilt se trouve donc dans cet espace unique en tant que l’un des plus grands hôpitaux de recherche de la région, au cœur des troubles liés à l’usage de ces substances.

Parfois, il est épuisant de ne pas pouvoir résoudre sa dépendance. C'est écrasant dans un sens pas sympa. Parfois, c'est triste de parler à des personnes qui souffrent de troubles liés à l'usage de substances, et je ne sais pas comment les aider. Elles me posent des questions, mais si je suis experte des changements neurobiologiques spécifiques qui se produisent il m’est difficile de comprendre l’impact de ce trouble sur la vie quotidienne d’un individu puisque je ne l’ai pas vécu personnellement.

Sommes-nous sur le point de comprendre et, à terme, de trouver un remède à la dépendance ?

Guérir de la dépendance est difficile car la dépendance n’est pas une maladie uniforme. Certaines personnes souffrant de dépendance souffrent de troubles comorbides comme l’anxiété et la dépression. Certaines personnes prennent des drogues pour éviter la douleur. Certaines personnes ont un comportement compulsif, d’autres non.

Il sera essentiel de comprendre ce qui est similaire et différent dans le cerveau des individus présentant chacun de ces symptômes uniques pour comprendre comment aborder le traitement en premier lieu. Dans mon laboratoire, par exemple, nous étudions les différences entre les hommes et les femmes.

Qu'avez-vous découvert ?

Lorsque l’on examine les raisons pour lesquelles les gens consomment de la drogue, les femmes sont plus susceptibles de déclarer qu’elles en prennent pour éviter ou échapper à des conséquences négatives, comme le stress et l’anxiété. Les hommes sont plus susceptibles de consommer des drogues de manière impulsive, de planer et de sortir avec des amis. Les deux sexes consomment des drogues et un certain pourcentage d’entre eux développeront un trouble lié à l’usage de substances. Mais ils le font pour différentes raisons.

Les hormones ont beaucoup à voir avec cela. Nous avons découvert que l'estradiol, une hormone ovarienne qui circule avec le cycle menstruel, modifie la façon dont la nicotine agit dans le cerveau en modifiant les fonctions de ses récepteurs.

Nous avons également constaté que si l’on donne aux animaux un accès illimité aux drogues, les mâles et les femelles consomment la même quantité de drogues et leur comportement semble identique. Mais lorsque nous avons examiné les modifications apportées aux protéines de leur cerveau, les hommes et les femmes étaient totalement différents. Beaucoup de ces protéines ont des fonctions cellulaires similaires. Nous pensons que ce médicament augmente la dopamine chez les hommes et les femmes et détermine le comportement de la même manière, mais les voies moléculaires utilisées par chaque sexe sont très différentes.

Pourquoi les cerveaux de sexes différents emprunteraient-ils des chemins différents pour arriver au même point ?

Si vous aviez un système dans lequel vous avez besoin d’un neurone pour coder une information, ce système serait susceptible de tomber en panne. Tout devrait fonctionner parfaitement à chaque fois pour que vous puissiez naviguer dans l'environnement. Mais le cerveau comporte de nombreuses redondances, ce qui signifie que vous n’avez pas besoin que tout fonctionne parfaitement. Il existe de nombreuses façons d’arriver au même but. La raison pour laquelle les mâles et les femelles ont des manières différentes de coder leurs comportements est probablement basée sur l'évolution et la survie de notre espèce.

Cela doit être un domaine difficile dans lequel travailler. Qu'est-ce qui vous motive ?

Ce qui me préoccupe chaque jour, c’est que ce sont des questions importantes. Apprendre la prochaine chose et résoudre des problèmes difficiles est en soi très satisfaisant. Ensuite, lorsque vous respirez, prenez du recul et réalisez que les problèmes difficiles que vous résolvez ont vraiment un impact sur les gens, cela rend le tout encore plus significatif. Mais ma véritable motivation réside dans le mentorat de la prochaine génération. Lorsque je me suis lancé dans la recherche, mon objectif était d’influencer le plus de personnes possible. Je pensais y parvenir en découvrant quelque chose d'important et en changeant la société, ce qui est évidemment le but ultime. Mais ensuite, quand je suis arrivée ici et que j'ai installé mon laboratoire, j'ai réalisé que ce qu'on fait, c'est apprendre aux étudiants qu'ils peuvent faire ce travail. Leur permettre de découvrir ce pour quoi ils sont bons et ce qu'ils aiment me permet de continuer, même lorsque la science ne va pas toujours comme je le souhaite.

Vous êtes un peu comme l'entraîneur de votre propre équipe.

Lorsque vous finissez par diriger un laboratoire, vous réalisez qu’il s’agit d’une grande partie de la science, mais aussi d’une grande partie de la non-science. Il s'agit d'amener les gens à travailler ensemble et de créer l'environnement approprié pour chaque individu, ce qui peut s'avérer difficile. C'est comme constituer une équipe. S'ils travaillent ensemble, c'est moins difficile pour chacun. Et si vous le faites correctement, alors tout le monde y gagne.

Vous défendez également les femmes scientifiques. D’où vient cette motivation ?

Personne dans ma famille n’avait de diplôme d’études supérieures avant moi. Parce que mon père est sportif, l'accent n'était pas mis sur les études. Ensuite, je me suis retrouvé dans un espace dans lequel – je ne veux pas dire que je n’avais rien à faire, mais j’étais entouré d’un groupe de personnes qui, à mon avis, étaient plus intelligentes que moi. Ils savaient ce qu'ils faisaient. Ils savaient quel chemin ils étaient censés emprunter.  Heureusement j’ai eu des mentors extraordinaires qui m’ont aidé à rester sur un chemin que je ne connaissais pas. Et puis, en vieillissant, j’ai commencé à réaliser que ma place était ici. J'étais aussi intelligente que les gens autour de moi. Cela seul m’a fait réaliser à quel point il est important que les gens se sentent à leur place.

Au lieu de demander aux femmes d'agir comme des hommes pour s'intégrer dans un système construit pour les hommes, peut-être devrions-nous changer le système pour renforcer les éléments qui nous manquent, c'est-à-dire les éléments que les femmes apportent à la table : la façon dont elles naviguent dans le monde, comment elles perçoivent les choses, comment elles accompagnent les étudiants. Nous bénéficions énormément de la création d’un espace pour les femmes.

Vous avez fait du sport toute votre vie, y compris le basket-ball à l'université. Pensez-vous que cela a eu une influence sur votre carrière aujourd’hui ? 

Les choses les plus importantes que l’on apprend dans le sport sont comment se dépasser pour s’améliorer chaque jour, comment se remettre d’un échec et comment compter sur ses coéquipiers. Quand j'étais plus jeune, ces expériences m'ont appris à venir travailler après qu'une expérience n'ait pas fonctionné et à demander de l'aide lorsque j'en avais besoin.

Durant mon entraînement, j’étais l’athlète qui jouait à un jeu. Cependant, lorsque je suis devenu professeur, je suis tout d’un coup devenu entraîneur. Mon travail est différent maintenant. Il se concentre sur la façon dont je peux amener mon équipe à s’améliorer. Je dois identifier les points forts de chacun et les mettre en mesure de réussir. Je suis également là pour les aider à combler les lacunes avec d’excellents coéquipiers qui sont bons dans des domaines pour lesquels ils ne sont peut-être pas bons. Le sport m'a donné les compétences nécessaires pour me concentrer sur le travail acharné et la motivation, et m'a donné un cadre pour créer une équipe efficace et la motiver à donner le meilleur d'elle-même.

Votre père, John Calipari , est un entraîneur de basket-ball professionnel. Était-il un mentor pour vous ?

Il était un mentor extraordinaire, mais plus par les choses qu'il faisait que par les choses qu'il disait. Quand j'étais au collège, il a été viré. Le regarder se faire virer, puis revenir et dire : " Vous savez quoi, tout va bien ; Je vais me lever et recommencer " – c'était vraiment important pour moi de réaliser que même lorsque les choses semblent être d'énormes échecs, c'est parfois le début de quelque chose de nouveau.

Auteur: Internet

Info: Quanta Magazine, Yasemin Saplakoglu, 7 décembre 2023 *système simple, rapide et efficace pour couper l'ADN à un endroit précis du génome, dans n'importe quelle cellule.

[ accoutumance ] [ femmes-hommes ] [ éducation ] [ dépaysement ] [ ajustement ]

 

Commentaires: 0

Ajouté à la BD par miguel

Intelligence artificielle

Les logiciels de chatbot commencent à être confrontés à des limites fondamentales

Des résultats récents montrent que les grands modèles de langage ont du mal à effectuer des tâches de composition, ce qui suggère une limite stricte à leurs capacités.

Le 17 décembre 1962, Life International a publié une énigme logique composée de 15 phrases décrivant cinq maisons sur une rue. Chaque phrase était un indice, comme " L'Anglais vit dans la maison rouge " ou " Le lait est bu dans la maison du milieu ". Chaque maison était d'une couleur différente, avec des habitants de nationalités différentes, possédant des animaux différents, et ainsi de suite. Le titre de l'article posait la question : " Qui possède le zèbre ? " Des problèmes comme celui-ci se sont révélés être une mesure des capacités — ou plutôt des limites — des modèles d'apprentissage automatique actuels.

Également connu sous le nom d'énigme ou de casse-tête d'Einstein (attribution probablement apocryphe), ce problème teste un certain type de raisonnement en plusieurs étapes. Nouha Dziri, chercheuse scientifique à l'Allen Institute for AI, et ses collègues ont récemment soumis des modèles de langage basés sur des transformers ( LLMs ), comme ChatGPT, à ce type de tâches — et les ont largement trouvés insuffisants. " Ils pourraient ne pas être capables de raisonner au-delà de ce qu'ils ont vu dans les données d'entraînement pour des tâches difficiles ", a déclaré Dziri. " Ou du moins, ils font une approximation, et cette approximation peut être erronée. "

L'énigme d'Einstein nécessite de composer une solution globale à partir de solutions à des sous-problèmes, ce que les chercheurs appellent une tâche compositionnelle. L'équipe de Dziri a montré que les LLMs, qui ont été entraînés uniquement à prédire le mot suivant dans une séquence — ce qui est le cas de la plupart d'entre eux — sont fondamentalement limités dans leur capacité à résoudre des tâches de raisonnement compositionnel. D'autres chercheurs ont montré que les transformers, l'architecture de réseau neuronal utilisée par la plupart des LLMs, ont des limites mathématiques strictes lorsqu'il s'agit de résoudre de tels problèmes. Les scientifiques ont obtenu quelques succès en repoussant ces limites, mais ces solutions semblent de plus en plus être des correctifs à court terme. Si c'est le cas, cela signifie qu'il existe des limites computationnelles fondamentales aux capacités de ces formes d'IAs — ce qui pourrait signifier qu'il est temps d'envisager d'autres approches.

" Ce travail est vraiment motivé par l'idée d'aider la communauté à décider si les transformers sont vraiment l'architecture que nous voulons adopter pour un apprentissage universel ", a déclaré Andrew Wilson, expert en apprentissage automatique à l'Université de New York, qui n'a pas participé à cette étude.

Le succès attire l'examen

Ironiquement, les LLMs ne doivent s'en prendre qu'à eux-mêmes pour cette découverte de l'une de leurs limites. " La raison pour laquelle nous nous sommes tous demandé s'ils faisaient un vrai raisonnement est due à leurs capacités impressionnantes ", a déclaré Dziri. Ils ont impressionné sur des tâches impliquant le langage naturel, malgré la simplicité apparente de leur entraînement. Pendant la phase d'entraînement, un LLM est exposé à un fragment de phrase avec le dernier mot masqué (bien que techniquement, ce ne soit pas toujours un seul mot). Le modèle prédit les informations manquantes, puis " apprend " de ses erreurs.

Les plus grands LLMs — OpenAI's o1 et GPT-4, Google's Gemini, Anthropic's Claude — s'entraînent sur presque toutes les données disponibles sur Internet. En conséquence, les LLMs finissent par apprendre la syntaxe et une grande partie des connaissances sémantiques du langage écrit. Ces modèles " pré-entraînés " peuvent être encore entraînés, ou affinés, pour accomplir des tâches sophistiquées bien au-delà de la simple complétion de phrases, comme résumer un document complexe ou générer du code pour jouer à un jeu vidéo. Les résultats étaient si puissants que les modèles semblaient, à certains moments, capables de raisonner. Pourtant, ils échouaient aussi de manière à la fois évidente et surprenante.

" Sur certaines tâches, ils performent incroyablement bien ", a déclaré Dziri. " Sur d'autres, ils sont étonnamment stupides. "

Prenons la multiplication de base. Les LLMs standards, comme ChatGPT et GPT-4, échouent lamentablement. Début 2023, lorsque l'équipe de Dziri a demandé à GPT-4 de multiplier deux nombres à trois chiffres, il n'a réussi que 59 % du temps. Lorsqu'il a multiplié deux nombres à quatre chiffres, la précision est tombée à seulement 4 %.

L'équipe a également testé les LLMs sur des tâches comme l'énigme d'Einstein, où ils ont également eu un succès limité. GPT-4 a toujours donné la bonne réponse lorsque le puzzle impliquait deux maisons avec deux attributs par maison. Mais la précision est tombée à 10 % lorsque la complexité du puzzle est passée à quatre maisons avec quatre attributs par maison. Pour la version originale de Life International — cinq maisons, chacune avec cinq attributs — le taux de réussite était de 0 %.

L'équipe de Dziri a pensé que peut-être les LLMs n'avaient tout simplement pas vu assez d'exemples dans leurs données d'entraînement, alors ils ont affiné GPT-3 sur 1,8 million d'exemples de multiplication de deux nombres. Ensuite, lorsqu'ils lui ont présenté de nouveaux problèmes, le LLM les a réussis — mais seulement s'ils étaient suffisamment similaires à ce qu'il avait vu pendant l'entraînement. Par exemple, les données d'entraînement incluaient la multiplication de deux nombres à trois chiffres, et d'un nombre à deux chiffres avec un nombre à quatre chiffres, mais lorsque le modèle a été interrogé sur la multiplication d'un nombre à quatre chiffres avec un nombre à trois chiffres, il n'a réussi que 2 % du temps. " S'ils raisonnent vraiment et comprennent certaines tâches, ils devraient saisir l'algorithme implicite ", a déclaré Dziri. Ce n'est pas ce que son équipe a observé. " Cela soulève beaucoup de questions sur la façon dont les LLMs accomplissent les tâches et s'ils font un vrai raisonnement. "

L'équipe a observé le même schéma pour résoudre l'énigme d'Einstein : GPT-3 a échoué lorsqu'on lui a demandé de résoudre des versions plus grandes du puzzle par rapport à celles sur lesquelles il avait été affiné. " Il imite quelque chose qu'il a vu, mais il n'en a pas une compréhension complète ", a déclaré Dziri.

Limites dures

Alors que Dziri et ses co-auteurs finalisaient leurs résultats, une autre équipe adoptait une approche différente pour comprendre pourquoi les LLMs avaient du mal avec les tâches compositionnelles. Binghui Peng, alors doctorant à l'Université de Columbia, travaillait avec l'un de ses directeurs de thèse, Christos Papadimitriou, et des collègues pour comprendre pourquoi les LLMs " hallucinent ", c'est-à-dire génèrent des informations factuellement incorrectes. Peng, maintenant chercheur postdoctoral à l'Université de Stanford, soupçonnait que c'était parce que les transformers semblaient manquer de la " capacité de composition ".

Pour comprendre pourquoi, imaginez que nous donnons à un LLM deux informations : Le père de Frédéric Chopin était Nicolas Chopin, et Nicolas Chopin est né le 15 avril 1771. Si nous lui demandons ensuite : " Quelle est la date de naissance du père de Frédéric Chopin ? ", le LLM devrait répondre en composant, ou en assemblant, les différents faits. En effet, il devrait répondre à la question imbriquée suivante : " Quelle est la date de naissance de (Qui est le père de (Frédéric Chopin) ? " Si le LLM prédit les mauvais mots comme réponse, on dit qu'il a halluciné — dans ce cas, peut-être à cause de son échec à résoudre la tâche compositionnelle.

Peng voulait tester cette intuition. Son équipe a commencé par étudier les propriétés d'un transformer simple, avec une seule couche, qui apprend à " prêter attention " à l'ordre et à la position des mots d'une phrase lorsqu'il essaie de prédire le mot suivant. (Les LLMs modernes ont des dizaines de telles couches.) L'équipe a établi un lien entre la complexité de la couche de transformer et la " taille du domaine ", c'est-à-dire le nombre de bits nécessaires pour représenter les questions. En se concentrant sur ce modèle simple, ils ont prouvé une limite mathématique. " Si le nombre total de paramètres dans ce transformer à une couche est inférieur à la taille d'un domaine, alors les transformers ne peuvent pas résoudre la tâche compositionnelle ", a déclaré Peng. En d'autres termes, un LLM avec une seule couche de transformer était clairement et mathématiquement limité.

Bien que ce soit un résultat théorique fort, ses implications pratiques n'étaient pas claires, car les LLMs modernes sont bien plus complexes. " Il n'est pas facile d'étendre notre preuve ", a déclaré Peng. Son équipe a donc utilisé une approche différente pour étudier les capacités des transformers plus complexes : ils se sont tournés vers la théorie de la complexité computationnelle, qui étudie les problèmes en termes de ressources, comme le temps et la mémoire, nécessaires pour les résoudre.

Pousser les limites

Pour être clair, ce n'est pas la fin des LLMs. Wilson de NYU souligne que malgré ces limites, les chercheurs commencent à améliorer les transformers pour les aider à mieux gérer, entre autres, l'arithmétique. Par exemple, Tom Goldstein, informaticien à l'Université du Maryland, et ses collègues ont ajouté une astuce à la façon dont ils présentaient les nombres à un transformer entraîné à additionner, en intégrant des informations " positionnelles " supplémentaires dans chaque chiffre. En conséquence, le modèle pouvait être entraîné sur des nombres à 20 chiffres et additionner de manière fiable (avec 98 % de précision) des nombres à 100 chiffres, alors qu'un modèle entraîné sans cette astuce n'était précis qu'à environ 3 %. " Cela suggère qu'il y a peut-être des interventions basiques que l'on pourrait faire ", a déclaré Wilson. " Cela pourrait vraiment faire progresser ces problèmes sans avoir à repenser toute l'architecture. "

Une autre façon de surmonter les limites d'un LLM, au-delà de simplement augmenter la taille du modèle, est de fournir une solution étape par étape d'un problème dans l'invite, une technique connue sous le nom de chain-of-thought prompting. Des études empiriques ont montré que cette approche peut donner à un LLM comme GPT-4 une nouvelle capacité à résoudre des tâches plus variées. Il n'est pas tout à fait clair pourquoi, ce qui a poussé de nombreux chercheurs à étudier ce phénomène. " Nous étions curieux de savoir pourquoi c'est si puissant et pourquoi on peut faire tant de choses ", a déclaré Haotian Ye, doctorant à l'Université de Stanford.

Lorsque Ye était encore étudiant à l'Université de Pékin, lui et ses collègues ont modélisé le comportement des transformers avec et sans chain-of-thought prompting. Leur preuve, utilisant une autre branche de l'informatique appelée théorie de la complexité des circuits, a établi comment le chain-of-thought prompting transforme essentiellement un grand problème en une séquence de problèmes plus petits, permettant aux transformers de s'attaquer à des tâches compositionnelles plus complexes. " Cela signifie... qu'il peut résoudre certains problèmes qui se trouvent dans une classe computationnelle plus large ou plus difficile ", a déclaré Ye.

Mais Ye met en garde : leur résultat n'implique pas que les modèles du monde réel résoudront réellement de tels problèmes difficiles, même avec le chain-of-thought. Le travail s'est concentré sur ce qu'un modèle est théoriquement capable de faire ; les spécificités de la façon dont les modèles sont entraînés dictent comment ils peuvent atteindre cette limite supérieure.

En fin de compte, aussi impressionnants que soient ces résultats, ils ne contredisent pas les conclusions des équipes de Dziri et Peng. Les LLMs correspondent fondamentalement aux modèles qu'ils ont vus, et leurs capacités sont limitées par des frontières mathématiques. Les astuces d'incorporation et le chain-of-thought prompting étendent simplement leur capacité à faire des correspondances de modèles plus sophistiquées. Les résultats mathématiques impliquent que vous pouvez toujours trouver des tâches compositionnelles dont la complexité dépasse les capacités d'un système donné. Même certains modèles plus récents, comme les " modèles à espace d'états ", qui ont été présentés comme des alternatives plus puissantes aux transformers, montrent des limites similaires.

D'un côté, ces résultats ne changent rien pour la plupart des gens qui utilisent ces outils. " Le grand public ne se soucie pas de savoir s'ils raisonnent ou non ", a déclaré Dziri. Mais pour les personnes qui construisent ces modèles et essaient de comprendre leurs capacités, cela compte. " Nous devons vraiment comprendre ce qui se passe sous le capot ", a-t-elle déclaré. " Si nous comprenons comment ils accomplissent une tâche et comment ils raisonnent, nous pouvons probablement les améliorer. Mais si nous ne savons pas, c'est là que c'est vraiment difficile de faire quoi que ce soit. "




Auteur: Internet

Info: https://www.quantamagazine.org/chatbot-software-begins-to-face-fundamental-limitations-20250131/, Anil Ananthaswamy, 31 janv 2025

[ larges modèles de langage ] [ frontières cognitives ] [ limites architecturales ] [ données massives ]

 

Commentaires: 0

Ajouté à la BD par miguel

spiritualité

D' Héliopolis le culte osirien s'implante à Busiris à la place de l'ancien roi divinisé Andjyty, l'homme aux deux cornes de bélier et aux deux plumes sur la tête avec dans les mains le sceptre Héka (symbole magique) et le flagellum (insigne de royauté que reçoit le prince héritier lors de son intronisation). Busiris était à l'époque prédynastique la capitale du delta, mais elle perdit le titre durant l'Ancien-Empire au profit de Bouto (ville située entre Alexandrie et Saïs). Busiris que Strabon nomme en grec Cynopolis, resta célèbre pour son grand temple dédié à la déesse... Isis. Cela n'a pas empêché l'extension du culte d'Osiris qui est devenu dans la mémoire populaire " l'être perpétuellement bon " aimé de tout son peuple pour lequel il a dû se sacrifier, afin de lui montrer le chemin qui mène à la vie éternelle. Plus de 2500 ans avant la naissance de Jésus, Osiris était comme lui un roi né d'une fécondation spirituelle, comme lui il est la lumière qui éclaire et chasse les ténèbres. Tué par ses frères de religion il renaîtra et montera au ciel pour juger les âmes selon leurs mérites personnels...
Isis : la reine-mère aux pouvoirs temporels et spirituels. Etrange reine aux origines mystiques qui porte à deux lettres près, le nom de son époux Osiris assassiné par Seth. Comme la grande déesse-mère de l'Antiquité, Isis sera souvent honorée et son aide sollicitée en tant guérisseuse et mère protectrice. Selon la légende, elle va retrouver avec l'aide d'Anubis (patron des embaumeurs) et de sa soeur Nephthys les morceaux de son époux disséminés dans tous les nomes d'Egypte. Connaissant le mystérieux secret de Rê d'où il tire sa toute puissance, elle l'utilise pour ressusciter durant quelques instants son époux, le temps d'être fécondée spirituellement par lui. Sous le Nouvel Empire Isis est aimée et adorée de tous comme étant la "Mère universelle" et particulièrement la déesse de ceux qui souffrent. Elle console les pauvres et ceux qui vont bientôt mourir. Elle a le pouvoir de faire ressusciter les morts, depuis son interposition pour la résurrection de l'esprit d'Osiris. Comme Marie au Golgotha dans la religion chrétienne qui devient par ses souffrances au travers du disciple Jean " la Mère de toute l'humanité ", Isis souffre et devient avec son fils Horus, la grande mère victorieuse qui refoule les forces des ténèbres et remporte par le combat de ses souffrances une victoire décisive sur le mal.
Le mythe de l'Inondation bienfaisante : En Egypte depuis l'époque préhistorique l'inondation était un phénomène naturel qui arrivait chaque année vers la mi-Juillet, cette date correspondait également au nouvel an égyptien. Cette inondation fluctuait d'une année à l'autre en fonction des pluies tombées sur les hauts plateaux de Nubie que charriaient le Nil et ses affluents. Elle pouvait tout aussi bien être insignifiante, par un très bas niveau, ce qui correspondait à une "année de sécheresse" ou imprégner généreusement durant trois mois toutes les terres desséchées par la chaleur solaire et assurer aux habitants une bonne germination des graines et assurer de bonnes récoltes. On comprend pourquoi les éléments naturels comme la pluie, le soleil, l'inondation ou la sécheresse ont eu une importance vitale pour les premières peuplades.
D'abord symbolisé dans l'ennéade d'Héliopolis par les deux lions Shou et Tefnout adorés à Léontopolis. Tefnout la fille de Rê et déesse fugueuse avait quitté son père et son époux Shou pour vivre en liberté dans les montagnes de Nubie où elle terrorisait les habitants. Rê qui s'ennuyait de sa fille envoya Shou avec le dieu Thot de la sagesse sous la forme d'un singe qui utilisa sa sagesse et son Verbe pour réussir à convaincre Tefnout, la déesse lointaine à revenir sous la forme d'une inondation bienfaisante qui s'adoucit dès le passage de la première cataracte de Philae. A partir de la IIIe dynastie l'inondation est liée au rassemblement des morceaux d'Osiris éparpillés dans les divers nomes qui vont assurer la revitalisation des terres. Certains prêtres voyaient également dans l'inondation : les larmes mystiques d'Isis pleurant son époux disparu, etc, etc.
L'eau de vie selon un extrait des " anciens Textes des Pyramides " : Selon la légende Rê naissait sous la forme d'un scarabée noir qui sous cette forme traversait la nuit. Il faut dire qu'en ce temps-là existait encore des scarabées volants aujourd'hui disparus ! Au matin le scarabée se métamorphosait en enfant appelé Khepri = la vie qui vient. Jusqu'à midi l'enfant grandissait pour prendre la forme d'un homme avec une tête de faucon appelé Rê-Horatky (la puissance du roi Horus à son zénith). Le soir, lorsque l'astre disparaissait derrière les monts de l'Occident, Rê était englobé par Atoum l'esprit invisible et devenait Atoum-Rê sous l'aspect d'un vieillard qui s'en allait sur sa barque, disparaissait dans le fleuve avant de renaître au petit matin sur l'autre rive du Nil.
A la 2è dynastie les pharaons se considérèrent comme les fils du soleil, à la 5è dynastie, ils se voyaient comme l'incarnation du soleil, le pharaon est en Rê et Rê est dans le Pharaon. Principale source de vie, le soleil centralise en lui les pouvoirs des rois et des principales divinités, ainsi on l'appellera souvent Atoum-Rê, Amon-Rê, Knouhm-Rê, Osiris-Rê et Horus-Rê... Ihet serait la vache primordiale ou mère génitrice du soleil qui après sa naissance l'aurait placé entre ses cornes pour le protéger. Quant à la déesse Tasenet-Neferet, elle fut considérée à l'époque tardive comme l'oeil de Rê et la soeur du soleil. A Kôm-Ombo, elle est unie à Horus l'Ancien et devient l'épouse d'Haroëris.
Les compagnes de Rê à Héliopolis : NEBETHETEPET : (assimilée à Hathor) avec la déesse IOUSSAS (la dame de la satisfaction), ces deux déesses auraient inspiré le démiurge d'Héliopolis ATOUM-Rê à créer le monde. SHESEMTET : (une des faces d'Hathor qui se manifeste dans l'Uraeus). MAAT : Fille d'ATOUM elle le principe de la lumière et la déesse de la vérité, représentant la JUSTICE divine. Elle est aussi le symbole du charme féminin. Les filles de Rê : PAKHET : la déesse lionne de Béni Hassan qui surveillait les frontières du désert.
BASTET : la déesse chatte de Bubastis qui est alors la déesse gardienne du foyer, ou sous son aspect lionne l'oeil de Rê. TEFNOUT : la lionne de Léontopolis, elle est la principale représentante des déesses dangereuses. HATHOR : sous son aspect de déesse dangereuse Hathor unie aux forces de Mâat repoussaient les attaques des forces du chaos. P T A H : le dieu au crâne rasé et gainé comme une momie.
Si à Héliopolis le dieu Atoum-Rê s'imposa à la tête de l'ennéade divine, à Memphis on vénéra durant les deux premières dynasties le dieu Sokar sous l'aspect d'une momie à tête de faucon qui traversait le Nil ( fleuve sacré) dans sa barque Hénou, afin de faire revivre le soleil sur l'autre rive. C'est probablement sa silhouette gravée sur la massue du Roi Narmer, qui se trouve assise en face du trône royal, ce qui laisse penser que dès la première dynastie officielle, les précurseurs d'Imhotep ont déjà essayé d'introduire cette idée de résurrection à la cour royale tout en essayant de conserver l'image d'Horus l'Ancien en la personne du grand Monarque.
C'est sous la troisième dynastie que s'installera parallèlement Ptah une nouvelle divinité à Memphis qui possède également un aspect de roi momifié, tandis que le clergé confiera au dieu Sokar la garde de la "cité des morts à Saqqarah.endroit nommé Roséatou"
Le dieu Ptah est en quelque sorte une image évoluée de l'Ancien Horus-Sokar qui tout en gardant son aspect de momie royale, serre dans ses mains la croix Ankh égyptienne et le signe Djed symbolisant la colonne dorsale d'Osiris (siège du fluide vital,) sans oublier le sceptre Ouas du pouvoir divin. Sous le nom de Ptah-Tenen ce dieu devient celui qui développe la vie terrestre. Parfois en Haute Egypte on le représente sous l'aspect d'un lion qui en s'unissant avec la déesse lionne Sekhmet engendre le dieu guerrier Néfertoum: symbole de la renaissance perpétuelle du soleil.
Sokar, Ptah et Osiris vont eux-mêmes rapidement se confondre en une seule personne, fusion qui s'accomplira totalement lors de la 3è période intermédiaire (-1085 à -730 av. J.C.)
C'est donc 400 ans avant l'arrivée d'Imhotep, que l'on constate l'introduction de ce dieu des morts à forme humaine qui représente déjà une conception de la vie après la mort.
Contrairement à d'autres religions Imhotep ne va pas bannir toutes les anciennes divinités mais en leur laissant une importance secondaire il va s'en servir pour les transformer et faire passer dans le peuple les idées majeures fondamentales : la conscience, la Justice et la vérité.
Ptah devient le Créateur par le verbe et le Père des dieux
Sokar avec sa barque Henou devient le conducteur des âmes
Osiris devient le dieu qui a le pouvoir de faire renaître les bons.
Il ne suffisait pas d'ordonner la construction des pyramides, il fallait surtout motiver le peuple pour qu'il s'engage et achève de plein gré et avec amour, cet énorme travail.
Parfois l'esprit populaire identifiait Ptah à l'ancien taureau Apis, son culte s'est étendu au Nouvel Empire jusqu'à Deir el Médineh où il fut associé à la déesse (mi-femme, mi serpent) Meresger dans un temple proche de la Vallée où l'on enterrait les reines.
La déesse Hathor (demeure nourricière d'Horus le Jeune). Hathor a revêtu au cours des siècles (comme la déesse hindoue Devi) de multiples aspects allant de la mère protectrice archaïque (femme avec cornes de vache) à la jeune femme séduisante universelle. Sous sa forme ancienne elle devient une copie de Nout la déesse du ciel dont le corps rempli d'étoiles est arc-bouté au-dessus de la planète Terre. Fille de Rê, elle porte entre ses cornes de vache blanche étoilée le soleil, comme pour le protéger. Sous son aspect dangereux elle défend la réputation de son père Rê contre les humains qui l'accusent d'être trop vieux. Rê lui donne son troisième oeil et l'envoie punir les humains, mais elle causa de tels ravages que même Rê s'effraya et lui fit boire de la bière à son insu pour sauver le reste de l'humanité. Sous son côté féminin séducteur elle est non seulement la déesse de l'amour au feu dévorant mais également la déesse de la joie et de la vie. Des surnoms qui laissent rêveur. Elle devient la Dame du Sycomore du Sud, la déesse du Sinaï (!) ou la grande dame du pays de Pount, Hathor dont le nom signifie " la demeure nourricière d'Horus " Elle reste étroitement associée à Isis, certaines ressemblances laissent à penser qu'elle fut également introduite en Egypte par Imhotep. Associée au mythe de l'inondation, elle participe chaque année à la fête annuelle de la "Belle Rencontre " au temple de Dendérah (Haute Egypte). Durant cette fête la déesse s'unissait au dieu Horus d'Edfou. De cette union naissait le petit dieu Ithy patron de la musique et des musiciens. Au Moyen-Empire la déesse sera honorée aux temples de Dendérah et de Thèbes en tant que déesse de la Montagne des Morts et dans cette fonction rejoindra la grande déesse Isis. Or Dendérah est considéré comme un des temples les plus anciens qui aurait déjà été reconstruit six fois avant la période romaine !
Atoum : Grand Dieu Invisible d'Héliopolis (où officiait le Grand-Prêtre Imhotep) Son nom signifie " Celui qui est et qui n'est pas... Le Seigneur de l'univers - Le Tout et le néant" Atoum devint en quelque sorte la force invisible qui régénère le soleil vieillissant et le père de la nouvelle lumière qui traverse l'empire des morts et doit accéder à une nouvelle vie le lendemain. Il est aussi le père qui a engendré la déesse Mâat incarnation de la vérité et de la justice qui est également une des épouses de Rê. Son culte restera très important aussi longtemps que Memphis sera la capitale de l'Egypte, mais lorsque Thèbes remplacera Memphis, Atoum s'éclipsera peu à peu au profit d'Amon, qui n'est en somme qu'une copie spirituelle du dieu-berger Atoum qui prolonge l'image du Dieu Suprême, Omniprésent, Tout-puissant et Invisible à partir d'une nouvelle capitale religieuse (Thèbes au lieu de Memphis). Dès le début de l'Ancien Empire il est le dieu des morts qui participait au jugement des âmes. Associé à Osiris, il restera longtemps le dieu de l'embaumement, rite qu'il a pratiqué la première fois sur la personne d'Osiris, reconstitué et ressuscité par son épouse Isis. Désormais il offre ses services à tous les défunts qu'il guide par les Textes des Pyramides jusqu'aux régions célestes. On le représentait sous la forme d'un homme avec une tête de chacal. (Puis il y aura la parenthèse Akhenaton qui aurait vu l'exode des juifs vers la terre promise)

Auteur: Internet

Info:

[ ancienne Egypte ] [ mythe ] [ légende ] [ historique ]

 

Commentaires: 0

théorie-pratique

Le débat pourrait aider les modèles d’IA à converger vers la vérité

Laisser les systèmes d’IA discuter entre eux peut aider à révéler quand un grand modèle linguistique a commis des erreurs.

En février 2023, Bard, le chatbot d'intelligence artificielle de Google, a affirmé que le télescope spatial James Webb avait capturé la première image d'une planète en dehors de notre système solaire. Ce n'était pas le cas. Lorsque des chercheurs de l'université Purdue ont posé plus de 500 questions de programmation à ChatGPT d'OpenAI, plus de la moitié des réponses étaient inexactes.

Ces erreurs étaient faciles à repérer, mais les experts craignent qu’à mesure que les modèles deviennent plus grands et répondent à des questions plus complexes, leur expertise finira par dépasser celle de la plupart des utilisateurs humains. Si de tels systèmes " surhumains " voient le jour, comment pourrons-nous leur faire confiance ? " Les problèmes que vous essayez de résoudre dépassent vos capacités pratiques ", a déclaré Julian Michael, informaticien au Centre de science des données de l'Université de New York. " Comment superviser un système pour qu'il accomplisse avec succès une tâche que vous ne pouvez pas réaliser ? "

Une possibilité est aussi simple qu'extravagante : laisser deux grands modèles débattre de la réponse à une question donnée, avec un modèle plus simple (ou un humain) chargé de reconnaître la réponse la plus précise. En théorie, le processus permet aux deux agents de mettre en évidence les failles dans les arguments de l'autre jusqu'à ce que le juge dispose de suffisamment d'informations pour discerner la vérité. L'approche a été proposée pour la première fois il y a six ans, mais deux séries de conclusions ont été publiées plus tôt cette année, l'une en février de la startup d'IA Anthropic et le deuxième en juillet de Google DeepMind — offrent la première preuve empirique que le débat entre deux LLM aide un juge (humain ou machine) à reconnaître la vérité.

" Ces travaux ont été très importants dans ce qu'ils ont apporté ", a déclaré Michael. Ils offrent également de nouvelles pistes à explorer. Pour ne citer qu'un exemple, Michael et son groupe ont rapporté en septembre que le fait d'entraîner les participants IAs qui débattent à gagner - et pas seulement à converser, comme dans les deux études précédentes - augmentait encore la capacité des juges non-experts à reconnaître la vérité.

L'argument

La création de systèmes d’IA fiables s’inscrit dans un objectif plus vaste appelé alignement, qui vise à garantir qu’un système d’IA partage les mêmes valeurs et objectifs que ses utilisateurs humains. Aujourd’hui, l’alignement repose sur le retour d’information humain, c’est-à-dire sur l’évaluation de l’IA par des personnes. Mais ce retour d’information pourrait bientôt être insuffisant pour garantir l’exactitude d’un système. Ces dernières années, les chercheurs ont de plus en plus appelé à de nouvelles approches en matière de " surveillance évolutive ", qui constituent un moyen de garantir la véracité même lorsque des systèmes surhumains effectuent des tâches que les humains ne peuvent pas effectuer.

Les informaticiens réfléchissent depuis des années à la supervision évolutive. Le débat sur une approche possible a émergé en 2018, avant que les LLM ne deviennent aussi importants et omniprésents qu'ils le sont aujourd'hui. L'un de ses architectes était Geoffrey Irving, qui est aujourd’hui le scientifique en chef de l’Institut de sécurité de l’IA du Royaume-Uni. Il a rejoint OpenAI en 2017, deux ans avant que la société ne lance GPT-2, l’un des premiers LLM à avoir suscité un large intérêt, dans l’espoir de travailler à l’alignement des systèmes d’IA sur les objectifs humains. Leur objectif était la sécurité, a-t-il déclaré, " en essayant simplement de demander aux humains ce qu’ils veulent et [d’amener le modèle à] le faire ".

Son collègue Paul Christiano, aujourd’hui responsable de la sécurité à l’Institut américain de sécurité de l’IA, a abordé ce problème en cherchant des moyens de décomposer des questions complexes en questions plus petites et plus faciles auxquelles un modèle de langage pourrait répondre honnêtement. " Le débat est devenu une variante de ce schéma ", a déclaré Irving, où des arguments successifs ont effectivement divisé une question plus vaste en composants plus petits qui pouvaient être jugés comme exacts.

Irving et Christiano ont travaillé avec Dario Amodei (qui a fondé Anthropic avec sa sœur Daniela en 2021) sur l'utilisation du débat dans les systèmes de langage naturel. (Étant donné que c'était avant GPT-2, les modèles de langage étaient trop faibles pour tester le débat de manière empirique, ils se sont donc concentrés sur des arguments conceptuels et une expérience de jeu-jouet.) L'idée était simple : poser une question à deux copies similaires d'un modèle d'IA puissant et les laisser trouver la réponse pour convaincre un juge qu'ils ont raison. Irving a comparé cela au jeu en solo, qui a aidé les systèmes d'IA à améliorer leurs stratégies dans des jeux comme les échecs et le Go.

Le trio a conçu des jeux rudimentaires impliquant des images et des questions textuelles. Dans l’un des jeux, deux modèles d’IA avaient chacun accès à la même image représentant le chiffre 5. L’un des modèles affirmait que l’image était en fait le chiffre 5, l’autre qu’il s’agissait d’un 6. Les modèles concurrents se relayaient pour révéler plus de pixels au juge, ce qui constituait un modèle plus faible. Après six tours, le juge a deviné le chiffre avec précision dans 89 % des cas. Lorsqu’on lui montrait des pixels aléatoires, le juge n’a deviné correctement que dans 59 % des cas.

Cet exemple simple, décrit en octobre 2018, a suggéré que le débat pouvait conférer un avantage. Mais les auteurs ont noté plusieurs réserves. Les humains ont tendance à croire ce qu’ils veulent entendre, par exemple, et dans des situations réelles, cet instinct peut prendre le pas sur l’avantage du débat. En outre, certaines personnes sont probablement plus aptes à juger les débats que d’autres – peut-être en est-il de même pour les modèles linguistiques ?

Les auteurs ont également appelé à une meilleure compréhension de la façon dont les humains pensent. Dans un essai de 2019, Irving et Amanda Askell, aujourd'hui chez Anthropic, ont fait valoir que si les systèmes d'IA veulent s'aligner sur les valeurs humaines, nous devons mieux comprendre comment les humains agissent en fonction de nos valeurs. Selon eux, la recherche sur l'IA doit intégrer davantage de travaux sur la manière dont les humains prennent des décisions et parviennent à des conclusions sur la vérité et le mensonge. Les chercheurs ne seront pas en mesure de comprendre comment organiser un débat s'ils ne savent pas comment les gens jugent les arguments ou comment ils parviennent à la vérité.

Pouvoir de persuasion

Un petit sous-ensemble d'informaticiens et de linguistes ont rapidement commencé à rechercher les avantages du débat. Ils ont trouvé des exemples où cela n'a pas aidé.  Dans une étude de 2022 les chercheurs ont soumis des humains à un test difficile à choix multiples et ont demandé aux LLM de fournir des arguments pour différentes réponses. Mais les personnes qui ont entendu les arguments générés par l'IA n'ont pas obtenu de meilleurs résultats au test que celles qui n'ont pas interagi du tout avec les LLMs.

Même si les LLM n'ont pas aidé les humains, certains indices laissaient penser qu'ils pourraient aider les modèles linguistiques. Dans un article de 2023, les chercheurs ont rapporté que lorsque plusieurs copies d'un LLM étaient autorisées à débattre et à converger vers une réponse, plutôt que de convaincre un juge, elles se montraient plus précises, plus souvent. Les deux résultats de cette année sont parmi les premiers tests empiriques à montrer qu'un débat entre LLM peut fonctionner lorsqu'il est jugé par un autre modèle, moins informé.

Le groupe Anthropic a montré à deux modèles experts des extraits d'une histoire de science-fiction, puis leur a posé des questions de compréhension. Chaque modèle a proposé une réponse et, au cours de plusieurs tours, a défendu sa propre réponse et a argumenté contre l'autre. Un juge évaluait ensuite les arguments et décidait qui avait raison. Dans certains cas, le juge avait accès à des citations vérifiées du texte original ; dans d'autres pas.

Lorsque les LLM avaient été entraînés spécifiquement pour être persuasifs, les juges LLM non experts sont parvenus à la bonne réponse dans 76 % des cas. En revanche, lors des tests sans débat, les juges non humains n'ont répondu correctement que dans 54 % des cas, un résultat à peine meilleur qu'en tirant à pile ou face.

" Ils ont réussi à rendre les modèles suffisamment performants en matière de débat pour que l'on puisse commencer à voir des résultats ", a déclaré Michael. 

Deux mois plus tard, l’équipe de Google DeepMind a présenté une expérience similaire avec une variété de tâches et de contraintes, en laissant les modèles linguistiques choisir leur propre camp dans le débat, par exemple. Les tâches comprenaient des questions de compréhension de lecture à choix multiples, des questions sur des articles de Wikipédia et des questions de type oui/non sur des sujets de mathématiques et de sciences de niveau universitaire. Certaines questions impliquaient des images et du texte.

Dans toutes les tâches et configurations expérimentales, le débat a toujours conduit à une plus grande précision. C’était encourageant et pas totalement inattendu. " En principe, nous nous attendons à ce que le débat surpasse ces valeurs de référence dans la plupart des tâches ", a déclaré Zachary Kenton, qui a codirigé l’étude DeepMind. " C’est parce que le juge a l’occasion de voir les deux faces de l’argument dans un débat et devrait donc être mieux informé. "

Avec ces deux études, les chercheurs ont montré pour la première fois que le débat pouvait faire la différence en permettant à d’autres systèmes d’IA de juger de l’exactitude des déclarations d’un LLM. C’est une étape passionnante, mais il reste encore beaucoup de travail avant que nous puissions tirer parti de manière fiable de la confrontation de débatteurs numériques.

Ludifier le débat

La première question est de savoir dans quelle mesure les LLM sont sensibles aux spécificités de leurs contributions et à la structure de l’argumentation. Le comportement des LLM " est sensible à des caractéristiques sans importance telles que le fait de savoir quel débatteur a eu le dernier mot ", a déclaré Kenton. " Ce qui peut conduire à ce que les débats ne dépassent pas ces bases de référence simples sur certaines tâches. "

Ce n’est qu’un début. Le groupe Anthropic a trouvé des preuves montrant que les juges d’IA peuvent être influencés par un argument plus long, même s’il est moins convaincant. D’autres tests ont montré que les modèles peuvent montrer ce qu’on appelle un biais de flagornerie – la tendance d’un LLM à revenir sur une réponse correcte pour faire plaisir à l’utilisateur.  Beaucoup de gens ont cette expérience avec des modèles où il dit quelque chose, et si vous dites “Non, c’est faux”, il dira “Oh, je suis vraiment désolé”, a déclaré Michael. " Le modèle dit “Oh, vous avez raison. Deux plus deux font cinq.” 

Il faut également prendre en compte la situation dans son ensemble : les chercheurs de l'Oxford Internet Institute soulignent que même si les nouveaux articles apportent des preuves empiriques selon lesquelles les LLM peuvent s'orienter mutuellement vers l'exactitude, les résultats ne sont peut-être pas applicables à grande échelle. Sandra Wachter, qui étudie l'éthique et le droit, souligne que les tests comportaient des réponses clairement bonnes ou mauvaises. " C'est peut-être vrai pour un domaine comme les mathématiques, où il existe une vérité de base acceptée, mais dans d'autres cas, " c'est très compliqué, ou c'est très gris, ou vous avez besoin de beaucoup de nuances ". En fin de compte, ces modèles ne sont pas encore totalement compris, ce qui rend difficile de leur faire confiance en tant que juges potentiels.

Enfin, Irving souligne que les chercheurs qui travaillent sur le débat devront répondre à des questions plus vastes. Le débat exige que les débatteurs soient meilleurs que le juge, mais " meilleurs " dépendra de la tâche. " Quelle est la notion-dimension à propos de laquelle les débatteurs en savent le plus? ", a-t-il demandé. Dans ces tests, il s'agit de connaissances. Dans les tâches qui nécessitent du raisonnement ou, par exemple, comment câbler une maison électriquement, cette dimension peut être différente.

Selon Irving, trouver des solutions de surveillance évolutives est un défi critique et ouvert en matière de sécurité de l’IA à l’heure actuelle.

Il est donc encourageant de disposer de preuves empiriques de l’efficacité d’une méthode, même dans certaines situations seulement. " Ce sont des pas dans la bonne direction ", a déclaré Irving. " Il se pourrait que nous poursuivions ces expériences et obtenions des résultats positifs, qui s’amélioreront avec le temps. "


 

 

Auteur: Internet

Info: https://www.quantamagazine.org/, Stephen Ornes, 8 novembre 2024

[ dualité ] [ IAs perroquets ] [ théorie-pratique ] [ limitation booléenne ]

 

Commentaires: 0

Ajouté à la BD par miguel