Citation
Catégorie
Tag – étiquette
Auteur
Info
Rechercher par n'importe quelle lettre



nb max de mots
nb min de mots
trier par
Dictionnaire analogique intriqué pour extraits... Recherche mots ou phrases tous azimuts... Outil de précision sémantique et de réflexion communautaire... Voir aussi la rubrique mode d'emploi. Jetez un oeil à la colonne "chaînes". ATTENTION, faire une REINITIALISATION après  une recherche complexe. Et utilisez le nuage de corrélats ... Lire la suite >>
Résultat(s): 5375
Temps de recherche: 0.0478s

Intelligence artificielle

Ce médecin s'efforce de créer une IA scientifiquement informée.

En formant des modèles d'apprentissage automatique avec des exemples de sciences fondamentales, Miles Cranmer espère accélérer le rythme des découvertes scientifiques.

La physique a ébloui Miles Cranmer dès son plus jeune âge, il recevait des livres sur le sujet de la part de son grand-père, professeur de physique à l'université de Toronto, et ses parents l'emmenaient à des journées portes ouvertes dans des universités proches de chez eux, dans le sud de l'Ontario, au Canada. L'Institut Perimeter de physique théorique était l'un de ses préférés. "Je me souviens que quelqu'un parlait de l'infini quand j'étais très jeune, et c'était tellement cool pour moi", a déclaré Cranmer. Au lycée, il a fait un stage à l'Institut d'informatique quantique de l'université de Waterloo, " le meilleur été de ma vie à ce moment-là ". Il a rapidement commencé à étudier la physique en tant qu'étudiant de premier cycle à l'université McGill.

Puis, un soir, au cours de sa deuxième année, Cranmer, alors âgé de 19 ans, a lu une interview de Lee Smolin dans Scientific American. qui disait qu'il faudrait " des générations " pour réconcilier la théorie quantique et la relativité. « Cela a déclenché quelque chose dans mon cerveau », a déclaré Cranmer. " Je ne peux pas accepter cela, il faut que ça aille plus vite. " Et pour lui, le seul moyen d'accélérer la chronologie des progrès scientifiques était d'utiliser l'intelligence numérique artificielle. " Cette nuit-là, j'ai décidé : "Nous devons faire de l'IA pour la science." Il a commencé à étudier l'apprentissage automatique , qu'il a finalement fusionné avec ses recherches doctorales en astrophysique à l'université de Princeton.

Près d'une décennie plus tard, Cranmer (aujourd'hui à l'Université de Cambridge) a vu l'IA commencer à transformer la science, mais pas autant qu'il l'imaginait. Des systèmes à usage unique comme AlphaFold peuvent générer des prédictions. scientifiques avec une précision révolutionnaire, mais les chercheurs manquent toujours de " modèles de base " conçus pour la découverte scientifique générale. Ces modèles fonctionneraient davantage comme une version scientifiquement précise de ChatGPT, générant de manière flexible des simulations et des prédictions dans plusieurs domaines de recherche. En 2023, Cranmer et plus de deux douzaines d'autres scientifiques ont lancé l'initiative IA polymathique visant à commencer à développer ces modèles de fondation.

La première étape consiste à doter le modèle des compétences scientifiques qui échappent encore à la plupart des systèmes d'IA de pointe. "Certaines personnes voulaient créer un modèle de langage pour l'astrophysique, mais j'étais vraiment sceptique à ce sujet", se souvient Cranmer. "Si on simule des systèmes fluides massifs, en étant mauvais en traitement numérique généralisé" - comme le sont sans doute les grands modèles de langage - "ce n'est pas satisfaisant". s'entraînent.

 Pourtant, Cranmer estime que ces obstacles sont surmontables. " Je suis loin d'être aussi intelligent qu'Einstein ou d'autres grands scientifiques ", at-il déclaré. " Donc, si je réfléchis à ce que je peux faire pour accélérer le rythme de la recherche, c'est vraiment en faisant progresser l'apprentissage automatique. C'est ce que je peux apporter. "

Quanta a discuté avec Cranmer de la possibilité de doter l'IA d'une mémoire scientifique, d'extraire des informations à partir de réseaux neuronaux et de ce que les scientifiques et les programmeurs pourraient bientôt avoir en commun. Cet entretien a été condensé et édité pour plus de clarté.

- Les chercheurs en IA ont remporté deux prix Nobel l'année dernière. N'avons-nous pas déjà une "IA pour la science" ? Que manque-t-il ?

Le plus grand défi, si l'on fait abstraction de tout, c'est que l'apprentissage automatique est mauvais pour la prédiction " hors distribution ". Cela signifie que si vous avez un nouveau point de données qui ne ressemble à rien de ce que vous avez vu auparavant, un modèle d'apprentissage automatique aura tendance à mal fonctionner. C'est la principale faiblesse de l'apprentissage automatique, par rapport à la science traditionnelle.

Pensez à la relativité générale d'Einstein. Les médecins n'avaient aucune idée de l'existence d'un trou noir en 1915. Les mathématiques produisent simplement cette prédiction de manière logique. Et nous pouvons voir des preuves qui la confirment plus d'un siècle plus tard. C'est quelque chose que l'apprentissage automatique ne pourrait pas faire – ce genre d'extrapolation est tout simplement hors de question.

J'ai toujours été très intéressé par l'amélioration de cette partie de l'apprentissage automatique, car je pense que c'est la pièce manquante.

- Mais les réseaux neuronaux ne sont eux aussi que des équations. Comment se fait-il que les mathématiques d'Einstein nous donnent des modèles de l'univers, alors que celles de l'IA ne le peuvent pas ?

Je dirais que ce deuxième type de mathématiques, l'apprentissage automatique, n'a pas de mémoire, alors que le premier type en a. Dans les sciences physiques, si vous proposez une nouvelle théorie, toutes les observations précédentes doivent toujours être satisfaites par le nouveau cadre. Nous devons obéir aux mêmes règles que celles que nous avons découvertes auparavant. Alors que dans l'apprentissage automatique, vous repartez de zéro à chaque fois que vous entraînez un modèle.



Comment intégrer la mémoire, dans ce sens abstrait d'"accumulation de connaissances", dans l'apprentissage automatique ? L'une des méthodes consiste à utiliser des règles symboliques, qui nous permettent d'imposer les modèles qui apparaissent dans les cadres physiques. Par exemple, je sais que si j'entre dans une autre pièce, le physique ne change pas. Un modèle d’apprentissage automatique ne sait pas.

- Comment faire pour qu'un réseau neuronal joue selon ces règles ?

- J'ai passé les quatre dernières années à travailler sur un logiciel appelé PySR. Il s'agit d'une bibliothèque de régression symbolique qui apprend des équations correspondantes à un ensemble de données. Plutôt que de cacher une prédiction dans un réseau neuronal, cela permet de traduire le comportement du réseau neuronal en une équation symbolique dans un langage plus familier aux scientifiques. Forcer le modèle d'apprentissage automatique à utiliser des mathématiques symboliques est essentiellement un moyen de lui donner un biais en faveur des idées existantes à partir desquelles nous avons construit le physique.

Ca présente de nombreux avantages. Les équations obtenues sont très interprétables et ont tendance à se généraliser pour vous donner de bonnes prédictions hors distribution. L'inconvénient est que ces algorithmes sont très coûteux en termes de calcul. Si vous disposez de ressources infinies, ce serait parfait.

- Et les " modèles fondamentaux " scientifiques sur lesquels vous travaillez contournent-ils ce problème ?

- Avec la régression symbolique, on donne à un réseau neuronal les symboles que les scientifiques utilisent, comme une bibliothèque de concepts avec laquelle il peut construire des choses. Une autre façon de procéder est beaucoup plus axée sur les données : fournir une bibliothèque d'exemples. Notre approche dans Polymathic AI consiste à prendre un modèle et à l'entraînement sur toutes les données scientifiques qu'on peut obtenir. Vous partez toujours de zéro, mais vous lui avez donné tellement de données que vous ancrez en quelque sorte ses prédictions.

Je pense que c'est la raison pour laquelle les modèles de langage comme ChatGPT semblent efficaces dans les scénarios hors distribution : ils ont en quelque sorte transformé tout en un problème de prédiction dans la distribution, car ils ont été pré-entraînés sur de nombreux éléments différents. Lorsque ChatGPT est sorti, nous étions tous très enthousiastes à l'idée de réfléchir à la manière dont ce type d'outil pourrait être utilisé dans le domaine scientifique. Et au fil de nos discussions, cette idée s'est cristallisée : pré-entraîner un modèle non pas sur le langage, mais sur des ensembles de données numériques scientifiques.

C'était le défi le plus difficile pour nous. Obtenir des données scientifiques de haute qualité, comme des spectres d'étoiles, n'est pas aussi simple que de simplement lancer des robots sur Internet pour extraire des sites Web de données d'entraînement, comme le font les entreprises d'IA. Heureusement, en astronomie, une grande partie des données est accessible au public. Il suffit de les mettre dans un format uniforme. Nous avons publié deux ensembles de données : le Wellpour les simulations de physique numérique et l'univers multimodal pour les observations astronomiques. Ces ensembles de données offrent une quantité massive de données scientifiques comme base pour construire ces modèles fondamentaux.

- Vont-ils " halluciner " – inventer en toute confiance de fausses réponses – comme le font d'autres modèles d'IA ?

La raison principale de cette préformation est de se faire une idée de ce qui est physiquement raisonnable. Si le modèle se retrouve dans une situation nouvelle qu'il n'a jamais vue auparavant, plutôt que de faire une prédiction insensée, il va faire quelque chose de physiquement raisonnable.

(image : Miles Cranmer est assis à un bureau et regarde un tableau noir avec des équations, il utilise des règles symboliques pour inculquer aux machines une meilleure compréhension des découvertes passées, les aidant à traiter de nouvelles données et à produire des résultats plus compréhensibles.)

Ca n'élimine pas le problème, mais on va vers une grande. Je pense que c'est là que la régression symbolique pourrait également intervenir : traduire des parties du modèle en expressions mathématiques analytiques permettant de fournir des garanties.

Que pensez-vous que les scientifiques puissent faire avec ce type de fondation ?

- L'apprentissage automatique est très efficace pour résoudre des problèmes impliquant des volumes de données considérables, mais il est moins efficace pour les problèmes comportant très peu d'exemples. C'est pourquoi je suis vraiment enthousiaste à l'idée d'utiliser ce genre de modèle de base, car il nous permet d'aborder des types de problèmes à faible volume de données. On peut entraîner le modèle sur des simulations, ce qui lui permet d'intégrer la majeure partie du physique. Mais il suffit ensuite d'ajouter quelques expériences pour affiner ses prédictions. Ce ne sera pas parfait, mais ce sera mieux qu'un modèle d'apprentissage automatique formé à partir de zéro. Ainsi, à partir de quelques points de données du monde réel, vous pouvez extraire plus de données scientifiques qu'auparavant. C'est l'idée.

- Cela pourrait-il aboutir à automatiser le travail des scientifiques ?

- Je pense vraiment que ce type d'outil permettra d'automatiser de nombreuses tâches. Mon objectif est de rendre tous les scientifiques capables de faire beaucoup, beaucoup plus. Cela pourrait changer la définition de ce qu'est un scientifique, mais je pense que cette définition a déjà changé au cours de l'histoire.

 C'est pareil avec les modèles de langage. Ils ne remplacent pas les programmeurs, ils modifient simplement la définition de ce qu'est la programmation, de la même manière qu'écrire en Python ne remplace pas quelqu'un qui écrit des compilateurs. Il s'agit simplement de niveaux d'abstraction différents.

En ce sens, je ne crains pas qu'une quelconque forme d'IA remplace les scientifiques. Elle nous permet simplement de faire plus avec le même laps de temps. C'est ce qui m'enthousiasme vraiment. Comprendre l'univers n'a pas vraiment de fin. Cela va continuer et nous allons continuer à en apprendre toujours plus.


 

 

Auteur: Internet

Info: Jean Pavlus, 28 février 2025

[ accélérationnisme ] [ concepts vectorisés ] [ termes univers ] [ réductionnisme sémantique ] [ mathématisation ] [ réduction linguistique ]

 

Commentaires: 0

Ajouté à la BD par miguel

infra-monde

Le physicien qui décode la nature non-binaire du monde subatomique

À l'intérieur du proton, les quarks et les gluons modifient et transforment leurs propriétés d'une manière que les physiciens peinent encore à comprendre. Rithya Kunnawalkam Elayavalli apporte au problème une perspective différente de celle de leurs pairs. De nombreuses découvertes en physique découlent de la théorie à l'expérience. Albert Einstein a théorisé que la masse courbe le tissu de l'espace-temps, puis Arthur Eddington a observé les effets de cette courbure lors d'une éclipse solaire. De même, Peter Higgs a d'abord proposé l'existence du boson de Higgs ; près de 50 ans plus tard, la particule a été découverte au Grand Collisionneur de Hadrons.

L'hadronisation est différente. C'est le processus par lequel les particules élémentaires appelées quarks et gluons s'assemblent pour former des protons et des neutrons - les composants des atomes. Aucune théorie actuelle ne peut décrire avec précision comment ou pourquoi l'hadronisation se produit.

"C'est vraiment l'opposé de la norme", déclare Rithya Kunnawalkam Elayavalli, physicien nucléaire de haute énergie à l'Université Vanderbilt à Nashville, Tennessee.

Kunnawalkam Elayavalli passe ses journées à observer l'hadronisation et à essayer de formuler une théorie qui l'explique. Ils font partie des expériences Sphenix et STAR au Collisionneur d'Ions Lourds Relativistes (RHIC) à New York, ainsi que membre de l'expérience CMS au CERN près de Genève. Leurs recherches étudient le comportement des quarks et des gluons après les collisions, pendant la fraction de milliseconde durant laquelle ces particules se déplacent librement avant de s'hadroniser à nouveau.

Ces expériences ont révélé des détails sur la structure des quarks et des gluons dans cet état intermédiaire, ainsi que sur le moment de l'hadronisation. Pourtant, Kunnawalkam Elayavalli trouve frustrant d'observer sans comprendre davantage.

Le domaine quantique défie les binaires - les gluons en particulier. Ces entités élémentaires peuvent avoir trois charges différentes dans de multiples configurations. Et elles doivent exister en ensembles qui équilibrent ces charges. Pour Kunnawalkam Elayavalli, c'est similaire à la multiplicité des genres qu'ils expérimentent en tant que personne non-binaire. Quanta Magazine s'est entretenu avec eux pour discuter des mystères de la physique nucléaire qui transcende le binaire, ainsi que de leur expérience en tant que personne transgenre - au Tennessee, qui plus est, où la législation anti-trans est parmi les plus régressives du pays - tout en faisant de la science naturelle.

L'interview a été condensée et éditée pour plus de clarté.

Que comprenons-nous des quarks et des gluons ?

Au moment du Big Bang, il devait y avoir une forme de matière qui existait, cette matière primordiale faite de quarks et de gluons avant qu'ils ne se convertissent en hadrons. La meilleure compréhension des quarks et des gluons que nous ayons vient de la théorie de la chromodynamique quantique, qui a été développée dans les années 1970. Nous l'appelons "chromo" parce que nous avons introduit ce nouveau concept appelé charge de couleur. Les quarks et les gluons peuvent avoir trois charges différentes, et les physiciens ont nommé ces trois choses rouge, bleu et vert. Vous pouvez aussi avoir des antiquarks, ce qui signifie que vous avez des anti-couleurs : anti-rouge, anti-bleu et anti-vert.

- Juste pour être clair, cela n'a rien à voir avec la couleur telle que nous la connaissons ?

Il n'y a pas de véritable connexion. Nous avions besoin de quelque chose qui venait par trois et qui, une fois additionné, devient une quantité nulle. La couleur était un terme raisonnable à utiliser. Avec la lumière, quand vous combinez rouge, bleu et vert ensemble, vous obtenez de la lumière blanche, qui est neutre. Et si vous combinez une couleur et son anti-couleur, vous obtenez aussi du blanc. De même, les quarks et les gluons portent par eux-mêmes des charges de couleur, et tous les hadrons sont des combinaisons neutres en couleur de ces quarks et gluons. Tout ce que nous voyons dans le monde est neutre en couleur.

Mais pour compliquer les choses, les gluons ont plusieurs charges de couleur ; une couleur va dans ce sens, l'autre couleur va dans l'autre sens. Les quarks ont trois charges de couleur. Les gluons ont deux charges de couleur.

- Comment savons-nous que cette description est correcte ?

Notre validation de la théorie de la chromodynamique quantique vient des comparaisons avec les données réelles des collisionneurs. Nous faisons entrer en collision un électron et un positron, qui est l'antiparticule de l'électron. Nous savons que lorsque la matière rencontre sa propre antimatière, elle explose. Cette explosion d'énergie se convertit en une paire quark et antiquark. La probabilité que ce processus se produise était bien décrite par la théorie de la chromodynamique quantique.

C'est ainsi que nous savons que cette théorie peut modéliser les quarks et les gluons. Ce qu'elle ne peut pas faire, c'est décrire les quarks et les gluons lorsqu'ils se regroupent en hadrons. À ce moment-là, la théorie s'effondre dans la région que nous appelons non perturbative - physique non calculable. Tous nos calculs explosent. Ils explosent littéralement, dans le sens où les termes tendent vers l'infini. C'est là que notre compréhension théorique nous fait défaut.

- Comment vous et vos collègues utilisez-vous les collisionneurs de particules pour mieux comprendre ce processus ?

Le RHIC fait entrer en collision des noyaux d'atomes d'or. Quand vous faites cela, vous injectez tellement d'énergie dans le système, parce que vous faites entrer en collision plusieurs protons et neutrons avec plusieurs protons et neutrons. Ces gars ont tellement d'énergie que vous recréez en quelque sorte un peu du Big Bang. Nous l'appelons le Petit Bang. Et à partir du Petit Bang, vous obtenez un très court laps de temps, 10−22 secondes - yoctosecondes. Dans ce court laps de temps, un fluide appelé plasma quarks-gluons apparaît, et tous les quarks et gluons communiquent entre eux. C'est une boule de feu. Ensuite, elle évolue. Elle s'expand. Elle refroidit. À un certain point, elle atteint la température à laquelle les quarks et les gluons se convertissent en hadrons.

Donc nous commençons avec des hadrons que nous faisons entrer en collision. Puis nous passons aux quarks et aux gluons, et ensuite nous revenons aux hadrons. L'hadronisation se produit devant nous chaque fois que nous faisons fonctionner nos collisionneurs, sur n'importe quel collisionneur dans l'histoire de la physique. Le fait que nous ne puissions pas le comprendre au niveau quantitatif ou même qualitatif - c'est frustrant ! Une des principales motivations de ma recherche est de l'observer et d'essayer de comprendre ce qui se passe ici.

- Dans ma tête, j'imagine que vous prenez tous une photo avec un petit appareil photo et que vous étudiez l'explosion.

- Eh bien, en gros, oui.

Voici une analogie simple. Disons que vous travaillez dans les tests de sécurité automobile. Vous mettez un mannequin dans la voiture, vous accélérez la voiture, vous heurtez un bloc, et ensuite vous regardez ce qui arrive au corps du mannequin pour déterminer si c'est sûr et si les airbags fonctionnent.

Maintenant imaginez que vous n'avez qu'une photographie du site de test de collision plusieurs années plus tard. Et une photographie de la voiture non endommagée avant la collision. Ce décalage temporel de plusieurs années dans l'analogie reflète le décalage en yoctosecondes entre la collision et votre capacité à la capturer, n'est-ce pas ?

- Oui, cela se produit en un temps très court, et il n'y a aucun moyen de l'arrêter.

Donc vous regardez ces deux photographies, et vous dites : Je sais que la main du mannequin a commencé ici et a fini là. Quels sont les autres indices dans la photographie que je peux utiliser pour recréer le trajet de la main du mannequin ?

Je crée un algorithme de reconstruction. D'ici, la main va revenir par là, et puis je rassemble plus d'informations, et puis je remonte plus loin. Je peux estimer ce qui se passe en théorie grâce à une simulation.

Nous avons un processus itératif où nous apprenons. Nous faisons une prédiction ; les données ne sont pas d'accord. Nous mettons à jour la prédiction ; nous la comparons avec de nouvelles données. Peut-être que ça correspond.

Faire cela aux plus petits niveaux de la matière autour de nous, c'est vraiment ce dont il s'agit en physique des particules et en physique nucléaire de haute énergie.

- Qu'avez-vous découvert ?

Nous mesurons des jets, qui sont des structures en forme de cône composées d'un spray de hadrons et d'autres particules et fragments de particules qui s'échappent d'une collision. Nous reconstruisons et étudions la sous-structure de ces jets. En regardant la distribution des particules dans le jet, si je regarde les particules qui sont éloignées les unes des autres, c'est une région très calculable du jet. À mesure que l'échelle de distance se rapproche, cela entre dans la région incalculable ou non perturbative. Nous avons identifié une échelle spécifique où les quarks et les gluons ne peuvent plus être considérés comme des quarks et des gluons ; ils doivent être considérés comme des hadrons.

Dans notre quête à long terme pour identifier comment se produit l'hadronisation, nous avons découvert avec nos données et nos calculs que l'hadronisation semble se produire à cette échelle de distance fixe, appelée région de transition. Je peux convertir cette distance en temps. Donc nous arrivons enfin au point où nous savons exactement quand l'hadronisation a lieu.

- Est-ce que les propriétés des quarks et des gluons résonnent avec vous en tant que personne non-binaire ?

Oui, je pense que le simple fait que les gluons portent plusieurs charges de couleur signifie qu'ils sont fondamentalement des créatures non-binaires. Et ils sont la pierre angulaire de tout ce qui nous entoure.

C'est un aspect plus coloré de la nature. Cela nous dit qu'il y a quelque chose de plus que la simple charge binaire positive ou négative. Vous avez beaucoup plus de choix de couleurs. Vous avez beaucoup plus de saveurs dans la soupe.

- Que signifie pour vous l'observation de ces particules ?

Je suis dans un voyage de découverte de soi en même temps que mon voyage intellectuel pour comprendre les quarks et les gluons et comment ils évoluent. Tout, selon moi, a un chemin d'évolution.

J'ai commencé dans une société [dans le sud de l'Inde] qui était très binaire dans sa représentation visuelle. Il y avait des rôles de genre clairement définis. Venir aux États-Unis et y passer 15 ans m'a pris beaucoup de temps pour réaliser ce que je pourrais comprendre être moi-même. L'idée du non-binaire, de ne pas appartenir à une certaine représentation - cela a pris beaucoup de temps à réaliser.

Ma première réalisation que c'était une possibilité, que la transition pourrait arriver, c'était au CERN. Mon collègue est simplement apparu en portant une robe. Et je me suis dit : Oh, on peut faire ça !

Dans le monde de la physique, il n'y a pas beaucoup de personnes queer ou trans. La représentation compte beaucoup pour moi, et être présent.e en tant que personne trans ouvertement, représentant mon domaine, mon domaine d'étude - qui est fondamentalement non-binaire dans sa nature - est un aspect très important de mon travail quotidien. Mais c'est difficile. Notre représentant du Tennessee au Congrès vient de déposer un projet de loi qui supprime le financement fédéral de toute institution qui facilite "la dissociation d'un individu de son sexe". C'est le libellé du projet de loi.

Ils s'en prennent à l'assurance. Ils s'en prennent aux universités.

- Comment pouvez-vous penser à la physique quand vous pensez à tout cela ?

Cinquante pour cent de mon cerveau pense à cela, comment je peux survivre, et dans les 50% restants du cerveau, je peux penser à la physique.

Je suis physicien.ne, mais avant cela, je suis une personne. Si quelqu'un veut juste parler physique avec moi, vous ne pouvez pas juste avoir ma physique, vous avez aussi le fait que je suis une personne trans et vous entendez parler de l'environnement dans lequel on me demande de faire ma recherche. 

Auteur: Internet

Info: https://www.quantamagazine.org/, P Louvet, janvier 2025

[ unicité ] [ physique fondamentale ] [ observateur miroir ] [ katoï ] [ transsexualité ]

 

Commentaires: 0

Ajouté à la BD par miguel

addiction

Elle étudie la façon dont la toxicomanie interfère avec l'apprentissage dans le cerveau

Erin Calipari cherche à comprendre comment des drogues comme les opioïdes et la cocaïne modifient les circuits d'apprentissage et la neurochimie dans l'un des épicentres nationaux des troubles liés à la consommation de substances psychoactives et de la toxicomanie.

(Photo : La dopamine est mieux comprise comme une molécule " d’apprentissage " que comme une molécule de " plaisir ", déclare Erin. "Tout le monde doit avoir un neuromodulateur préféré dans le cerveau, et pour moi c'est la dopamine.")

À quoi ressemble l’apprentissage dans le cerveau et comment les drogues interfèrent-elles avec cela ?

Notre cerveau est programmé pour nous aider à voir les choses qui sont importantes et à y réagir. Cela détermine si nous devons refaire quelque chose ou non. Devons-nous déménager ou rester ? Est-ce bon ou mauvais? Est-ce quelque chose auquel je dois faire attention ?

Les drogues convainquent notre cerveau : " Oui, c’est important. C’est quelque chose que nous devons refaire. Les drogues déterminent non seulement les décisions concernant la drogue elle-même, mais également les décisions concernant les stimuli non médicamenteux présents dans notre environnement. Elles modifient la façon dont nous apprenons.

Comment ça marche au niveau moléculaire ?

Les médicaments comme les opioïdes agissent sur la dopamine. La plupart des gens considèrent la dopamine comme une " molécule du plaisir ", mais ce n’est pas tout. Oui, la dopamine est libérée par des stimuli enrichissants comme le chocolat ou le sucre. Mais Elle est également libérée par des stimuli aversifs comme le stress ou la douleur. Elle se déclenche lorsque les choses sont nouvelles ou différentes, qu'elles soient bonnes ou mauvaises. Et de cette façon, la dopamine est essentielle pour vous aider à apprendre.

Les drogues continuent essentiellement à stimuler la dopamine même lorsque les choses ne sont plus nouvelles ou différentes. Le cerveau continue de penser que quelque chose est important, vous signalant ainsi de continuer à y prêter attention. Mais si les drogues augmentent la dopamine sur le moment, leur consommation à long terme la diminue. Ainsi, avec la consommation croissante de drogues, il y a de moins en moins de dopamine dans le cerveau, ce qui signifie que vous avez du mal à apprendre quelque chose de nouveau.

La dopamine doit-elle être redéfinie comme une molécule " d’apprentissage " plutôt que comme une molécule de " plaisir " ?

Oui. Comprendre la dopamine en tant que molécule qui détermine l’efficacité de notre apprentissage est beaucoup plus précis.

Comment étudiez-vous ce système compliqué ?

Dans mon laboratoire, nous utilisons différentes stratégies pour enregistrer et manipuler différentes cellules du cerveau afin d’essayer de déterminer quelles cellules et quels circuits nous aident à prendre des décisions adaptatives. Et puis, une fois que nous avons identifié ces circuits, nous y allons et disons : Comment l'exposition aux drogues change-t-elle le fonctionnement du système ? Nous effectuons ce travail au niveau physiologique et épigénétique. L’objectif est de comprendre la biologie fondamentale – comment les médicaments détournent les circuits – et ensuite de déterminer si nous pouvons inverser le processus. Nous pouvons utiliser les outils CRISPR*, par exemple, pour inverser une partie de la plasticité de cellules cérébrales spécifiques.

Comprendre le fonctionnement de la dopamine peut-il éventuellement nous aider à développer des traitements contre la dépendance ?

Comprendre ce que fait la dopamine pour aider le cerveau à apprendre est vraiment important. Mais ce sera très difficile à cibler. Vous ne pouvez pas simplement bloquer la dopamine : si vous le faites, les gens ne pourront plus bouger, ils ne pourront plus prêter attention à quoi que ce soit. De nombreux travaux sont en cours sur différentes manières d'affiner le système dopaminergique au lieu de simplement l'activer ou le désactiver. Je pense que c'est ce que nous allons devoir faire.

Qu'est-ce que ça fait de travailler en tant que chercheur en toxicomanie dans l'un des épicentres de la toxicomanie ?

Nashville est mauvais. Au plus fort de l’épidémie d’opioïdes, le Tennessee avait l’un des taux de prescriptions d’opioïdes les plus élevés. Ces dernières années, ce chiffre a diminué, mais pas le problème des opioïdes. Et il ne s’agit pas uniquement d’opioïdes pour nous ; la méthamphétamine est également un problème important. Vanderbilt se trouve donc dans cet espace unique en tant que l’un des plus grands hôpitaux de recherche de la région, au cœur des troubles liés à l’usage de ces substances.

Parfois, il est épuisant de ne pas pouvoir résoudre sa dépendance. C'est écrasant dans un sens pas sympa. Parfois, c'est triste de parler à des personnes qui souffrent de troubles liés à l'usage de substances, et je ne sais pas comment les aider. Elles me posent des questions, mais si je suis experte des changements neurobiologiques spécifiques qui se produisent il m’est difficile de comprendre l’impact de ce trouble sur la vie quotidienne d’un individu puisque je ne l’ai pas vécu personnellement.

Sommes-nous sur le point de comprendre et, à terme, de trouver un remède à la dépendance ?

Guérir de la dépendance est difficile car la dépendance n’est pas une maladie uniforme. Certaines personnes souffrant de dépendance souffrent de troubles comorbides comme l’anxiété et la dépression. Certaines personnes prennent des drogues pour éviter la douleur. Certaines personnes ont un comportement compulsif, d’autres non.

Il sera essentiel de comprendre ce qui est similaire et différent dans le cerveau des individus présentant chacun de ces symptômes uniques pour comprendre comment aborder le traitement en premier lieu. Dans mon laboratoire, par exemple, nous étudions les différences entre les hommes et les femmes.

Qu'avez-vous découvert ?

Lorsque l’on examine les raisons pour lesquelles les gens consomment de la drogue, les femmes sont plus susceptibles de déclarer qu’elles en prennent pour éviter ou échapper à des conséquences négatives, comme le stress et l’anxiété. Les hommes sont plus susceptibles de consommer des drogues de manière impulsive, de planer et de sortir avec des amis. Les deux sexes consomment des drogues et un certain pourcentage d’entre eux développeront un trouble lié à l’usage de substances. Mais ils le font pour différentes raisons.

Les hormones ont beaucoup à voir avec cela. Nous avons découvert que l'estradiol, une hormone ovarienne qui circule avec le cycle menstruel, modifie la façon dont la nicotine agit dans le cerveau en modifiant les fonctions de ses récepteurs.

Nous avons également constaté que si l’on donne aux animaux un accès illimité aux drogues, les mâles et les femelles consomment la même quantité de drogues et leur comportement semble identique. Mais lorsque nous avons examiné les modifications apportées aux protéines de leur cerveau, les hommes et les femmes étaient totalement différents. Beaucoup de ces protéines ont des fonctions cellulaires similaires. Nous pensons que ce médicament augmente la dopamine chez les hommes et les femmes et détermine le comportement de la même manière, mais les voies moléculaires utilisées par chaque sexe sont très différentes.

Pourquoi les cerveaux de sexes différents emprunteraient-ils des chemins différents pour arriver au même point ?

Si vous aviez un système dans lequel vous avez besoin d’un neurone pour coder une information, ce système serait susceptible de tomber en panne. Tout devrait fonctionner parfaitement à chaque fois pour que vous puissiez naviguer dans l'environnement. Mais le cerveau comporte de nombreuses redondances, ce qui signifie que vous n’avez pas besoin que tout fonctionne parfaitement. Il existe de nombreuses façons d’arriver au même but. La raison pour laquelle les mâles et les femelles ont des manières différentes de coder leurs comportements est probablement basée sur l'évolution et la survie de notre espèce.

Cela doit être un domaine difficile dans lequel travailler. Qu'est-ce qui vous motive ?

Ce qui me préoccupe chaque jour, c’est que ce sont des questions importantes. Apprendre la prochaine chose et résoudre des problèmes difficiles est en soi très satisfaisant. Ensuite, lorsque vous respirez, prenez du recul et réalisez que les problèmes difficiles que vous résolvez ont vraiment un impact sur les gens, cela rend le tout encore plus significatif. Mais ma véritable motivation réside dans le mentorat de la prochaine génération. Lorsque je me suis lancé dans la recherche, mon objectif était d’influencer le plus de personnes possible. Je pensais y parvenir en découvrant quelque chose d'important et en changeant la société, ce qui est évidemment le but ultime. Mais ensuite, quand je suis arrivée ici et que j'ai installé mon laboratoire, j'ai réalisé que ce qu'on fait, c'est apprendre aux étudiants qu'ils peuvent faire ce travail. Leur permettre de découvrir ce pour quoi ils sont bons et ce qu'ils aiment me permet de continuer, même lorsque la science ne va pas toujours comme je le souhaite.

Vous êtes un peu comme l'entraîneur de votre propre équipe.

Lorsque vous finissez par diriger un laboratoire, vous réalisez qu’il s’agit d’une grande partie de la science, mais aussi d’une grande partie de la non-science. Il s'agit d'amener les gens à travailler ensemble et de créer l'environnement approprié pour chaque individu, ce qui peut s'avérer difficile. C'est comme constituer une équipe. S'ils travaillent ensemble, c'est moins difficile pour chacun. Et si vous le faites correctement, alors tout le monde y gagne.

Vous défendez également les femmes scientifiques. D’où vient cette motivation ?

Personne dans ma famille n’avait de diplôme d’études supérieures avant moi. Parce que mon père est sportif, l'accent n'était pas mis sur les études. Ensuite, je me suis retrouvé dans un espace dans lequel – je ne veux pas dire que je n’avais rien à faire, mais j’étais entouré d’un groupe de personnes qui, à mon avis, étaient plus intelligentes que moi. Ils savaient ce qu'ils faisaient. Ils savaient quel chemin ils étaient censés emprunter.  Heureusement j’ai eu des mentors extraordinaires qui m’ont aidé à rester sur un chemin que je ne connaissais pas. Et puis, en vieillissant, j’ai commencé à réaliser que ma place était ici. J'étais aussi intelligente que les gens autour de moi. Cela seul m’a fait réaliser à quel point il est important que les gens se sentent à leur place.

Au lieu de demander aux femmes d'agir comme des hommes pour s'intégrer dans un système construit pour les hommes, peut-être devrions-nous changer le système pour renforcer les éléments qui nous manquent, c'est-à-dire les éléments que les femmes apportent à la table : la façon dont elles naviguent dans le monde, comment elles perçoivent les choses, comment elles accompagnent les étudiants. Nous bénéficions énormément de la création d’un espace pour les femmes.

Vous avez fait du sport toute votre vie, y compris le basket-ball à l'université. Pensez-vous que cela a eu une influence sur votre carrière aujourd’hui ? 

Les choses les plus importantes que l’on apprend dans le sport sont comment se dépasser pour s’améliorer chaque jour, comment se remettre d’un échec et comment compter sur ses coéquipiers. Quand j'étais plus jeune, ces expériences m'ont appris à venir travailler après qu'une expérience n'ait pas fonctionné et à demander de l'aide lorsque j'en avais besoin.

Durant mon entraînement, j’étais l’athlète qui jouait à un jeu. Cependant, lorsque je suis devenu professeur, je suis tout d’un coup devenu entraîneur. Mon travail est différent maintenant. Il se concentre sur la façon dont je peux amener mon équipe à s’améliorer. Je dois identifier les points forts de chacun et les mettre en mesure de réussir. Je suis également là pour les aider à combler les lacunes avec d’excellents coéquipiers qui sont bons dans des domaines pour lesquels ils ne sont peut-être pas bons. Le sport m'a donné les compétences nécessaires pour me concentrer sur le travail acharné et la motivation, et m'a donné un cadre pour créer une équipe efficace et la motiver à donner le meilleur d'elle-même.

Votre père, John Calipari , est un entraîneur de basket-ball professionnel. Était-il un mentor pour vous ?

Il était un mentor extraordinaire, mais plus par les choses qu'il faisait que par les choses qu'il disait. Quand j'étais au collège, il a été viré. Le regarder se faire virer, puis revenir et dire : " Vous savez quoi, tout va bien ; Je vais me lever et recommencer " – c'était vraiment important pour moi de réaliser que même lorsque les choses semblent être d'énormes échecs, c'est parfois le début de quelque chose de nouveau.

Auteur: Internet

Info: Quanta Magazine, Yasemin Saplakoglu, 7 décembre 2023 *système simple, rapide et efficace pour couper l'ADN à un endroit précis du génome, dans n'importe quelle cellule.

[ accoutumance ] [ femmes-hommes ] [ éducation ] [ dépaysement ] [ ajustement ]

 

Commentaires: 0

Ajouté à la BD par miguel

Intelligence artificielle

Les logiciels de chatbot commencent à être confrontés à des limites fondamentales

Des résultats récents montrent que les grands modèles de langage ont du mal à effectuer des tâches de composition, ce qui suggère une limite stricte à leurs capacités.

Le 17 décembre 1962, Life International a publié une énigme logique composée de 15 phrases décrivant cinq maisons sur une rue. Chaque phrase était un indice, comme " L'Anglais vit dans la maison rouge " ou " Le lait est bu dans la maison du milieu ". Chaque maison était d'une couleur différente, avec des habitants de nationalités différentes, possédant des animaux différents, et ainsi de suite. Le titre de l'article posait la question : " Qui possède le zèbre ? " Des problèmes comme celui-ci se sont révélés être une mesure des capacités — ou plutôt des limites — des modèles d'apprentissage automatique actuels.

Également connu sous le nom d'énigme ou de casse-tête d'Einstein (attribution probablement apocryphe), ce problème teste un certain type de raisonnement en plusieurs étapes. Nouha Dziri, chercheuse scientifique à l'Allen Institute for AI, et ses collègues ont récemment soumis des modèles de langage basés sur des transformers ( LLMs ), comme ChatGPT, à ce type de tâches — et les ont largement trouvés insuffisants. " Ils pourraient ne pas être capables de raisonner au-delà de ce qu'ils ont vu dans les données d'entraînement pour des tâches difficiles ", a déclaré Dziri. " Ou du moins, ils font une approximation, et cette approximation peut être erronée. "

L'énigme d'Einstein nécessite de composer une solution globale à partir de solutions à des sous-problèmes, ce que les chercheurs appellent une tâche compositionnelle. L'équipe de Dziri a montré que les LLMs, qui ont été entraînés uniquement à prédire le mot suivant dans une séquence — ce qui est le cas de la plupart d'entre eux — sont fondamentalement limités dans leur capacité à résoudre des tâches de raisonnement compositionnel. D'autres chercheurs ont montré que les transformers, l'architecture de réseau neuronal utilisée par la plupart des LLMs, ont des limites mathématiques strictes lorsqu'il s'agit de résoudre de tels problèmes. Les scientifiques ont obtenu quelques succès en repoussant ces limites, mais ces solutions semblent de plus en plus être des correctifs à court terme. Si c'est le cas, cela signifie qu'il existe des limites computationnelles fondamentales aux capacités de ces formes d'IAs — ce qui pourrait signifier qu'il est temps d'envisager d'autres approches.

" Ce travail est vraiment motivé par l'idée d'aider la communauté à décider si les transformers sont vraiment l'architecture que nous voulons adopter pour un apprentissage universel ", a déclaré Andrew Wilson, expert en apprentissage automatique à l'Université de New York, qui n'a pas participé à cette étude.

Le succès attire l'examen

Ironiquement, les LLMs ne doivent s'en prendre qu'à eux-mêmes pour cette découverte de l'une de leurs limites. " La raison pour laquelle nous nous sommes tous demandé s'ils faisaient un vrai raisonnement est due à leurs capacités impressionnantes ", a déclaré Dziri. Ils ont impressionné sur des tâches impliquant le langage naturel, malgré la simplicité apparente de leur entraînement. Pendant la phase d'entraînement, un LLM est exposé à un fragment de phrase avec le dernier mot masqué (bien que techniquement, ce ne soit pas toujours un seul mot). Le modèle prédit les informations manquantes, puis " apprend " de ses erreurs.

Les plus grands LLMs — OpenAI's o1 et GPT-4, Google's Gemini, Anthropic's Claude — s'entraînent sur presque toutes les données disponibles sur Internet. En conséquence, les LLMs finissent par apprendre la syntaxe et une grande partie des connaissances sémantiques du langage écrit. Ces modèles " pré-entraînés " peuvent être encore entraînés, ou affinés, pour accomplir des tâches sophistiquées bien au-delà de la simple complétion de phrases, comme résumer un document complexe ou générer du code pour jouer à un jeu vidéo. Les résultats étaient si puissants que les modèles semblaient, à certains moments, capables de raisonner. Pourtant, ils échouaient aussi de manière à la fois évidente et surprenante.

" Sur certaines tâches, ils performent incroyablement bien ", a déclaré Dziri. " Sur d'autres, ils sont étonnamment stupides. "

Prenons la multiplication de base. Les LLMs standards, comme ChatGPT et GPT-4, échouent lamentablement. Début 2023, lorsque l'équipe de Dziri a demandé à GPT-4 de multiplier deux nombres à trois chiffres, il n'a réussi que 59 % du temps. Lorsqu'il a multiplié deux nombres à quatre chiffres, la précision est tombée à seulement 4 %.

L'équipe a également testé les LLMs sur des tâches comme l'énigme d'Einstein, où ils ont également eu un succès limité. GPT-4 a toujours donné la bonne réponse lorsque le puzzle impliquait deux maisons avec deux attributs par maison. Mais la précision est tombée à 10 % lorsque la complexité du puzzle est passée à quatre maisons avec quatre attributs par maison. Pour la version originale de Life International — cinq maisons, chacune avec cinq attributs — le taux de réussite était de 0 %.

L'équipe de Dziri a pensé que peut-être les LLMs n'avaient tout simplement pas vu assez d'exemples dans leurs données d'entraînement, alors ils ont affiné GPT-3 sur 1,8 million d'exemples de multiplication de deux nombres. Ensuite, lorsqu'ils lui ont présenté de nouveaux problèmes, le LLM les a réussis — mais seulement s'ils étaient suffisamment similaires à ce qu'il avait vu pendant l'entraînement. Par exemple, les données d'entraînement incluaient la multiplication de deux nombres à trois chiffres, et d'un nombre à deux chiffres avec un nombre à quatre chiffres, mais lorsque le modèle a été interrogé sur la multiplication d'un nombre à quatre chiffres avec un nombre à trois chiffres, il n'a réussi que 2 % du temps. " S'ils raisonnent vraiment et comprennent certaines tâches, ils devraient saisir l'algorithme implicite ", a déclaré Dziri. Ce n'est pas ce que son équipe a observé. " Cela soulève beaucoup de questions sur la façon dont les LLMs accomplissent les tâches et s'ils font un vrai raisonnement. "

L'équipe a observé le même schéma pour résoudre l'énigme d'Einstein : GPT-3 a échoué lorsqu'on lui a demandé de résoudre des versions plus grandes du puzzle par rapport à celles sur lesquelles il avait été affiné. " Il imite quelque chose qu'il a vu, mais il n'en a pas une compréhension complète ", a déclaré Dziri.

Limites dures

Alors que Dziri et ses co-auteurs finalisaient leurs résultats, une autre équipe adoptait une approche différente pour comprendre pourquoi les LLMs avaient du mal avec les tâches compositionnelles. Binghui Peng, alors doctorant à l'Université de Columbia, travaillait avec l'un de ses directeurs de thèse, Christos Papadimitriou, et des collègues pour comprendre pourquoi les LLMs " hallucinent ", c'est-à-dire génèrent des informations factuellement incorrectes. Peng, maintenant chercheur postdoctoral à l'Université de Stanford, soupçonnait que c'était parce que les transformers semblaient manquer de la " capacité de composition ".

Pour comprendre pourquoi, imaginez que nous donnons à un LLM deux informations : Le père de Frédéric Chopin était Nicolas Chopin, et Nicolas Chopin est né le 15 avril 1771. Si nous lui demandons ensuite : " Quelle est la date de naissance du père de Frédéric Chopin ? ", le LLM devrait répondre en composant, ou en assemblant, les différents faits. En effet, il devrait répondre à la question imbriquée suivante : " Quelle est la date de naissance de (Qui est le père de (Frédéric Chopin) ? " Si le LLM prédit les mauvais mots comme réponse, on dit qu'il a halluciné — dans ce cas, peut-être à cause de son échec à résoudre la tâche compositionnelle.

Peng voulait tester cette intuition. Son équipe a commencé par étudier les propriétés d'un transformer simple, avec une seule couche, qui apprend à " prêter attention " à l'ordre et à la position des mots d'une phrase lorsqu'il essaie de prédire le mot suivant. (Les LLMs modernes ont des dizaines de telles couches.) L'équipe a établi un lien entre la complexité de la couche de transformer et la " taille du domaine ", c'est-à-dire le nombre de bits nécessaires pour représenter les questions. En se concentrant sur ce modèle simple, ils ont prouvé une limite mathématique. " Si le nombre total de paramètres dans ce transformer à une couche est inférieur à la taille d'un domaine, alors les transformers ne peuvent pas résoudre la tâche compositionnelle ", a déclaré Peng. En d'autres termes, un LLM avec une seule couche de transformer était clairement et mathématiquement limité.

Bien que ce soit un résultat théorique fort, ses implications pratiques n'étaient pas claires, car les LLMs modernes sont bien plus complexes. " Il n'est pas facile d'étendre notre preuve ", a déclaré Peng. Son équipe a donc utilisé une approche différente pour étudier les capacités des transformers plus complexes : ils se sont tournés vers la théorie de la complexité computationnelle, qui étudie les problèmes en termes de ressources, comme le temps et la mémoire, nécessaires pour les résoudre.

Pousser les limites

Pour être clair, ce n'est pas la fin des LLMs. Wilson de NYU souligne que malgré ces limites, les chercheurs commencent à améliorer les transformers pour les aider à mieux gérer, entre autres, l'arithmétique. Par exemple, Tom Goldstein, informaticien à l'Université du Maryland, et ses collègues ont ajouté une astuce à la façon dont ils présentaient les nombres à un transformer entraîné à additionner, en intégrant des informations " positionnelles " supplémentaires dans chaque chiffre. En conséquence, le modèle pouvait être entraîné sur des nombres à 20 chiffres et additionner de manière fiable (avec 98 % de précision) des nombres à 100 chiffres, alors qu'un modèle entraîné sans cette astuce n'était précis qu'à environ 3 %. " Cela suggère qu'il y a peut-être des interventions basiques que l'on pourrait faire ", a déclaré Wilson. " Cela pourrait vraiment faire progresser ces problèmes sans avoir à repenser toute l'architecture. "

Une autre façon de surmonter les limites d'un LLM, au-delà de simplement augmenter la taille du modèle, est de fournir une solution étape par étape d'un problème dans l'invite, une technique connue sous le nom de chain-of-thought prompting. Des études empiriques ont montré que cette approche peut donner à un LLM comme GPT-4 une nouvelle capacité à résoudre des tâches plus variées. Il n'est pas tout à fait clair pourquoi, ce qui a poussé de nombreux chercheurs à étudier ce phénomène. " Nous étions curieux de savoir pourquoi c'est si puissant et pourquoi on peut faire tant de choses ", a déclaré Haotian Ye, doctorant à l'Université de Stanford.

Lorsque Ye était encore étudiant à l'Université de Pékin, lui et ses collègues ont modélisé le comportement des transformers avec et sans chain-of-thought prompting. Leur preuve, utilisant une autre branche de l'informatique appelée théorie de la complexité des circuits, a établi comment le chain-of-thought prompting transforme essentiellement un grand problème en une séquence de problèmes plus petits, permettant aux transformers de s'attaquer à des tâches compositionnelles plus complexes. " Cela signifie... qu'il peut résoudre certains problèmes qui se trouvent dans une classe computationnelle plus large ou plus difficile ", a déclaré Ye.

Mais Ye met en garde : leur résultat n'implique pas que les modèles du monde réel résoudront réellement de tels problèmes difficiles, même avec le chain-of-thought. Le travail s'est concentré sur ce qu'un modèle est théoriquement capable de faire ; les spécificités de la façon dont les modèles sont entraînés dictent comment ils peuvent atteindre cette limite supérieure.

En fin de compte, aussi impressionnants que soient ces résultats, ils ne contredisent pas les conclusions des équipes de Dziri et Peng. Les LLMs correspondent fondamentalement aux modèles qu'ils ont vus, et leurs capacités sont limitées par des frontières mathématiques. Les astuces d'incorporation et le chain-of-thought prompting étendent simplement leur capacité à faire des correspondances de modèles plus sophistiquées. Les résultats mathématiques impliquent que vous pouvez toujours trouver des tâches compositionnelles dont la complexité dépasse les capacités d'un système donné. Même certains modèles plus récents, comme les " modèles à espace d'états ", qui ont été présentés comme des alternatives plus puissantes aux transformers, montrent des limites similaires.

D'un côté, ces résultats ne changent rien pour la plupart des gens qui utilisent ces outils. " Le grand public ne se soucie pas de savoir s'ils raisonnent ou non ", a déclaré Dziri. Mais pour les personnes qui construisent ces modèles et essaient de comprendre leurs capacités, cela compte. " Nous devons vraiment comprendre ce qui se passe sous le capot ", a-t-elle déclaré. " Si nous comprenons comment ils accomplissent une tâche et comment ils raisonnent, nous pouvons probablement les améliorer. Mais si nous ne savons pas, c'est là que c'est vraiment difficile de faire quoi que ce soit. "




Auteur: Internet

Info: https://www.quantamagazine.org/chatbot-software-begins-to-face-fundamental-limitations-20250131/, Anil Ananthaswamy, 31 janv 2025

[ larges modèles de langage ] [ frontières cognitives ] [ limites architecturales ] [ données massives ]

 

Commentaires: 0

Ajouté à la BD par miguel

spiritualité

D' Héliopolis le culte osirien s'implante à Busiris à la place de l'ancien roi divinisé Andjyty, l'homme aux deux cornes de bélier et aux deux plumes sur la tête avec dans les mains le sceptre Héka (symbole magique) et le flagellum (insigne de royauté que reçoit le prince héritier lors de son intronisation). Busiris était à l'époque prédynastique la capitale du delta, mais elle perdit le titre durant l'Ancien-Empire au profit de Bouto (ville située entre Alexandrie et Saïs). Busiris que Strabon nomme en grec Cynopolis, resta célèbre pour son grand temple dédié à la déesse... Isis. Cela n'a pas empêché l'extension du culte d'Osiris qui est devenu dans la mémoire populaire " l'être perpétuellement bon " aimé de tout son peuple pour lequel il a dû se sacrifier, afin de lui montrer le chemin qui mène à la vie éternelle. Plus de 2500 ans avant la naissance de Jésus, Osiris était comme lui un roi né d'une fécondation spirituelle, comme lui il est la lumière qui éclaire et chasse les ténèbres. Tué par ses frères de religion il renaîtra et montera au ciel pour juger les âmes selon leurs mérites personnels...
Isis : la reine-mère aux pouvoirs temporels et spirituels. Etrange reine aux origines mystiques qui porte à deux lettres près, le nom de son époux Osiris assassiné par Seth. Comme la grande déesse-mère de l'Antiquité, Isis sera souvent honorée et son aide sollicitée en tant guérisseuse et mère protectrice. Selon la légende, elle va retrouver avec l'aide d'Anubis (patron des embaumeurs) et de sa soeur Nephthys les morceaux de son époux disséminés dans tous les nomes d'Egypte. Connaissant le mystérieux secret de Rê d'où il tire sa toute puissance, elle l'utilise pour ressusciter durant quelques instants son époux, le temps d'être fécondée spirituellement par lui. Sous le Nouvel Empire Isis est aimée et adorée de tous comme étant la "Mère universelle" et particulièrement la déesse de ceux qui souffrent. Elle console les pauvres et ceux qui vont bientôt mourir. Elle a le pouvoir de faire ressusciter les morts, depuis son interposition pour la résurrection de l'esprit d'Osiris. Comme Marie au Golgotha dans la religion chrétienne qui devient par ses souffrances au travers du disciple Jean " la Mère de toute l'humanité ", Isis souffre et devient avec son fils Horus, la grande mère victorieuse qui refoule les forces des ténèbres et remporte par le combat de ses souffrances une victoire décisive sur le mal.
Le mythe de l'Inondation bienfaisante : En Egypte depuis l'époque préhistorique l'inondation était un phénomène naturel qui arrivait chaque année vers la mi-Juillet, cette date correspondait également au nouvel an égyptien. Cette inondation fluctuait d'une année à l'autre en fonction des pluies tombées sur les hauts plateaux de Nubie que charriaient le Nil et ses affluents. Elle pouvait tout aussi bien être insignifiante, par un très bas niveau, ce qui correspondait à une "année de sécheresse" ou imprégner généreusement durant trois mois toutes les terres desséchées par la chaleur solaire et assurer aux habitants une bonne germination des graines et assurer de bonnes récoltes. On comprend pourquoi les éléments naturels comme la pluie, le soleil, l'inondation ou la sécheresse ont eu une importance vitale pour les premières peuplades.
D'abord symbolisé dans l'ennéade d'Héliopolis par les deux lions Shou et Tefnout adorés à Léontopolis. Tefnout la fille de Rê et déesse fugueuse avait quitté son père et son époux Shou pour vivre en liberté dans les montagnes de Nubie où elle terrorisait les habitants. Rê qui s'ennuyait de sa fille envoya Shou avec le dieu Thot de la sagesse sous la forme d'un singe qui utilisa sa sagesse et son Verbe pour réussir à convaincre Tefnout, la déesse lointaine à revenir sous la forme d'une inondation bienfaisante qui s'adoucit dès le passage de la première cataracte de Philae. A partir de la IIIe dynastie l'inondation est liée au rassemblement des morceaux d'Osiris éparpillés dans les divers nomes qui vont assurer la revitalisation des terres. Certains prêtres voyaient également dans l'inondation : les larmes mystiques d'Isis pleurant son époux disparu, etc, etc.
L'eau de vie selon un extrait des " anciens Textes des Pyramides " : Selon la légende Rê naissait sous la forme d'un scarabée noir qui sous cette forme traversait la nuit. Il faut dire qu'en ce temps-là existait encore des scarabées volants aujourd'hui disparus ! Au matin le scarabée se métamorphosait en enfant appelé Khepri = la vie qui vient. Jusqu'à midi l'enfant grandissait pour prendre la forme d'un homme avec une tête de faucon appelé Rê-Horatky (la puissance du roi Horus à son zénith). Le soir, lorsque l'astre disparaissait derrière les monts de l'Occident, Rê était englobé par Atoum l'esprit invisible et devenait Atoum-Rê sous l'aspect d'un vieillard qui s'en allait sur sa barque, disparaissait dans le fleuve avant de renaître au petit matin sur l'autre rive du Nil.
A la 2è dynastie les pharaons se considérèrent comme les fils du soleil, à la 5è dynastie, ils se voyaient comme l'incarnation du soleil, le pharaon est en Rê et Rê est dans le Pharaon. Principale source de vie, le soleil centralise en lui les pouvoirs des rois et des principales divinités, ainsi on l'appellera souvent Atoum-Rê, Amon-Rê, Knouhm-Rê, Osiris-Rê et Horus-Rê... Ihet serait la vache primordiale ou mère génitrice du soleil qui après sa naissance l'aurait placé entre ses cornes pour le protéger. Quant à la déesse Tasenet-Neferet, elle fut considérée à l'époque tardive comme l'oeil de Rê et la soeur du soleil. A Kôm-Ombo, elle est unie à Horus l'Ancien et devient l'épouse d'Haroëris.
Les compagnes de Rê à Héliopolis : NEBETHETEPET : (assimilée à Hathor) avec la déesse IOUSSAS (la dame de la satisfaction), ces deux déesses auraient inspiré le démiurge d'Héliopolis ATOUM-Rê à créer le monde. SHESEMTET : (une des faces d'Hathor qui se manifeste dans l'Uraeus). MAAT : Fille d'ATOUM elle le principe de la lumière et la déesse de la vérité, représentant la JUSTICE divine. Elle est aussi le symbole du charme féminin. Les filles de Rê : PAKHET : la déesse lionne de Béni Hassan qui surveillait les frontières du désert.
BASTET : la déesse chatte de Bubastis qui est alors la déesse gardienne du foyer, ou sous son aspect lionne l'oeil de Rê. TEFNOUT : la lionne de Léontopolis, elle est la principale représentante des déesses dangereuses. HATHOR : sous son aspect de déesse dangereuse Hathor unie aux forces de Mâat repoussaient les attaques des forces du chaos. P T A H : le dieu au crâne rasé et gainé comme une momie.
Si à Héliopolis le dieu Atoum-Rê s'imposa à la tête de l'ennéade divine, à Memphis on vénéra durant les deux premières dynasties le dieu Sokar sous l'aspect d'une momie à tête de faucon qui traversait le Nil ( fleuve sacré) dans sa barque Hénou, afin de faire revivre le soleil sur l'autre rive. C'est probablement sa silhouette gravée sur la massue du Roi Narmer, qui se trouve assise en face du trône royal, ce qui laisse penser que dès la première dynastie officielle, les précurseurs d'Imhotep ont déjà essayé d'introduire cette idée de résurrection à la cour royale tout en essayant de conserver l'image d'Horus l'Ancien en la personne du grand Monarque.
C'est sous la troisième dynastie que s'installera parallèlement Ptah une nouvelle divinité à Memphis qui possède également un aspect de roi momifié, tandis que le clergé confiera au dieu Sokar la garde de la "cité des morts à Saqqarah.endroit nommé Roséatou"
Le dieu Ptah est en quelque sorte une image évoluée de l'Ancien Horus-Sokar qui tout en gardant son aspect de momie royale, serre dans ses mains la croix Ankh égyptienne et le signe Djed symbolisant la colonne dorsale d'Osiris (siège du fluide vital,) sans oublier le sceptre Ouas du pouvoir divin. Sous le nom de Ptah-Tenen ce dieu devient celui qui développe la vie terrestre. Parfois en Haute Egypte on le représente sous l'aspect d'un lion qui en s'unissant avec la déesse lionne Sekhmet engendre le dieu guerrier Néfertoum: symbole de la renaissance perpétuelle du soleil.
Sokar, Ptah et Osiris vont eux-mêmes rapidement se confondre en une seule personne, fusion qui s'accomplira totalement lors de la 3è période intermédiaire (-1085 à -730 av. J.C.)
C'est donc 400 ans avant l'arrivée d'Imhotep, que l'on constate l'introduction de ce dieu des morts à forme humaine qui représente déjà une conception de la vie après la mort.
Contrairement à d'autres religions Imhotep ne va pas bannir toutes les anciennes divinités mais en leur laissant une importance secondaire il va s'en servir pour les transformer et faire passer dans le peuple les idées majeures fondamentales : la conscience, la Justice et la vérité.
Ptah devient le Créateur par le verbe et le Père des dieux
Sokar avec sa barque Henou devient le conducteur des âmes
Osiris devient le dieu qui a le pouvoir de faire renaître les bons.
Il ne suffisait pas d'ordonner la construction des pyramides, il fallait surtout motiver le peuple pour qu'il s'engage et achève de plein gré et avec amour, cet énorme travail.
Parfois l'esprit populaire identifiait Ptah à l'ancien taureau Apis, son culte s'est étendu au Nouvel Empire jusqu'à Deir el Médineh où il fut associé à la déesse (mi-femme, mi serpent) Meresger dans un temple proche de la Vallée où l'on enterrait les reines.
La déesse Hathor (demeure nourricière d'Horus le Jeune). Hathor a revêtu au cours des siècles (comme la déesse hindoue Devi) de multiples aspects allant de la mère protectrice archaïque (femme avec cornes de vache) à la jeune femme séduisante universelle. Sous sa forme ancienne elle devient une copie de Nout la déesse du ciel dont le corps rempli d'étoiles est arc-bouté au-dessus de la planète Terre. Fille de Rê, elle porte entre ses cornes de vache blanche étoilée le soleil, comme pour le protéger. Sous son aspect dangereux elle défend la réputation de son père Rê contre les humains qui l'accusent d'être trop vieux. Rê lui donne son troisième oeil et l'envoie punir les humains, mais elle causa de tels ravages que même Rê s'effraya et lui fit boire de la bière à son insu pour sauver le reste de l'humanité. Sous son côté féminin séducteur elle est non seulement la déesse de l'amour au feu dévorant mais également la déesse de la joie et de la vie. Des surnoms qui laissent rêveur. Elle devient la Dame du Sycomore du Sud, la déesse du Sinaï (!) ou la grande dame du pays de Pount, Hathor dont le nom signifie " la demeure nourricière d'Horus " Elle reste étroitement associée à Isis, certaines ressemblances laissent à penser qu'elle fut également introduite en Egypte par Imhotep. Associée au mythe de l'inondation, elle participe chaque année à la fête annuelle de la "Belle Rencontre " au temple de Dendérah (Haute Egypte). Durant cette fête la déesse s'unissait au dieu Horus d'Edfou. De cette union naissait le petit dieu Ithy patron de la musique et des musiciens. Au Moyen-Empire la déesse sera honorée aux temples de Dendérah et de Thèbes en tant que déesse de la Montagne des Morts et dans cette fonction rejoindra la grande déesse Isis. Or Dendérah est considéré comme un des temples les plus anciens qui aurait déjà été reconstruit six fois avant la période romaine !
Atoum : Grand Dieu Invisible d'Héliopolis (où officiait le Grand-Prêtre Imhotep) Son nom signifie " Celui qui est et qui n'est pas... Le Seigneur de l'univers - Le Tout et le néant" Atoum devint en quelque sorte la force invisible qui régénère le soleil vieillissant et le père de la nouvelle lumière qui traverse l'empire des morts et doit accéder à une nouvelle vie le lendemain. Il est aussi le père qui a engendré la déesse Mâat incarnation de la vérité et de la justice qui est également une des épouses de Rê. Son culte restera très important aussi longtemps que Memphis sera la capitale de l'Egypte, mais lorsque Thèbes remplacera Memphis, Atoum s'éclipsera peu à peu au profit d'Amon, qui n'est en somme qu'une copie spirituelle du dieu-berger Atoum qui prolonge l'image du Dieu Suprême, Omniprésent, Tout-puissant et Invisible à partir d'une nouvelle capitale religieuse (Thèbes au lieu de Memphis). Dès le début de l'Ancien Empire il est le dieu des morts qui participait au jugement des âmes. Associé à Osiris, il restera longtemps le dieu de l'embaumement, rite qu'il a pratiqué la première fois sur la personne d'Osiris, reconstitué et ressuscité par son épouse Isis. Désormais il offre ses services à tous les défunts qu'il guide par les Textes des Pyramides jusqu'aux régions célestes. On le représentait sous la forme d'un homme avec une tête de chacal. (Puis il y aura la parenthèse Akhenaton qui aurait vu l'exode des juifs vers la terre promise)

Auteur: Internet

Info:

[ ancienne Egypte ] [ mythe ] [ légende ] [ historique ]

 

Commentaires: 0

théorie-pratique

Le débat pourrait aider les modèles d’IA à converger vers la vérité

Laisser les systèmes d’IA discuter entre eux peut aider à révéler quand un grand modèle linguistique a commis des erreurs.

En février 2023, Bard, le chatbot d'intelligence artificielle de Google, a affirmé que le télescope spatial James Webb avait capturé la première image d'une planète en dehors de notre système solaire. Ce n'était pas le cas. Lorsque des chercheurs de l'université Purdue ont posé plus de 500 questions de programmation à ChatGPT d'OpenAI, plus de la moitié des réponses étaient inexactes.

Ces erreurs étaient faciles à repérer, mais les experts craignent qu’à mesure que les modèles deviennent plus grands et répondent à des questions plus complexes, leur expertise finira par dépasser celle de la plupart des utilisateurs humains. Si de tels systèmes " surhumains " voient le jour, comment pourrons-nous leur faire confiance ? " Les problèmes que vous essayez de résoudre dépassent vos capacités pratiques ", a déclaré Julian Michael, informaticien au Centre de science des données de l'Université de New York. " Comment superviser un système pour qu'il accomplisse avec succès une tâche que vous ne pouvez pas réaliser ? "

Une possibilité est aussi simple qu'extravagante : laisser deux grands modèles débattre de la réponse à une question donnée, avec un modèle plus simple (ou un humain) chargé de reconnaître la réponse la plus précise. En théorie, le processus permet aux deux agents de mettre en évidence les failles dans les arguments de l'autre jusqu'à ce que le juge dispose de suffisamment d'informations pour discerner la vérité. L'approche a été proposée pour la première fois il y a six ans, mais deux séries de conclusions ont été publiées plus tôt cette année, l'une en février de la startup d'IA Anthropic et le deuxième en juillet de Google DeepMind — offrent la première preuve empirique que le débat entre deux LLM aide un juge (humain ou machine) à reconnaître la vérité.

" Ces travaux ont été très importants dans ce qu'ils ont apporté ", a déclaré Michael. Ils offrent également de nouvelles pistes à explorer. Pour ne citer qu'un exemple, Michael et son groupe ont rapporté en septembre que le fait d'entraîner les participants IAs qui débattent à gagner - et pas seulement à converser, comme dans les deux études précédentes - augmentait encore la capacité des juges non-experts à reconnaître la vérité.

L'argument

La création de systèmes d’IA fiables s’inscrit dans un objectif plus vaste appelé alignement, qui vise à garantir qu’un système d’IA partage les mêmes valeurs et objectifs que ses utilisateurs humains. Aujourd’hui, l’alignement repose sur le retour d’information humain, c’est-à-dire sur l’évaluation de l’IA par des personnes. Mais ce retour d’information pourrait bientôt être insuffisant pour garantir l’exactitude d’un système. Ces dernières années, les chercheurs ont de plus en plus appelé à de nouvelles approches en matière de " surveillance évolutive ", qui constituent un moyen de garantir la véracité même lorsque des systèmes surhumains effectuent des tâches que les humains ne peuvent pas effectuer.

Les informaticiens réfléchissent depuis des années à la supervision évolutive. Le débat sur une approche possible a émergé en 2018, avant que les LLM ne deviennent aussi importants et omniprésents qu'ils le sont aujourd'hui. L'un de ses architectes était Geoffrey Irving, qui est aujourd’hui le scientifique en chef de l’Institut de sécurité de l’IA du Royaume-Uni. Il a rejoint OpenAI en 2017, deux ans avant que la société ne lance GPT-2, l’un des premiers LLM à avoir suscité un large intérêt, dans l’espoir de travailler à l’alignement des systèmes d’IA sur les objectifs humains. Leur objectif était la sécurité, a-t-il déclaré, " en essayant simplement de demander aux humains ce qu’ils veulent et [d’amener le modèle à] le faire ".

Son collègue Paul Christiano, aujourd’hui responsable de la sécurité à l’Institut américain de sécurité de l’IA, a abordé ce problème en cherchant des moyens de décomposer des questions complexes en questions plus petites et plus faciles auxquelles un modèle de langage pourrait répondre honnêtement. " Le débat est devenu une variante de ce schéma ", a déclaré Irving, où des arguments successifs ont effectivement divisé une question plus vaste en composants plus petits qui pouvaient être jugés comme exacts.

Irving et Christiano ont travaillé avec Dario Amodei (qui a fondé Anthropic avec sa sœur Daniela en 2021) sur l'utilisation du débat dans les systèmes de langage naturel. (Étant donné que c'était avant GPT-2, les modèles de langage étaient trop faibles pour tester le débat de manière empirique, ils se sont donc concentrés sur des arguments conceptuels et une expérience de jeu-jouet.) L'idée était simple : poser une question à deux copies similaires d'un modèle d'IA puissant et les laisser trouver la réponse pour convaincre un juge qu'ils ont raison. Irving a comparé cela au jeu en solo, qui a aidé les systèmes d'IA à améliorer leurs stratégies dans des jeux comme les échecs et le Go.

Le trio a conçu des jeux rudimentaires impliquant des images et des questions textuelles. Dans l’un des jeux, deux modèles d’IA avaient chacun accès à la même image représentant le chiffre 5. L’un des modèles affirmait que l’image était en fait le chiffre 5, l’autre qu’il s’agissait d’un 6. Les modèles concurrents se relayaient pour révéler plus de pixels au juge, ce qui constituait un modèle plus faible. Après six tours, le juge a deviné le chiffre avec précision dans 89 % des cas. Lorsqu’on lui montrait des pixels aléatoires, le juge n’a deviné correctement que dans 59 % des cas.

Cet exemple simple, décrit en octobre 2018, a suggéré que le débat pouvait conférer un avantage. Mais les auteurs ont noté plusieurs réserves. Les humains ont tendance à croire ce qu’ils veulent entendre, par exemple, et dans des situations réelles, cet instinct peut prendre le pas sur l’avantage du débat. En outre, certaines personnes sont probablement plus aptes à juger les débats que d’autres – peut-être en est-il de même pour les modèles linguistiques ?

Les auteurs ont également appelé à une meilleure compréhension de la façon dont les humains pensent. Dans un essai de 2019, Irving et Amanda Askell, aujourd'hui chez Anthropic, ont fait valoir que si les systèmes d'IA veulent s'aligner sur les valeurs humaines, nous devons mieux comprendre comment les humains agissent en fonction de nos valeurs. Selon eux, la recherche sur l'IA doit intégrer davantage de travaux sur la manière dont les humains prennent des décisions et parviennent à des conclusions sur la vérité et le mensonge. Les chercheurs ne seront pas en mesure de comprendre comment organiser un débat s'ils ne savent pas comment les gens jugent les arguments ou comment ils parviennent à la vérité.

Pouvoir de persuasion

Un petit sous-ensemble d'informaticiens et de linguistes ont rapidement commencé à rechercher les avantages du débat. Ils ont trouvé des exemples où cela n'a pas aidé.  Dans une étude de 2022 les chercheurs ont soumis des humains à un test difficile à choix multiples et ont demandé aux LLM de fournir des arguments pour différentes réponses. Mais les personnes qui ont entendu les arguments générés par l'IA n'ont pas obtenu de meilleurs résultats au test que celles qui n'ont pas interagi du tout avec les LLMs.

Même si les LLM n'ont pas aidé les humains, certains indices laissaient penser qu'ils pourraient aider les modèles linguistiques. Dans un article de 2023, les chercheurs ont rapporté que lorsque plusieurs copies d'un LLM étaient autorisées à débattre et à converger vers une réponse, plutôt que de convaincre un juge, elles se montraient plus précises, plus souvent. Les deux résultats de cette année sont parmi les premiers tests empiriques à montrer qu'un débat entre LLM peut fonctionner lorsqu'il est jugé par un autre modèle, moins informé.

Le groupe Anthropic a montré à deux modèles experts des extraits d'une histoire de science-fiction, puis leur a posé des questions de compréhension. Chaque modèle a proposé une réponse et, au cours de plusieurs tours, a défendu sa propre réponse et a argumenté contre l'autre. Un juge évaluait ensuite les arguments et décidait qui avait raison. Dans certains cas, le juge avait accès à des citations vérifiées du texte original ; dans d'autres pas.

Lorsque les LLM avaient été entraînés spécifiquement pour être persuasifs, les juges LLM non experts sont parvenus à la bonne réponse dans 76 % des cas. En revanche, lors des tests sans débat, les juges non humains n'ont répondu correctement que dans 54 % des cas, un résultat à peine meilleur qu'en tirant à pile ou face.

" Ils ont réussi à rendre les modèles suffisamment performants en matière de débat pour que l'on puisse commencer à voir des résultats ", a déclaré Michael. 

Deux mois plus tard, l’équipe de Google DeepMind a présenté une expérience similaire avec une variété de tâches et de contraintes, en laissant les modèles linguistiques choisir leur propre camp dans le débat, par exemple. Les tâches comprenaient des questions de compréhension de lecture à choix multiples, des questions sur des articles de Wikipédia et des questions de type oui/non sur des sujets de mathématiques et de sciences de niveau universitaire. Certaines questions impliquaient des images et du texte.

Dans toutes les tâches et configurations expérimentales, le débat a toujours conduit à une plus grande précision. C’était encourageant et pas totalement inattendu. " En principe, nous nous attendons à ce que le débat surpasse ces valeurs de référence dans la plupart des tâches ", a déclaré Zachary Kenton, qui a codirigé l’étude DeepMind. " C’est parce que le juge a l’occasion de voir les deux faces de l’argument dans un débat et devrait donc être mieux informé. "

Avec ces deux études, les chercheurs ont montré pour la première fois que le débat pouvait faire la différence en permettant à d’autres systèmes d’IA de juger de l’exactitude des déclarations d’un LLM. C’est une étape passionnante, mais il reste encore beaucoup de travail avant que nous puissions tirer parti de manière fiable de la confrontation de débatteurs numériques.

Ludifier le débat

La première question est de savoir dans quelle mesure les LLM sont sensibles aux spécificités de leurs contributions et à la structure de l’argumentation. Le comportement des LLM " est sensible à des caractéristiques sans importance telles que le fait de savoir quel débatteur a eu le dernier mot ", a déclaré Kenton. " Ce qui peut conduire à ce que les débats ne dépassent pas ces bases de référence simples sur certaines tâches. "

Ce n’est qu’un début. Le groupe Anthropic a trouvé des preuves montrant que les juges d’IA peuvent être influencés par un argument plus long, même s’il est moins convaincant. D’autres tests ont montré que les modèles peuvent montrer ce qu’on appelle un biais de flagornerie – la tendance d’un LLM à revenir sur une réponse correcte pour faire plaisir à l’utilisateur.  Beaucoup de gens ont cette expérience avec des modèles où il dit quelque chose, et si vous dites “Non, c’est faux”, il dira “Oh, je suis vraiment désolé”, a déclaré Michael. " Le modèle dit “Oh, vous avez raison. Deux plus deux font cinq.” 

Il faut également prendre en compte la situation dans son ensemble : les chercheurs de l'Oxford Internet Institute soulignent que même si les nouveaux articles apportent des preuves empiriques selon lesquelles les LLM peuvent s'orienter mutuellement vers l'exactitude, les résultats ne sont peut-être pas applicables à grande échelle. Sandra Wachter, qui étudie l'éthique et le droit, souligne que les tests comportaient des réponses clairement bonnes ou mauvaises. " C'est peut-être vrai pour un domaine comme les mathématiques, où il existe une vérité de base acceptée, mais dans d'autres cas, " c'est très compliqué, ou c'est très gris, ou vous avez besoin de beaucoup de nuances ". En fin de compte, ces modèles ne sont pas encore totalement compris, ce qui rend difficile de leur faire confiance en tant que juges potentiels.

Enfin, Irving souligne que les chercheurs qui travaillent sur le débat devront répondre à des questions plus vastes. Le débat exige que les débatteurs soient meilleurs que le juge, mais " meilleurs " dépendra de la tâche. " Quelle est la notion-dimension à propos de laquelle les débatteurs en savent le plus? ", a-t-il demandé. Dans ces tests, il s'agit de connaissances. Dans les tâches qui nécessitent du raisonnement ou, par exemple, comment câbler une maison électriquement, cette dimension peut être différente.

Selon Irving, trouver des solutions de surveillance évolutives est un défi critique et ouvert en matière de sécurité de l’IA à l’heure actuelle.

Il est donc encourageant de disposer de preuves empiriques de l’efficacité d’une méthode, même dans certaines situations seulement. " Ce sont des pas dans la bonne direction ", a déclaré Irving. " Il se pourrait que nous poursuivions ces expériences et obtenions des résultats positifs, qui s’amélioreront avec le temps. "


 

 

Auteur: Internet

Info: https://www.quantamagazine.org/, Stephen Ornes, 8 novembre 2024

[ dualité ] [ IAs perroquets ] [ théorie-pratique ] [ limitation booléenne ]

 

Commentaires: 0

Ajouté à la BD par miguel

homme-machine

La théorie des jeux peut rendre l'IA plus correcte et plus efficace

Les chercheurs s’appuient sur des idées issues de la théorie des jeux pour améliorer les grands modèles de langage et les rendre plus cohérents.

Imaginez que vous ayez un ami qui donne des réponses différentes à la même question, selon la façon dont vous la posez. " Quelle est la capitale du Pérou ? "  btiendrait une réponse : " Lima est-elle la capitale du Pérou ? " en obtiendrait un autre. Vous seriez probablement un peu inquiet au sujet des facultés mentales de votre ami et vous auriez certainement du mal à faire confiance à ses réponses.

C'est exactement ce qui se passe avec de nombreux grands modèles de langage (LLM), les outils d'apprentissage automatique ultra-puissants qui alimentent ChatGPT et d'autres merveilles de l'intelligence artificielle. Une question générative, ouverte, donne une réponse, et une question discriminante, qui implique de devoir choisir entre des options, en donne souvent une différente. "Il y a un décalage lorsque la même question est formulée différemment", a déclaré Athul Paul Jacob , doctorant au Massachusetts Institute of Technology.

Pour rendre les réponses d'un modèle de langage plus cohérentes - et rendre le modèle globalement plus fiable - Jacob et ses collègues ont conçu un jeu dans lequel les deux modes du modèle sont amenés à trouver une réponse sur laquelle ils peuvent s'entendre. Surnommée le jeu du consensus , cette procédure simple oppose un LLM à lui-même, en utilisant les outils de la théorie des jeux pour améliorer la précision et la cohérence interne du modèle.

"Les recherches explorant l'autocohérence au sein de ces modèles ont été très limitées", a déclaré Shayegan Omidshafiei , directeur scientifique de la société de robotique Field AI. "Cet article est l'un des premiers à aborder ce problème, de manière intelligente et systématique, en créant un jeu permettant au modèle de langage de jouer avec lui-même."

"C'est un travail vraiment passionnant", a ajouté Ahmad Beirami, chercheur scientifique chez Google Research. Pendant des décennies, a-t-il déclaré, les modèles linguistiques ont généré des réponses aux invites de la même manière. "Avec leur idée novatrice consistant à intégrer un jeu dans ce processus, les chercheurs du MIT ont introduit un paradigme totalement différent, qui peut potentiellement conduire à une multitude de nouvelles applications."

Mettre le jeu au travail

Ce nouveau travail, qui utilise les jeux pour améliorer l'IA, contraste avec les approches précédentes, qui mesuraient le succès d'un programme d'IA via sa maîtrise des jeux. En 1997, par exemple, l'ordinateur Deep Blue d'IBM a battu le grand maître d'échecs Garry Kasparov – une étape importante pour les machines dites pensantes. Dix-neuf ans plus tard, un programme de Google DeepMind nommé AlphaGo a remporté quatre matchs sur cinq contre l'ancien champion de Go Lee Sedol, révélant ainsi une autre arène dans laquelle les humains ne régnaient plus en maître. Les machines ont également surpassé les humains dans les jeux de dames, le poker à deux joueurs et d’autres jeux à somme nulle, dans lesquels la victoire d’un joueur condamne invariablement l’autre.

Le jeu de la diplomatie, un jeu favori de politiciens comme John F. Kennedy et Henry Kissinger, posait un défi bien plus grand aux chercheurs en IA. Au lieu de seulement deux adversaires, le jeu met en scène sept joueurs dont les motivations peuvent être difficiles à lire. Pour gagner, un joueur doit négocier et conclure des accords de coopération que n'importe qui peut rompre à tout moment. La diplomatie est tellement complexe qu'un groupe de Meta s'est félicité qu'en 2022, son programme d'IA Cicero ait développé un « jeu de niveau humain » sur une période de 40 parties. Bien qu'il n'ait pas vaincu le champion du monde, Cicero s'est suffisamment bien comporté pour se classer dans les 10 % les plus performants face à des participants humains.

Au cours du projet, Jacob — membre de l'équipe Meta — a été frappé par le fait que Cicéron s'appuyait sur un modèle de langage pour générer son dialogue avec les autres joueurs. Il a senti un potentiel inexploité. L'objectif de l'équipe, a-t-il déclaré, " était de créer le meilleur modèle de langage possible pour jouer à ce jeu ". Mais qu'en serait-il s’ils se concentraient plutôt sur la création du meilleur jeu possible pour améliorer les performances des grands modèles de langage ?

Interactions consensuelles

En 2023, Jacob a commencé à approfondir cette question au MIT, en travaillant avec Yikang Shen, Gabriele Farina et son conseiller Jacob Andreas sur ce qui allait devenir le jeu du consensus. L'idée centrale est venue d'imaginer une conversation entre deux personnes comme un jeu coopératif, où le succès se concrétise lorsqu'un auditeur comprend ce que l'orateur essaie de transmettre. En particulier, le jeu de consensus est conçu pour aligner les deux systèmes du modèle linguistique : le générateur, qui gère les questions génératives, et le discriminateur, qui gère les questions discriminatives.

Après quelques mois d’arrêts et de redémarrages, l’équipe a transposé ce principe dans un jeu complet. Tout d'abord, le générateur reçoit une question. Cela peut provenir d’un humain, ou d’une liste préexistante. Par exemple, " Où est né Barack Obama ? " Le générateur obtient ensuite des réponses de candidats, disons Honolulu, Chicago et Nairobi. Encore une fois, ces options peuvent provenir d'un humain, d'une liste ou d'une recherche effectuée par le modèle de langage lui-même.

Mais avant de répondre, il est également indiqué au générateur s'il doit répondre correctement ou incorrectement à la question, en fonction des résultats d'un pile ou face équitable.

Si c'est face, alors la machine tente de répondre correctement. Le générateur envoie la question initiale, accompagnée de la réponse choisie, au discriminateur. Si le discriminateur détermine que le générateur a intentionnellement envoyé la bonne réponse, chacun obtient un point, en guise d'incitation.

Si la pièce tombe sur pile, le générateur envoie ce qu’il pense être la mauvaise réponse. Si le discriminateur décide qu’on lui a délibérément donné la mauvaise réponse, ils marquent à nouveau tous les deux un point. L’idée ici est d’encourager l’accord. " C'est comme apprendre un tour à un chien ", a expliqué Jacob. " On lui donne une friandise lorsqu'ils fait la bonne chose. "

Le générateur et le discriminateur commencent également doté chacun de  quelques " croyances " initiales. Credo sous forme d'une distribution de probabilité liée aux différents choix. Par exemple, le générateur peut croire, sur la base des informations qu'il a glanées sur Internet, qu'il y a 80 % de chances qu'Obama soit né à Honolulu, 10 % de chances qu'il soit né à Chicago, 5 % de chances qu'il soit né à Nairobi et 5 % de chances qu'il soit ailleurs. Le discriminateur peut commencer avec une distribution différente. Si les deux " acteurs " sont toujours récompensés après être parvenus à un accord, ils se voient également retirer des points s'ils s'écartent trop de leurs convictions initiales. Cet arrangement encourage les joueurs à intégrer leur connaissance du monde – toujours tirée d'Internet – dans leurs réponses, ce qui devrait rendre le modèle plus précis. Sans ce prérequis ils pourraient s’entendre sur une réponse totalement fausse comme celle de Delhi, mais accumuler quand même des points.

Pour chaque question, les deux systèmes jouent environ 1 000 parties l'un contre l'autre. Au cours de ces nombreuses itérations, chaque camp apprend les croyances de l'autre et modifie ses stratégies en conséquence.

Finalement, le générateur et le discriminateur commencent à être davantage d’accord à mesure qu’ils s’installent dans ce qu’on appelle l’équilibre de Nash. C’est sans doute le concept central de la théorie des jeux. Cela représente une sorte d’équilibre dans un jeu – le point auquel aucun joueur ne peut améliorer ses résultats personnels en changeant de stratégie. Au jeu du chifoumi, par exemple, les joueurs obtiennent de meilleurs résultats lorsqu'ils choisissent chacune des trois options exactement un tiers du temps, et ils obtiendront invariablement de moins bons résultats avec toute autre tactique.

Dans le jeu du consensus, cela peut se jouer de plusieurs manières. Le discriminateur pourrait observer qu'il marque un point lorsqu'il dit " correct " chaque fois que le générateur envoie le mot " Honolulu " pour le lieu de naissance d'Obama. Le générateur et le discriminateur apprendront, après avoir joué plusieurs fois, qu'ils seront récompensés s'ils continuent de le faire, et qu'aucun d'eux n'aura aucune motivation pour faire autre chose... consensus qui représente l'un des nombreux exemples possibles d'équilibre de Nash pour cette question. Le groupe du MIT s'est également appuyé sur une forme modifiée d'équilibre de Nash qui intègre les croyances antérieures des joueurs, ce qui permet de maintenir leurs réponses ancrées dans la réalité.

L'effet net, ont observé les chercheurs, est de rendre le modèle linguistique jouant ce jeu plus précis et plus susceptible de donner la même réponse, quelle que soit la façon dont la question est posée. Pour tester les effets du jeu du consensus, l'équipe a essayé une série de questions standard sur divers modèles de langage de taille modérée comportant de 7 milliards à 13 milliards de paramètres. Ces modèles ont systématiquement obtenu un pourcentage plus élevé de réponses correctes que les modèles qui n'avaient pas joué, même ceux de taille beaucoup plus importante, comportant jusqu'à 540 milliards de paramètres. La participation au jeu a également amélioré la cohérence interne d'un modèle.

En principe, n'importe quel LLM pourrait gagner à jouer contre lui-même, et 1 000 tours ne prendraient que quelques millisecondes sur un ordinateur portable standard. "Un avantage appréciable de l'approche globale", a déclaré Omidshafiei, "est qu'elle est très légère sur le plan informatique, n'impliquant aucune formation ni modification du modèle de langage de base."

Jouer à des jeux avec le langage

Après ce premier succès, Jacob étudie désormais d’autres moyens d’intégrer la théorie des jeux dans la recherche LLM. Les résultats préliminaires ont montré qu’un LLM déjà solide peut encore s’améliorer en jouant à un jeu différent – ​​provisoirement appelé jeu d’ensemble – avec un nombre arbitraire de modèles plus petits. Le LLM principal aurait au moins un modèle plus petit servant d’allié et au moins un modèle plus petit jouant un rôle antagoniste. Si l'on demande au LLM primaire de nommer le président des États-Unis, il obtient un point chaque fois qu'il choisit la même réponse que son allié, et il obtient également un point lorsqu'il choisit une réponse différente de celle de son adversaire. Ces interactions avec des modèles beaucoup plus petits peuvent non seulement améliorer les performances d'un LLM, suggèrent les tests, mais peuvent le faire sans formation supplémentaire ni modification des paramètres.

Et ce n'est que le début. Étant donné qu'une variété de situations peuvent être considérées comme des jeux, les outils de la théorie des jeux peuvent être mis en œuvre dans divers contextes du monde réel, a déclaré Ian Gemp , chercheur scientifique chez Google DeepMind. Dans un article de février 2024 , lui et ses collègues se sont concentrés sur des scénarios de négociation qui nécessitent des échanges plus élaborés que de simples questions et réponses. "L'objectif principal de ce projet est de rendre les modèles linguistiques plus stratégiques", a-t-il déclaré.

Un exemple dont il a parlé lors d'une conférence universitaire est le processus d'examen des articles en vue de leur acceptation par une revue ou une conférence, en particulier après que la soumission initiale ait reçu une évaluation sévère. Étant donné que les modèles linguistiques attribuent des probabilités à différentes réponses, les chercheurs peuvent construire des arbres de jeu similaires à ceux conçus pour les jeux de poker, qui tracent les choix disponibles et leurs conséquences possibles. "Une fois que vous avez fait cela, vous pouvez commencer à calculer les équilibres de Nash, puis classer un certain nombre de réfutations", a déclaré Gemp. Le modèle vous dit essentiellement : c'est ce que nous pensons que vous devriez répondre.

Grâce aux connaissances de la théorie des jeux, les modèles de langage seront capables de gérer des interactions encore plus sophistiquées, plutôt que de se limiter à des problèmes de type questions-réponses. "Le gros gain à venir réside dans les conversations plus longues", a déclaré Andreas. "La prochaine étape consiste à faire interagir une IA avec une personne, et pas seulement avec un autre modèle de langage."

Jacob considère le travail de DeepMind comme complémentaire aux jeux de consensus et d'ensemble. " À un niveau élevé, ces deux méthodes combinent des modèles de langage et la théorie des jeux ", a-t-il déclaré, même si les objectifs sont quelque peu différents. Alors que le groupe Gemp transforme des situations courantes dans un format de jeu pour aider à la prise de décision stratégique, Jacob a déclaré : " nous utilisons ce que nous savons de la théorie des jeux pour améliorer les modèles de langage dans les tâches générales. "

À l’heure actuelle, ces efforts représentent " deux branches du même arbre ", a déclaré Jacob : deux manières différentes d’améliorer le fonctionnement des modèles de langage. " Je pense personnellement  que dans un an ou deux, ces deux branches convergeront. " 

Auteur: Internet

Info: https://www.quantamagazine.org/ - Steve Nadis, 9 mai 2024

[ maïeutique machine-machine ] [ discussion IA - FLP ]

 
Commentaires: 1
Ajouté à la BD par miguel

mnémotechnie

“Dans la mémorisation, ce qui ne fonctionne pas du tout c’est de relire son cours” 

Sébastien Martinez, ingénieur de formation, s’est imposé comme une référence dans l’art de la mémorisation. Champion de France de mémoire depuis 2015, formateur reconnu, conférencier, auteur et président de l’Association des sports de mémoire, il enseigne des techniques concrètes à destination des étudiants, des enseignants et des professionnels. Entre associations créatives, attention ciblée et méthodes d’entraînements, il partage des techniques simples et accessibles pour renforcer la mémoire au quotidien.

Pour commencer, pouvez-vous nous expliquer comment vous en êtes venu à vous passionner pour la mémorisation et quelle est la mission que vous vous êtes fixée ?

- Ma mission, c’est de me dire que ces méthodes pour la plupart sont millénaires et devraient être enseignées à l’école. Aujourd’hui, j’ai deux casquettes. Je suis président de l’Association des sports de mémoire que j’ai co-créée en 2020, et on organise tous les ans un championnat pour faire grandir cette communauté d’athlètes de la mémoire.

Et d’un autre côté, j’ai également créé un centre de formation. Là, je donne des formations aussi bien auprès des enseignants que des élèves. La plupart du temps, ce sont quand même des étudiants qui passent des concours, de première à cinquième année de médecine par exemple. J’ai aussi pas mal d’élèves de l’école du Louvre à Paris.

Sinon, J’ai également des échanges avec des associations de parents d’élèves, des écoles. Et là, la démarche c’est plutôt de redonner confiance aux élèves, de leur montrer qu’on est capable d’apprendre.

- Comment devient-on champion de France de mémoire ?

- Il faut s’inscrire à une compétition, s’entraîner et, évidemment, essayer de la gagner. Dans ces championnats, il y a dix épreuves en tout : mémorisation de chiffres, de mots, de trombinoscopes, de jeux de cartes… Pour gagner, il faut s’entraîner. Plus on s’entraîne, plus on va vite, plus on peut mémoriser de mots, et plus on marque de points dans l’épreuve. Finalement, la mémoire, c’est comme un sport : c’est un muscle qu’on travaille pour atteindre le plus haut niveau en compétition.

Après, je tiens à préciser que ce n’est pas la mémoire en tant que telle qu’on entraîne, mais plutôt la faculté à mémoriser. Concrètement, la mémoire, on la considère comme un disque dur sans limite. Par contre, notre capacité à écrire sur ce disque dur, ça, on peut l’entraîner, et c’est ça qu’on peut voir comme un muscle. Mais la mémoire elle-même étant infinie, on ne peut pas " entraîner " quelque chose d’infini.

Vous évoquez des techniques de mémorisation " millénaires ". Pour ceux qui souhaitent découvrir ces méthodes, quels sont les grands principes à retenir pour améliorer sa mémoire au quotidien ?

- Il y a trois grandes facultés à développer : l’attention, l’association et la répétition (ou l’entraînement). Toute stratégie qui fait travailler l’une de ces trois compétences est forcément bénéfique. Souvent, on néglige l’association, donc je conseille vraiment de commencer par là, parce que c’est la moins intuitive.

Il existe deux façons d’associer : la méthode rationnelle, cartésienne, et la méthode plus " loufoque ". Par exemple, si vous voulez retenir le mot " bradycardie ", vous pouvez vous appuyer sur l’étymologie : " brady " qui signifie " lent " et " cardie " qui renvoie au rythme cardiaque. C’est un lien logique. Mais parfois, on n’a pas accès à cette logique car on est trop débutant, que c’est trop compliqué, ou bien qu’il n’y a pas de logique du tout. Dans ces cas-là, on se tourne vers l’association farfelue.

Dans mon dernier livre, je prends l’exemple des dieux grecs et romains. Pour Zeus, on l’imagine souvent en vieux barbu avec un éclair à la main, mais un enfant de moins de dix ans ne va peut-être pas avoir cette image. Lui, il va plutôt penser à un œuf, parce que " œuf " ressemble à " Zeus ". Et pour Jupiter, la version romaine, on peut imaginer la planète… ou une jupe si on ne connaît pas encore les planètes. Du coup, on se retrouve avec un œuf qui porte une jupe, et voilà un lien qui va marquer l’esprit de l’enfant. L’idée c’est de trouver du sens avec ses propres références. Plus c’est personnel, plus le cerveau s’active, et plus la rétention à moyen et long terme est efficace.

Pour l’anecdote, je viens de terminer un cycle de formation avec des collégiens de 3e. Il y avait notamment une professeure d’anglais qui avait proposé comme exercice de mémoriser les États américains, les 12 ou 13 premiers je crois. Elle me disait que ce qui est génial, c’est qu’ils n’ont pas du tout les mêmes références. Par exemple, pour l’État de Georgia, plein d’élèves ont pensé à Cristiano Ronaldo parce que sa compagne s’appelle Georgina.

Elle a refait le même exercice avec d’autres classes, un peu plus studieuses, plus " scolaires ", et ces élèves-là avaient des références plus classiques. Eh bien, ceux qui sont partis dans tous les sens, avec des références plus personnelles, ont mieux réussi à retenir. Et ça, c’est vraiment un lâcher-prise quand on est pédagogue. Nous, on a nos propres références, on va alimenter nos élèves, nos enfants, avec ce qu’on connaît. Mais si on ne va pas chercher leurs références à eux, ça marchera moins bien.

- Construire des associations personnelles ou " farfelues " semble demander un effort supplémentaire. Que répondez-vous à ceux qui craignent que ces techniques soient trop contraignantes à mettre en place ?

- On peut avoir l’impression que ça demande un effort en plus, mais il faut retenir deux choses. Premièrement, il faut vraiment passer par les trois étapes dont on parlait. Si on n’en fait qu’une seule, ça ne sert à rien. Ensuite, il faut forcément manipuler ce qu’on a appris.

La deuxième chose, c’est qu’on a souvent le sentiment que tout ça demande plus d’efforts, mais il faut comprendre que notre cerveau est en quelque sorte " enfermé " dans la boîte crânienne, sans contact direct avec l’extérieur. Ses seules interfaces, ce sont notre corps et nos cinq sens. À l’intérieur, tout n’est que signaux électriques. Donc, quand on cherche à activer notre cerveau, chaque sens stimule une zone cérébrale différente. Plus on fait appel à nos cinq sens, plus on active notre cerveau et meilleure est la rétention de l’information.

- Lorsque l’on souhaite réviser ou apprendre, y a-t-il des pratiques répandues qui peuvent au contraire nous freiner dans notre mémorisation ? Quels sont selon vous les " red flags " à éviter

Dans la mémorisation, ce qui ne fonctionne pas du tout quand on révise, c’est de relire son cours. Relire, c’est une perte de temps. Ce qu’il faut faire à la place, c’est s’entraîner. Par exemple, à Harvard, ils ont mis en place un protocole : il y a d’abord 30 minutes de cours, puis, à la fin, la classe est divisée en trois groupes. Le premier groupe ne fait rien, le deuxième relit ses notes, et le troisième répond à des questions. On recommence ensuite la même séquence de 30 minutes de cours, on reforme les trois groupes, et on répète ça pendant deux heures, donc quatre fois au total. À la fin, il y a une évaluation.

Le résultat, c’est que le premier et le deuxième groupe obtiennent en moyenne les mêmes scores, alors que le troisième groupe (celui qui se teste en répondant aux questions) a un résultat nettement supérieur. C’est ce qu’on appelle “ l’effet test ”. Au lieu de commencer par relire quand on révise, il vaut mieux commencer par se tester. Il y a deux façons de faire : la “ feuille blanche ” (on prend une feuille et on note tout ce dont on se souvient du cours), qui est la méthode la plus efficace mais aussi la plus difficile, ou bien, si on a préparé des questions, on y répond directement. Sinon, on peut prendre le plan du cours, le regarder et essayer de retrouver le contenu.

Pourquoi est-ce plus efficace ? Parce qu’on a plusieurs biais cognitifs, dont le premier est le biais de confirmation. Quand on relit ses notes, on ne fait que regarder ce qu’on connaît déjà et on entretient ce qu’on appelle “ l’illusion de la connaissance ”. Ça explique pourquoi tant d’élèves sortent d’un contrôle en disant : “ Mon prof est un sadique, il m’a interrogé sur la partie que je ne connaissais pas. ” En réalité, ils se sont contentés de relire leur cours, donc ils n’en maîtrisaient que 20 %.

Alors que si on commence par se tester, parfois on ne retrouve pas grand-chose, parfois on se souvient de pas mal de points. Dans les deux cas, ça rend la relecture suivante beaucoup plus efficace, parce qu’on ne relit pas ce qu’on connaît déjà (pas de temps à perdre) et on se focalise sur ce qui nous manque ou qu’on a mal retenu. Le gros “ red flag ”, c’est de vouloir commencer par relire ses cours pour être précis… On voit que ça ne suffit pas !

- Après il y a d’autres biais bien sûr. En ce qui concerne l’attention, le plus gros “ red flag ”, c’est de vouloir travailler jusqu’à l’épuisement. J’ai beaucoup d’élèves qui s’imposent des séances de deux heures non-stop, et, à la fin, ils sont complètement vidés, ils arrêtent et ne reprennent jamais. Il vaut mieux fractionner, comme en sport. La méthode la plus connue, c’est le Pomodoro : on travaille 25 minutes, puis on fait 5 minutes de pause. Ça marche super bien, parce qu’on est intense pendant 25 minutes, puis on récupère un peu.

Donc l’idée, c’est de faire des petites pauses régulièrement, plutôt que de s’acharner jusqu’à être épuisé — j’exagère un peu, mais vous voyez le principe. On fractionne son temps, et on est beaucoup plus efficace à long terme.

- Une étude récente de l’Inserm s’inquiète de la baisse des capacités cognitives chez les enfants, notamment à cause de l’omniprésence des écrans. Comment analysez-vous l’impact des nouvelles technologies et des réseaux sociaux sur notre capacité d’attention et de mémorisation ?

- Moi, j’invite les jeunes à prendre un peu de hauteur là-dessus. En tant qu’ingénieur, je me rends bien compte que ce ne sont pas tant les écrans en eux-mêmes le problème, mais plutôt les applis et les réseaux sociaux, conçus pour maximiser leurs profits. Et pour gagner plus, ils cherchent à maximiser le temps qu’on passe dessus. Quand on comprend ça, on voit vite qu’ils ne sont pas nos alliés : leur but n’est pas notre bien-être, mais de nous rendre accrocs.

Du coup, je conseille de mettre en place des “ rituels de désintoxication ”. Par exemple, le soir, à partir de 17-18h, je pose mon téléphone loin de moi, en général dans mon bureau. Comme ça, il faut faire l’effort d’aller le chercher. Et puis, le dimanche, je coupe tout : mon téléphone ne me sert plus que pour passer ou recevoir des appels, c’est tout.

L’idée, c’est de s’aménager des moments sans rien faire. Pendant des milliers d’années, notre cerveau a évolué en s’ennuyant de temps en temps. Quand on s’ennuie, certains processus essentiels s’enclenchent. Alors que scroller sur son smartphone, ce n’est pas “ne rien faire” : on ne laisse pas au cerveau l’occasion de déclencher ces mécanismes dont il a besoin pour rester en bonne santé. En gros, je recommande de se créer des “espaces d’ennui”.

- Pour conclure, vous soulignez régulièrement l’importance de facteurs comme le stress, la fatigue ou l’anxiété. Concrètement, en quoi ces éléments peuvent-ils nuire à une bonne mémorisation, et que recommandez-vous pour y remédier ?

- Sur le stress, il y a au moins deux aspects à prendre en compte. D’abord, sur le long terme, dans les organisations ou en classe, on sait qu’un enfant apprend mieux dans un environnement bienveillant. Pourquoi ? Parce que dans un environnement bienveillant, on s’autorise à faire des erreurs et on reçoit des retours constructifs de la part du groupe, ce qui nous fait progresser. À l’inverse, dans un environnement stressant, on va essayer de dissimuler ses erreurs, et du coup, on n’apprend pas. C’est la dimension " groupe ".

Ensuite, du point de vue individuel, j’ai un exemple à vous donner. Le 28 novembre, j’étais invité sur le Magazine de la santé, où l’on m’a demandé de faire une démonstration de mémorisation en direct de 20 mots à retenir en 1 minute 30. Avec l’expérience, je sais qu’entre ce que j’arrive à faire chez moi et ce que je fais en plateau, je dois généralement multiplier mon temps par deux ou trois. À la maison, mon record pour 20 mots est de 26 secondes. Sur le plateau, j’ai donc demandé 1 minute 30, parce qu’il y a la pression du direct, 500 000 téléspectateurs, tout ça est stressant ! Le stress impacte directement nos capacités. Et pas seulement le stress, d’ailleurs, mais aussi tous les éléments perturbateurs extérieurs.



 



 

Auteur: Internet

Info: https://www.vousnousils.fr/, Benjamin Galle-Tessonneau, Jan 8, 2025

[ corps-esprit ] [ triade ] [ intellection ] [ remémoration ]

 

Commentaires: 0

Ajouté à la BD par miguel

infra-monde

Première carte réalisée à partir de la géométrie quantique secrète d'un solide

Des physiciens ont récemment cartographié la forme cachée qui sous-tend les comportements quantiques d'un cristal, en utilisant une nouvelle méthode qui devrait devenir omniprésente.

Il est bien connu qu'à l'échelle quantique, les particules peuvent se trouver simultanément à plusieurs endroits. L'état d'une particule se propage comme une onde, atteignant son maximum là où elle est susceptible de se trouver. Lorsque l'on mesure sa position, cet état dispersé, appelé fonction d'onde, se transforme en un seul emplacement défini.

La forme complète de la fonction d'onde a longtemps échappé à la détection, car toute mesure la détruisait. Mais dans les années 1980, les physiciens ont commencé à développer des méthodes pour mesurer et contrôler les fonctions d'onde de systèmes simples – des avancées qui ont depuis jeté les bases de l'informatique quantique. Ces dernières années, une nouvelle approche permet aux physiciens d'aller plus loin et d'en apprendre davantage sur les fonctions d'onde de matériaux entiers.

" Nous sommes dans la deuxième révolution quantique ", a déclaré Riccardo Comin, physicien expérimental au Massachusetts Institute of Technology, l'un des chefs de file de ces travaux. " Nous disposons désormais des outils nécessaires pour explorer véritablement la fonction d'onde des particules quantiques. "

Le nouveau cadre décrit une fonction d'onde comme un objet se déplaçant dans un paysage caché – un espace appelé " géométrie quantique " du matériau. Les collines et les vallées de ce monde invisible déterminent comment la fonction d'onde d'un matériau donné peut évoluer et dans quels états il peut se trouver.

" On peut obtenir beaucoup d'informations sur ce qui se passe dans les matériaux quantiques, et cela peut accélérer la découverte de nouveaux phénomènes ", a déclaré Marc Bockrath, physicien à l'Université d'État de l'Ohio qui travaille également sur la géométrie quantique.

Comin et ses collaborateurs ont récemment mesuré la géométrie quantique complète d'un cristal— un premier aperçu de la fonction d’onde d’un matériau réel. Explorons les paysages cachés qui se dévoilent.

Géométrie secrète

Les physiciens comparent souvent la fonction d'onde d'une particule à une flèche. Si la particule peut se trouver dans deux états possibles, ils représentent ces options comme des directions opposées vers lesquelles la flèche pointe – par exemple, vers le haut et vers le bas. Si la particule est dans une combinaison des deux états, alors la flèche pointe quelque part autour d'une sphère, les deux états correspondant aux pôles.

(Image montrant une sphère avec les potentialités de directions d'une flèche)

La direction de la flèche indique la probabilité relative de chaque possibilité. La mesure de la particule oriente la flèche exactement vers le haut ou vers le bas, et la probabilité de chaque résultat dépend du pôle le plus proche.

De nombreuses particules ont plus de deux états possibles, auquel cas la flèche occupe un espace de grande dimension. C'est impossible à visualiser, mais les mathématiques donnent aux physiciens une idée de la fonction d'onde de la particule à un instant donné.

Pour les matériaux composés de nombreuses particules, une seule flèche de grande dimension peut représenter l'état combiné de tous les électrons qui les composent. Cette flèche collective oscille selon les variations des conditions ambiantes du matériau, comme sa température ou l'intensité du champ magnétique environnant. Pour contrôler un matériau, les physiciens doivent savoir comment la flèche tourne lorsqu'ils actionnent ces différents boutons.

Pour suivre l'évolution, ils construisent une carte. Imaginez, par exemple, que vous modifiez l'intensité du champ magnétique appliqué au matériau. Sur votre carte, vous ferez correspondre la direction est-ouest à cette intensité. Lorsque le champ est faible (correspondant à l'ouest sur la carte), la fonction d'onde de vos électrons sera dans un état donné, représenté par une flèche. Avec des champs magnétiques plus forts, vous êtes plus à l'est et la fonction d'onde prend un état différent. En vous déplaçant d'ouest en est sur votre carte, la flèche pivote, indiquant l'évolution de la fonction d'onde des électrons selon que vous augmentez ou diminuez le champ.

Cette carte peut être étendue pour inclure toutes les possibilités d'ajustement d'un matériau. Chaque bouton réglable, ou paramètre, ajoute une nouvelle dimension à la carte.

Imaginez que vous suiviez la vitesse de rotation de la flèche lorsque vous vous déplacez sur cette carte. Grâce à ces informations, la carte devient 3D, comme si vous cartographiiez une chaîne de montagnes. Plus le relief est escarpé à chaque point de la carte, plus la fonction d'onde des électrons varie autour de ces valeurs des paramètres. Si elle change beaucoup, vous êtes sur une montagne. Si elle ne change pas du tout, vous êtes sur un terrain plat.

Un objet mathématique appelé métrique quantique capture la forme de ce paysage. Il le fait en décrivant le chemin le plus court entre deux points. Tout comme un avion reliant New York à Pékin ne traversera pas la Terre, mais la contournera en courbe, le chemin entre deux états quantiques révèle la géométrie sous-jacente dans laquelle ils évoluent.

Cette géométrie secrète des fonctions d'onde est restée indétectée pendant des décennies. Mais lorsque les matériaux quantiques ont commencé à surprendre les physiciens par des comportements inexplicables, ces derniers ont compris, dans les années 1980, que certains de ces comportements pouvaient s'expliquer par la fonction d'onde d'un matériau se déplaçant autour d'une forme courbe.

(Image : Imaginez une flèche se déplaçant sur une surface plane. Sa direction ne change pas. Mais sur une surface courbe, après avoir parcouru une boucle fermée, la flèche pointe dans une direction différente de celle du départ.)

Le même phénomène peut se produire avec les états quantiques. Imaginez que l'on fasse varier les conditions d'un matériau pour déplacer la fonction d'onde sur la carte, puis que l'on ramène le matériau à ses conditions initiales. Si sa flèche pointe maintenant dans une nouvelle direction, le matériau est " topologique " : sa forme cachée et sous-jacente l'a forcé à adopter un nouvel état.

Le changement de direction causé par la topologie sous-jacente est appelé la phase de Berry, d'après le physicien théoricien britannique Michael Berry, qui a popularisé l'idée. La manière dont cette phase s'accumule sur un chemin en boucle est appelée la courbure de Berry, faisant référence à la forme incurvée que la flèche traverse secrètement.

Pour Comin, la phase de Berry est " l’un des concepts les plus fascinants de la théorie quantique des solides ". Longtemps invisible aux expérimentateurs, elle peut avoir des conséquences physiques étranges.

Beignets saupoudrés

Cette géométrie abstraite prend vie dans les laboratoires où des physiciens comme Comin étudient les cristaux – des réseaux d'atomes disposés en motifs répétitifs. Ces dernières années, ils ont découvert que les cristaux 2D – des réseaux d'atomes plats dans lesquels les électrons peuvent se déplacer dans deux directions – présentent une grande variété de comportements quantiques. Voyons pourquoi la carte de la géométrie quantique d'un cristal 2D prend la forme d'un tore, un anneau.

En général, les motifs répétitifs des cristaux limitent les états possibles des électrons qui les composent. Les électrons peuvent circuler rapidement, lentement, voire pas du tout, et chaque option correspond à une fonction d'onde collective différente. Pour un cristal 2D, les physiciens peuvent représenter la carte des états possibles sur une feuille de papier : chaque coordonnée correspond à l'impulsion possible des électrons dans les directions verticale et horizontale.

(Image : Comme la carte des états d'un cristal se répète, se déplacer dans une direction à partir du bord de la carte plane fait revenir de l'autre côté. Pour illustrer ce phénomène, les physiciens prennent la carte et l'enroulent deux fois. D'abord, la carte plane devient un cylindre, puis les extrémités du cylindre se rejoignent, créant un tore.

Changer les conditions, par exemple en faisant passer un courant à travers le cristal, modifiera le mouvement des électrons, ce qui poussera la flèche à se déplacer sur cette carte en forme de tore. )

Et avec les matériaux topologiques en particulier, tourner les boutons puis revenir aux conditions initiales – autrement dit, tracer une boucle autour du tore – fait que la flèche des électrons pointe dans une direction différente de celle d'avant. Cela signifie que plusieurs flèches, ou fonctions d'onde, peuvent coexister au même point du tore, créant ainsi un " point de discontinuité ".

(image d'un tore où les flèches partent dans tous les sens  : Lorsque les électrons passent sur un tel point, leur flèche collective s'inverse soudainement et l'état du matériau change radicalement.)

Cet effet est similaire à celui du passage d'une charge électrique, qui inverserait également la force exercée sur les électrons. C'est pourquoi les matériaux topologiques peuvent être interprétés comme hébergeant des charges fantômes, qui provoquent le déplacement des électrons comme s'ils étaient soumis à un champ de force fictif.

La découverte de ce " champ fantôme " dans les années 1980 a consolidé le lien entre la géométrie cachée des états quantiques et le comportement des matériaux. Elle fait partie des travaux qui ont valu le prix Nobel de physique 2016 .

Territoire inexploré

Les matériaux topologiques ne sont plus si mystérieux : les physiciens les utilisent couramment pour découvrir de nouvelles phases de la matière et explorent leur potentiel pour l'informatique quantique. Mais ce n'est que récemment qu'ils ont pu appréhender la géométrie quantique dans son ensemble, qui inclut non seulement la courbure de Berry, mais aussi la métrique quantique, c'est-à-dire la forme du paysage accidenté qui peut exister au-dessus d'une carte en forme de tore. Il y a quelques années, la métrique quantique a permis aux chercheurs de comprendre ce qui se passait dans un cristal 2D hébergeant une nouvelle forme exotique de supraconductivité.— le flux d’électricité sans résistance.

(Image : un homme souriant se tient debout, les bras croisés, devant un fond sombre. Une femme vêtue d'une veste en tweed se tient devant un tableau blanc. Le physicien Riccardo Comin (à gauche) et ses collaborateurs ont récemment cartographié pour la première fois la géométrie quantique complète d'un cristal. Päivi Törmä (à droite) a contribué à montrer comment la géométrie quantique peut expliquer des comportements de matériaux exotiques tels que la supraconductivité.) 

Les résultats suggèrent que la métrique quantique pourrait constituer un cadre puissant pour comprendre les matériaux. Certains y voient la porte ouverte à la conception de supraconducteurs à température ambiante, qui, s'ils sont réalisés, pourraient révolutionner tous les domaines, de l'informatique quantique à l'énergie solaire. " Nous pouvons commencer à rechercher le même mécanisme " dans d'autres matériaux, a déclaré Päivi Törmä.,  physicien à l'Université Aalto en Finlande qui a aidé à expliquer la supraconductivité exotique en termes de métrique quantique, " et cela peut être très prometteur ".

Motivés par ces développements, Comin et Mingu Kang, physicien à l'Université nationale de Séoul, ont pris le tout premier instantané de la géométrie quantique d'un cristal.

Les physiciens étudient depuis longtemps les cristaux en les bombardant de rayons ultraviolets pour en extraire des électrons. En mesurant l'énergie des électrons libérés, ils peuvent évaluer la conductivité électrique du matériau et déterminer s'il s'agit d'un isolant, d'un métal ou d'un matériau intermédiaire.

Comin et Kang ont modernisé la méthode classique. Ils ont travaillé avec un cristal topologique appelé solide de Kagome, composé de couches d'atomes disposées selon un motif étoilé à six côtés. Ils souhaitaient observer l'effet du " champ fantôme " topologique sur les électrons du cristal afin de pouvoir mesurer sa courbure de Berry, une composante de sa géométrie quantique.

Ils ont envoyé une lumière polarisée circulairement sur le cristal, puis ont mesuré l'énergie des électrons de chaque direction de spin. Le champ fantôme a appliqué une force supplémentaire aux électrons dans différentes directions, selon leur spin. Ils ont ainsi pu extraire la courbure de Berry.

Puis Comin s'est associé au groupe de Bohm-Jung Yang  à Séoul et a collaboré pour étudier la métrique quantique du solide de Kagome. " Personne n'avait jamais réalisé cela auparavant dans un solide ", a déclaré Comin. " C'était totalement inédit. "

Ensemble, les mesures ont permis de brosser un tableau de la géométrie quantique complète du cristal. " En examinant ces deux mesures indépendantes, nous avons montré qu'elles concordaient parfaitement ", a déclaré Comin. " Nous commençons à percevoir la géométrie de ces états. Et c'est quelque chose que je n'avais jamais vu auparavant. "

Leur méthode peut être utilisée sur de nombreux types de cristaux.  Dans un nouvel article paru dans Science cette semaine  l'équipe de Yang a expliqué avoir appliqué la même approche à un cristal appelé phosphore noir. Certains pensent que cela pourrait devenir une méthode omniprésente pour étudier les matériaux quantiques.

La géométrie quantique " deviendra certainement un outil ou une façon standard de voir les choses ", a déclaré Törmä. " Mais qu'en révèle-t-elle ? Cela reste à voir. "




 

Auteur: Internet

Info:

[ superpositions ] [ intrications ]

 

Commentaires: 0

Ajouté à la BD par miguel

syngamie

Dire que le spermatozoïde pénètre l’ovule, c’est faire de lui un preux chevalier

Pourquoi la biologie reproduit-elle en les naturalisant les stéréotypes d'un ovule passif qui se laisserait pénétrer par les spermatozoïdes, alors qu'il n'en est rien?

Si un enfant vous demande comment on fait les bébés, plutôt que de parler de cigogne ou de chou, vous allez sûrement utiliser une métaphore habituelle et répondre que papa plante la petite graine dans le ventre de maman. Après tout, vous avez appris à l’école que la fécondation s'effectuait par la rencontre entre un spermatozoïde et un ovocyte, le premier pénétrant le second après une course contre des millions de participants dont ressort un seul gagnant.

La " petite graine " n’est donc pour vous qu’une façon imagée, compréhensible pour les enfants, de parler de la reproduction sexuelle et de la réunion des gamètes mâle et femelle. Sauf qu'en réalité, ça ne se passe pas du tout comme ça. Eh non, les gamètes mâles ne sont pas de vaillants chevaliers lancés dans une course folle pour fusionner avec un gamète femelle qui attendrait nonchalamment le baiser princier du vainqueur qui viendrait réveiller la Belle au bois dormant.

Une " réalité " biologique biaisée par les stéréotypes

" L’ovule et le spermatozoïde interagissent mutuellement. Que la biologie refuse de les dépeindre ainsi n’en est que plus dérangeant", écrivait déjà en 1991 Emily Martin [1], professeure émérite d’anthropologie à l’université de New York, qui tenait dans cet article à "mettre en lumière les stéréotypes de genre cachés dans le langage scientifique de la biologie". Eh oui, " la simple formule “l’œuf est fécondé”, le simple syntagme “fécondation” implique une représentation de la conjonction des deux gamètes donnant un rôle prépondérant au spermatozoïde", indique le spécialiste de la philosophie des sciences Thierry Hoquet. Preuve que les clichés sexistes vont jusqu'à imprégner la science. Et qu’il n’est pas si facile de s’en débarrasser.

En 1972, déjà, relate Emily Martin dans cet article de référence, le biologiste John F. Hartman avait démontré que, " lorsque l’on tue un ovule en le perçant avec une aiguille, le spermatozoïde vivant ne peut pas entrer dans la zone pellucide ", c’est-à-dire la matrice qui entoure l’ovocyte. Ce résultat, qui date d’il y a presque cinquante ans, soulignait que le spermatozoïde ne peut pas tout et que l’ovule n’est pas un terreau fertile et nutritionnel sur lequel une semence vient s’implanter puis croître; ce n’est pas que la " petite graine "  ne peut germer parce que l’ovule est mort et donc la terre trop aride, c’est que le gamète mâle ne peut pas, tout seul, entrer dans l’enclos de ce que l’on ne devrait donc plus percevoir comme un mignon potager. Il y a une sorte de partage des tâches lors de la rencontre.

À la surface de l’ovocyte, on trouve des molécules (portant le nom de ZP3) qui vont s’emboîter avec les protéines présentes sur le spermatozoïde et vont permettre aux gamètes mâle et femelle de se coupler. Rien à voir donc avec la " petite graine ".

En 1984, poursuit Emily Martin, des chercheurs de l’université John-Hopkins vont plus loin. Ils remarquent, "à leur grande surprise, que la poussée du spermatozoïde vers l’avant était extrêmement faible" et que "la tête du spermatozoïde, au lieu de pousser vers l’avant, effectuait surtout des mouvements d’aller et retour" (une observation qui ne doit rien aux nouvelles technologies mais obtenue " à l’aide de pipettes en verre, d’un manomètre et d’un simple microscope, soit des techniques vieilles de plus d’un siècle", précise la chercheuse en anthropologie). La découverte est de taille. Elle confirme que les spermatozoïdes ne franchissent pas cette " barrière"  de l’ovule à coups de tête et de flagelle car, même s’ils avaient une force suffisante, " cette force se dirigerait principalement vers les côtés plutôt que vers l’avant".

En somme, puisque "la propension la plus forte des spermatozoïdes, par un facteur dix, consiste à s’échapper en tentant de s’extraire de l’ovule", cela signifie que "la surface de l’ovule doit être conçue pour capter les spermatozoïdes et prévenir leur fuite". D’autres laboratoires viennent conforter ces données. Pour résumer, à la surface de l’ovocyte, on trouve des molécules (portant le nom de ZP3) qui vont s’emboîter avec les protéines présentes sur le spermatozoïde et vont permettre aux gamètes mâle et femelle de se coupler. Rien à voir donc avec la "petite graine" ni ses versions moins édulcorées mais tout aussi erronées scientifiquement de spermatozoïde pénétrant l’ovule et l’ensemençant.

Les gamètes interagissent, une vision constructive

Sauf que, malgré ces découvertes scientifiques étayées et datées, l’idée du spermatozoïde comme acteur principal persiste tandis que le rôle de l’ovule continue d’être minimisé. Dans l’encyclopédie Dokéo Corps humain 9-12 ans, parue en 2003, on pouvait ainsi lire que, "grâce à sa tête foreuse, il perce la peau de l’ovule et le pénètre", relevait dans un article de 2005 la sociologue Christine Détrez. Idem dans l’ouvrage Le corps humain, paru en 1999 (aujourd’hui épuisé): on y lisait page 106 que "celui qui atteint l’ovule rompt l’enveloppe et pénètre à l’intérieur". Des exemples de cette "saga du spermatozoïde", il y en a pléthore: "un seul y pénétrera pour le féconder" (Le corps pour le faire connaître aux enfants); il doit "ouvrir une brèche dans l’ovule" (Il était une fois la vie – Le corps humain, p.216). En miroir, l’ovule "“attend” (le verbe est récurrent), passivement, sorte de Belle au bois dormant ne se réveillant qu’une fois fécondé", expose Christine Détrez. "Tous les mois, la femme émet une graine de vie, l’ovule, qui attend d’être fécondée par un des spermatozoïdes produits par l’homme", raconte par exemple l’encyclopédie pour enfants des éditions Fleurus.

Si encore il ne s’agissait que des ouvrages de vulgarisation pour enfants… Le problème, c’est que les articles scientifiques eux-mêmes perpétuent cet imaginaire de l’ovule attentiste et du spermatozoïde énergique. Même lorsque les scientifiques accordent à l’ovule un rôle plus prégnant, "la métaphore du spermatozoïde agressif" est toujours présente, souligne Emily Martin. Ainsi, Gerald et Helen Schatten, bien qu’admettant en 1984 qu’ovule et spermatozoïdes sont tous deux actifs, écrivent que, "du bout de sa tête triangulaire, le spermatozoïde lance un filament long et fin et harponne l’ovule""Pourquoi ne pas appeler cette action “construire un pont” ou “lancer une corde”, plutôt que lancer un harpon? questionne Emily Martin. Les harpons transpercent leurs proies, les blessent ou les tuent, alors que ce filament ne fait que se coller."

La molécule ZP3 et ses "récepteurs" drôlement actifs

Pareil pour la façon dont est décrite la molécule ZP3 par Paul M. Wassarman dans un article de 1988: un "récepteur de spermatozoïdes". Sans compter qu’est aussi utilisée juste après la mention "comme une clé ouvre une serrure""Quand le spermatozoïde est désigné comme une “clef” et l’ovule comme une “serrure”, il est assez facile de déduire lequel agit et lequel subit l’action", ironise l’anthropologue, avant de s’interroger: "Ne pourrions-nous pas parler des deux moitiés appariées d’un médaillon?" Et ce, alors que ce sont les protéines présentes sur les spermatozoïdes qui sont des récepteurs d’un point de vue strictement biologique parce qu’elles ont des "poches" alors que ZP3 est un ensemble de "ligands""un polymère de “clés”, où de nombreux petits boutons dépassent", détaille-t-elle. Mais non, Wassarman fait de ZP3 le récepteur et parle de "“protéines se liant à l’ovule” pour les molécules du spermatozoïde qui, sinon, auraient été appelées récepteurs". Le savoir a évolué, mais le langage pour en rendre compte, lui, reste coloré des croyances qui lui ont précédé.

Ne pas laisser trop de pouvoir aux femmes

Ces croyances s’expliquent. Il faut avoir en tête que "ces découvertes sont extrêmement récentes, rappelle le professeur de philosophie à l’université Paris X-Nanterre Thierry Hoquet, également auteur de l’ouvrage Des sexes innombrables – Le genre à l'épreuve de la biologieLe rôle de chacun des parents et des gamètes était encore débattu en 1750. Il y a deux-cent-cinquante ans, on ne savait vraiment rien du tout! On ne savait pas ce qu’il y avait dans ces œufs, quel rôle jouait le mâle dans l’affaire, juste qu’il y avait besoin d’un coït." Un terrain propice au développement d’un récit donnant le beau rôle aux spermatozoïdes, découverts en 1678 –l’éjaculation étant visible et dans le champ de la production et du mouvement tandis que ce qui se passait à l’intérieur du corps féminin est longtemps resté mystérieux.

"Dans ce qu’on décrit comme la fécondation, donc la rencontre des gamètes, on rejoue le geste par lequel l’homme pénètre la femme. On s’est imaginé les gamètes comme des espèces d’individu en petit."

Thierry Hoquet, spécialiste de la philosophie des sciences

Rien d’étonnant à ce qu’il y ait eu "une mise en abyme", évoque Thierry Hoquet: "Ce n’est pas seulement l’ovule qui est pénétré par le spermatozoïde. Dans ce qu’on décrit comme la fécondation, donc la rencontre des gamètes, on rejoue le geste par lequel l’homme pénètre la femme. On s’est imaginé les gamètes comme des espèces d’individu en petit." Pour lui, cette "projection de l’individu adulte" dans des cellules reproductrices est une manifestation d’"animisme" et celui-ci, loin d’être relégué dans un lointain passé, affecte encore aujourd’hui nos mentalités.

"Pourquoi, alors que manifestement dans l’espèce humaine la contribution mâle est secondaire ou mineure, prend-elle dans les récits populaires toute la place, comme s’il s’agissait de l’unique élément fondateur de la formation du nourrisson?" La réponse est dans la question de Thierry Hoquet. Le rôle symbolique conféré au spermatozoïde vient en quelque sorte compenser le fait que la gestation soit féminine. "Le travail reproducteur est profondément inégal dans sa répartition", ajoute le spécialiste de philosophie des sciences. Pas seulement lors du développement de l’embryon. Mais aussi en raison du lieu où se rencontrent les gamètes, qui n’est pas un milieu neutre car situé dans les trompes utérines, au sein même du corps du sujet féminin. Et le zygote, la cellule avec une paire de chromosomes, n’est pas vraiment une fusion des deux gamètes mais plutôt un enveloppement du mâle par la femelle. "Dans notre espèce, le spermatozoïde est réduit à son élément génétique, ce n’est pas la cellule entière qui joue un rôle, par exemple nutritif." Si l’on voit dans les gamètes des mini-individus, pas étonnant que cette asymétrie biologique ait été masquée. Il s’agissait de ne pas laisser trop de pouvoir aux femmes.

La persistance tenace d'un mythe culturel

C’est bien pour cela que les récits entourant la "fécondation" font écho aux rôles traditionnellement associés au masculin et au féminin et qu’on retrouve ces images marquées tout au long du processus de reproduction. Dès la spermatogénèse et l’ovulation, comme le retrace Emily Martin: "L’ovule est vu comme gros et passif. Il ne se déplace pas, ne chemine pas, mais est passivement “transporté”, “balayé”, voire même “dérive” le long du tube utérin. À l’inverse, les spermatozoïdes sont présentés comme étant petits, “aérodynamiques” et toujours actifs." Femme au foyer. Homme travailleur. "Si les “faits” de la biologie ne sont peut-être pas toujours des constructions culturelles, je soutiens que c’est le cas ici", assénait-elle.

Rétablir la vérité biologique sans projection animiste

Or ce n’est pas sans danger. "Doter l’ovule et le spermatozoïde d’une capacité d’action intentionnelle […] conduit à repousser les limites de la viabilité jusqu’au moment de la fertilisation", alerte Emily Martin. À une époque où le droit à l’IVG est encore remis en question, y compris en France, il serait peut-être temps de "démythologiser" la rencontre des gamètes, conseille le professeur de philosophie. Et, pour cela, il pourrait être utile d’observer d’autres espèces qui se reproduisent sans pénis ni pénétration voire sans spermatozoïdes (on parle alors de reproduction parthénogénétique) ou même en utilisant les spermatozoïdes d’autres espèces, comme les kleptons, non pour un mélange des génomes mais comme déclencheur de la parthénogénèse. Ça remet les idées en place et permet de voir les gamètes comme ce qu’ils sont: non les représentants minuscules des individus qui les ont produits mais des cellules reproductrices.

"Le fait que ces stéréotypes soient maintenant inscrits au niveau cellulaire constitue un déplacement très puissant, permettant de les faire paraître naturels et impossibles à défaire."  Emily Martin, professeure émérite d’anthropologie à l’université de New York

Sans oublier que l’autre danger de voir dans le spermatozoïde un valeureux guerrier et dans l’ovocyte une demoiselle endormie, comme l’analysait Emily Martin, c’est celui de la naturalisation. "Le fait que ces stéréotypes soient maintenant inscrits au niveau cellulaire constitue un déplacement très puissant, permettant de les faire paraître naturels et impossibles à défaire." C’est bien pour cela qu’il convient de rétablir la vérité biologique, et strictement biologique. Sans en inférer aucun investissement social ou parental prédéterminé. "Il ne s’agit pas de dire que les gamètes mâle et femelle ont une situation symétrique mais de souligner que les deux font quelque chose et non de supposer que l’un fait tout et l’autre rien, insiste Thierry Hoquet. Sinon, on réduit tout à l'opposition actif-passif, et alors on ne fait plus de la biologie mais de la métaphysique."

 

Auteur: Internet

Info: slate, Daphnée Leportois – 5.2.2029 [1]Son article “The Egg and the Sperm: How Science Has Constructed a Romance Based on Stereotypical Male-Female Roles”, paru originellement en 1991 dans la revue Signs: Journal of Women in Culture and Society, a été traduit en français sous le titre "L’ovule et le spermatozoïde. Comment la science a construit un roman d’amour basé sur des rôles féminins et masculins stéréotypés" et constitue l’un des chapitres de l’ouvrage collectif Les sciences du désir. La sexualité féminine, de la psychanalyse aux neurosciences.

[ instant zéro ] [ procréation ] [ patriarcat ] [ femmes-hommes ]

 

Commentaires: 0

Ajouté à la BD par miguel