English  |  Français 

Projets

Les projets de notre groupe sont inscrits dans une démarche interdisciplinaire basée sur des modèles ayant pour but d'étudier le rôle des états émotionnels et sociaux dans la prise de décision. Il s'agit là d'un domaine très prometteur puisque de nombreuses preuves commencent à émerger aussi bien par rapport à l'importance de tels états dans la prise de décision économique que dans le cadre de possibles contributions avec l'aide des outils neuroscientifiques dans l'étude de ceux-ci (Camerer et al., 2005; Glimcher et Rustichini, 2004; Rangel et al., 2008). L'élément central de ce projet de recherche est d'appréhender les mécanismes neuronaux qui sous-tendent la prise de décision économique et de comprendre comment les émotions et la cognition régulent les processus de prise de décision. Notre projet se concentre sur l'étude de la prise de décision basée sur la valeur 1) chez un individu et 2) dans un contexte de prise décision sociale comme détaillé ci-dessous.

1) La prise de décision individuelle :

La base neuronale de prise de décision liée aux signaux de valeur [PI: Plassmann]

Le but de ce projet est de mieux comprendre la base neuronale de la valeur subjective ou encore, de comprendre les signaux d'utilité qui guident les choix économiques. Nous nous intéressons plus particulièrement aux signatures neuronales dans les signaux de valeur au moment du choix, et de la consommation, ainsi qu'à la manière dont le cerveau encode les coûts primaires et secondaires. Le plan du projet se base sur le précédent travail d'Hilke Plassmann dans ce domaine (Plassmann et al. 2007, 2010; Plassmann et al. 2008, Camus et al. 2009 et Litt et al. 2011). Dans cette continuité, nous projetons donc de dissocier les signatures neuronales des différents signaux de valeur importants dans la prise de décision humaine en utilisant l'IRMf fondée sur un modèle façonné provenant de l'économie comportementale, la TMS, l'oculométrie, et la MEG. Il s'agit d'un projet à plus grande échelle divisé en trois parties en lien.

Dans la première partie, nous étudions la manière dont la valeur prédite se traduit en une valeur expérimentée, et la manière dont le cerveau met la valeur à jour lorsque celle-ci passe du statut de prédite à expérimentée. Imaginons par exemple que vous mangiez fréquemment un même type de barre aux céréales mais qu'un jour, celle-ci vous provoque une intoxication alimentaire. Est-ce que l'expérience de cette intoxication alimentaire va changer la valeur prédite de cette même barre la prochaine fois que vous envisagerez d'en manger une ? Et est-ce que les changements dans cette valeur prédite vont affecter la valeur expérimentée ? Et comment la valeur prédite change-t-elle lorsque la valeur expérimentée et cette dernière divergent ? La valeur prédite, la valeur expérimentée, et les erreurs de prédiction (à savoir la déviation de la valeur expérimentée vers une valeur prédite) sont des signaux conceptuellement différents jouant des rôles différents dans les dynamiques temporelles de la prise de décision humaine. Dans la plupart des précédentes études sur la décision en neurosciences, ces signaux sont souvent en corrélation et la majeure partie de la littérature existante à ce propos les confond (généralement en faisant régresser l'un, et en affirmant que l'autre n'existe pas). Cela a engendré des découvertes conflictuelles concernant les rôles des différentes zones du cerveau qui encodent ces signaux.

Dans la seconde partie du projet, nous nous intéressons aux signatures neuronales des coûts et à la façon dont les coûts de différentes "devises" s'intègrent à la valeur "nette" générale. La recherche sur l'économie comportementale suggère que lors de l'achat d'un produit, les gens expérimentent une compétition hédonique entre le plaisir anticipé découlant de l'acquisition et de la consommation du produit, et les pertes anticipées dues à travers l'idée d'argent dépensé lors de la transaction (le prix du produit) mais également la souffrance d'exécuter le paiement (le coût de la transaction). L'équilibre entre ces gains et ces pertes est déterminant dans la décision d'acheter ou non un produit (Prelec&Loewenstein, 1998). De précédentes recherches sur la décision en neurosciences ont étudié la manière dont les calculs de la valeur prédite sont représentés dans le cerveau et également si ces représentations diffèrent des différentes modalités telles que les récompenses primaires et secondaires. Cependant, malgré son importance dans la prise de décision économique, on sait peu de choses sur la manière dont le cerveau humain calcule les facteurs aversifs, c'est-à-dire les coûts durant l'achat. C'est la question centrale de cette partie du projet : nous cherchons plus particulièrement à savoir si la représentation des coûts et l'intégration de la valeur nette dans le cerveau diffèrent entre les coûts monétaires comme par exemple payer, et les coûts somatosensoriels comme les chocs électriques tolérés qui sont intégrés à la valeur économique.

Dans la troisième partie de ce projet, nous nous concentrons sur la dissociation entre les corrélations neuronales des signaux de valeur attendue et les signaux de valeur motivationnelle poursuivant le précédent travail d'Hilke Plassmann qui dissocie la valeur attendue et les signaux de prépondérance dans la décision (Litt et al. 2009). Il y a des indices dans le travail fait sur le primate animal et humain affirmant que nous avons des signatures neuronales distinctes de valeur attendue dans une option de choix, c'est-à-dire "aimer" et montrant également à quel point nous sommes motivés et désireux de travailler pour cela, c'est-à-dire "vouloir". De manière intéressante, ces signaux de valeur sont parfois en conflit. Par exemple, les personnes au régime peuvent se retrouver dans une situation où elles "veulent" manger un aliment très calorique mais qu'elles "n'aiment" pas consommer en raison de ses conséquences néfastes sur la santé. Cela a démontré la grande difficulté à traduire cette distinction en un design expérimental valide. Cependant, nous projetons de nous regrouper avec d'autres personnes parmi lesquelles un psychologue cognitif qui a développé une tâche fiable par ces deux types de signaux de valeur basés sur des mesures de latence de réponse. Nous utiliserons l'IRMf et des interventions pharmacologiques pour dissocier les fondations neuronales des signaux de valeur attendue de celles des signaux de valeur motivationnelle.

Pour les parties 1 et 2 de ce projet, nous avons déjà conduit des pré-tests afin d'adapter les équipements à la population française. Au cours de ces pré-tests, la première donnée pilote a déjà été récupérée. Production&Implications. Cette ligne dans les recherches d'Hilke Plassmann a contribué, et contribuera, à notre compréhension de la manière dont le cerveau représente les signaux de valeur cruciaux à une théorie interdisciplinaire sur la prise de décision humaine. Cette recherche basique n'est pas seulement fondamentalement importante pour les neuroscientifiques, elle l'est aussi pour les chercheurs en décision comportementale. Nous avons  besoin dans un premier temps de mieux comprendre les questions basiques comme par exemples : quels systèmes neuronaux représentent un certain processus psychologique avant de pouvoir construire nos découvertes dans le but de générer de nouvelles théories ou de tester des théories existantes sur la prise de décision comportementale.

Le contrôle cognitif des signaux de valeur [PI:Plassmann]

Le précédent travail d'Hilke Plassmann sur la régulation cognitive des signaux de valeur a révélé quels étaient les mécanismes du cerveau qui étaient engagés dans la régulation des options pour le choix (Hutcherson et al., 2012). De manière intéressante, nous avons montré que la régulation  cognitive ne mène pas simplement à une activité croissante et inhibante des zones du cerveau qui encodent les préférences, comme les mesures comportementales le suggéreraient. A la place, nous avons trouvé une première preuve démontrant que la régulation cognitive sous la forme d'indulgence ou de haute régulation déplace le contrôle vers une zone du réseau de préférence contrairement à la basse régulation qui déplace le contrôle vers une zone différente de ce réseau. Ces premières découvertes suggèrent que les différents modèles de calcul sont en jeu. Le but de ce projet est de comprendre la contribution de chaque zone du réseau neuronal de préférence et leurs moteurs dans la régulation combinés à l'IRMf fondée sur un modèle et à la MEG sur des populations de sujets sains, et sur des populations avec des troubles de la prise de décision comportementale comme par exemple les sujets obèses.

La modulation émotionnelle des signaux de valeur [PI : Plassmann & Coricelli]

Le but de cette ligne dans les recherches d'Hilke Plassmann est d'élucider les mécanismes psychologiques novateurs par lesquels les facteurs de contexte externe altèrent les représentations comportementales et neurales de la prise de décision liées aux signaux de valeur. Dans ces études, nous combinons les approches expérimentales et traditionnelles aux approches neuroscientifiques en tirant les avantages de chacune tout en dépassant les limites de l'auto-évaluation.

2) La prise de décision dans le cadre dynamique et social

La neuroéconomie de l'apprentissage. L'apprentissage du regret: ses fondements théoriques et neuraux [PI: Coricelli]

Ce projet vise à améliorer la compréhension des processus qui affectent le comportement humain dans le contexte de choix interactifs répétés. Nous utiliserons à la fois les méthodologies théoriques et neuroscientifiques pour fournir de nouveaux modèles plus précis à l'apprentissage dans le cadre interactif. Nous envisageons de développer un modèle d'apprentissage adaptif dans lequel l'observation du résultat des options non choisies (résultat contrefactuel/fictif) améliore les décisions prises dans le processus d'apprentissage, c'est-à-dire l'apprentissage du regret.

La base théorique de l'apprentissage du regret [PI: Coricelli]

La première difficulté pour établir une base analytique au rôle du regret dans le fait que son effet doit être établi de manière quantitative et qualitative. Considérons par exemple les modèles de Q-learning : dans ces modèles, un vecteur représentant l'approximation actuelle de la vraie valeur est mis à jour à chaque période par une quantité proportionnelle à l'erreur de prédiction ignorant les informations concernant les profits des autres actions. Dans des conditions techniques légères, le processus converge vers la valeur Q que l'on obtient en suivant la politique optimale après la première période. Ainsi, l'amélioration qui peut donc être introduite en considérant, via le regret, le bénéfice des autres actions, ne peut pas consister en une meilleure limite de comportement, puisque la politique optimale peut déjà être obtenue en ignorant le bénéfice des actions non choisies. Une amélioration dans une dimension différente peut alors être introduite : par exemple, on peut montrer que le regret engendre une convergence plus rapide vers la solution optimale, ou une plus petite perte dans la trajectoire menant à la limite. Ainsi, même si la limite est la même, la vitesse de convergence vers elle est plus rapide. Un problème plus fondamental dans n'importe quelle théorie de l'apprentissage adaptif introduisant la pensée contrefactuelle dans l'analyse du processus d'apprentissage est ce que nous pouvons appeler : le problème d'attribution. Le problème est simple à comprendre. Le choix de l'action en cours détermine la récompense en cours, et également la transition au prochain état. Chaque effet influence la valeur de l'état. Considérons l'action prescrite par le choix optimal. Il peut arriver que la récompense par cette période pouvant être obtenue à partir d'une action différente, soit plus grande. Malgré cela, il est évident que l'action prescrite par la politique puisse toujours être optimale, car l'action avec le plus grand bénéfice en cours peut générer un mauvais "état" avec des bénéfices bas. Une bonne solution à ce problème d'intégration du regret dans l'apprentissage adaptif lorsque la transition parmi les états dépend de l'action, n'est pas encore disponible. La difficulté fondamentale réside dans l'asymétrie de l'information disponible sur les conséquences des actions prises : même dans des conditions totales de retour dans lesquelles celui qui apprend connaît les récompenses associées aux différentes actions, ne peut pas connaître l'effet de toutes ces actions sur l'état suivant, car cet effet est seulement observable par l'action qui a réellement été choisie.

Apprentissage privé et social : le rôle du cortex orbito-frontal sur l'apprentissage émotionnel  [PI: Coricelli & Plassmann]

Dans l'apprentissage social, l'intégration de la pensée contrefactuelle est simple à appréhender d'un point de vue théorique, car chaque effet, celui sur la récompense et celui sur la transition d'état, est observé dans toutes les actions. Plan du projet : nous utiliserons des tâches expérimentales au cours desquelles les participants pourront comparer leurs choix et leurs résultats avec un autre individu pendant que les bénéfices des deux joueurs demeureront complétement indépendants. Nous comparerons directement l'apprentissage fictif et celui du regret dans les deux contextes : privé et social. L'hypothèse principale sur les corrélations neurales concerne le rôle fondamental du cortex orbito-frontal dans l'apprentissage du regret et son interaction avec le cortex pré-frontal dans l'apprentissage social.

Prise de décision interactive, et élaboration d'une modélisation : l'apprentissage en faisant (subcortical) VS. l'apprentissage en pensant (cortical) [PI : Coricelli]

Par généralisation, nous entendons ici le panel de mécanismes et règles cognitifs à partir desquels les sujets extraient de leur expérience passée, un savoir général afin de gérer de nouvelles situations, voire des situations inconnues. La littérature actuelle révèle un manque substantiel d'une exploration empirique solide et systématique de ce thème.

Construction de la réputation et exploitation de la réputation : l'interaction dynamique entre le stratium et le cortex pré-frontal dans l'apprentissage social [PI: Coricelli]

Une question importante dans l'apprentissage par les jeux souligne  la manière dont les croyances à propos du comportement des autres sont générées et exploitées dans un cadre dynamique, c'est-à-dire l'apprentissage par des jeux répétés. Nous étudierons la base neurale de la réputation et la confiance durant ces jeux économiques répétés. Notre projet de recherche vise à comprendre les corrélations neuronales de mécanismes de construction de la réputation chez les humains.

INSERM ENS