Título: Temporal discounting of expected value of reward in the medial intraparietal cortex
Autores: Tsoulfas, Georgios
Fecha: 2011
Publicador: McGill University - MCGILL
Fuente:
Tipo: Electronic Thesis or Dissertation
Tema: Biology - Physiology
Descripción: Previous work has shown that expected value of reward associated with a reach modulates neurons in the medial intraparietal cortex (MIP) and that this reward signal can be decoded. In this study, we investigated the reliability of reward coding in MIP by examining how given reward magnitudes are encoded when presented in different contexts. We are interested in determining how prior knowledge of reward is used to interpret information about the reward in the current trial. We recorded from single neurons in MIP while two rhesus macaque monkeys performed a memory reach task under two conditions. In the first condition, high and low reward values were randomly interleaved trial by trial (variable reward schedule), while in the second condition only one of these reward values was delivered for a block of trials (constant reward schedule). For both reward schedules, the reward magnitude was indicated by a cue preceding the delay period of each trial. Each recording session consisted of a variable reward schedule as well as a small and large constant reward schedule. For the same reward, the firing rate of neurons in the delay period changed significantly between the constant and variable reward schedule conditions. A model that discounts past acquired rewards and formulates a weighted history of reward for the present trial is proposed to explain the observed differences in firing rate between contexts. We identify neurons that fire in accordance to a temporal discount of reward, with significant correlation (R2 > 0.25) between the model and experimental data, suggesting that the neuronal activation within MIP is modulated both by current expected value of reward and discounted past reward magnitudes.
De précédents travaux ont démontré que l'espérance face à la valeur de la récompense associée à une tâche d'atteinte, affecte l'activité des neurones du cortex intraparietal médial (MIP) et que ce signal de récompense peut-être décodé. Dans cette étude, nous nous attaquons à la fiabilité de l'encodage de la récompense dans la région MIP en examinant comment la quantification de la récompense est encodée quand elle est présentée dans différents contextes. Nous sommes intéressés à savoir si la connaissance acquise au cours des essais précédents est utilisée pour interpréter l'information a propos de la récompense de l'essai courant. Nous avons échantillonné l'activité de neurones, un à un, alors que deux singes, macaque rhésus, performaient une tâche d'atteinte avec délai, sous deux conditions de remise de récompense. Soumis à première condition, les grandes et petites quantités de récompense ont été enchainées de façon aléatoire (ordonnancement de récompense aléatoire), alors que sous la deuxième condition un seul format de récompense a été maintenu pour toute la durée du bloc d'essais (ordonnancement de récompense constant). Pour les deux types d'ordonnancement, la quantité de récompense était indiquée par un signal précédent la période de délai de chaque essai. Chaque séance d'enregistrement comprend un bloc d'ordonnancement aléatoire, un bloc de grandes récompenses constantes et un bloc de petites récompenses constantes. Pour la même récompense, le taux de mise à feu des neurones dans la période de délai ont été affecté de façon significative par l'ordonnancement des récompenses. Un modèle est proposé pour expliquer la différence dans les taux de mises à feu. Nous identifions les neurones qui font feu en accord avec une réduction temporelle de la récompense, avec une corrélation significative (R2 > 0.25) entre le model et les données expérimentales, suggérant que l'activité neuronale dans MIP est fonction à la fois de l'espérance de la valeur de la récompense présente et de la réduction temporelle des récompenses passées.
Idioma: en