Κάθε μέρα, ο εγκέφαλός μας λαμβάνει χιλιάδες αποφάσεις, μικρές και μεγάλες. Οποιαδήποτε από αυτές τις αποφάσεις - από τις λιγότερο σημαντικές, όπως η επιλογή ενός εστιατορίου, μέχρι τις πιο σημαντικές, όπως η επιδίωξη μιας διαφορετικής καριέρας ή η μετακόμιση σε μια νέα πόλη - μπορεί να οδηγήσει σε καλύτερα ή χειρότερα αποτελέσματα.
Πώς μετρά ο εγκέφαλος τον κίνδυνο και την ανταμοιβή κατά τη λήψη αυτών των αποφάσεων; Η απάντηση στο ερώτημα αυτό εξακολουθεί να προβληματίζει τους επιστήμονες, αλλά μια νέα μελέτη που διεξήχθη από ερευνητές της Ιατρικής Σχολής του Χάρβαρντ και του Πανεπιστημίου του Χάρβαρντ προσφέρει ενδιαφέροντα στοιχεία.
Η έρευνα, που δημοσιεύθηκε στις 19 Φεβρουαρίου στο Nature ενσωμάτωσε έννοιες μηχανικής μάθησης σε πειράματα με ποντίκια για να μελετήσει το εγκεφαλικό κύκλωμα που υποστηρίζει αποφάσεις που βασίζονται στην ανταμοιβή.
Οι επιστήμονες αποκάλυψαν δύο ομάδες εγκεφαλικών κυττάρων στα ποντίκια: μία που βοηθά τα ποντίκια να μάθουν για αποτελέσματα πάνω από το μέσο όρο και μία άλλη που σχετίζεται με αποτελέσματα κάτω από το μέσο όρο. Μαζί, όπως έδειξαν τα πειράματα, αυτά τα κύτταρα επιτρέπουν στον εγκέφαλο να μετράει το πλήρες φάσμα των πιθανών ανταμοιβών που σχετίζονται με μια επιλογή.
"Τα αποτελέσματά μας υποδηλώνουν ότι τα ποντίκια - και κατ' επέκταση και άλλα θηλαστικά - φαίνεται να μπορούν να αναπαραστήσουν νοητικά με μεγαλύτερη λεπτομέρεια απ' ό,τι πιστεύαμε προηγουμένως τον κίνδυνο και την ανταμοιβή" , δήλωσε ο συν-συγγραφέας Jan Drugowitsch, αναπληρωτής καθηγητής νευροβιολογίας στο Ινστιτούτο Blavatnik της Ιατρικής Σχολής του Χάρβαρντ.
Εάν επιβεβαιωθούν στους ανθρώπους, τα ευρήματα θα μπορούσαν να αποτελέσουν ένα πλαίσιο για την κατανόηση του τρόπου με τον οποίο ο ανθρώπινος εγκέφαλος λαμβάνει αποφάσεις που βασίζονται στην ανταμοιβή και τι συμβαίνει στην ικανότητα να κρίνει τον κίνδυνο και την ανταμοιβή όταν το κύκλωμα ανταμοιβής αποτυγχάνει.
Η μηχανική μάθηση φωτίζει τις αποφάσεις που βασίζονται στην ανταμοιβή
Οι νευροεπιστήμονες ενδιαφέρονται εδώ και καιρό για το πώς ο εγκέφαλος χρησιμοποιεί εμπειρίες του παρελθόντος για να λάβει νέες αποφάσεις. Ωστόσο, σύμφωνα με τον Drugowitsch, πολλές παραδοσιακές θεωρίες σχετικά με την εν λόγω λήψη αποφάσεων αποτυγχάνουν να συλλάβουν την πολυπλοκότητα και τις αποχρώσεις της συμπεριφοράς στον πραγματικό κόσμο.
Ο Drugowitsch χρησιμοποιεί το παράδειγμα της επιλογής ενός εστιατορίου: Αν έχετε τη διάθεση να παίξετε εκ του ασφαλούς, μπορεί να επιλέξετε ένα εστιατόριο με μενού που η εμπειρία σας λέει ότι είναι δοκιμασμένα καλό, ενώ αν έχετε όρεξη να ρισκάρετε, μπορεί να επιλέξετε ένα εστιατόριο που γνωρίζετε ότι προσφέρει ένα μείγμα εξαιρετικών αλλά και λιγότερο καλών πιάτων.
Στο παραπάνω παράδειγμα, τα εστιατόρια διαφέρουν σημαντικά ως προς το εύρος των προσφορών τους, ωστόσο οι υπάρχουσες θεωρίες της νευροεπιστήμης τα θεωρούν ισοδύναμα όταν υπολογίζονται κατά μέσο όρο, και έτσι προβλέπουν ίση πιθανότητα επιλογής ενός από τα δύο.
«Ξέρουμε ότι οι άνθρωποι και τα ζώα δεν ενεργούν έτσι - μπορούμε να αποφασίσουμε μεταξύ της τακτικής του ρίσκου και εκείνης της ασφάλειας», δήλωσε ο Drugowitsch.
Τα τελευταία χρόνια, οι ερευνητές της μηχανικής μάθησης ανέπτυξαν μια θεωρία λήψης αποφάσεων που αποτυπώνει καλύτερα το πλήρες φάσμα των πιθανών ανταμοιβών που συνδέονται με μια επιλογή. Ενσωμάτωσαν αυτή τη θεωρία σε έναν νέο αλγόριθμο μηχανικής μάθησης που ξεπέρασε σε επιδόσεις εναλλακτικούς αλγορίθμους σε βιντεοπαιχνίδια Atari και σε μια σειρά από άλλες εργασίες στις οποίες κάθε απόφαση έχει πολλαπλά πιθανά αποτελέσματα. Ο νέος αλγόριθμος ήταν καλύτερος στην εξήγηση της δραστηριότητας της ντοπαμίνης.
Οι αισιόδοξοι και οι απαισιόδοξοι νευρώνες
Στη νέα μελέτη, ο Drugowitsch σε συνεργασία με άλλους επιστήμονες σχεδίασε πειράματα σε ποντίκια για να δουν πώς εξελίσσεται αυτή η διαδικασία σε μια περιοχή του εγκεφάλου που ονομάζεται κοιλιακό ραβδωτό σώμα, η οποία αποθηκεύει πληροφορίες σχετικά με πιθανές ανταμοιβές που σχετίζονται με μια απόφαση.
«Η δραστηριότητα της ντοπαμίνης παρέχει μόνο το σήμα μάθησης για τις αναμενόμενες ανταμοιβές, αλλά θέλαμε να βρούμε αναπαραστάσεις αυτών των εμπεδομένων ανταμοιβών απευθείας στον εγκέφαλο», δήλωσε ο Drugowitsch.
Οι ερευνητές εκπαίδευσαν τα ποντίκια να συσχετίζουν διαφορετικές οσμές με ανταμοιβές διαφορετικού μεγέθους - στην ουσία, διδάσκοντας στα ποντίκια το εύρος των πιθανών αποτελεσμάτων μιας επιλογής. Στη συνέχεια παρουσίασαν στα ποντίκια οσμές και παρατήρησαν τη συμπεριφορά του γλειψίματος (τα ποντίκια γλύφουν περισσότερο προσδοκώντας καλύτερες ανταμοιβές), ενώ κατέγραφαν τη νευρική δραστηριότητα στο κοιλιακό ραβδωτό σώμα.
Η ομάδα εντόπισε δύο διαφορετικές ομάδες νευρώνων στον εγκέφαλο: Μία που βοηθά το ποντίκι να καταλάβει τα καλύτερα από τα αναμενόμενα αποτελέσματα και μία άλλη που συνδέεται με τα χειρότερα από τα αναμενόμενα αποτελέσματα.
«Μπορείτε να το φανταστείτε αυτό σαν να έχετε έναν αισιόδοξο και έναν απαισιόδοξο στον εγκέφαλό σας, που και οι δύο σας δίνουν συμβουλές για το τι να κάνετε στη συνέχεια», εξήγησε ο Drugowitsch.
Όταν οι ερευνητές έβαλαν σε σίγαση τους «αισιόδοξους» νευρώνες, το ποντίκι παρουσίασε συμπεριφορά που υποδηλώνει ότι προσδοκούσε μια λιγότερο ελκυστική ανταμοιβή. Αντίθετα, όταν οι ερευνητές έβαλαν σε σίγαση τους «απαισιόδοξους» νευρώνες, το ποντίκι συμπεριφερόταν σαν να περίμενε μια υψηλότερης αξίας ανταμοιβή.
«Αυτές οι δύο ομάδες εγκεφαλικών κυττάρων συνεργάζονται για να σχηματίσουν μια αναπαράσταση της πλήρους κατανομής των πιθανών ανταμοιβών για μια απόφαση», δήλωσε ο Drugowitsch.
Αν και σημείωσε ότι χρειάζεται περισσότερη έρευνα για να επιβεβαιωθούν τα αποτελέσματα σε ανθρώπους πιστεύει ότι η εργασία μπορεί ήδη να ρίξει κάποιο φως στον τρόπο με τον οποίο οι άνθρωποι αξιολογούν τον κίνδυνο στις αποφάσεις και γιατί οι άνθρωποι με ορισμένες καταστάσεις όπως η κατάθλιψη ή ο εθισμός μπορεί να δυσκολεύονται με τέτοιες εκτιμήσεις.