Ισορροπία Nash. Θεωρία Παιγνίων για Οικονομολόγους (Τζον Νας)

Πίνακας περιεχομένων:

Ισορροπία Nash. Θεωρία Παιγνίων για Οικονομολόγους (Τζον Νας)
Ισορροπία Nash. Θεωρία Παιγνίων για Οικονομολόγους (Τζον Νας)

Βίντεο: Ισορροπία Nash. Θεωρία Παιγνίων για Οικονομολόγους (Τζον Νας)

Βίντεο: Ισορροπία Nash. Θεωρία Παιγνίων για Οικονομολόγους (Τζον Νας)
Βίντεο: John Nash / Τζον Νας - Θεωρία παιγνίων (Και αν όλοι πάμε για την ξανθιά;) 2024, Νοέμβριος
Anonim

Στη δεκαετία του 1930, ο John von Neumann και ο Oscar Morgenstern έγιναν οι ιδρυτές ενός νέου και ενδιαφέροντος κλάδου των μαθηματικών που ονομάζεται «θεωρία παιγνίων». Στη δεκαετία του 1950, ο νεαρός μαθηματικός John Nash άρχισε να ενδιαφέρεται για αυτή την κατεύθυνση. Η θεωρία της ισορροπίας έγινε το αντικείμενο της διατριβής του, την οποία έγραψε σε ηλικία 21 ετών. Έτσι γεννήθηκε μια νέα στρατηγική παιχνιδιού που ονομάζεται "Nash Equilibrium", που κέρδισε το βραβείο Νόμπελ πολλά χρόνια αργότερα - το 1994.

Ισορροπία Nash
Ισορροπία Nash

Το μεγάλο κενό μεταξύ της συγγραφής μιας διατριβής και της γενικής αναγνώρισης έχει γίνει τεστ για έναν μαθηματικό. Η ιδιοφυΐα χωρίς αναγνώριση οδήγησε σε σοβαρές ψυχικές διαταραχές, αλλά ο John Nash κατάφερε να λύσει αυτό το πρόβλημα χάρη στο εξαιρετικό λογικό μυαλό του. Η θεωρία του Nash Equilibrium κέρδισε το βραβείο Νόμπελ και η ζωή του γυρίστηκε στο Beautiful mind.

Σύντομα για τη θεωρία παιγνίων

Δεδομένου ότι η θεωρία της ισορροπίας Nash εξηγεί τη συμπεριφορά των ανθρώπων στις συνθήκες αλληλεπίδρασης, αξίζει να εξεταστούν οι βασικές έννοιες της θεωρίας παιγνίων.

Η θεωρία παιγνίων μελετά τη συμπεριφορά των συμμετεχόντων (πρακτόρων) όσον αφορά την αλληλεπίδραση μεταξύ τους όπως ένα παιχνίδι, όταν το αποτέλεσμα εξαρτάται από την απόφαση και τη συμπεριφορά πολλών ανθρώπων. Ο συμμετέχων παίρνει αποφάσεις με βάση τις προβλέψεις του για τη συμπεριφορά των άλλων, η οποία ονομάζεται στρατηγική παιχνιδιού.

Υπάρχει επίσης μια κυρίαρχη στρατηγική στην οποία ο συμμετέχων έχει το καλύτερο αποτέλεσμα για οποιαδήποτε συμπεριφορά άλλων συμμετεχόντων. Αυτή είναι η καλύτερη στρατηγική win-win του παίκτη.

Το δίλημμα του φυλακισμένου και η επιστημονική ανακάλυψη

Το δίλημμα του φυλακισμένου είναι μια περίπτωση παιχνιδιού όπου οι συμμετέχοντες αναγκάζονται να λάβουν ορθολογικές αποφάσεις, επιτυγχάνοντας έναν κοινό στόχο ενόψει μιας σύγκρουσης εναλλακτικών επιλογών. Το ερώτημα είναι ποια από αυτές τις επιλογές θα διαλέξει, συνειδητοποιώντας το προσωπικό και γενικό συμφέρον, καθώς και την αδυναμία να αποκτήσει και τα δύο. Οι παίκτες φαίνεται να είναι φυλακισμένοι σε ένα σκληρό περιβάλλον παιχνιδιού, που μερικές φορές τους κάνει να σκέφτονται πολύ παραγωγικά.

Παραδείγματα ισορροπίας Nash
Παραδείγματα ισορροπίας Nash

Αυτό το δίλημμα διερεύνησε ο Αμερικανός μαθηματικός John Nash. Η ισορροπία που πέτυχε ήταν επαναστατική με τον δικό της τρόπο. Ιδιαίτερα αυτή η νέα σκέψη επηρέασε έντονα τη γνώμη των οικονομολόγων για το πώς οι παίκτες της αγοράς κάνουν επιλογές, λαμβάνοντας υπόψη τα συμφέροντα των άλλων, με στενή αλληλεπίδραση και διασταύρωση συμφερόντων.

Είναι καλύτερο να μελετάτε τη θεωρία των παιγνίων μέσω συγκεκριμένων παραδειγμάτων, καθώς αυτός ο ίδιος ο μαθηματικός κλάδος δεν είναι καθαρά θεωρητικός.

Παράδειγμα διλήμματος κρατουμένων

Παράδειγμα, δύο άτομα διέπραξαν ληστεία, έπεσαν στα χέρια της αστυνομίας και ανακρίνονται σε ξεχωριστά κελιά. Παράλληλα, οι αστυνομικοί προσφέρουν σε κάθε συμμετέχοντα ευνοϊκούς όρους υπό τους οποίους θα αφεθεί ελεύθερος εάν καταθέσει εναντίον του συντρόφου του. Καθένα απόοι εγκληματίες έχουν τις ακόλουθες στρατηγικές που θα εξετάσει:

  1. Και οι δύο καταθέτουν ταυτόχρονα και καταδικάζονται σε 2,5 χρόνια φυλάκιση.
  2. Και οι δύο σιωπούν ταυτόχρονα και λαμβάνουν 1 χρόνο ο καθένας, γιατί σε αυτήν την περίπτωση η βάση των αποδεικτικών στοιχείων της ενοχής τους θα είναι μικρή.
  3. Ο ένας καταθέτει και αφήνεται ελεύθερος, ενώ ο άλλος σιωπά και καταδικάζεται σε 5 χρόνια φυλάκιση.

Προφανώς, η έκβαση της υπόθεσης εξαρτάται από την απόφαση και των δύο συμμετεχόντων, αλλά δεν μπορούν να συμφωνήσουν, γιατί κάθονται σε διαφορετικά κελιά. Φαίνεται ξεκάθαρα και η σύγκρουση των προσωπικών τους συμφερόντων στον αγώνα για ένα κοινό συμφέρον. Καθένας από τους κρατούμενους έχει δύο επιλογές δράσης και 4 επιλογές για αποτελέσματα.

Αλυσίδα λογικών συμπερασμάτων

Έτσι, ο δράστης Α εξετάζει τις ακόλουθες επιλογές:

  1. Είμαι σιωπηλός και ο σύντροφός μου σιωπά - θα πάρουμε και οι δύο 1 χρόνο φυλάκιση.
  2. Δίνω τον σύντροφό μου και με παραδίδει - και οι δύο τιμωρούνται με 2,5 χρόνια φυλάκιση.
  3. Είμαι σιωπηλός και ο σύντροφός μου με προδίδει - Θα πάρω 5 χρόνια φυλάκιση και θα είναι ελεύθερος.
  4. Παραδίδω τον σύντροφό μου, αλλά είναι σιωπηλός - παίρνω ελευθερία και παίρνει 5 χρόνια φυλάκιση.

Ας δώσουμε έναν πίνακα πιθανών λύσεων και αποτελεσμάτων για σαφήνεια.

Πίνακας πιθανών αποτελεσμάτων του διλήμματος του κρατουμένου.

Θεωρία ισορροπίας Nash
Θεωρία ισορροπίας Nash

Το ερώτημα είναι τι θα επιλέξει ο κάθε διαγωνιζόμενος;

"Να είσαι σιωπηλός, δεν μπορείς να μιλήσεις" ή "Δεν μπορείς να είσαι σιωπηλός, δεν μπορείς να μιλήσεις"

Για να κατανοήσετε την επιλογή του συμμετέχοντος, πρέπει να περάσετε από την αλυσίδα των σκέψεών του. Μετά το σκεπτικό του εγκληματία Α: αν σιωπήσω και ο σύντροφός μου σιωπήσει, θα λάβουμε ελάχιστη θητεία (1 έτος), αλλά εγώΔεν ξέρω πώς θα φερθεί. Αν καταθέσει εναντίον μου, τότε καλύτερα να καταθέσω, αλλιώς μπορώ να κάτσω 5 χρόνια. Προτιμώ να κάτσω 2,5 χρόνια παρά 5 χρόνια. Αν σιωπήσει, τόσο περισσότερο χρειάζεται να καταθέσω, γιατί έτσι θα αποκτήσω την ελευθερία μου. Συμμετέχων Β.

ισορροπία John Nash
ισορροπία John Nash

Δεν είναι δύσκολο να καταλάβει κανείς ότι η κυρίαρχη στρατηγική για καθέναν από τους δράστες είναι η κατάθεση. Το βέλτιστο σημείο αυτού του παιχνιδιού έρχεται όταν και οι δύο εγκληματίες καταθέσουν και λάβουν το «βραβείο» τους - 2,5 χρόνια φυλάκιση. Η θεωρία παιχνιδιών Nash ονομάζει αυτή την ισορροπία.

Μη βέλτιστη βέλτιστη λύση Nash

Η επαναστατική φύση της άποψης του Nashian είναι ότι μια τέτοια ισορροπία δεν είναι η βέλτιστη όταν εξετάζουμε τον μεμονωμένο συμμετέχοντα και το προσωπικό του συμφέρον. Εξάλλου, η καλύτερη επιλογή είναι να παραμείνετε σιωπηλοί και να αφεθείτε ελεύθεροι.

Η ισορροπία Nash είναι ένα σημείο σύγκλισης συμφερόντων, όπου κάθε συμμετέχων επιλέγει τη βέλτιστη επιλογή για αυτόν μόνο εάν άλλοι συμμετέχοντες επιλέξουν μια συγκεκριμένη στρατηγική.

Λαμβάνοντας υπόψη την επιλογή όταν και οι δύο εγκληματίες είναι σιωπηλοί και λαμβάνουν μόνο 1 χρόνο, μπορούμε να την ονομάσουμε ως βέλτιστη επιλογή Pareto. Ωστόσο, είναι δυνατό μόνο εάν οι εγκληματίες μπορούσαν να συμφωνήσουν εκ των προτέρων. Αλλά και αυτό δεν θα εγγυάται αυτό το αποτέλεσμα, αφού ο πειρασμός να αποσυρθεί κανείς από τη συμφωνία και να αποφύγει την τιμωρία είναι μεγάλος. Η έλλειψη απόλυτης εμπιστοσύνης ο ένας στον άλλο και ο κίνδυνος να πάρουν 5 χρόνια αναγκασμένοι να επιλέξουν την επιλογή με αναγνώριση. Σκεφτείτε τι θα τηρήσουν οι συμμετέχοντεςΗ επιλογή με τη σιωπή, η δράση σε συνεννόηση, είναι απλώς παράλογη. Ένα τέτοιο συμπέρασμα μπορεί να εξαχθεί αν μελετήσουμε την ισορροπία Nash. Τα παραδείγματα αποδεικνύουν μόνο ότι έχετε δίκιο.

Εγωιστής ή ορθολογικός

Η Θεωρία Ισορροπίας Nash έδωσε εκπληκτικά συμπεράσματα που διέψευσαν τις αρχές που υπήρχαν πριν. Για παράδειγμα, ο Adam Smith θεώρησε τη συμπεριφορά καθενός από τους συμμετέχοντες ως εντελώς εγωιστική, γεγονός που έφερε το σύστημα σε ισορροπία. Αυτή η θεωρία ονομάστηκε «αόρατο χέρι της αγοράς».

Θεωρία ισορροπίας John Nash
Θεωρία ισορροπίας John Nash

Ο John Nash είδε ότι εάν όλοι οι συμμετέχοντες ενεργήσουν για τα δικά τους συμφέροντα, αυτό δεν θα οδηγήσει ποτέ σε ένα βέλτιστο ομαδικό αποτέλεσμα. Δεδομένου ότι η ορθολογική σκέψη είναι εγγενής σε κάθε συμμετέχοντα, η επιλογή που προσφέρει η στρατηγική ισορροπίας Nash είναι πιο πιθανή.

Πείραμα αμιγώς ανδρικό

Ένα χαρακτηριστικό παράδειγμα είναι το παιχνίδι του ξανθού παράδοξου, το οποίο, αν και φαίνεται εκτός τόπου, είναι μια ξεκάθαρη απεικόνιση του πώς λειτουργεί η θεωρία παιγνίων Nash.

Σε αυτό το παιχνίδι πρέπει να φανταστείτε ότι μια παρέα με δωρεάν παιδιά ήρθε σε ένα μπαρ. Κοντά είναι μια παρέα κοριτσιών, μια από τις οποίες είναι προτιμότερη από άλλες, ας πούμε μια ξανθιά. Πώς ενεργούν οι άντρες για να αποκτήσουν την καλύτερη κοπέλα για τον εαυτό τους;

κατάσταση ισορροπίας
κατάσταση ισορροπίας

Λοιπόν, το σκεπτικό των αγοριών: αν όλοι αρχίσουν να εξοικειώνονται με την ξανθιά, τότε, πιθανότατα, κανείς δεν θα το πάρει, τότε οι φίλοι της δεν θα θέλουν να γνωριστούν. Κανείς δεν θέλει να είναι ο δεύτερος εναλλακτικός. Αν όμως τα αγόρια επιλέξουν να αποφύγουνξανθιά, τότε η πιθανότητα για καθένα από τα αγόρια να βρει μια καλή φίλη ανάμεσα στα κορίτσια είναι μεγάλη.

Η κατάσταση ισορροπίας Nash δεν είναι η βέλτιστη για τους άντρες, γιατί, επιδιώκοντας μόνο τα δικά τους εγωιστικά συμφέροντα, ο καθένας θα διάλεγε την ξανθιά. Φαίνεται ότι η επιδίωξη μόνο ιδιοτελών συμφερόντων θα ισοδυναμεί με κατάρρευση ομαδικών συμφερόντων. Η ισορροπία Nash θα σημαίνει ότι κάθε τύπος ενεργεί για τα δικά του συμφέροντα, τα οποία έρχονται σε επαφή με τα συμφέροντα ολόκληρης της ομάδας. Αυτή δεν είναι η καλύτερη επιλογή για όλους προσωπικά, αλλά η καλύτερη για όλους, με βάση τη συνολική στρατηγική επιτυχίας.

Όλη μας η ζωή είναι ένα παιχνίδι

Η λήψη αποφάσεων στον πραγματικό κόσμο μοιάζει πολύ με ένα παιχνίδι όπου περιμένεις ορισμένες ορθολογικές συμπεριφορές και από άλλους συμμετέχοντες. Στις επιχειρήσεις, στη δουλειά, σε μια ομάδα, σε μια εταιρεία, ακόμα και σε σχέσεις με το αντίθετο φύλο. Από μεγάλες συμφωνίες έως συνηθισμένες καταστάσεις ζωής, όλα υπακούουν στον έναν ή τον άλλο νόμο.

θεωρία παιχνιδιών nash
θεωρία παιχνιδιών nash

Φυσικά, οι παραπάνω καταστάσεις παιχνιδιού με εγκληματίες και ένα μπαρ είναι απλώς εξαιρετικές απεικονίσεις που δείχνουν την ισορροπία Nash. Παραδείγματα τέτοιων διλημμάτων προκύπτουν πολύ συχνά στην πραγματική αγορά, και αυτό λειτουργεί ιδιαίτερα σε περιπτώσεις όπου δύο μονοπώλια ελέγχουν την αγορά.

Μικτές στρατηγικές

Συχνά συμμετέχουμε όχι σε ένα, αλλά σε πολλά παιχνίδια ταυτόχρονα. Επιλέγοντας μία από τις επιλογές σε ένα παιχνίδι, με γνώμονα μια λογική στρατηγική, αλλά καταλήγετε σε ένα άλλο παιχνίδι. Μετά από μερικές ορθολογικές αποφάσεις, μπορεί να διαπιστώσετε ότι το αποτέλεσμα δεν σας αρέσει. Τιπαίρνω;

Ας εξετάσουμε δύο τύπους στρατηγικής:

  • Η καθαρή στρατηγική είναι η συμπεριφορά του συμμετέχοντος, η οποία προέρχεται από τη σκέψη για την πιθανή συμπεριφορά άλλων συμμετεχόντων.
  • Μικτή στρατηγική ή τυχαία στρατηγική είναι η εναλλαγή καθαρών στρατηγικών τυχαία ή η επιλογή μιας καθαρής στρατηγικής με μια ορισμένη πιθανότητα. Αυτή η στρατηγική ονομάζεται επίσης τυχαιοποιημένη.
Ισορροπία Nash σε μικτές στρατηγικές
Ισορροπία Nash σε μικτές στρατηγικές

Λαμβάνοντας υπόψη αυτή τη συμπεριφορά, έχουμε μια νέα ματιά στην ισορροπία Nash. Αν νωρίτερα ειπώθηκε ότι ο παίκτης επιλέγει μια στρατηγική μια φορά, τότε μπορεί να φανταστεί κανείς μια άλλη συμπεριφορά. Μπορεί να υποτεθεί ότι οι παίκτες επιλέγουν μια στρατηγική τυχαία με μια συγκεκριμένη πιθανότητα. Τα παιχνίδια που δεν μπορούν να βρουν τις ισορροπίες Nash σε καθαρές στρατηγικές τα έχουν πάντα σε μικτές στρατηγικές.

Η ισορροπία Nash στις μικτές στρατηγικές ονομάζεται μικτή ισορροπία. Αυτή είναι μια ισορροπία όπου κάθε συμμετέχων επιλέγει τη βέλτιστη συχνότητα επιλογής των στρατηγικών του, υπό την προϋπόθεση ότι οι άλλοι συμμετέχοντες επιλέγουν τις στρατηγικές τους με μια δεδομένη συχνότητα.

Πέναλτι και μικτή στρατηγική

Ένα παράδειγμα μικτής στρατηγικής μπορεί να βρεθεί στο παιχνίδι του ποδοσφαίρου. Το καλύτερο παράδειγμα μιας μικτής στρατηγικής είναι ίσως η διαδικασία των πέναλτι. Έτσι, έχουμε έναν τερματοφύλακα που μπορεί να πηδήξει μόνο σε μια γωνία και έναν παίκτη που θα εκτελεί το πέναλτι.

Λοιπόν, αν την πρώτη φορά που ο παίκτης επιλέξει τη στρατηγική για να σουτάρει στην αριστερή γωνία και ο τερματοφύλακας πέσει επίσης σε αυτή τη γωνία και πιάσει την μπάλα, πώς μπορούν να εξελιχθούν τα πράγματα τη δεύτερη φορά; Αν ο παίκτηςθα χτυπήσει στην αντίθετη γωνία, αυτό είναι πιθανότατα πολύ προφανές, αλλά το χτύπημα στην ίδια γωνία δεν είναι λιγότερο προφανές. Επομένως, τόσο ο τερματοφύλακας όσο και ο παίκτης δεν έχουν άλλη επιλογή από το να βασίζονται σε τυχαία επιλογή.

Έτσι, εναλλάσσοντας την τυχαία επιλογή με μια συγκεκριμένη καθαρή στρατηγική, ο παίκτης και ο τερματοφύλακας προσπαθούν να πάρουν το μέγιστο αποτέλεσμα.

Συνιστάται: