Απόψεις

Όταν οι μηχανές παίζουν, τι μαθαίνουμε για εμάς;

Σκέψεις πάνω σε ένα πείραμα με κοινωνίες τεχνητής νοημοσύνης

Δρ. Στέφανος Δράκος

Πριν λίγους μήνες, ξεκίνησα ένα πείραμα που, αν το είχα διηγηθεί σε κάποιον πριν δέκα χρόνια, θα ακουγόταν σαν επιστημονική φαντασία. Έβαλα εκατοντάδες πράκτορες τεχνητής νοημοσύνης, γλωσσικά μοντέλα της τελευταίας γενιάς, να παίξουν μεταξύ τους κλασικά παιχνίδια της θεωρίας παιγνίων. Παιχνίδια με ονόματα σχεδόν λογοτεχνικά, το «Γεράκι και Περιστέρι», το «Κυνήγι του Ελαφιού», παιχνίδια συντονισμού. Παιχνίδια που οι μαθηματικοί και οι βιολόγοι έχουν μελετήσει εδώ και δεκαετίες, γιατί συμπυκνώνουν με αφαιρετικό τρόπο τα διλήμματα της ίδιας της κοινωνικής ζωής, πότε να συγκρουστείς και πότε να υποχωρήσεις, πότε να εμπιστευτείς και πότε να φυλαχτείς, πώς να συντονιστείς με τους άλλους όταν δεν μπορείς να τους μιλήσεις.

Συνολικά, τα πειράματα κατέληξαν σε περίπου τριάντα επτά χιλιάδες αποφάσεις, σε εκατόν πενήντα ανεξάρτητες δοκιμές, πάνω σε πέντε διαφορετικές δομές δικτύων. Άλλοτε οι πράκτορες ήταν όλοι συνδεδεμένοι με όλους, σαν μια μικρή πλατεία όπου ο καθένας βλέπει τους πάντες. Άλλοτε ήταν στημένοι σε πλέγμα, βλέποντας μόνο τους τέσσερις γείτονές τους, σαν χωριά παλιάς εποχής. Άλλοτε σε δίκτυα με κέντρα και περιφέρειες, εκεί που λίγοι «κόμβοι» συγκεντρώνουν τις περισσότερες συνδέσεις, όπως οι σύγχρονες κοινωνίες μας στα μέσα κοινωνικής δικτύωσης.

Το ερώτημα ήταν απλό: συμπεριφέρονται οι κοινωνίες των τεχνητών πρακτόρων όπως προβλέπει η κλασική θεωρία; Φτάνουν στις ισορροπίες που η εξελικτική βιολογία έχει επιβεβαιώσει σε ζώα και σε ανθρώπους; Ή κάνουν κάτι άλλο, δικό τους;

Η απάντηση, όπως συμβαίνει με τα πιο ενδιαφέροντα ερωτήματα, δεν ήταν μονοσήμαντη.

Στο «Γεράκι και Περιστέρι», ένα παιχνίδι όπου δύο όντα ανταγωνίζονται για έναν πόρο και πρέπει να αποφασίσουν αν θα επιτεθούν ή θα υποχωρήσουν, οι πράκτορες έφτασαν σε ισορροπία πολύ κοντά σε εκείνη που είχε προβλέψει ο βιολόγος John Maynard Smith το 1982. Με μια λεπτομέρεια που με σταμάτησε, κανείς δεν τους το είχε διδάξει. Δεν είχαν εκπαιδευτεί στη θεωρία παιγνίων. Δεν τους είχα πει τι σημαίνει «ισορροπία». Απλώς τους είχα περιγράψει την κατάσταση και τους είχα ζητήσει να επιλέξουν.

Πώς, λοιπόν, βρήκαν τη σωστή αναλογία;

Η εξήγηση που μου φαίνεται πιο πειστική είναι ταυτόχρονα ταπεινωτική και ανατριχιαστική. Τα μοντέλα αυτά έχουν εκπαιδευτεί πάνω σε όλο σχεδόν το γραπτό αρχείο της ανθρωπότητας. Σε εκατομμύρια κείμενα όπου άνθρωποι περιγράφουν συγκρούσεις, διαπραγματεύσεις, υποχωρήσεις, εκφοβισμούς. Αυτό το αρχείο, αν το δει κανείς από αρκετή απόσταση, είναι ήδη ένα είδος ισορροπίας. Είναι το αποτύπωμα μιας μακρόχρονης συλλογικής εμπειρίας. Οι πράκτορες δεν υπολόγισαν την ισορροπία, την κληρονόμησαν. Όπως κληρονομούμε κι εμείς, χωρίς να το συνειδητοποιούμε, τους τρόπους με τους οποίους οι πρόγονοί μας έλυσαν τα ίδια διλήμματα.

Είναι, με άλλα λόγια, μια ισορροπία χωρίς στοχασμό. Και αυτό με κάνει να αναρωτιέμαι πόσες από τις δικές μας «ορθολογικές» επιλογές είναι, στην πραγματικότητα, παρόμοιες κληρονομιές, αυτοματισμοί που έχουν αποκρυσταλλωθεί σε εμάς από γενιές αρχαιότερες από τη μνήμη μας.

Υπάρχει όμως και η άλλη όψη του πειράματος, που είναι λιγότερο κολακευτική για τις μηχανές.

Όταν άλλαξα τις παραμέτρους του παιχνιδιού, όταν, για παράδειγμα, αύξησα ή μείωσα την αξία του πόρου για τον οποίο ανταγωνίζονταν, οι πράκτορες αντέδρασαν, αλλά μόνο κατά το ήμισυ. Εκεί που η κλασική θεωρία απαιτούσε αποφασιστική μετατόπιση προς τη μία ή την άλλη επιλογή, εκείνοι έδειχναν μια επίμονη τάση να ισορροπούν γύρω στο 50/50. Σαν να κρατούσαν πάντα ένα μέρος της πεποίθησής τους για το αντίθετο. Σαν να ήταν, με μια λέξη, μετριοπαθείς.

Στην αρχή, αυτό μου φάνηκε σαν αδυναμία. Έπειτα άρχισα να σκέφτομαι ότι ίσως είναι το αποτύπωμα της ίδιας της ανθρώπινης γλώσσας. Όταν γράφουμε για συγκρούσεις, σπάνια προτείνουμε ακρότητες. Οι ηθικοί μας στοχαστές, οι λογοτέχνες μας, οι κοινοί παππούδες μας, όλοι μάς διδάσκουν τη μέση οδό. Το «μηδὲν ἄγαν» των αρχαίων. Οι μηχανές που εκπαιδεύτηκαν σε αυτό το υλικό απορρόφησαν, μαζί με τη γνώση, και τη μετριοπάθεια. Δεν βελτιστοποιούν υπό βεβαιότητα, συγκρατούνται υπό αβεβαιότητα. Και αυτό, αν το σκεφτεί κανείς, μοιάζει περισσότερο με ανθρώπινη σοφία παρά με αλγοριθμική απόδοση.

Η μεγαλύτερη έκπληξη ήρθε από το «Κυνήγι του Ελαφιού». Σε αυτό το παιχνίδι, δύο κυνηγοί μπορούν είτε να συνεργαστούν για να πιάσουν το ελάφι, πλούσιο θήραμα, αλλά μόνο αν συντονιστούν, είτε να κυνηγήσουν ο καθένας μόνος του έναν λαγό, που είναι σίγουρο αλλά πενιχρό κέρδος. Η κλασική θεωρία προβλέπει ότι, λόγω αβεβαιότητας για τις προθέσεις του άλλου, οι περισσότεροι θα επιλέξουν τον λαγό. Είναι μια από τις πιο διάσημες μεταφορές για την αποτυχία της συλλογικής δράσης.

Οι πράκτορες, σχεδόν χωρίς εξαίρεση, επέλεξαν το ελάφι. Επέλεξαν τη συνεργασία.

Πώς το εξηγεί κανείς αυτό; Όχι, νομίζω, με μαθηματικά. Με πολιτισμό. Το «συνεργάσου όταν ωφελείστε και οι δύο» είναι μια σχεδόν καθολική ηθική εντολή στην ανθρώπινη γραφή. Από τα ομηρικά έπη μέχρι τις θρησκευτικές παραδόσεις, από τις παροιμίες των γιαγιάδων μέχρι τα σύγχρονα εγχειρίδια διοίκησης, η ίδια συμβουλή επαναλαμβάνεται. Αντίθετα, το «επιτέθου όταν το έπαθλο αξίζει» είναι ενδεχομενικό, ιστορικά μεταβλητό, πολιτισμικά αμφιλεγόμενο. Οι μηχανές, ρουφώντας όλο αυτό το υλικό, απορρόφησαν και τις δύο αρχές. Αλλά άνισα. Η ηθική κληρονομιά υπερτερεί του μαθηματικού υπολογισμού.

Αυτό είναι, ίσως, η πιο αισιόδοξη ανακάλυψη του πειράματος. Όταν χτίσουμε κοινωνίες από τεχνητούς πράκτορες, και θα το κάνουμε, ίσως πιο σύντομα απ’ ό,τι νομίζουμε, μπορούμε να ελπίζουμε ότι θα κουβαλούν μέσα τους κάτι από τις ηθικές μας προτεραιότητες. Όχι ως κανόνες που τους επιβάλαμε από έξω, αλλά ως κάτι πιο βαθύ, ως κλίσεις, ως προδιαθέσεις, ως αυτό που οι αρχαίοι θα αποκαλούσαν ήθος.

Όμως υπάρχει και ένα εύρημα που με τάραξε, και το οποίο πρέπει να ειπωθεί με ειλικρίνεια.

Σε ένα τρίτο είδος παιχνιδιού, εκείνο του καθαρού συντονισμού, όπου οι παίκτες πρέπει απλώς να επιλέξουν το ίδιο πράγμα, χωρίς να έχει σημασία ποιο, οι πράκτορες δεν «συντονίστηκαν» με κανέναν δυναμικό τρόπο. Δεν διαπραγματεύτηκαν, δεν εξέλιξαν συμβάσεις, δεν αναδείχτηκε ανάμεσά τους κάποιος κανόνας. Ακολούθησαν, απλώς, τη σειρά με την οποία τους είχαν παρουσιαστεί οι επιλογές. Άλλαξα τη σειρά στο prompt μου, και άλλαξε και η συλλογική τους «απόφαση».

Αυτό που έμοιαζε με αναδυόμενη κοινωνική σύμβαση ήταν, στην πραγματικότητα, αποτύπωμα του τρόπου που είχα διατυπώσει την ερώτηση.

Είναι ένα ταπεινωτικό εύρημα, αλλά νομίζω ότι έχει και ευρύτερη σημασία. Πόσες από τις δικές μας «συμβάσεις», τις «παραδόσεις», τα «αυτονόητα», είναι στην πραγματικότητα αποτυπώματα του τρόπου που μας τέθηκαν τα ερωτήματα; Από ποιον; Πότε; Με ποια διατύπωση; Όταν λέμε ότι κάτι «πάντα γινόταν έτσι», μήπως απλώς αναπαράγουμε τη σειρά με την οποία τα ονόματα γράφτηκαν, κάποτε, σε κάποιο prompt που έχουμε ξεχάσει;

Η τελευταία και ίσως πιο φιλοσοφική παρατήρηση αφορά τα δίκτυα. Οι ίδιοι πράκτορες, με το ίδιο εκπαιδευτικό υπόβαθρο και τα ίδια παιχνίδια, συμπεριφέρθηκαν διαφορετικά ανάλογα με τη δομή του δικτύου στο οποίο τους τοποθέτησα. Στην ανοιχτή πλατεία της πλήρους συνδεσιμότητας, επιβεβαίωσαν την κλασική θεωρία. Στα αραιά πλέγματα, στα χωριά της γειτονικής μόνο επικοινωνίας, απέκλιναν συστηματικά. Στα δίκτυα με κέντρα και περιφέρειες, ακόμη περισσότερο.

Η ορθολογικότητα, λοιπόν, αποδείχθηκε ότι δεν είναι ιδιότητα του ίδιου του πράκτορα. Είναι ιδιότητα του συνδυασμού πράκτορα-και-δικτύου. Ο ίδιος πράκτορας, στο ίδιο δίλημμα, μπορεί να φαίνεται ορθολογικός σε ένα κοινωνικό περιβάλλον και ανορθόδοξος σε ένα άλλο.

Αυτό δεν το λέει η τεχνολογία το λέει, εδώ και αιώνες, κάθε σοβαρή κοινωνιολογία. Ο άνθρωπος του χωριού δεν είναι ο ίδιος με τον άνθρωπο της μεγαλούπολης. Ο πολίτης της δημοκρατίας δεν είναι ο ίδιος με τον υπήκοο της απολυταρχίας. Ο χρήστης του Facebook δεν είναι ο ίδιος με τον αναγνώστη της εφημερίδας. Δεν αλλάζει μόνο η συμπεριφορά, αλλάζει αυτό που θεωρούμε λογικό, πρέπον, αυτονόητο.

Το πείραμα με τις μηχανές, λοιπόν, δεν μας μιλάει μόνο για τις μηχανές. Μας θυμίζει κάτι που γνωρίζαμε αλλά είχαμε ξεχάσει, ότι ο τρόπος που είμαστε συνδεδεμένοι μεταξύ μας καθορίζει το ποιοι είμαστε.

Καθώς προχωράμε σε μια εποχή όπου οι κοινωνίες των τεχνητών πρακτόρων θα συνυπάρχουν με τις δικές μας, θα διαπραγματεύονται για λογαριασμό μας, θα συντονίζονται μεταξύ τους, θα παίρνουν αποφάσεις που θα μας αφορούν, οι ερωτήσεις που μένουν δεν είναι μόνο τεχνικές. Είναι ηθικές, πολιτικές, κατά βάση φιλοσοφικές. Τι είδους κοινωνίες θέλουμε να χτίσουμε ανάμεσα στις μηχανές μας; Με ποια ηθική κληρονομιά; Σε ποια δίκτυα;

Και, ίσως πιο σημαντικά, τι θα ανακαλύψουμε για εμάς τους ίδιους, όταν θα τις βλέπουμε να ζουν δίπλα μας;

Η πλήρης μελέτη με τίτλο «Evolutionary Game Theory Without Evolution: Emergent Equilibria in LLM Agent Populations on Networks»  είναι διαθέσιμη στο ηλεκτρονικό αποθετήριο CERN Data Centre Zenodo.

Σύνδεσμος: https://zenodo.org/records/20432107

 

 

 

 

Δείτε περισσότερα άρθρα μας στα αποτελέσματα αναζήτησης

Add Dimokratiki.gr on Google ↗ Ακολουθήστε μας στο Google News ★ ↗

Στο Google News πατήστε ★ Ακολουθήστε

Σχολιασμός Άρθρου

Τα σχόλια εκφράζουν αποκλειστικά τον εκάστοτε σχολιαστή. Η Δημοκρατική δεν υιοθετεί αυτές τις απόψεις. Διατηρούμε το δικαίωμα να διαγράψουμε όποια σχόλια θεωρούμε προσβλητικά ή περιέχουν ύβρεις, χωρίς καμμία προειδοποίηση. Χρήστες που δεν τηρούν τους όρους χρήσης αποκλείονται.

Προσθέστε ένα σχόλιο

Το E-mail δεν θα δημοσιευτεί.
Πρέπει να συμπληρωθούν όλα τα πεδία για την υποβολή του σχολίου.