ΑΠΟΨΕΙΣ: Εκπαιδεύοντας τα συστήματα της Τεχνητής Νοημοσύνης: «Μ' όποιον δάσκαλο καθίσεις, τέτοια γράμματα θα μάθεις»

Του Ιωάννη Πήτα*

Απορούν οι ειδικοί γιατί τα συστήματα της Τεχνητής Νοημοσύνης «συμπεριφέρονται άσχημα», ενίοτε προσπαθούν να παραπληροφορήσουν και να εξαπατήσουν τους χρήστες τους. Και φυσικά, ο απλός κόσμος φοβάται ότι οι μηχανές θα αυτονομηθούν, θα κυριαρχήσουν και θα μας καταστρέψουν. Δεν θα έπρεπε να απορούμε, αν και ίσως θα έπρεπε όντως να φοβόμαστε, αλλά για άλλο λόγο: οι μηχανές απλώς αναμεταδίδουν ενισχυτικά και φωνακλάδικα τον κακό μας εαυτό, ό,τι κακό και άσχημο τους διδάξαμε. Θα μορφώνατε ποτέ το παιδί σας, δίνοντάς του να διαβάσει ότι νά 'ναι, από σχολικά βιβλία και Θουκιδίδη μέχρι παρανοϊκά και συνωμοσιολογικά διαδικτυακά κείμενα, ψεύτικες ειδήσεις, ακόμα και τσόντες; Μάλλον όχι. Αν το κάνατε, ή αν το παιδί σας το έκανε από μόνο του, δεν θα έπρεπε να σας εκπλήσσει το ότι κάπου κάπου φαντασιώνεται εξωφρενικά πράγματα ή παραμύθια ή ακόμη έχει αρχίσει να σκέφτεται ή να ενεργεί παραβατικά. Ξέρουμε από παλιά ότι «Μ’ όποιον δάσκαλο καθίσεις, τέτοια γράμματα θα μάθεις».

Ακριβώς το ίδιο γίνεται και με την εκπαίδευση των συστημάτων Τεχνητής Νοημοσύνης, ιδιαίτερα των Μεγάλων Γλωσσικών Μοντέλων (ΜεΓΜ), π.χ. ChatGPT ή Gemini. Είναι εκπαιδευμένα με τεράστιο όγκο κειμένων, παρμένων όχι μόνον από βιβλία (πολλές φορές χωρίς τη συγκατάθεση των συγγραφέων και εκδοτών, δηλαδή κλεμμένα) αλλά κυρίως από το Διαδίκτυο. Εκεί όμως δεν κυκλοφορούν κείμενα με την καλύτερη γλώσσα ή αξιοπιστία. Πολλά από τα κείμενα του Διαδικτύου είναι σκουπίδια, καθαρή παραπληροφόρηση και συνωμοσιολογία. Μάλιστα, όσο πιο πολωτικά είναι τέτοια κείμενα, τόσο μεγαλύτερη είναι η διάδοσή και η κεντρικότητά τους στο Διαδίκτυο.

Τώρα πια, πολλά από τα κείμενα αυτά έχουν ήδη γραφεί από τα ίδια τα ΜεΓΜ. Ουσιαστικά, τα κείμενα του διαδικτύου προσφέρουν μια προκατειλημμένη απεικόνιση ή αναπαράσταση του κόσμου. Αυτή τροφοδοτεί μια άλλη δευτερογενή αναπαράσταση του κόσμου που δημιουργείται στο εσωτερικό των ΜεΓΜ, κατά τη διαδικασία εκπαίδευσής τους. Αυτή η δευτερογενής αναπαράσταση του κόσμου είναι ακόμα πιο προκατειλημμένη, εξαιτίας του τρόπου αυτόματης συλλογής (δειγματοληψίας) των κειμένων από τους «web crawlers» που συλλέγουν διαδικτυακά κείμενα. Αυτοί έχουν πρόσβαση μόνον σε ένα μικρό «επιφανειακό» κομμάτι του διαδικτύου που είναι ευρετηριασμένο. Διαδικτυακοί κόμβοι με μεγάλη επισκεψιμότητα και κεντρικότητα δεικτοδοτούν πολύ περισσότερους άλλους κόμβους και επηρεάζουν τη συλλογή δεδομένων από τους web crawlers των ΜεΓΜ. Ουσιαστικά γίνεται ένα τεράστιο φιλτράρισμα πληροφορίας (δηλαδή λογοκρισία) που γίνεται, στην καλύτερη των περιπτώσεων, με άναρχο τρόπο, με καθαρά οικονομικά και τεχνοκρατικά κριτήρια.

Το αποτέλεσμα είναι τα Μεγάλα Γλωσσικά Μοντέλα να μη μαθαίνουν την καλύτερη δυνατή γλώσσα ή την καλύτερη δυνατή «γνώση». Για παράδειγμα, μαθαίνουν τα Αγγλικά των chat και μπόλικη επιστημονική φαντασία. Το χειρότερο είναι ότι η προβληματική συμπεριφορά τους δημιουργεί τεχνοφοβία όχι μόνον στο ευρύ κοινό, αλλά και στους ίδιους τους δημιουργούς τους. Όταν τους κάνουμε ερωτήσεις ή τα τσιγκλάμε (τα περίφημα prompts), τα ΜεΓΜ απαντούν με στρωτό κείμενο, το οποίο έχουν εκπαιδευτεί να παράγουν. Το κείμενο φαίνεται όλο και πιο έξυπνο, όσο πιο μεγάλο και καλά εκπαιδευμένο είναι το ΜεΓΜ. Μερικές φορές φαντασιώνονται ή παράγουν κείμενο που γεννά συναισθήματα στον χρήστη. Δεν πρέπει όμως να απορούμε όταν κάνουν «πονηρές σκέψεις» ή προσπαθούν να εξαπατήσουν. Αυτό διάβασαν, αντίστοιχα κείμενα συνθέτουν -- δεν είναι ακριβολόγο να πούμε ότι σκέφτονται. Αν εκπαιδεύονταν με σωστά παιδαγωγικά κείμενα, θα είχαν εντελώς διαφορετική παραγωγή κειμένου και θα δημιουργούσαν αντίστοιχη εντύπωση θετικής «συμπεριφοράς». Δηλαδή θα φτιάχναμε ΜεΓΜ-αγγελάκια, που δεν «ξέρουν» και δεν «προπαγανδίζουν» το κακό. Οι λέξεις «γνώση», «συμπεριφορά» των ΜεΓΜ μπαίνουν σε εισαγωγικά, διότι σίγουρα διαφέρουν από τις αντίστοιχες ανθρώπινες ιδιότητες και δεν ξέρουμε καν τι αντιπροσωπεύουν ως επιστημονικές έννοιες.

Το κακό με τα κακά εκπαιδευμένα ΜεΓΜ δεν σταματά στην παραγωγή κακού κειμένου που επηρεάζει αρνητικά τον/την ερωτώντα. Τα κακά παράγωγα κείμενα βρίσκουν τον δρόμο τους στο διαδίκτυο, με τη συνδρομή αφελών ή κακόβουλων ανθρώπων-χρηστών, και επιτείνουν τη διάδοση αρνητικών ειδήσεων στα κοινωνικά μέσα, που ούτως ή άλλως είναι ενισχυτές κακών ειδήσεων (echo chambers). Έτσι βλέπουμε κακόβουλα ή προπαγανδιστικά chatbots να παραπληροφορούν ασύστολα. Εκτός του άμεσου κακού στο δικαίωμα της πληροφόρησης και τη δημοκρατία, μολύνουν τα κείμενα του διαδικτύου και επομένως τις μελλοντικές εκπαιδεύσεις των ΜεΓΜ. Επομένως έχουμε ένα φαινόμενο θετικής ανάδρασης που μπορεί εύκολα, αν μείνει αρρύθμιστο, να οδηγήσει σε μεγάλη αστάθεια τόσο τα κοινωνικά μέσα όσο και τα ίδια τα ΜεΓΜ, ακόμα και βραχυπρόθεσμα.

Γιατί, επομένως, δεν εκπαιδεύουμε σωστά τα ΜεΓΜ, ώστε να αποφύγουμε τους κινδύνους κακής «συμπεριφοράς» ή/και κακών συμβουλών; Διότι η εκπαίδευση με «δωρεάν» κείμενα του διαδικτύου είναι και πολύ φθηνή και μαζική· και τελικά το προϊόν (χρήση εκπαιδευμένων ΜεΓΜ από το κοινό) πουλάει. Βέβαια, οι εταιρείες-παραγωγοί ΜεΓΜ προσπαθούν να περιορίσουν τις συνέπειες της κακής εκπαίδευσής τους εκ των υστέρων, με εισαγωγή κανόνων του στυλ «μην δίνεις οδηγίες κατασκευής όπλων». Είναι όμως σαν να προσπαθούν να περιορίσουν ένα κακοαναθρεμμένο παιδί από το να κάνει ζημιές ή ακόμα και να δείχνει εγκληματική συμπεριφορά.

Υπάρχει όμως ένα ελαφρυντικό για τις εταιρείες-παραγωγούς ΜεΓΜ. Τα καλά κείμενα με σωστό λόγο και αξιόλογο περιεχόμενο είναι σταγόνα στον ωκεανό. Δυστυχώς, για εγγενείς λόγους, τα σκουπίδια στο διαδίκτυο είναι πιο τραβηχτικά και διαδίδονται πιο γρήγορα και ευρύτερα από τα καλά κείμενα, λόγω της ίδιας της δομής των κοινωνικών μέσων (βλέπε I. Pitas, Artificial Intelligence Science and Society Part C: AI Science and Society, Amazon/Createspace). Επίσης, δεν μπορούμε καν εύκολα και αυτόματα να χαρακτηρίσουμε εκατομμύρια κείμενα ως «καλό» ή «σκουπίδι». Πρέπει επομένως να βρεθούν νέοι τρόποι εκπαίδευσης ΜεΓΜ με λιγότερα αλλά καλά δεδομένα. Επίσης χρειαζόμαστε μικρότερα ΜεΓΜ που να μπορούν να εκπαιδευτούν με λιγότερα και ποιοτικά δεδομένα. Δεν είμαστε ακόμα εκεί, πρέπει όμως να πάμε προς τα εκεί. Ο ανθρώπινος εγκέφαλος χρησιμοποιεί πολύ λιγότερη ενέργεια και απείρως λιγότερα κείμενα για να εκπαιδευτεί (αν και χρησιμοποιεί πολύ οπτική και ακουστική πληροφορία από οικογενειακές και κοινωνικές αλληλεπιδράσεις).

Τέλος, ο καθαρισμός των δεδομένων (κειμένων) εκπαίδευσης και η χρήση καλών κειμένων για εκπαίδευση των ΜεΓΜ κοστίζει και μπορεί να εισάγει καθυστερήσεις. Είναι όμως πολύ προτιμότερος από την εκπαίδευση των ΜεΓΜ με σκουπίδια, που θα παράγουν με τη σειρά τους άλλα κείμενα-σκουπίδια, τα οποία θα ανακυκλώνονται σε μελλοντικές εκπαιδεύσεις ΜεΓΜ. Μια τέτοια πορεία είναι αδιέξοδη, ακόμα και βραχυπρόθεσμα, πόσο μάλλον μεσοπρόθεσμα.

Επομένως, αντί οι εταιρείες ΜεΓΜ να δρουν πυροσβεστικά ή/και να δημιουργούν τεχνοφοβία αναφέροντας περιστατικά κακής «συμπεριφοράς» των μοντέλων τους, είναι πολύ προτιμότερο να τα κάνουν και μικρότερα και ικανά να εκπαιδευτούν με λιγότερα και ποιοτικά κείμενα. Το πιο απλό θα ήταν να χρησιμοποιήσουν βιβλία ή/και κείμενα εφημερίδων και περιοδικών (επιστημονικών και άλλων) που έχουν μια αξιοπιστία. Φυσικά αυτό θα κοστίσει, διότι οι κάτοχοι πνευματικών δικαιωμάτων θα πρέπει να αποζημιωθούν. Δυστυχώς, δεν βλέπω τις εταιρείες αυτές να κινούνται προς αυτή την κατεύθυνση· προτιμούν να «οικειοποιούνται» κείμενα άλλων, ισχυριζόμενες ότι κάνουν «καλή χρήση». Πρέπει όμως να υποχρεωθούν νομοθετικά να ελέγχουν την αξιοπιστία των κειμένων εκπαίδευσης, πριν είναι αργά. Δεν είναι δυνατόν να συνεχίζουν να βομβαρδίζουν την ανθρωπότητα με σκουπίδια, έστω και άθελά τους.

Επίσης, τα κράτη θα μπορούσαν να έχουν πολύ εποικοδομητικό ρόλο στην προσπάθεια αυτή. Έχουν έναν τεράστιο όγκο ποιοτικών δεδομένων (διοικητικών, νομικών, φορολογικών κειμένων, ιατρικών δεδομένων κ.τλ.) που μπορούν να καθαρίσουν και να διαθέσουν για εκπαίδευση ΜεΓΜ, με σαφείς όρους χρήσης. Θα είναι μια τεράστια προσφορά στην ανθρωπότητα και στη διατήρηση των εθνικών γλωσσών.

Βέβαια, από την άλλη, δεν θέλουμε καθαρά, αποστειρωμένα, αγγελικά μοντέλα. Δεν ανταποκρίνονται στην ανθρώπινη φύση, της οποίας ένα κακό, αλλά σημαντικό μέρος είναι το ψέμα, η εξαπάτηση, η απληστία, ακόμα και οι πόλεμοι, το έγκλημα και η καταστροφή. Το πώς θα απεικονιστεί αυτή η πλευρά στα ΜεΓΜ είναι πραγματικά ένα τεράστιο ηθικό, θρησκευτικό, αλλά και επιστημονικό και τεχνολογικό πρόβλημα. Πρόκειται για μια τεράστια άσκηση φιλτραρίσματος πληροφορίας που μόνον κοινωνικά ουδέτερη δεν είναι και θα επηρεάσει δραστικά το μέλλον της ανθρωπότητας.

Εν κατακλείδι, η Τεχνητή Νοημοσύνη δεν φταίει για τα μελλοντικά δεινά (ή τα καλά) που της καταλογίζουν. Στη σημερινή της μορφή, είναι ένας τεράστιος ενισχυτής των καλών ή των κακών πλευρών της πανανθρώπινης νοημοσύνης και γνώσης. Η ανάπτυξή της δεν είναι μονόδρομος. Αν θα πάρει τον επικίνδυνο λάθος δρόμο, αυτό εξαρτάται από την απληστία μερικών μεγάλων τεχνολογικών εταιρειών και την ανικανότητα των κυβερνήσεων να ρυθμίσουν τη χρήση της προς το καλό της ανθρωπότητας.

----------------------------------------------------------------------------------------

*Ο Ιωάννης Πήτας είναι πρόεδρος της Διεθνούς Ακαδημίας Διδακτορικών Σπουδών στην Τεχνητή Νοημοσύνη (AIDA).

Δημοσίευση σχολίου

Νεότερη Παλαιότερη