Για να δημιουργήσει ένα μυθιστόρημα ή έναν πίνακα ζωγραφικής, ένας καλλιτέχνης κάνει επιλογές που είναι θεμελιωδώς ξένες προς την τεχνητή νοημοσύνη.
Από τον Ted Chiang
Το 1953, ο Roald Dahl δημοσίευσε το «The Great Automatic Grammatizator», ένα διήγημα για έναν ηλεκτρολόγο μηχανικό που επιθυμεί κρυφά να γίνει συγγραφέας. Μια μέρα, μετά την ολοκλήρωση της κατασκευής της ταχύτερης υπολογιστικής μηχανής του κόσμου, ο μηχανικός συνειδητοποιεί ότι «η αγγλική γραμματική διέπεται από κανόνες που είναι σχεδόν μαθηματικοί στην αυστηρότητά τους». Κατασκευάζει μια μηχανή συγγραφής μυθιστορημάτων που μπορεί να παράγει ένα διήγημα πέντε χιλιάδων λέξεων σε τριάντα δευτερόλεπτα- ένα μυθιστόρημα χρειάζεται δεκαπέντε λεπτά και απαιτεί από τον χειριστή να χειρίζεται χειρολαβές και πεντάλ, σαν να οδηγούσε αυτοκίνητο ή να έπαιζε όργανο, για να ρυθμίζει τα επίπεδα χιούμορ και πάθους. Τα μυθιστορήματα που προκύπτουν είναι τόσο δημοφιλή που, μέσα σε ένα χρόνο, η μισή μυθοπλασία που εκδίδεται στα αγγλικά είναι προϊόν της εφεύρεσης του μηχανικού.
Υπάρχει κάτι στην τέχνη που μας κάνει να πιστεύουμε ότι δεν μπορεί να δημιουργηθεί με το πάτημα ενός κουμπιού, όπως στη φαντασία του Νταλ; Αυτή τη στιγμή, η μυθοπλασία που παράγεται από μεγάλα γλωσσικά μοντέλα όπως το ChatGPT είναι απαίσια, αλλά μπορεί κανείς να φανταστεί ότι τέτοια προγράμματα μπορεί να βελτιωθούν στο μέλλον. Πόσο καλά θα μπορούσαν να γίνουν; Θα μπορούσαν να γίνουν καλύτερα από τους ανθρώπους στο να γράφουν μυθοπλασία -ή να φτιάχνουν πίνακες ή ταινίες- με τον ίδιο τρόπο που οι αριθμομηχανές είναι καλύτερες στην πρόσθεση και την αφαίρεση;
Η τέχνη είναι γνωστό ότι είναι δύσκολο να οριστεί, το ίδιο και οι διαφορές μεταξύ καλής και κακής τέχνης. Επιτρέψτε μου όμως να προσφέρω μια γενίκευση: η τέχνη είναι κάτι που προκύπτει από την πραγματοποίηση πολλών επιλογών. Αυτό ίσως είναι πιο εύκολο να εξηγηθεί αν χρησιμοποιήσουμε τη συγγραφή μυθοπλασίας ως παράδειγμα. Όταν γράφετε μυθοπλασία, κάνετε -συνειδητά ή ασυνείδητα- μια επιλογή σχεδόν για κάθε λέξη που πληκτρολογείτε- για να το απλοποιήσουμε, μπορούμε να φανταστούμε ότι ένα διήγημα δέκα χιλιάδων λέξεων απαιτεί κάτι της τάξης των δέκα χιλιάδων επιλογών. Όταν δίνετε σε ένα πρόγραμμα δημιουργικής τεχνητής νοημοσύνης μια προτροπή, κάνετε πολύ λίγες επιλογές- αν δώσετε μια προτροπή εκατό λέξεων, έχετε κάνει περίπου εκατό επιλογές.
Εάν μια τεχνητή νοημοσύνη παράγει μια ιστορία δέκα χιλιάδων λέξεων με βάση την εντολή σας, πρέπει να συμπληρώσει όλες τις επιλογές που δεν κάνατε εσείς. Υπάρχουν διάφοροι τρόποι με τους οποίους μπορεί να το κάνει αυτό. Ένας από αυτούς είναι να πάρει έναν μέσο όρο των επιλογών που έχουν κάνει άλλοι συγγραφείς, όπως αυτές αντιπροσωπεύονται από κείμενα που βρίσκονται στο Διαδίκτυο- αυτός ο μέσος όρος είναι ισοδύναμος με τις λιγότερο ενδιαφέρουσες επιλογές, γι’ αυτό και το κείμενο που δημιουργείται από τεχνητή νοημοσύνη είναι συχνά πολύ άνοστο. Μια άλλη περίπτωση είναι να δοθεί εντολή στο πρόγραμμα να μιμηθεί το ύφος, μιμούμενο τις επιλογές που έκανε ένας συγκεκριμένος συγγραφέας, γεγονός που παράγει μια εξαιρετικά παράγωγη ιστορία. Σε καμία από τις δύο περιπτώσεις δεν δημιουργείται ενδιαφέρουσα τέχνη.
Νομίζω ότι η ίδια βασική αρχή ισχύει και για τις εικαστικές τέχνες, αν και είναι πιο δύσκολο να ποσοτικοποιηθούν οι επιλογές που μπορεί να κάνει ένας ζωγράφος. Οι πραγματικοί πίνακες φέρουν το σημάδι ενός τεράστιου αριθμού αποφάσεων. Συγκριτικά, ένα άτομο που χρησιμοποιεί ένα πρόγραμμα μετατροπής κειμένου σε εικόνα, όπως το DALL-E, εισάγει μια προτροπή όπως «Ένας ιππότης με πανοπλία πολεμά έναν δράκο που αναπνέει φωτιά» και αφήνει το πρόγραμμα να κάνει τα υπόλοιπα. (Η νεότερη έκδοση του DALL-E δέχεται προτροπές μέχρι και τεσσάρων χιλιάδων χαρακτήρων – εκατοντάδες λέξεις, αλλά όχι αρκετές για να περιγράψουν κάθε λεπτομέρεια μιας σκηνής). Οι περισσότερες από τις επιλογές στην εικόνα που προκύπτει πρέπει να δανειστούν από παρόμοιους πίνακες που βρίσκονται στο διαδίκτυο- η εικόνα μπορεί να είναι εξαιρετικά αποτυπωμένη, αλλά το άτομο που εισάγει την προτροπή δεν μπορεί να διεκδικήσει τα εύσημα γι’ αυτό.
Ορισμένοι σχολιαστές φαντάζονται ότι οι image generators θα επηρεάσουν την οπτική κουλτούρα όπως έκανε κάποτε η έλευση της φωτογραφίας. Αν και αυτό μπορεί να φαίνεται επιφανειακά εύλογο, η ιδέα ότι η φωτογραφία είναι παρόμοια με τη γενετική τεχνητή νοημοσύνη αξίζει να εξεταστεί πιο προσεκτικά. Όταν αναπτύχθηκε για πρώτη φορά η φωτογραφία, υποψιάζομαι ότι δεν φαινόταν σαν ένα καλλιτεχνικό μέσο επειδή δεν ήταν προφανές ότι υπήρχαν πολλές επιλογές που έπρεπε να γίνουν- απλά στήνατε τη φωτογραφική μηχανή και ξεκινούσατε τη φωτογράφηση. Αλλά με την πάροδο του χρόνου οι άνθρωποι συνειδητοποίησαν ότι υπήρχε ένας τεράστιος αριθμός πραγμάτων που μπορούσες να κάνεις με τις φωτογραφικές μηχανές και ότι η τέχνη έγκειται στις πολλές επιλογές που κάνει ένας φωτογράφος. Μπορεί να μην είναι πάντα εύκολο να διατυπώσεις ποιες είναι οι επιλογές, αλλά όταν συγκρίνεις τις φωτογραφίες ενός ερασιτέχνη με τις φωτογραφίες ενός επαγγελματία, μπορείς να δεις τη διαφορά. Έτσι, λοιπόν, το ερώτημα γίνεται: Υπάρχει παρόμοια δυνατότητα να κάνετε έναν τεράστιο αριθμό επιλογών χρησιμοποιώντας text-to-image generator; Νομίζω ότι η απάντηση είναι όχι. Ένας καλλιτέχνης -είτε δουλεύει ψηφιακά είτε με χρώμα- λαμβάνει σιωπηρά πολύ περισσότερες αποφάσεις κατά τη διαδικασία κατασκευής ενός πίνακα από όσες θα χωρούσαν σε μια προτροπή κειμένου μερικών εκατοντάδων λέξεων.
Μπορούμε να φανταστούμε text-to-image generator που, κατά τη διάρκεια πολλών συνεδριών, σας επιτρέπει να εισάγετε δεκάδες χιλιάδες λέξεις στο πλαίσιο κειμένου της, ώστε να είναι δυνατός ο εξαιρετικά λεπτομερής έλεγχος της εικόνας που παράγετε- αυτό θα ήταν κάτι ανάλογο με το Photoshop με μια καθαρά κειμενική διεπαφή. Θα έλεγα ότι ένα άτομο θα μπορούσε να χρησιμοποιεί ένα τέτοιο πρόγραμμα και να εξακολουθεί να αξίζει να αποκαλείται καλλιτέχνης. Ο σκηνοθέτης Bennett Miller χρησιμοποίησε το DALL-E 2 για να δημιουργήσει μερικές πολύ εντυπωσιακές εικόνες που έχουν εκτεθεί στην γκαλερί Gagosian- για να τις δημιουργήσει, δημιούργησε λεπτομερείς οδηγίες κειμένου και στη συνέχεια έδωσε εντολή στο DALL-E να αναθεωρεί και να επεξεργάζεται τις εικόνες που δημιουργήθηκαν ξανά και ξανά. Δημιούργησε περισσότερες από εκατό χιλιάδες εικόνες για να καταλήξει στις είκοσι εικόνες της έκθεσης. Έχει πει όμως ότι δεν μπόρεσε να επιτύχει συγκρίσιμα αποτελέσματα σε μεταγενέστερες εκδόσεις του DALL-E. Υποψιάζομαι ότι αυτό μπορεί να οφείλεται στο γεγονός ότι ο Miller χρησιμοποιούσε το DALL-E για κάτι που δεν προοριζόταν να κάνει- είναι σαν να χάκαρε το Microsoft Paint για να το κάνει να συμπεριφέρεται όπως το Photoshop, αλλά μόλις κυκλοφόρησε μια νέα έκδοση του Paint, οι παρεμβάσεις του σταμάτησαν να λειτουργούν. Η OpenAI πιθανότατα δεν προσπαθεί να δημιουργήσει ένα προϊόν για να εξυπηρετήσει χρήστες όπως ο Miller, επειδή ένα προϊόν που απαιτεί από τον χρήστη να εργάζεται για μήνες για να δημιουργήσει μια εικόνα δεν είναι ελκυστικό για ένα ευρύ κοινό. Η εταιρεία θέλει να προσφέρει ένα προϊόν που δημιουργεί εικόνες με λίγη προσπάθεια.
Είναι πιο δύσκολο να φανταστεί κάποιος ένα πρόγραμμα που, με πολλές συνεδρίες, θα τον βοηθήσει να γράψει ένα καλό μυθιστόρημα. Αυτό το υποθετικό πρόγραμμα συγγραφής μπορεί να απαιτεί να εισάγετε εκατό χιλιάδες λέξεις με προτροπές, προκειμένου να δημιουργήσει μια εντελώς διαφορετική εκατό χιλιάδες λέξεις που αποτελούν το μυθιστόρημα που οραματίζεστε. Δεν μου είναι σαφές πώς θα μπορούσε να μοιάζει ένα τέτοιο πρόγραμμα. Θεωρητικά, αν υπήρχε ένα τέτοιο πρόγραμμα, ο χρήστης θα μπορούσε ίσως να αξίζει να αποκαλείται συγγραφέας. Αλλά, και πάλι, δεν νομίζω ότι εταιρείες όπως η OpenAI θέλουν να δημιουργήσουν εκδόσεις του ChatGPT που απαιτούν από τους χρήστες εξίσου μεγάλη προσπάθεια με τη συγγραφή ενός μυθιστορήματος από το μηδέν. Το σημείο πώλησης της παραγωγικής τεχνητής νοημοσύνης είναι ότι αυτά τα προγράμματα παράγουν πολύ περισσότερα από όσα εσείς βάζετε σε αυτά, και αυτό ακριβώς είναι που τα εμποδίζει να είναι αποτελεσματικά εργαλεία για τους καλλιτέχνες.
Οι εταιρείες που προωθούν τα προγράμματα γενετικής τεχνητής νοημοσύνης ισχυρίζονται ότι θα απελευθερώσουν τη δημιουργικότητα. Στην ουσία, λένε ότι η τέχνη μπορεί να είναι μόνο έμπνευση και καθόλου ιδρώτας – αλλά αυτά τα πράγματα δεν μπορούν να διαχωριστούν εύκολα. Δεν λέω ότι η τέχνη πρέπει να περιλαμβάνει ανία. Αυτό που λέω είναι ότι η τέχνη απαιτεί επιλογές σε κάθε κλίμακα- οι αμέτρητες επιλογές μικρής κλίμακας που γίνονται κατά τη διάρκεια της υλοποίησης είναι εξίσου σημαντικές για το τελικό προϊόν με τις λίγες επιλογές μεγάλης κλίμακας που γίνονται κατά τη σύλληψη. Είναι λάθος να εξισώνουμε το «μεγάλης κλίμακας» με το «σημαντικό» όταν πρόκειται για τις επιλογές που γίνονται κατά τη δημιουργία της τέχνης- η αλληλεπίδραση μεταξύ της μεγάλης και της μικρής κλίμακας είναι εκεί που έγκειται η καλλιτεχνικότητα.
Η πεποίθηση ότι η έμπνευση υπερισχύει όλων των άλλων είναι, υποψιάζομαι, σημάδι ότι κάποιος δεν είναι εξοικειωμένος με το μέσο. Υποστηρίζω ότι αυτό ισχύει ακόμη και αν ο στόχος κάποιου είναι να δημιουργήσει ψυχαγωγία και όχι υψηλή τέχνη. Οι άνθρωποι συχνά υποτιμούν την προσπάθεια που απαιτείται για την ψυχαγωγία- ένα μυθιστόρημα θρίλερ μπορεί να μην ανταποκρίνεται στο ιδεώδες του Κάφκα για ένα βιβλίο -ένα «τσεκούρι για την παγωμένη θάλασσα μέσα μας»- αλλά μπορεί να είναι τόσο λεπτοδουλεμένο όσο ένα ελβετικό ρολόι. Και ένα αποτελεσματικό θρίλερ είναι κάτι περισσότερο από την υπόθεση ή την πλοκή του. Αμφιβάλλω αν θα μπορούσατε να αντικαταστήσετε κάθε πρόταση σε ένα θρίλερ με μια σημασιολογικά ισοδύναμη και το μυθιστόρημα που θα προκύψει να είναι το ίδιο διασκεδαστικό. Αυτό σημαίνει ότι οι προτάσεις του -και οι μικρής κλίμακας επιλογές που αντιπροσωπεύουν- βοηθούν να καθοριστεί η αποτελεσματικότητα του θρίλερ.
Πολλοί μυθιστοριογράφοι έχουν βιώσει την εμπειρία να τους πλησιάζει κάποιος που είναι πεπεισμένος ότι έχει μια σπουδαία ιδέα για ένα μυθιστόρημα, την οποία είναι πρόθυμος να μοιραστεί με αντάλλαγμα την κατανομή των εσόδων κατά το ήμισυ. Ένα τέτοιο άτομο αποκαλύπτει άθελά του ότι θεωρεί τη διατύπωση προτάσεων ενοχλητική και όχι θεμελιώδες μέρος της αφήγησης σε πεζό λόγο. Η γεννητική τεχνητή νοημοσύνη απευθύνεται σε ανθρώπους που πιστεύουν ότι μπορούν να εκφραστούν σε ένα μέσο χωρίς να εργάζονται πραγματικά σε αυτό το μέσο. Αλλά οι δημιουργοί παραδοσιακών μυθιστορημάτων, ζωγραφικής και ταινιών έλκονται από αυτές τις μορφές τέχνης επειδή βλέπουν τις μοναδικές εκφραστικές δυνατότητες που παρέχει κάθε μέσο. Είναι η προθυμία τους να εκμεταλλευτούν πλήρως αυτές τις δυνατότητες που κάνει το έργο τους ικανοποιητικό, είτε ως ψυχαγωγία είτε ως τέχνη.
Φυσικά, τα περισσότερα γραπτά, είτε πρόκειται για άρθρα είτε για εκθέσεις είτε για ηλεκτρονικά μηνύματα, δεν έρχονται με την προσδοκία ότι ενσωματώνουν χιλιάδες επιλογές. Σε τέτοιες περιπτώσεις, υπάρχει κάποιο κακό στην αυτοματοποίηση της εργασίας; Επιτρέψτε μου να προσφέρω μια άλλη γενίκευση: κάθε γραπτό που αξίζει την προσοχή σας ως αναγνώστη είναι το αποτέλεσμα της προσπάθειας που κατέβαλε το άτομο που το έγραψε. Η προσπάθεια κατά τη διάρκεια της συγγραφής δεν εγγυάται ότι το τελικό προϊόν αξίζει να διαβαστεί, αλλά χωρίς αυτήν δεν μπορεί να γίνει αξιόλογο έργο. Το είδος της προσοχής που δίνετε όταν διαβάζετε ένα προσωπικό ηλεκτρονικό μήνυμα είναι διαφορετικό από το είδος της προσοχής που δίνετε όταν διαβάζετε μια επιχειρηματική έκθεση, αλλά και στις δύο περιπτώσεις δικαιολογείται μόνο όταν ο συγγραφέας έβαλε κάποια σκέψη.
Πρόσφατα, η Google προέβαλε ένα διαφημιστικό σποτ κατά τη διάρκεια των Ολυμπιακών Αγώνων του Παρισιού για το Gemini, τον ανταγωνιστή του GPT-4 της OpenAI. Η διαφήμιση δείχνει έναν πατέρα να χρησιμοποιεί το Gemini για να συντάξει ένα γράμμα θαυμαστή, το οποίο η κόρη του θα στείλει σε έναν ολυμπιονίκη αθλητή που την εμπνέει. Η Google απέσυρε τη διαφήμιση μετά από εκτεταμένες αντιδράσεις από τους θεατές- ένας καθηγητής μέσων ενημέρωσης την αποκάλεσε «μία από τις πιο ενοχλητικές διαφημίσεις που έχω δει ποτέ». Είναι αξιοσημείωτο ότι ο κόσμος αντέδρασε με αυτόν τον τρόπο, παρόλο που η καλλιτεχνική δημιουργικότητα δεν ήταν το χαρακτηριστικό που αντικαταστάθηκε. Κανείς δεν περιμένει από ένα παιδικό γράμμα θαυμαστή σε έναν αθλητή να είναι εξαιρετικό- αν το νεαρό κορίτσι είχε γράψει το γράμμα η ίδια, πιθανότατα θα ήταν δυσδιάκριτο από αμέτρητα άλλα. Η σημασία ενός παιδικού γράμματος θαυμαστή -τόσο για το παιδί που το γράφει όσο και για τον αθλητή που το λαμβάνει- προέρχεται από την ειλικρίνειά του και όχι από την ευγλωττία του.
Πολλοί από εμάς έχουμε στείλει ευχετήριες κάρτες από κατάστημα, γνωρίζοντας ότι θα είναι σαφές στον παραλήπτη ότι δεν συνθέσαμε εμείς οι ίδιοι τις λέξεις. Δεν αντιγράφουμε τα λόγια από μια κάρτα Hallmark με το δικό μας γραφικό χαρακτήρα, γιατί αυτό θα μας φαινόταν ανέντιμο. Ο προγραμματιστής Simon Willison έχει περιγράψει την εκπαίδευση μεγάλων γλωσσικών μοντέλων ως «ξέπλυμα χρήματος για δεδομένα που προστατεύονται από πνευματικά δικαιώματα», κάτι που θεωρώ χρήσιμο τρόπο για να σκεφτεί κανείς τη γοητεία των προγραμμάτων γενετικής τεχνητής νοημοσύνης: σας επιτρέπουν να συμμετάσχετε σε κάτι σαν λογοκλοπή, αλλά δεν υπάρχει καμία ενοχή που να σχετίζεται με αυτό, επειδή δεν είναι σαφές ούτε σε εσάς ότι αντιγράφετε.
Ορισμένοι έχουν υποστηρίξει ότι τα μεγάλα γλωσσικά μοντέλα δεν ξεπλένουν τα κείμενα στα οποία εκπαιδεύονται αλλά, μάλλον, μαθαίνουν από αυτά, με τον ίδιο τρόπο που οι άνθρωποι συγγραφείς μαθαίνουν από τα βιβλία που έχουν διαβάσει. Αλλά ένα μεγάλο γλωσσικό μοντέλο δεν είναι συγγραφέας- δεν είναι καν χρήστης της γλώσσας. Η γλώσσα είναι, εξ ορισμού, ένα σύστημα επικοινωνίας και απαιτεί πρόθεση επικοινωνίας. Η αυτόματη συμπλήρωση του τηλεφώνου σας μπορεί να προσφέρει καλές ή κακές προτάσεις, αλλά σε καμία περίπτωση δεν προσπαθεί να πει κάτι σε εσάς ή στο άτομο στο οποίο στέλνετε μήνυμα. Το γεγονός ότι το ChatGPT μπορεί να παράγει συνεκτικές προτάσεις μας καλεί να φανταστούμε ότι καταλαβαίνει τη γλώσσα με τρόπο που δεν καταλαβαίνει η αυτόματη συμπλήρωση του τηλεφώνου σας, αλλά δεν έχει πλέον πρόθεση να επικοινωνήσει.
Είναι πολύ εύκολο να κάνετε το ChatGPT να εκπέμψει μια σειρά από λέξεις όπως «Χαίρομαι που σε βλέπω». Υπάρχουν πολλά πράγματα που δεν καταλαβαίνουμε για το πώς λειτουργούν τα μεγάλα γλωσσικά μοντέλα, αλλά για ένα πράγμα μπορούμε να είμαστε σίγουροι: το ChatGPT δεν είναι χαρούμενο που σας βλέπει. Ένας σκύλος μπορεί να επικοινωνήσει ότι χαίρεται που σας βλέπει, το ίδιο και ένα προγλωσσικό παιδί, παρόλο που και τα δύο δεν έχουν την ικανότητα να χρησιμοποιούν λέξεις. Το ChatGPT δεν αισθάνεται τίποτα και δεν επιθυμεί τίποτα, και αυτή η έλλειψη πρόθεσης είναι ο λόγος για τον οποίο το ChatGPT δεν χρησιμοποιεί στην πραγματικότητα γλώσσα. Αυτό που κάνει τις λέξεις «χαίρομαι που σε βλέπω» γλωσσική έκφραση δεν είναι ότι η ακολουθία των σημείων κειμένου από τα οποία αποτελείται είναι καλά σχηματισμένη- αυτό που την κάνει γλωσσική έκφραση είναι η πρόθεση να επικοινωνήσει κάτι.
Επειδή η γλώσσα μας έρχεται τόσο εύκολα, είναι εύκολο να ξεχάσουμε ότι βρίσκεται πάνω σε αυτές τις άλλες εμπειρίες υποκειμενικού συναισθήματος και της επιθυμίας να επικοινωνήσουμε αυτό το συναίσθημα. Μπαίνουμε στον πειρασμό να προβάλλουμε αυτές τις εμπειρίες σε ένα μεγάλο γλωσσικό μοντέλο όταν αυτό εκπέμπει συνεκτικές προτάσεις, αλλά αν το κάνουμε αυτό είναι σαν να πέφτουμε θύματα μιμητισμού- είναι το ίδιο φαινόμενο όπως όταν οι πεταλούδες αναπτύσσουν μεγάλες σκοτεινές κηλίδες στα φτερά τους που μπορούν να ξεγελάσουν τα πουλιά ώστε να νομίζουν ότι είναι αρπακτικά με μεγάλα μάτια. Υπάρχει ένα πλαίσιο στο οποίο οι σκοτεινές κηλίδες είναι επαρκείς- τα πουλιά είναι λιγότερο πιθανό να φάνε μια πεταλούδα που τις έχει, και η πεταλούδα δεν ενδιαφέρεται πραγματικά γιατί δεν την τρώνε, αρκεί να ζήσει. Αλλά υπάρχει μεγάλη διαφορά μεταξύ μιας πεταλούδας και ενός αρπακτικού που αποτελεί απειλή για ένα πουλί.
Κάποιος που χρησιμοποιεί τη γενετική τεχνητή νοημοσύνη για να τον βοηθήσει να γράψει μπορεί να ισχυριστεί ότι αντλεί έμπνευση από τα κείμενα στα οποία εκπαιδεύτηκε το μοντέλο, αλλά και πάλι θα υποστήριζα ότι αυτό διαφέρει από αυτό που συνήθως εννοούμε όταν λέμε ότι ένας συγγραφέας αντλεί έμπνευση από έναν άλλο. Σκεφτείτε μια φοιτήτρια που παραδίδει μια εργασία που αποτελείται αποκλειστικά από ένα πεντασέλιδο απόσπασμα από ένα βιβλίο, δηλώνοντας ότι αυτό το απόσπασμα μεταφέρει ακριβώς αυτό που ήθελε να πει, καλύτερα από ό,τι θα μπορούσε να το πει η ίδια. Ακόμη και αν η φοιτήτρια είναι απολύτως ειλικρινής με τον καθηγητή για το τι έκανε, δεν είναι ακριβές να πούμε ότι αντλεί έμπνευση από το βιβλίο που παραθέτει. Το γεγονός ότι ένα μεγάλο γλωσσικό μοντέλο μπορεί να αναδιατυπώσει την παράθεση αρκετά ώστε η πηγή να μην είναι αναγνωρίσιμη δεν αλλάζει τη θεμελιώδη φύση αυτού που συμβαίνει.
Όπως έχει σημειώσει η γλωσσολόγος Emily M. Bender, οι καθηγητές δεν ζητούν από τους μαθητές να γράψουν εκθέσεις επειδή ο κόσμος χρειάζεται περισσότερες εκθέσεις μαθητών. Ο σκοπός της συγγραφής δοκιμίων είναι να ενισχύσει τις δεξιότητες κριτικής σκέψης των μαθητών- με τον ίδιο τρόπο που η άρση βαρών είναι χρήσιμη ανεξάρτητα από το άθλημα που κάνει ένας αθλητής, η συγγραφή δοκιμίων αναπτύσσει δεξιότητες απαραίτητες για οποιαδήποτε δουλειά θα πάρει τελικά ένας φοιτητής. Η χρήση του ChatGPT για την ολοκλήρωση εργασιών είναι σαν να φέρνετε ένα περονοφόρο ανυψωτικό στην αίθουσα με τα βάρη- δεν θα βελτιώσετε ποτέ τη γνωστική σας ικανότητα με αυτόν τον τρόπο.
Δεν χρειάζεται όλα τα γραπτά να είναι δημιουργικά, ή ειλικρινή, ή ακόμη και ιδιαίτερα καλά- μερικές φορές χρειάζεται απλώς να υπάρχουν. Μια τέτοια γραφή μπορεί να υποστηρίζει άλλους στόχους, όπως η προσέλκυση προβολών για διαφημίσεις ή η ικανοποίηση γραφειοκρατικών απαιτήσεων. Όταν οι άνθρωποι καλούνται να παράγουν ένα τέτοιο κείμενο, δύσκολα μπορούμε να τους κατηγορήσουμε ότι χρησιμοποιούν όποια εργαλεία είναι διαθέσιμα για να επιταχύνουν τη διαδικασία. Είναι όμως ο κόσμος καλύτερος με περισσότερα έγγραφα για τα οποία έχει καταβληθεί ελάχιστη προσπάθεια; Θα ήταν μη ρεαλιστικό να ισχυριστούμε ότι αν αρνηθούμε τη χρήση μεγάλων γλωσσικών μοντέλων, τότε οι απαιτήσεις για τη δημιουργία κειμένων χαμηλής ποιότητας θα εξαφανιστούν. Ωστόσο, νομίζω ότι είναι αναπόφευκτο ότι όσο περισσότερο χρησιμοποιούμε μεγάλα γλωσσικά μοντέλα για την εκπλήρωση αυτών των απαιτήσεων, τόσο μεγαλύτερες θα γίνουν τελικά αυτές οι απαιτήσεις. Μπαίνουμε σε μια εποχή όπου κάποιος μπορεί να χρησιμοποιήσει ένα μεγάλο γλωσσικό μοντέλο για να δημιουργήσει ένα έγγραφο από μια λίστα με κουκκίδες και να το στείλει σε ένα άτομο που θα χρησιμοποιήσει ένα μεγάλο γλωσσικό μοντέλο για να συμπυκνώσει το έγγραφο σε μια λίστα με κουκκίδες. Μπορεί κανείς να ισχυριστεί σοβαρά ότι αυτό αποτελεί βελτίωση;
Δεν αποκλείεται μια μέρα να έχουμε προγράμματα υπολογιστών που θα μπορούν να κάνουν οτιδήποτε μπορεί να κάνει ένας άνθρωπος, αλλά, σε αντίθεση με τους ισχυρισμούς των εταιρειών που προωθούν την τεχνητή νοημοσύνη, αυτό δεν είναι κάτι που θα δούμε μέσα στα επόμενα χρόνια. Ακόμα και σε τομείς που δεν έχουν απολύτως καμία σχέση με τη δημιουργικότητα, τα σημερινά προγράμματα τεχνητής νοημοσύνης έχουν βαθύτατους περιορισμούς που μας δίνουν εύλογους λόγους να αμφισβητήσουμε αν αξίζουν να αποκαλούνται καθόλου ευφυή.
Ο επιστήμονας πληροφορικής François Chollet έχει προτείνει την ακόλουθη διάκριση: ικανότητα είναι το πόσο καλά εκτελείτε μια εργασία, ενώ ευφυΐα είναι το πόσο αποτελεσματικά αποκτάτε νέες δεξιότητες. Νομίζω ότι αυτό αντικατοπτρίζει αρκετά καλά τις διαισθήσεις μας για τα ανθρώπινα όντα. Οι περισσότεροι άνθρωποι μπορούν να μάθουν μια νέα δεξιότητα με αρκετή εξάσκηση, αλλά όσο πιο γρήγορα το άτομο αποκτά τη δεξιότητα, τόσο πιο έξυπνο θεωρούμε ότι είναι. Το ενδιαφέρον σε αυτόν τον ορισμό είναι ότι – σε αντίθεση με τα τεστ I.Q. – εφαρμόζεται και σε μη ανθρώπινες οντότητες: όταν ένας σκύλος μαθαίνει γρήγορα ένα νέο κόλπο, το θεωρούμε σημάδι ευφυΐας.
Το 2019, ερευνητές διεξήγαγαν ένα πείραμα στο οποίο δίδαξαν σε αρουραίους πώς να οδηγούν. Τοποθέτησαν τους αρουραίους σε μικρά πλαστικά δοχεία με τρεις ράβδους από χάλκινο σύρμα- όταν τα ποντίκια έβαζαν τα πόδια τους σε μία από αυτές τις ράβδους, το δοχείο είτε πήγαινε μπροστά, είτε έστριβε αριστερά, είτε έστριβε δεξιά. Οι αρουραίοι μπορούσαν να δουν ένα πιάτο με φαγητό στην άλλη πλευρά του δωματίου και προσπαθούσαν να βάλουν τα οχήματά τους να πάνε προς αυτό. Οι ερευνητές εκπαίδευαν τους αρουραίους για πέντε λεπτά κάθε φορά και μετά από είκοσι τέσσερις συνεδρίες εξάσκησης, οι αρουραίοι είχαν γίνει ικανοί στην οδήγηση. Είκοσι τέσσερις δοκιμές ήταν αρκετές για να κατακτήσουν μια εργασία που πιθανώς κανένας αρουραίος δεν είχε αντιμετωπίσει ποτέ πριν στην εξελικτική ιστορία του είδους. Νομίζω ότι αυτό είναι μια καλή απόδειξη της ευφυΐας.
Σκεφτείτε τώρα τα σημερινά προγράμματα τεχνητής νοημοσύνης που έχουν ευρέως αναγνωριστεί για τις επιδόσεις τους. Το AlphaZero, ένα πρόγραμμα που αναπτύχθηκε από την DeepMind της Google, παίζει σκάκι καλύτερα από οποιονδήποτε ανθρώπινο παίκτη, αλλά κατά τη διάρκεια της εκπαίδευσής του έπαιξε σαράντα τέσσερα εκατομμύρια παρτίδες, πολύ περισσότερες από όσες μπορεί να παίξει οποιοσδήποτε άνθρωπος σε μια ζωή. Για να κατακτήσει ένα νέο παιχνίδι, θα πρέπει να υποβληθεί σε έναν εξίσου τεράστιο όγκο εκπαίδευσης. Σύμφωνα με τον ορισμό του Chollet, τα προγράμματα όπως το AlphaZero είναι εξαιρετικά ικανά, αλλά δεν είναι ιδιαίτερα ευφυή, επειδή δεν είναι αποτελεσματικά στο να αποκτούν νέες δεξιότητες. Προς το παρόν είναι αδύνατο να γραφτεί ένα πρόγραμμα υπολογιστή ικανό να μάθει ακόμη και μια απλή εργασία σε μόλις είκοσι τέσσερις δοκιμές, αν δεν δοθούν εκ των προτέρων στον προγραμματιστή πληροφορίες σχετικά με την εργασία.
Τα αυτοοδηγούμενα αυτοκίνητα που έχουν εκπαιδευτεί σε εκατομμύρια χιλιόμετρα οδήγησης μπορούν ακόμα να πέσουν πάνω σε ένα αναποδογυρισμένο φορτηγό με ρυμουλκούμενο, επειδή τέτοια πράγματα δεν απαντώνται συνήθως στα δεδομένα εκπαίδευσής τους, ενώ οι άνθρωποι που κάνουν το πρώτο τους μάθημα οδήγησης θα ξέρουν να σταματήσουν. Περισσότερο από την ικανότητά μας να λύνουμε αλγεβρικές εξισώσεις, η ικανότητά μας να αντιμετωπίζουμε άγνωστες καταστάσεις είναι ένα θεμελιώδες μέρος του γιατί θεωρούμε τους ανθρώπους ευφυείς. Οι υπολογιστές δεν θα μπορέσουν να αντικαταστήσουν τους ανθρώπους μέχρι να αποκτήσουν αυτού του είδους την ικανότητα, και αυτό είναι ακόμη πολύ μακριά- προς το παρόν, απλώς αναζητούμε εργασίες που μπορούν να γίνουν με υπερτροφοδοτούμενη αυτόματη συμπλήρωση.
Παρά την πολυετή διαφημιστική εκστρατεία, η ικανότητα της γενετικής τεχνητής νοημοσύνης να αυξήσει δραματικά την οικονομική παραγωγικότητα παραμένει θεωρητική. (Νωρίτερα φέτος, η Goldman Sachs δημοσίευσε μια έκθεση με τίτλο «Gen AI: Too Much Spend, Too Little Benefit?»). Το έργο στο οποίο η γενετική τεχνητή νοημοσύνη έχει επιτύχει περισσότερο είναι η μείωση των προσδοκιών μας, τόσο για τα πράγματα που διαβάζουμε όσο και για τους εαυτούς μας όταν γράφουμε κάτι για να το διαβάσουν άλλοι. Πρόκειται για μια θεμελιωδώς απάνθρωπη τεχνολογία, επειδή μας αντιμετωπίζει ως κάτι λιγότερο από αυτό που είμαστε: δημιουργοί και προσλαμβάνοντες νοήματος. Μειώνει το μέγεθος της πρόθεσης στον κόσμο.
Ορισμένα άτομα έχουν υπερασπιστεί τα μεγάλα γλωσσικά μοντέλα λέγοντας ότι τα περισσότερα από αυτά που λένε ή γράφουν οι άνθρωποι δεν είναι ιδιαίτερα πρωτότυπα. Αυτό είναι αλήθεια, αλλά είναι επίσης άσχετο. Όταν κάποιος σας λέει «συγγνώμη», δεν έχει σημασία ότι και άλλοι άνθρωποι έχουν ζητήσει συγγνώμη στο παρελθόν- δεν έχει σημασία ότι το «συγγνώμη» είναι μια σειρά κειμένου που είναι στατιστικά μη αξιοσημείωτη. Αν κάποιος είναι ειλικρινής, η συγγνώμη του είναι πολύτιμη και ουσιαστική, ακόμη και αν έχουν προηγηθεί συγγνώμες. Ομοίως, όταν λέτε σε κάποιον ότι χαίρεστε που τον βλέπετε, λέτε κάτι ουσιαστικό, ακόμη και αν δεν έχει καινοτομία.
Κάτι παρόμοιο ισχύει και για την τέχνη. Είτε δημιουργείτε ένα μυθιστόρημα είτε έναν πίνακα ζωγραφικής, είτε μια ταινία, εμπλέκεστε σε μια πράξη επικοινωνίας μεταξύ εσάς και του κοινού σας. Αυτό που δημιουργείτε δεν χρειάζεται να είναι εντελώς διαφορετικό από κάθε προηγούμενο έργο τέχνης στην ιστορία της ανθρωπότητας για να είναι πολύτιμο- το γεγονός ότι εσείς είστε αυτός που το λέει, το γεγονός ότι προέρχεται από τη μοναδική εμπειρία της ζωής σας και φτάνει σε μια συγκεκριμένη στιγμή στη ζωή αυτού που βλέπει το έργο σας, είναι αυτό που το κάνει καινούργιο. Όλοι είμαστε προϊόντα των όσων έχουν έρθει πριν από εμάς, αλλά το να ζούμε τη ζωή μας σε αλληλεπίδραση με τους άλλους είναι αυτό που δίνει νόημα στον κόσμο. Αυτό είναι κάτι που ένας αλγόριθμος αυτόματης συμπλήρωσης δεν μπορεί ποτέ να κάνει, και μην αφήσετε κανέναν να σας πει το αντίθετο.