«Υπάρχει ένα μεγάλο πρόβλημα με τη generative τεχνητή νοημοσύνη», λέει η Sasha Luccioni στην Hugging Face, μια εταιρεία μηχανικής μάθησης. «Πρόκειται για ένα ενεργειακό παμφάγο. Κάθε φορά που ρωτάμε κάτι, ενεργοποιείται το σύνολο του κυκλώματος, επομένως από υπολογιστική άποψη είναι εξαιρετικά αναποτελεσματικό», συμπληρώνει.
Για παράδειγμα, τα Μεγάλα Μοντέλα Γλωσσών (LLM) στην καρδιά πολλών συστημάτων της generative τεχνητής νοημοσύνης έχουν εκπαιδευτεί σε τεράστιες αποθήκες γραπτών πληροφοριών, οι οποίες τα βοηθούν να δημιουργούν κείμενο ως απάντηση σε σχεδόν οποιοδήποτε ερώτημα.
«Όταν χρησιμοποιείται η generative τεχνητή νοημοσύνη, δημιουργεί περιεχόμενο από την αρχή, ουσιαστικά δημιουργεί απαντήσεις», εξηγεί η Δρ Luccioni. Αυτό σημαίνει ότι ο υπολογιστής πρέπει να δουλέψει εντατικά. Ένα τέτοιο σύστημα τεχνητής νοημοσύνης μπορεί να χρησιμοποιεί περίπου 33 φορές περισσότερη ενέργεια από τα μηχανήματα που εκτελούν λογισμικό για συγκεκριμένες εργασίες, σύμφωνα με μια πρόσφατη μελέτη της Δρ Luccioni και των συνεργατών της – η εργασία πρόκειται να δημοσιευτεί σε επιστημονικό περιοδικό.
Ωστόσο, δεν είναι ο προσωπικός μας υπολογιστής που χρησιμοποιεί όλη αυτή την ενέργεια (η το κινητό μας). Οι υπολογισμοί στους οποίους βασιζόμαστε ολοένα και περισσότερο συμβαίνουν σε γιγάντια κέντρα δεδομένων που, για τους περισσότερους ανθρώπους, είναι εκτός οπτικής γωνίας και εκτός νου. «Το σύννεφο», λέει η Δρ Luccioni. «Δεν σκέφτεσαι αυτά τα τεράστια μεταλλικά κουτιά που θερμαίνονται και καταναλώνουν τόση ενέργεια».
Τα κέντρα δεδομένων του κόσμου χρησιμοποιούν όλο και περισσότερη ηλεκτρική ενέργεια. Το 2022, καταβρόχθισαν 460 τεραβατώρες ηλεκτρικής ενέργειας και ο Διεθνής Οργανισμός Ενέργειας (IEA) αναμένει ότι αυτή θα διπλασιαστεί σε μόλις τέσσερα χρόνια. Τα κέντρα δεδομένων είναι πιθανό να χρησιμοποιούν συνολικά 1.000 τεραβατώρες ετησίως έως το 2026. «Αυτή η ζήτηση είναι περίπου ισοδύναμη με την κατανάλωση ηλεκτρικής ενέργειας της Ιαπωνίας», σύμφωνα με τον IEA. Η Ιαπωνία έχει πληθυσμό 125 εκατομμυρίων κατοίκων.
Στα κέντρα δεδομένων, τεράστιοι όγκοι πληροφοριών αποθηκεύονται για ανάκτηση οπουδήποτε στον κόσμο – από τα email μας μέχρι τις ταινίες του Χόλιγουντ. Οι υπολογιστές σε αυτά τα απρόσωπα κτίρια τροφοδοτούν επίσης την τεχνητή νοημοσύνη και τα κρυπτονομίσματα – υποστηρίζουν τη ζωή όπως την ξέρουμε.
Όμως, ορισμένες χώρες γνωρίζουν πολύ καλά πόσο ενεργοβόρες είναι αυτές οι εγκαταστάσεις. Επί του παρόντος, υπάρχει μορατόριουμ που εμποδίζει την κατασκευή νέων κέντρων δεδομένων πέριξ του Δουβλίνου. Σχεδόν το ένα πέμπτο της ηλεκτρικής ενέργειας της Ιρλανδίας καταναλώνεται από τα κέντρα δεδομένων και ο αριθμός αυτός αναμένεται να αυξηθεί σημαντικά τα επόμενα χρόνια – εν τω μεταξύ τα νοικοκυριά της Ιρλανδίας μειώνουν την κατανάλωσή τους.
Ο επικεφαλής του National Grid είπε σε ομιλία του τον Μάρτιο ότι η ζήτηση ηλεκτρικής ενέργειας από το κέντρο δεδομένων του Ηνωμένου Βασιλείου θα εξαπλασιαστεί σε μόλις 10 χρόνια, για την τροφοδότηση (σε μεγάλο βαθμό) της τεχνητής νοημοσύνης. Ωστόσο, το National Grid αναμένει ότι η ενέργεια που θα απαιτηθεί για την ηλεκτροδότηση των μεταφορών και τη θέρμανση θα είναι συνολικά πολύ μεγαλύτερη.
«Οι εταιρείες κοινής ωφέλειας στις ΗΠΑ αρχίζουν να αισθάνονται την πίεση», λέει ο Chris Seiple στο Wood Mackenzie, μια συμβουλευτική εταιρεία.
«Αντιμετωπίζουν μεγάλη ζήτηση από τα κέντρα δεδομένων την ίδια ακριβώς στιγμή που έχουμε μια αναγέννηση της εγχώριας βιομηχανικής παραγωγής – χάρη στην κυβερνητική πολιτική», προσθέτει. Οι νομοθέτες σε ορισμένες πολιτείες επανεξετάζουν τώρα τις φορολογικές ελαφρύνσεις που προσφέρονται στους προγραμματιστές κέντρων δεδομένων λόγω της τεράστιας πίεσης που ασκούν αυτές οι εγκαταστάσεις στην τοπική ενεργειακή υποδομή, σύμφωνα με αναφορές στις ΗΠΑ.
«Υπάρχει μια τεράστια ζήτηση γης για τοποθεσίες κέντρων δεδομένων κοντά σε σταθμούς παραγωγής ηλεκτρικής ενέργειας ή κόμβους ανανεώσιμων πηγών ενέργειας», συνεχίζει ο Seiple: «Η πολιτεία της Αϊόβας είναι μια εστία ανάπτυξης κέντρων δεδομένων καθώς υπάρχει πολλή παραγωγή αιολικής ενέργειας εκεί», προσθέτει.
Ορισμένα κέντρα δεδομένων μπορούν να αντέξουν οικονομικά να πάνε σε πιο απομακρυσμένες περιοχές αυτές τις μέρες, επειδή η καθυστέρηση – που συνήθως μετράται σε χιλιοστά του δευτερολέπτου – μεταξύ της αποστολής πληροφοριών από ένα κέντρο δεδομένων και του χρήστη που τις λαμβάνει, δεν αποτελεί σημαντική ανησυχία για τα όλο και πιο δημοφιλή συστήματα generative τεχνητής νοημοσύνης. Στο παρελθόν, κέντρα δεδομένων που χειρίζονται επικοινωνίες έκτακτης ανάγκης ή αλγόριθμους χρηματοοικονομικών συναλλαγών, για παράδειγμα, είχαν τοποθετηθεί μέσα ή πολύ κοντά σε μεγάλα κέντρα πληθυσμού, προκειμένου να προσφέρουν απόλυτα καλύτερους χρόνους απόκρισης.
«Δεν υπάρχει αμφιβολία ότι οι ενεργειακές απαιτήσεις των κέντρων δεδομένων θα αυξηθούν τα επόμενα χρόνια, αλλά υπάρχει τεράστια αβεβαιότητα για το πόσο», τονίζει ο Seiple.
Μέρος αυτής της αβεβαιότητας οφείλεται στο γεγονός ότι το υλικό πίσω από τη generative τεχνητή νοημοσύνη εξελίσσεται συνεχώς.
Ο Tony Grayson είναι γενικός διευθυντής στην Compass Quantum, μια επιχείρηση κέντρου δεδομένων. Επισημαίνει ότι το τσιπ υπερυπολογιστή Grace Blackwell που κυκλοφόρησε πρόσφατα η Nvidia (που πήρε το όνομά του από έναν επιστήμονα υπολογιστών και έναν μαθηματικό), έχει σχεδιαστεί ειδικά για να τροφοδοτεί διεργασίες υψηλής τεχνολογίας, συμπεριλαμβανομένης της generative τεχνητής νοημοσύνης, κβαντικου υπολογισμού και σχεδιασμού φαρμάκων με τη βοήθεια υπολογιστή.
Η Nvidia λέει ότι στο μέλλον, μια εταιρεία θα μπορούσε να εκπαιδεύει τεχνητή νοημοσύνη αρκετές φορές μεγαλύτερη από τα μεγαλύτερα συστήματα τεχνητής νοημοσύνης που είναι διαθέσιμα αυτή τη στιγμή σε 90 ημέρες, χρησιμοποιώντας 8.000 τσιπ προηγούμενης γενιάς Nvidia. Αυτό θα χρειαζόταν παροχή ηλεκτρικού ρεύματος 15 μεγαβάτ.
Όμως το ίδιο έργο θα μπορούσε να πραγματοποιηθεί στον ίδιο χρόνο από μόλις 2.000 τσιπ Grace Blackwell, και θα χρειάζονταν τροφοδοσία τεσσάρων μεγαβάτ, σύμφωνα με την Nvidia (αυτό εξακολουθεί να αντιστοιχεί σε 8,6 γιγαβατώρες απαιτούμενης ηλεκτρικής ενέργειας – περισσότερη από την ετήσια ζήτηση ηλεκτρικής ενέργειας της Βόρειας Ιρλανδίας). «Η απόδοση ανεβαίνει τόσο πολύ που η συνολική εξοικονόμηση ενέργειας είναι μεγάλη», λέει ο Grayson. Συμφωνεί, ωστόσο, ότι οι απαιτήσεις ενέργειας διαμορφώνονται εκεί που οι φορείς εκμετάλλευσης των κέντρων δεδομένων τοποθετούν τις εγκαταστάσεις τους: «Οι άνθρωποι πηγαίνουν εκεί που είναι η φθηνή ενέργεια». Η Δρ Luccioni σημειώνει ότι η ενέργεια και οι πόροι που απαιτούνται για την κατασκευή των πιο πρόσφατων τσιπ υπολογιστών είναι σημαντικά.
«Ωστόσο, είναι αλήθεια ότι τα κέντρα δεδομένων έχουν γίνει πιο αποδοτικά από ενεργειακής σκοπιάς με την πάροδο του χρόνου», υποστηρίζει ο Dale Sartor, σύμβουλος και συνεργάτης του Εθνικού Εργαστηρίου Lawrence Berkeley στις ΗΠΑ. Η απόδοσή τους μετριέται συχνά από την άποψη της αποτελεσματικότητας χρήσης ενέργειας ή PUE. Όσο μικρότερος είναι ο αριθμός, τόσο το καλύτερο. Τα υπερσύγχρονα κέντρα δεδομένων έχουν PUE περίπου 1,1, σημειώνει. Αυτές οι εγκαταστάσεις εξακολουθούν να δημιουργούν σημαντικές ποσότητες σπατάλης θερμότητας και η Ευρώπη προηγείται των ΗΠΑ στην εξεύρεση τρόπων χρήσης αυτής της σπατάλης – όπως το ζέσταμα πισινών – λέει ο Sartor.
Ο Bruce Owen, Διευθύνων Σύμβουλος του Ηνωμένου Βασιλείου στην Equinix, μιας εταιρείας κέντρων δεδομένων, λέει: «Εξακολουθώ να πιστεύω ότι η ζήτηση θα αυξηθεί περισσότερο από αυτό το κέρδος απόδοσης που βλέπουμε τώρα». Προβλέπει ότι θα κατασκευαστούν περισσότερα κέντρα δεδομένων με επιτόπιες εγκαταστάσεις παραγωγής ενέργειας. Η Equinix πάντως απέτυχε να λάβει άδεια σχεδιασμού πέρυσι, για ένα κέντρο δεδομένων στο Δουβλίνο, με ενσωματωμένη ενεργειακή μονάδα που θα λειτουργούσε με αεριο.
Ο Sartor πιστεύει ότι το κόστος μπορεί τελικά να καθορίσει εάν η generative τεχνητή νοημοσύνη αξίζει τον κόπο για ορισμένες εφαρμογές: «Αν ο παλιός τρόπος είναι φθηνότερος και ευκολότερος, τότε δεν θα υπάρχει μεγάλη αγορά για τον νέο», λέει ο ίδιος. Η Δρ Luccioni τονίζει, ωστόσο, ότι οι άνθρωποι θα πρέπει να κατανοήσουν ξεκάθαρα τον τρόπο με τον οποίο διαφέρουν οι επιλογές που έχουν μπροστά τους όσον αφορά την ενεργειακή απόδοση. Εργάζεται σε ένα πρότζεκτ για την ανάπτυξη αξιολογήσεων ενέργειας για τεχνητή νοημοσύνη.
«Αντί να επιλέξει κανείς το άλφα μοντέλο παραγώγου GPT που είναι πολύ αδέξιο και χρησιμοποιεί πολλή ενέργεια, μπορεί να επιλέξει το βήτα – ενεργειακού αστέρα Α+ – που θα είναι πολύ πιο ελαφρύ και αποτελεσματικό», καταλήγει.
Πηγή protothema.gr