Τον Ιούνιο, οι ρυθμιστικές αρχές της Νότιας Κορέας ενέκριναν το πρώτο φάρμακο, ένα εμβόλιο κατά της COVID-19, που παρασκευάστηκε από μια νέα πρωτεΐνη που σχεδιάστηκε από ανθρώπους. Το εμβόλιο βασίζεται σε ένα σφαιρικό πρωτεϊνικό νανοσωματίδιο που δημιουργήθηκε από ερευνητές πριν από σχεδόν μια δεκαετία.
Τώρα, χάρη στις γιγαντιαίες προόδους στην τεχνητή νοημοσύνη, μια ερευνητική ομάδα με επικεφαλής τον Ντέιβιντ Μπέικερ, βιοχημικό στο Πανεπιστήμιο της Ουάσιγκτον στο Σιάτλ, σχεδιάζει τέτοια μόρια σε δευτερόλεπτα αντί για μήνες. Τέτοιες προσπάθειες αποτελούν μέρος μιας επιστημονικής αλλαγής, καθώς εργαλεία τεχνητής νοημοσύνης, όπως το λογισμικό πρόβλεψης πρωτεϊνικής δομής AlphaFold της DeepMind, αγκαλιάζονται από τους επιστήμονες. Τον Ιούλιο, η DeepMind αποκάλυψε ότι η τελευταία έκδοση του AlphaFold πρόβλεψε δομές για κάθε πρωτεΐνη που είναι γνωστή στην επιστήμη.
«Μετά την AlphaFold, υπήρξε μια αλλαγή στον τρόπο με τον οποίο σχεδιάζουμε πρωτεΐνες», δήλωσε στο επιστημονικό περιοδικό «Nature» η Νοέλια Φερούζ, υπολογιστική βιολόγος στο Πανεπιστήμιο της Girona, στην Ισπανία. «Είμαστε μάρτυρες πολύ συναρπαστικών στιγμών», τόνισε.
Οι περισσότερες προσπάθειες επικεντρώνονται σε εργαλεία που μπορούν να βοηθήσουν στη δημιουργία πρωτότυπων πρωτεϊνών χωρίς να δίνεται μεγάλη έμφαση στο τι μπορούν να κάνουν αυτά τα μόρια. Όμως οι ερευνητές – και ένας αυξανόμενος αριθμός εταιρειών που εφαρμόζουν τεχνητή νοημοσύνη στον σχεδιασμό πρωτεϊνών – θα ήθελαν να σχεδιάσουν πρωτεΐνες που μπορούν να κάνουν χρήσιμα πράγματα, από τον καθαρισμό τοξικών αποβλήτων έως τη θεραπεία ασθενειών. Μεταξύ των εταιρειών που εργάζονται για την επίτευξη αυτού του στόχου, είναι η DeepMind στο Λονδίνο και η Meta (Facebook) στην Καλιφόρνια.
Το εργαστήριο του Μπέικερ αναπτύσσει νέες πρωτεΐνες τις τελευταίες τρεις δεκαετίες. Τη δεκαετία του ’90, το εργαστήριο άρχισε να αναπτύσσει το λογισμικό Rosetta το οποίο χωρίζει τη διαδικασία σε βήματα. Αρχικά, οι ερευνητές σχεδίαζαν ένα σχήμα για μια νέα πρωτεΐνη -συχνά συγκεντρώνοντας κομμάτια άλλων πρωτεϊνών- και το λογισμικό κατέληγε σε μια αλληλουχία αμινοξέων που αντιστοιχούσε σε αυτό το σχήμα.
Αλλά αυτές οι πρωτεΐνες σπάνια αναδιπλώνονταν στο επιθυμητό σχήμα όταν κατασκευάζονταν στο εργαστήριο. Έτσι, χρειάστηκε ένα άλλο βήμα για να ρυθμιστεί η αλληλουχία της πρωτεΐνης έτσι ώστε να αναδιπλώνεται σε μία και μόνη επιθυμητή δομή. Αυτό το βήμα, το οποίο περιλάμβανε την προσομοίωση όλων των τρόπων με τους οποίους οι διαφορετικές αλληλουχίες θα μπορούσαν να αναδιπλωθούν, ήταν υπολογιστικά δαπανηρό, λέει ο Σερκέι Οβτσινίκοφ, εξελικτικός βιολόγος στο Πανεπιστήμιο Χάρβαρντ, ο οποίος εργαζόταν στο εργαστήριο του Μπέικερ.
«Πρέπει να έχεις κυριολεκτικά 10.000 υπολογιστές να ‘τρέχουν’ για εβδομάδες για να το κάνεις αυτό», σημείωσε.
Τι έπεται για την AlphaFold και την επανάσταση στην τεχνητή αναδίπλωση πρωτεϊνών
Με τη βελτίωση του AlphaFold και άλλων προγραμμάτων τεχνητής νοημοσύνης, αυτό το χρονοβόρο βήμα έγινε στιγμιαίο, σύμφωνα με τον ερευνητή. Η ομάδα του Μπέικερ τροφοδότησε ένα δίκτυο πρόβλεψης δομών με τυχαίες αλληλουχίες αμινοξέων, το οποίο στη συνέχεια μετάβαλλε τη δομή τους έτσι ώστε να γίνεται όλο και πιο πρωτεϊνική.
Το AlphaFold και ένα παρόμοιο εργαλείο που αναπτύχθηκε από το εργαστήριο του Μπέικερ και ονομάζεται RoseTTAFold, εκπαιδεύτηκαν για να προβλέπουν τη δομή μεμονωμένων πρωτεϊνικών αλυσίδων. Ωστόσο, οι ερευνητές ανακάλυψαν σύντομα ότι τέτοια δίκτυα μπορούσαν επίσης να μοντελοποιήσουν συναρμογές πολλαπλών αλληλεπιδρώντων πρωτεϊνών. Η ομάδα ήταν βέβαιη ότι θα μπορούσε να δημιουργήσει πρωτεΐνες που θα αυτοσυναρμολογούνταν σε νανοσωματίδια διαφορετικών σχημάτων και μεγεθών. Αυτά θα αποτελούνταν από πολλά αντίγραφα μιας μόνο πρωτεΐνης και θα ήταν παρόμοια με αυτά στα οποία βασίζεται το εμβόλιο κατά της COVID-19.
Όταν όμως έδωσαν εντολή σε μικροοργανισμούς να φτιάξουν τις πρωτεΐνες στο εργαστήριο, κανένα από τα 150 σχέδια δεν αναδιπλώθηκε και απλώς παρέμειναν στον πυθμένα του δοκιμαστικού σωλήνα.
Περίπου την ίδια εποχή, ένας άλλος ερευνητής στο εργαστήριο, ο επιστήμονας μηχανικής μάθησης Χούστας Νταουπάρας, ανέπτυσσε ένα εργαλείο βαθιάς μάθησης για να αντιμετωπίσει το πρόβλημα της αντίστροφης αναδίπλωσης πρωτεΐνης- τον προσδιορισμό μιας πρωτεϊνικής αλληλουχίας που αντιστοιχεί στο συνολικό σχήμα μιας δεδομένης πρωτεΐνης. Το δίκτυο, το οποίο ονομάζεται ProteinMPNN, λειτουργεί ως «ορθογραφικός έλεγχος» για τις πρωτεΐνες που δημιουργούνται με τη χρήση του AlphaFold και άλλων εργαλείων, τροποποιώντας τις αλληλουχίες και διατηρώντας το συνολικό σχήμα των μορίων.
Ο Μπέικερ και η ομάδα του χρησιμοποίησαν αυτό το δίκτυο για να ελέγξουν 30 από τις νέες πρωτεΐνες τους χρησιμοποιώντας κρυο-ηλεκτρονική μικροσκοπία και άλλες πειραματικές τεχνικές και διαπίστωσαν ότι 27 από αυτές ταίριαζαν με αυτά που είχε προτείνει η τεχνητή νοημοσύνη.
Οι δημιουργίες της ομάδας περιλάμβαναν γιγάντιους δακτυλίους με πολύπλοκες συμμετρίες, που δεν έμοιαζαν με οτιδήποτε απαντάται στη φύση. Θεωρητικά, η προσέγγιση αυτή θα μπορούσε να χρησιμοποιηθεί για τον σχεδιασμό νανοσωματιδίων που αντιστοιχούν σε σχεδόν οποιοδήποτε συμμετρικό σχήμα, εξηγεί Λούκας Μίλες, βιοφυσικός και συν-επικεφαλής της μελέτης.
Επανάσταση της βαθιάς μάθησης
Εργαλεία βαθιάς μάθησης όπως το proteinMPNN έχουν αλλάξει τα δεδομένα στο σχεδιασμό πρωτεϊνών, λέει ο Άρνι Έλοφσον, υπολογιστικός βιολόγος στο Πανεπιστήμιο της Στοκχόλμης.
«Σχεδιάζεις την πρωτεΐνη, πατάς ένα κουμπί και παίρνεις κάτι που μία στις δέκα φορές λειτουργεί». Ακόμη υψηλότερα ποσοστά επιτυχίας μπορούν να επιτευχθούν με το συνδυασμό πολλαπλών νευρωνικών δικτύων για την αντιμετώπιση διαφορετικών τμημάτων της διαδικασίας σχεδιασμού, όπως έκανε η ομάδα του Μπέικερ για το σχεδιασμό των νανοσωματιδίων. «Τώρα έχουμε πλήρη έλεγχο του σχήματος της πρωτεΐνης», λέει ο Οβτσινίκοφ.
Το εργαστήριο του Μπέικερ δεν είναι το μόνο που χρησιμοποιεί τεχνητή νοημοσύνη για το σχεδιασμό πρωτεϊνών. Στο πλαίσιο μιας μελέτης ανασκόπησης που δημοσιεύθηκε στο «bioRxiv» αυτόν τον μήνα, η Φερούζ και οι συνεργάτες της ανέφερε περισσότερα από 40 εργαλεία σχεδιασμού πρωτεϊνών με τεχνητή νοημοσύνη που έχουν αναπτυχθεί τα τελευταία χρόνια.
Πολλά από αυτά τα εργαλεία, συμπεριλαμβανομένου του proteinMPNN, αντιμετωπίζουν το πρόβλημα της αντίστροφης αναδίπλωσης: καθορίζουν μια αλληλουχία που αντιστοιχεί σε μια συγκεκριμένη δομή συχνά χρησιμοποιώντας προσεγγίσεις που χρησιμοποιούν τα εργαλεία αναγνώρισης εικόνας. Κάποια άλλα εργαλεία βασίζονται σε μια αρχιτεκτονική παρόμοια με εκείνη των γλωσσικών νευρωνικών δικτύων όπως το GPT-3, αλλά αντί για κείμενο παράγουν νέες πρωτεϊνικές αλληλουχίες.
Τον Ιούλιο, η ομάδα του Μπέικερ περιέγραψε δύο μεθόδους που επιτρέπουν στους ερευνητές να ενσωματώσουν μια συγκεκριμένη αλληλουχία ή δομή σε μια νέα πρωτεΐνη. Οι ερευνητές χρησιμοποίησαν αυτές τις μεθόδους για να σχεδιάσουν ένζυμα που καταλύουν συγκεκριμένες αντιδράσεις, καθώς και μια πρωτεΐνη που θα μπορούσε να χρησιμοποιηθεί σε ένα εμβόλιο κατά ενός αναπνευστικού ιού που αποτελεί κύρια αιτία νοσηλείας βρεφών.
ΠΗΓΗ: Nature