Η Stability AI ανακοίνωσε την κυκλοφορία της νέας γεννήτριας εικόνων AI Stable Diffusion XL 1.0, η οποία σύμφωνα με την εταιρία είναι το πιο «προηγμένο» μοντέλο της μέχρι σήμερα.
Το εργαλείο τεχνητής νοημοσύνης (AI) είναι διαθέσιμο σε ανοιχτό κώδικα στο GitHub και στις καταναλωτικές εφαρμογές ClipDrop και DreamStudio.
Το Stable Diffusion XL (SDXL) 1.0 περιέχει 3,5 δισεκατομμύρια παραμέτρους και μπορεί να δημιουργήσει εικόνες ενός megapixel σε πολλαπλές αναλογίες διαστάσεων. Το μοντέλο μαθαίνει τις παραμέτρους από τα δεδομένα εκπαίδευσης και αργότερα χρησιμοποιούνται ως είσοδοι– ουσιαστικά καθορίζουν την ικανότητα του προγράμματος.
Η Stability AI αναφέρει ότι η τελειοποίηση του SDXL σημαίνει ότι θα παράγει «πιο ζωντανά και ακριβή χρώματα, με καλύτερη αντίθεση, φωτισμό και σκιές από τον προκάτοχό του». Λέει επίσης ότι οι εντολές θα να είναι λιγότερο περίπλοκες και ότι θα καταλαβαίνει απλούστερη γλώσσα.
Το Stability API προσφέρει τη νέα λειτουργία fine-tuning beta, η οποία είναι ικανή να λαμβάνει ένα μικρό σύνολο εικόνων για τη δημιουργία εικόνων συγκεκριμένων ανθρώπων και προϊόντων. Ωστόσο, το εν λόγω χαρακτηριστικό βρίσκεται επί του παρόντος σε περιορισμένη δοκιμή και θα κυκλοφορήσει τις επόμενες εβδομάδες.
Η εταιρεία αναφέρει ότι το τελευταίο Stable Diffusion έχει βελτιωθεί στον τομέα της δημιουργίας κειμένου. Οι γεννήτριες μετατροπής κειμένου σε εικόνα συχνά δυσκολεύονται να παράγουν το κατάλληλο κείμενο, αλλά η Stability AI επιμένει ότι το SDXL είναι σε θέση να παράγει «προηγμένο» κείμενο. Χθες, οι εικόνες που διέρρευσαν από ένα φημολογούμενο DALL-E 3 έδειξαν επίσης καλύτερη παραγωγή κειμένου.
Το SDXL υποστηρίζει επίσης το inpainting και το outpainting. Το inpainting είναι η αλλαγή μέρους μιας εικόνας, ενώ το outpainting σημαίνει την επέκταση εκτός της αρχικής εικόνας με συνεκτικό τρόπο, παρόμοια με το εργαλείο Generative Fill της Adobe.
Οι αγωγές
Η φύση του Stable Diffusion με ανοιχτό κώδικα σημαίνει ότι μπορεί να χρησιμοποιηθεί από κακόβουλους παράγοντες για τη δημιουργία επιβλαβούς περιεχομένου, όπως μη συναινετικά deepfakes. Το Tech Crunch σημειώνει ότι υπάρχουν αμέτρητα σεμινάρια για το πώς να χρησιμοποιήσετε το Stable Diffusion για να δημιουργήσετε deepfakes και πορνό.
Το SDXL «εκπαιδεύτηκε» σε δεδομένα που παρήχθησαν από καλλιτέχνες οι οποίοι δυσανασχετούν με τη χρήση της δουλειάς τους με αυτόν τον τρόπο, ισχυριζόμενοι ότι ποτέ δεν έδωσαν σε εταιρείες όπως η Stability AI την άδεια να το κάνουν. Η εταιρεία λέει ότι προστατεύεται από το δόγμα της δίκαιης χρήσης, αλλά αυτό δεν έχει ακόμη εξεταστεί σε δικαστήριο και η εταιρεία βρίσκεται αντιμέτωπη με αγωγές.
«Βελτιώνουμε συνεχώς τη λειτουργικότητα ασφαλείας του Stable Diffusion και είμαστε σοβαροί στο να συνεχίσουμε να επαναλαμβάνουμε αυτά τα μέτρα», λέει στο Tech Crunch ο Joe Penna, επικεφαλής της εφαρμοσμένης μηχανικής μάθησης της Stability AI. «Επιπλέον, δεσμευόμαστε να σεβόμαστε τα αιτήματα των καλλιτεχνών να αφαιρεθούν από τα σύνολα δεδομένων εκπαίδευσης».
Το SDXL θα εμφανίζεται επίσης στο Amazon Webrock, μια πλατφόρμα cloud που φιλοξενεί μοντέλα τεχνητής νοημοσύνης.
«Το τελευταίο μοντέλο SDXL αντιπροσωπεύει το επόμενο βήμα στην κληρονομιά καινοτομίας της Stability AI και την ικανότητά της να φέρνει στην αγορά τα πιο πρωτοποριακά μοντέλα ανοικτής πρόσβασης για την κοινότητα της τεχνητής νοημοσύνης», λέει ο Emad Mostaque, διευθύνων σύμβουλος της Stability AI.
«Η αποκάλυψη της έκδοσης 1.0 στο Amazon Bedrock αποδεικνύει την ισχυρή δέσμευσή μας να συνεργαζόμαστε με την AWS για να παρέχουμε τις καλύτερες λύσεις για τους προγραμματιστές και τους πελάτες μας.»
Πηγή: Petapixel
Πηγή: ertnews.gr