Στο διαδίκτυο έχουν διαρρεύσει εικόνες μίας νέας έκδοσης του DALLE της OpenAI, το σύστημα τεχνητής νοημοσύνης που δημιουργεί ρεαλιστικές εικόνες και τέχνη από μία περιγραφή σε φυσική γλώσσα.
Συγκεκριμένα, ο youtuber MattVidPro AI δημοσίευσε βίντεο στις 26 Ιουλίου στο οποίο δείχνει αυτές τις εικόνες της νέας έκδοσης, πιθανώς του DALLE-3. Ισχυρίζεται ότι οι εικόνες προέρχονται από έναν χρήστη στο κανάλι του στο Discord , ο οποίος είναι ένας από τους 400 ανθρώπους στον κόσμο που έχουν πρόσβαση σε μία αποκλειστική δοκιμαστική πλατφόρμα για την τελευταία έκδοση του DALL-E.
«Πραγματικά ρίχνουμε μια ματιά στο μέλλον της παραγωγής εικόνων τεχνητής νοημοσύνης… Σας υπόσχομαι ότι δεν έχετε δει ποτέ καμία παραγωγή εικόνων τεχνητής νοημοσύνης που να είναι τόσο καλή. Το Midjourney δεν μπορεί να ανταγωνιστεί αυτό το επίπεδο», λέει.
Το DALLE-2 έχει βγει εδώ και παραπάνω από έναν χρόνο και ενώ ήταν το καλύτερο στην κατηγορία του, το Midjourney και το Stable Diffusion το ξεπέρασαν. Όμως σύμφωνα με τον Matt, η νέα έκδοση θα ξεπεράσει οτιδήποτε είναι στην αγορά.
Ένα από τα εντυπωσιακά χαρακτηριστικά των εικόνων που παρουσιάζει ο Matt στο βίντεό του είναι η ικανότητα του νέου μοντέλου να εισάγει σωστά κείμενο σε μία εικόνα, κάτι το οποίο τα υπόλοιπα συστήματα παραγωγής εικόνων δεν έχουν καταφέρει.
Ένα απίστευτο παράδειγμα είναι μια φωτογραφία του βιντεοπαιχνιδιού Grand Theft Auto V, η οποία είναι μια σχεδόν τέλεια αναπαράσταση του διάσημου παιχνιδιού σε ένα κουτί δίσκου PS4.
Σύμφωνα με τον Matt, σε αυτό το τελευταίο μοντέλο του DALL-E επί του παρόντος, μπορούν να δημιουργηθούν βίαιες εικόνες. «Θα δημιουργεί τέλεια τους χαρακτήρες που προστατεύονται από πνευματικά δικαιώματα, τα λογότυπα, τις απόλυτα ακριβείς απεικονίσεις διασημοτήτων και πλήρεις απεικονίσεις ακραίας βίας», επισημαίνει.
Ο Matt προβλέπει ότι το DALLE-3 θα κυκλοφορήσει μέχρι το τέλος του έτους.
ΠΗΓΗ: PetaPixel
Πηγή: ertnews.gr