Το ChatGPT της OpenAI μπορεί πλέον να «βλέπει, να ακούει και να μιλάει» ή, τουλάχιστον να κατανοεί λέξεις, να απαντά με τη δική του συνθετική (ρομποτική) φωνή και να επεξεργάζεται εικόνες, όπως ανακοίνωσε χθες η εταιρεία (25/09).
Η ενημέρωση του chatbot – η μεγαλύτερη της OpenAI από την κυκλοφορία του GPT-4 – επιτρέπει στους χρήστες να επιλέγουν φωνητικές συνομιλίες στην εφαρμογή για κινητά του ChatGPT και να διαλέγουν μια από τις πέντε διαφορετικές συνθετικές φωνές του chatbot. Οι χρήστες θα μπορούν επίσης να μοιράζονται εικόνες με το ChatGPT και να επισημαίνουν περιοχές εστίασης ή ανάλυσης.
Τα νέα χαρακτηριστικά θα είναι διαθέσιμα αποκλειστικά για τους συνδρομητές τις επόμενες δύο εβδομάδες, δήλωσε η OpenAI. Ενώ η φωνητική λειτουργία θα περιορίζεται στις εφαρμογές iOS και Android, οι δυνατότητες επεξεργασίας εικόνας θα είναι διαθέσιμες σε όλες τις πλατφόρμες.
Σε μια προσπάθεια να ενθαρρύνουν τους καταναλωτές να υιοθετήσουν τη γενετική τεχνητή νοημοσύνη στην καθημερινή τους ζωή, οι τεχνολογικοί κολοσσοί λανσάρουν όχι μόνο νέες εφαρμογές chatbot, αλλά και νέα χαρακτηριστικά. Η Google ανακοίνωσε μια σειρά από ενημερώσεις για το chatbot Bard και η Microsoft πρόσθεσε οπτική αναζήτηση στο Bing.
Οι ειδικοί έχουν εκφράσει ανησυχίες σχετικά με την τεχνολογία παραγωγής συνθετικών φωνών, η οποία θα προσφέρει μεν στους χρήστες μια πιο φυσική εμπειρία, αλλά θα διευκολύνει και τη δημιουργία πειστικών deepfakes. Οι φορείς κυβερνοαπειλών και οι ερευνητές έχουν ήδη αρχίσει να διερευνούν πώς μπορούν να χρησιμοποιηθούν τα deepfakes για να διεισδύσουν στα συστήματα κυβερνοασφάλειας.
Η OpenAI αναφέρθηκε σε αυτές τις ανησυχίες στην ανακοίνωσή της τη Δευτέρα, λέγοντας ότι οι συνθετικές φωνές «δημιουργήθηκαν με φωνές ηθοποιών με τους οποίους έχουμε συνεργαστεί άμεσα», και δεν συλλέχθηκαν από αγνώστους.
ΠΗΓΗ: CNBC