Το ChatGPT μπορεί πλέον να «βλέπει, να ακούει και να μιλάει» ή, τουλάχιστον, να κατανοεί προφορικές λέξεις, να απαντά με μια «συνθετική» φωνή και να επεξεργάζεται εικόνες, όπως ανακοίνωσε η OpenAI.
Η ενημέρωση του chatbot – η μεγαλύτερη από την εισαγωγή του GPT-4 – επιτρέπει στους χρήστες να συμμετέχουν σε φωνητικές συνομιλίες με την εφαρμογή για κινητά του ChatGPT και να επιλέγουν μεταξύ πέντε διαφορετικών φωνών. Οι χρήστες θα μπορούν επίσης να μοιράζονται εικόνες με το ChatGPT και να επισημαίνουν τα κομμάτια της φωτογραφίας που θέλουν να εστιάσει το chatbot μέσω εντολών.
Οι αλλαγές θα είναι διαθέσιμες στους χρήστες που πληρώνουν συνδρομή τις επόμενες δύο εβδομάδες. Η φωνητική λειτουργία θα περιορίζεται στην εφαρμογή iOS και Android. Οι δυνατότητες επεξεργασίας εικόνας θα είναι διαθέσιμες σε όλες τις πλατφόρμες.
Η ανάπτυξη των νέων αυτών δυνατοτήτων εντάσσεται στο πλαίσιο της γενικότερης προπάθειας των εταιρειών OpenAI, Microsoft, Google και Anthropic να κερδίσουν τον «αγώνα» της τεχνητής νοημοσύνης.
Ειδικότερα, οι τεχνολογικοί κολοσσοί αγωνίζονται να λανσάρουν όχι μόνο νέες εφαρμογές chatbot, αλλά και νέες δυνατότητες. Η Google ανακοίνωσε μια σειρά από ενημερώσεις στο chatbot Bard και η Microsoft πρόσθεσε την οπτική αναζήτηση στο Bing.
Νωρίτερα φέτος, η επένδυση της Microsoft στο OpenAI με επιπλέον 10 δισεκατομμύρια δολάρια, την κατέστησε τη μεγαλύτερη στον κλάδο της τεχνητής νοημοσύνης για το έτος, σύμφωνα με το PitchBook.
Ανησυχία για τις φωνές του chatbot
Παράλληλα, οι ειδικοί έχουν εκφράσει τις ανησυχίες τους σχετικά με τις συνθετικές φωνές που δημιουργούνται από την τεχνητή νοημοσύνη, οι οποίες σε αυτήν την περίπτωση θα μπορούσαν να επιτρέψουν στους χρήστες μια πιο φυσική εμπειρία, αλλά και να επιτρέψουν στη δημιουργία πιο πιστικών deepfakes. Οι φορείς και οι ερευνητές των κυβερνοαπειλών έχουν ήδη αρχίσει να διερευνούν πώς μπορούν να χρησιμοποιηθούν τα deepfakes για να διεισδύσουν σε συστήματα κυβερνοασφάλειας.
Η OpenAI αναφέρθηκε σε αυτές τις ανησυχίες στην ανακοίνωσή της τη Δευτέρα, λέγοντας ότι οι συνθετικές φωνές «δημιουργήθηκαν από τη συνεργασία μας με ηθοποιούς φωνής», και όχι από την συλλογή φωνών από αγνώστους.