Η Voice Engine της OpenAI μπορεί να μιμηθεί οποιαδήποτε φωνή με ένα δείγμα 15 δευτερολέπτων

1 Απριλίου, 2024

Η OpenAI μπορεί πλέον να αναδημιουργεί ανθρώπινες φωνές με την πλατφόρμα “Voice Engine”. Η εταιρεία που χρηματοδοτείται από τη Microsoft κρατάει τη νέα μηχανή τεχνητής νοημοσύνης στην αφάνεια λόγω προφανών ηθικών και νομικών επιπτώσεων.

Μετά την τεράστια επιτυχία των ChatGPT, DALL-E και Sora, η OpenAI έχει τώρα επιχειρήσει να εισέλθει στον τομέα του ήχου, και συγκεκριμένα στην ανθρώπινη ομιλία και φωνή. Το Voice Engine AI βρίσκεται επί του παρόντος σε φάση δοκιμών beta, αλλά οι χρήστες για την ώρα ενδέχεται να μην είναι σε θέση να εγγραφούν για συνδρομή.

Το ChatGPT ξεσήκωσε τον κόσμο, το DALL-E ξεκλείδωσε τη δημιουργικότητα σε εκατομμύρια ανθρώπους και το Sora μπορεί σύντομα να επιτρέψει στους απλούς χρήστες του διαδικτύου να γίνουν δημιουργοί ταινιών. Μετά το κείμενο, τις εικόνες και τα βίντεο, η OpenAI ανακοίνωσε τώρα τη Voice Engine, μια πλατφόρμα τεχνητής νοημοσύνης που μπορεί να αναπαράγει ανθρώπινες φωνές.

Οι New York Times έλαβαν ένα demo της πλατφόρμας Voice Engine. Σύμφωνα με πληροφορίες, η μηχανή τεχνητής νοημοσύνης μπορεί να αναδημιουργήσει οποιαδήποτε ανθρώπινη φωνή από μια ηχογράφηση 15 δευτερολέπτων. Αν αυτό δεν είναι αρκετά τρομακτικό, μετά την απορρόφηση των απαραίτητων πληροφοριών, η Voice Engine μπορεί να μιλήσει κανονικά με το κείμενο που θα την τροφοδοτήσει ο χρήστης!

Παραδόξως, η προτροπή κειμένου δεν χρειάζεται να είναι καν στη μητρική γλώσσα του ομιλητή. Με άλλα λόγια, ακόμη και αν εσύ που εκπαιδεύεις την AI μιλάς ελληνικά, η AI μπορεί να μιλήσει σε οποιαδήποτε γλώσσα επιλέξεις!

Η OpenAI διαβεβαίωσε ότι διερευνά πολλαπλούς ελέγχους ασφαλείας, όπως τα υδατογραφήματα ενώ θα υπάρχουν έλεγχοι που θα περιορίζουν τη Voice Engine από το να δημιουργεί τις φωνές συγκεκριμένων ατόμων. Είναι ενδιαφέρον ότι ο διευθυντής προϊόντων της OpenAI, Jeff Harris, φέρεται να υποστήριξε ότι η εταιρεία δεν έχει άμεσα σχέδια να βγάλει χρήματα από την τεχνολογία. Ο πρωταρχικός σκοπός της είναι να είναι χρήσιμη σε ανθρώπους που έχασαν τη φωνή τους λόγω ασθένειας ή ατυχήματος, πρόσθεσε. Το Voice Engine είναι προς το παρόν διαθέσιμο σε “μια μικρή ομάδα επιχειρήσεων”. Με απλά λόγια, μερικές εταιρείες, προφανώς κατόπιν πρόσκλησης, έχουν περιορισμένη πρόσβαση στην πλατφόρμα.

 

Περιττό να αναφέρουμε ότι υπάρχουν τεράστιες ηθικές και νομικές επιπτώσεις μιας πλατφόρμας τεχνητής νοημοσύνης που μπορεί να αναδημιουργήσει ανθρώπινες φωνές, σε πολλές γλώσσες, με βάση μια ηχογράφηση 15 δευτερολέπτων. Μην ξεχνάμε άλλωστε ότι ήδη απατεώνες χρησιμοποιούν εδώ και καιρό AI για να μιμηθούν φωνές συγκεκριμένων ανθρώπων. Σκεφτείτε λοιπόν να λάβετε μια κλήση στην οποία θα ακούτε ένα δικό σας πρόσωπο να ζητάει χρήματα για κάποιο σοβαρό πρόβλημα το οποίο αντιμετωπίζει.
Σε λάθος χέρια, η Voice Engine θα μπορούσε να δεχτεί και να αναδημιουργήσει τις φωνές πολιτικών, διασημοτήτων, δημοσιογράφων και άλλων επιφανών προσωπικοτήτων. Η πλατφόρμα θα μπορούσε να χρησιμοποιηθεί για τη δημιουργία πειστικών ηχητικών αποσπασμάτων που διαδίδουν παραπληροφόρηση ή προπαγάνδα. Σε ένα εξίσου τρομακτικό σενάριο, οι χάκερ και οι εγκληματίες θα μπορούσαν να θέσουν σε κίνδυνο τα συστήματα ασφαλείας που βασίζονται στον έλεγχο ταυτότητας φωνής. Ως εκ τούτου, το OpenAI πιθανότατα θα λογοκρίνει και θα ρυθμίσει σε μεγάλο βαθμό την πλατφόρμα Voice Engine για να αποτρέψει την κακή χρήση της.

Πέρα από τις ανησυχίες για την ασφάλεια και την ηθική, η Μηχανή Φωνής του OpenAI θα μπορούσε να είναι εξαιρετικά χρήσιμη για τους παραγωγούς ταινιών και διαδικτυακών σειρών που πρέπει να μεταγλωττίζουν τις δημιουργίες τους σε άλλες γλώσσες. Ομοίως, οι τομείς της εκπαίδευσης και της ψυχαγωγίας θα μπορούσαν να επωφεληθούν σε μεγάλο βαθμό. Όλοι το γνωρίζουμε άλλωστε. Ένα μαχαίρι είναι εξαιρετικό για να ετοιμάζουμε φαγητό, αλλά μπορεί εύκολα να γίνει και φονικό όπλο!

OpenAI

Huawei skin banner L
Huawei skin banner R