Η απίθανη τεχνητή νοημοσύνη Stable Diffusion τώρα μπαίνει και στον χώρο του βίντεο

23 Νοεμβρίου, 2023

Η δημιουργική τέχνη του Stable Diffusion αποκτάει κίνηση, ανακοίνωσε η Stability AI. Η εταιρεία κυκλοφόρησε ένα νέο προϊόν με την ονομασία Stable Video Diffusion το οποίο επιτρέπει στους χρήστες να δημιουργούν βίντεο από μια μόνο εικόνα. “Αυτό το τελευταίας τεχνολογίας γεννητικό μοντέλο βίντεο AI αντιπροσωπεύει ένα σημαντικό βήμα στο ταξίδι μας προς τη δημιουργία μοντέλων για όλους και για κάθε τύπο”, έγραψε η εταιρεία.

Το νέο εργαλείο κυκλοφόρησε με τη μορφή δύο μοντέλων μετατροπής εικόνας σε βίντεο, καθένα από τα οποία μπορεί να παράγει 14 έως 25 καρέ μήκους με ταχύτητες μεταξύ 3 και 30 καρέ ανά δευτερόλεπτο σε ανάλυση 576 × 1024.


Το Stable Video Diffusion είναι διαθέσιμο μόνο για ερευνητικούς σκοπούς προς το παρόν και όχι για real world ή εμπορικές εφαρμογές. Οι δυνητικοί χρήστες μπορούν να εγγραφούν για να μπουν σε μια λίστα αναμονής για πρόσβαση στο νέο αυτό εργαλείο, το οποίο όπως φαίνεται προορίζεται για τομείς όπως η διαφήμιση, η εκπαίδευση και η ψυχαγωγία.

Τα δείγματα που παρουσιάζονται στο βίντεο φαίνεται να είναι σχετικά υψηλής ποιότητας, ωστόσο φαίνεται να υπάρχουν και περιορισμοί. Για παράδειγμα μπορεί να παράγει σχετικά σύντομο βίντεο (λιγότερο από 4 δευτερόλεπτα), δεν έχει τέλειο φωτορεαλισμό, δεν μπορεί να δημιουργήσει κίνηση της κάμερας εκτός από κάποια αργά περιορισμένα pan δεν έχει έλεγχο κειμένου, και μπορεί να μην παράγει σωστά ανθρώπους και πρόσωπα.

Το εργαλείο εκπαιδεύτηκε σε ένα σύνολο δεδομένων εκατομμυρίων βίντεο και στη συνέχεια τελειοποιήθηκε σε ένα μικρότερο σύνολο, με τη Stability AI να αναφέρει μόνο ότι χρησιμοποίησε βίντεο που ήταν δημόσια διαθέσιμα για ερευνητικούς σκοπούς. Η προέλευση του συνόλου δεδομένων είναι σημαντική, δεδομένου ότι η Stability AI μηνύθηκε πρόσφατα από την Getty Images για παράνομο scraping των αρχείων εικόνων της.
Το βίντεο είναι ένας βασικός στόχος για τη γεννητική τεχνητή νοημοσύνη, λόγω της δυνατότητάς του να απλοποιήσει τη δημιουργία περιεχομένου. Ωστόσο, είναι επίσης ένα εργαλείο που έχει και τις περισσότερες πιθανότητες να χρησιμοποιηθεί κακόβουλα με την δημιουργία deepfakes και την παραβίαση πνευματικών δικαιωμάτων.