Η τεχνητή νοημοσύνη του DragGAN φέρνει το τέλος του Photoshop λίγο πιο κοντά

23 Μαΐου, 2023

Το DragGAN είναι μια νέα εφαρμογή τεχνητής νοημοσύνης που σας επιτρέπει να επεξεργάζεστε εύκολα φωτογραφίες απλά κάνοντας drag επάνω την εικόνα. Είναι πραγματικά τόσο απλό και για να είμαι ειλικρινής με έχει αφήσει με το στόμα ανοικτό!

Έχουμε δει πώς τα diffusion models, όπως το DALLE.2, το Stable Diffusion και το Midjourney, μπορούν να λειτουργήσουν, αλλά τώρα αρχίζουμε να βλέπουμε νέες χρήσεις για μια παλαιότερη τεχνολογία, τα GANs (generative adversarial networks).
Ενώ αυτό το λογισμικό επεξεργασίας εικόνων με τεχνητή νοημοσύνη βρίσκεται σε πρώιμο στάδιο τα αποτελέσματα είναι είναι απλά μαγικά. Το DragGAN είναι ένας διαδραστικός τρόπος επεξεργασίας φωτογραφιών ή έργων τέχνης με τον οποίο απλά επιλέγεις σημεία επάνω σε μια εικόνα και έπειτα κάνεις drag. Η τεχνητή νοημοσύνη κάνει όλη τη δύσκολη δουλειά.

Η εφαρμογή χρησιμοποιεί τεχνητή νοημοσύνη για να χειρίζεται εικόνες. Υπάρχει κάποια τεχνολογική ορολογία, αλλά ουσιαστικά η AI σας επιτρέπει να αλλάζετε δραματικά την εικόνα διατηρώντας στο ακέραιο τις λεπτομέρειες της.

Μπορείτε να προσαρμόζετε εικόνες που έχουν οριστεί σε διάφορες κατηγορίες, όπως ζώα, αυτοκίνητα και ανθρώπους, καθώς και τοπία, και να ρυθμίζετε τα πάντα, από τη διάταξη της εικόνας μέχρι τις πόζες και τα σχήματα, και να αλλάζετε ακόμη και την έκφραση ενός ατόμου σε μια φωτογραφία.

Η ερευνητική ομάδα έγραψε: “Φανταστείτε να μπορείτε απλώς να “σύρετε” οποιοδήποτε σημείο μιας εικόνας ακριβώς εκεί που θέλετε να είναι. Αυτό επιδιώκουμε να επιτύχουμε με τη νέα μας μέθοδο, την οποία ονομάζουμε DragGAN”. Το εργαλείο που βασίζεται στο GAN λειτουργεί επί του παρόντος σε 2D εικόνες, αλλά η ομάδα σχεδιάζει να κυκλοφορήσει μια έκδοση που θα λειτουργεί με 3D μοντέλα.


Η τεχνητή νοημοσύνη έχει βαλθεί να εξαφανίσει πολλά επαγγέλματα, αλλά αυτό του γραφίστα ή του χειριστή Photoshop βρίσκεται πραγματικά στα πρόθυρα της καταστροφής.
Τα εργαλεία όπως το DragGAN είναι σίγουρα το μέλλον και αναμένεται να μειώσουν στο ελάχιστο τις μέχρι πρότινος χρονοβόρες διαδικασίες επεξεργασίας εικόνας.