Στις φωτογραφίες του Τάσου Παπαναγιώτου θα δεις ανθρώπους που δεν υπάρχουν
Οι viral τάσεις στα Μέσα Κοινωνικής Δικτύωσης του τελευταίους μήνες μας υπενθυμίζουν πως βρισκόμαστε μπροστά σε μια νέα τεχνολογική επανάσταση η οποία προβλέπεται καθοριστική για την πολιτισμική εξέλιξη των ερχόμενων δεκαετιών.
Ο λόγος για την άφιξη της Τεχνητής Νοημοσύνη (TN) στις ζωές μας. Τα «μαγικά άβαταρ» και οι επεξεργασμένες selfie της «Lensa AI» έχουν κατακλύσει τα social media, το «chatGPT» είναι το νέο talk-of-the town σε κάθε διαδικτυακή γειτονιά, και ολοένα και περισσότερος κόσμος έχει αρχίσει να εξοικειώνεται με ΑI εφαρμογές και εργαλεία επεξεργασίας εικόνων.
Σε αντίθεση με την κοινή πεποίθηση, η τέχνη που παράγεται με τη βοήθεια Τεχνητής Νοημοσύνης πρωτοεμφανίστηκε πριν πολλά χρόνια, κατά τη διάρκεια της δεκαετίας του 1960. Ωστόσο, τα περισσότερα AI προγράμματα που χαίρουν ευρείας χρήσης σήμερα είναι νεότευκτα, με το Midjourney και το chatGPT -δύο από τους πιο γνωστούς παίκτες στον χώρο της ΤΝ- να κάνουν το ντεμπούτο τους το 2022.
«Είναι η πρώτη φορά που ένας απλός άνθρωπος έρχεται σε επαφή με αυτά τα πολύπλοκα νέα μοντέλα Α.Ι.» δηλώνει ο David Holz, CEO του AI μοντέλου δημιουργίας εικόνων Midjourney. Οι πρόσφατες εξελίξεις στον χώρο της AI επιστήμης έχουν πλέον ενισχύσει θεαματικά την ικανότητα των μοντέλων ΤΝ να κατανοούν τη γλώσσα και να δημιουργούν ρεαλιστικές εικόνες βάσει απλών οδηγιών, γεγονός που τα καθιστά για πρώτη φορά εύχρηστα και προσιτά στο ευρύ κοινό.
Ο Τάσος Παπαναγιώτου, ένας κειμενογράφος που πειραματίζεται με τη δημιουργία φωτογραφιών στο Midjourney, μας επιβεβαιώνει πως πρόκειται για ένα πρόγραμμα που μπορεί να χρησιμοποιήσει ο καθένας. Ο ίδιος δραστηριοποιείται στον χώρο της διαφήμισης τα τελευταία χρόνια, ωστόσο η εμπειρία του με την οπτική επικοινωνία και η αγάπη του για την γραφιστική τον ώθησαν να εξερευνήσει την ΤΝ ως μία νέα πηγή έκφρασης.
Αξιοποιώντας τα εργαλεία του μέλλοντος, ο Τάσος αποφάσισε να αναβιώσει μνήμες του παρελθόντος, δημιουργώντας μια συλλογή από ΑI φωτογραφίες ανθρώπων που δεν υπήρξαν ποτέ.
Τι σε ώθησε να πειραματιστείς με την AI τεχνολογία και συγκεκριμένα με το Midjourney;
Είμαι κειμενογράφος με background στην οπτική επικοινωνία (γραφιστική), διαβάζοντας λοιπόν το περασμένο καλοκαίρι για το τι είναι η text-to-image τεχνητή νοημοσύνη, αποφάσισα να δω πώς λειτουργεί. Έφτιαξα εικόνες με πολλά διαφορετικά στυλ, έπαθα... σοκ με τον ρεαλισμό τους, αλλά η αλήθεια είναι ότι σύντομα βαρέθηκα να βλέπω παντού «έργα» με ημίγυμνες και επιστημονική φαντασία ξεπατικωμένη από τους ίδιους 2-3 καλλιτέχνες. Από τη στιγμή που η πλατφόρμα ήταν σε θέση να αναπαράξει π.χ. ακόμα και αποτελέσματα με συγκεκριμένους φακούς φωτογραφικών μηχανών ή φιλμ που πλέον δεν κυκλοφορούν στο εμπόριο, σκέφτηκα να δημιουργήσω ένα δικό μου κονσεπτάκι, ως αφιέρωμα σε μια εποχή που αγαπώ ιδιαίτερα.
Πώς εμπνεύστηκες την ιδέα του Midjourney to Greece και ποιο είναι το concept πίσω απ’ τη σελίδα;
Tα '90s, που έζησα ως έφηβος, ήταν μια αγνή, pre-digital εποχή, κοντινή αλλά και μακρινή σε σχέση με το σήμερα. Μέσα από το Midjourney to Greece θέλω να περάσω το ύφος και την αίσθηση εκείνων των χρόνων, με ό,τι αυτό εμπεριέχει: Τα ξενύχτια στο mIRC, τις πολιτικές συγκεντρώσεις, τον φανατισμό των ντέρμπι, τα εφηβικά πάρτι και τα ελληνάδικα. Λίγο από όλα! Ήταν μια περίοδος με πρωτοφανείς τάσεις και πολιτισμικές εξελίξεις (τα video games, τα κινητά, το ίντερνετ), που καθιστούν κατά την άποψη μου τα '90s την καλύτερη δεκαετία για να μεγαλώσει ένα παιδί.
Μπορεί ο οποιοσδήποτε να χρησιμοποιήσει το Midjourney ή απαιτείται κάποια τεχνική κατάρτιση;
Γενικά, η χρήση του Midjourney δεν απαιτεί απαραίτητα συγκεκριμένες τεχνικές δεξιότητες. Και αυτό γιατί η ΤΝ μπορεί να αυτοματοποιήσει ορισμένες πτυχές της δημιουργίας εικόνων. Κάποια δημιουργικότητα και κατανόηση της γλώσσας και της αφήγησης μπορεί όμως να είναι χρήσιμη στην παραγωγή «αποτελεσματικών» εικόνων. Η γνώση της ιστορίας της τέχνης ή άλλων καλλιτεχνών μπορεί επίσης να βελτιώσει μια εντολή, γιατί παρέχει έμπνευση και «πλαίσιο» για τις εικόνες που δημιουργούνται -αλλά δεν είναι απαραίτητη. Νομίζω πως η ικανότητα περιγραφής μιας ιδέας με σαφήνεια, είναι ο πιο σημαντικός παράγοντας στη δημιουργία εικόνων υψηλής ποιότητας με το Midjourney.
Θεωρείς πως η ανθρώπινη συνεισφορά και «καθοδήγηση» παίζει καθοριστικό ρόλο σε ένα έργο που δημιουργείται από ένα μοντέλο Τεχνητής Νοημοσύνης;
Για να είμαστε ειλικρινείς, με οποιαδήποτε απλή εντολή μπορείς πλέον να δημιουργήσεις ένα τέλειο αποτέλεσμα, π.χ. ακόμα και με το «ένα κορίτσι με κόκκινη μπλούζα». Αλλά ναι, η ανθρώπινη συνεισφορά και η καθοδήγηση μπορεί να παίξει καθοριστικό ρόλο. Το αποτέλεσμα επηρεάζεται σε μεγάλο βαθμό από το «input» που λαμβάνει το Midjourney, και η ποιότητα του «output» εξαρτάται από την ικανότητα και τη δημιουργικότητα του ατόμου που παρέχει την εντολή. O χρήστης δηλαδή πρέπει να είναι σε θέση να περιγράψει σωστά μια ιδέα, γιατί αυτό έχει σημαντικό αντίκτυπο στον ρεαλισμό της εικόνας που θα δημιουργήσει το μοντέλο. Επιπλέον, η περιγραφή στην εντολή μπορεί να χρειαστεί να αλλάξει πολλές φορές προκειμένου να πετύχει κανείς το επιθυμητό αποτέλεσμα.
Είναι στο χέρι σου να καθορίσεις πόσο λεπτομερής θα είναι η περιγραφή σου ή υπάρχουν συγκεκριμένες προδιαγραφές;
Ναι, μπορείς να καθορίσεις σχεδόν τα πάντα. Δεν υπάρχουν συγκεκριμένες προδιαγραφές σχετικά με τον όγκο των πληροφοριών που πρέπει να παρέχονται· το επίπεδο ακρίβειας και λεπτομέρειας της περιγραφής εξαρτάται από τον εκάστοτε χρήστη. Ο κάθε δημιουργός επιλέγει τις πληροφορίες που θέλει να εισάγει, συμπεριλαμβανομένων κειμένου και οπτικών «αναφορών». Προσωπικά, θεωρώ ότι μια εντολή (prompt) μεσαίας «έκτασης» είναι ιδανική για μια καλή φωτογραφία. Visual references εισάγω μόνο στην περίπτωση που θέλω να πετύχω κάτι πολύ συγκεκριμένο, όπως ένα γνωστό πρόσωπο, έναν γνωστό τύπο ρούχου ή άλλο αντικείμενο που θέλω να εμφανιστεί σωστά.
Αισθάνεσαι πως η δουλειά σου στο Μidjourney είναι πρωτίστως καλλιτεχνικής φύσεως;
Κοίταξε, νομίζω πως η δουλειά γενικά στο Midjourney είναι ένας συνδυασμός καλλιτεχνικών αλλά και τεχνολογικών στοιχείων. Από τη μία πλευρά, η δημιουργία εικόνων με το Midjourney απαιτεί ένα ορισμένο επίπεδο δημιουργικότητας και κατανόησης της "οπτικής αφήγησης". Το να μπορείς να δημιουργήσεις δηλαδή ευφάνταστες περιγραφές που θα μεταφραστούν σε εικόνες. Από την άλλη πλευρά, δεν παύει να είναι ένα τεχνολογικό εργαλείο που χρησιμοποιεί αλγόριθμους για τη δημιουργία εικόνων που βασίζονται σε περιγραφές. Όπως διάβασα κάπου, το Midjourney είναι «μία μηχανή για τη φαντασία», που δημιουργεί μια νέα οπτική γλώσσα έκφρασης! Άρα, η ΤΝ μπορεί να θεωρηθεί ως ένα εργαλείο που ενισχύει την ανθρώπινη δημιουργικότητα, χωρίς ωστόσο να την αντικαθιστά.
Όταν ξεκινάς να περιγράφεις μια φωτογραφία, έχεις στο μυαλό σου μία πολύ συγκεκριμένη εικόνα που θέλεις να προκύψει; Εκπλήσσεσαι ποτέ από το αποτέλεσμα;
Ναι, όταν ξεκινάω μια περιγραφή έχω κάτι πολύ συγκεκριμένο στο μυαλό μου αλλά αυτό δεν σημαίνει αναγκαστικά πως θα βγει όπως το φαντάστηκα. Πέραν από τα κωμικά λάθη που προκύπτουν (λάθη στα χέρια, διπλά κεφάλια, όμοια πρόσωπα στην ίδια φωτογραφία κ.α.), θα χρειαστούν πολλές απόπειρες για να βγει κάτι σωστά και με τον τρόπο που θες! Για παράδειγμα, όταν θέλω να δημιουργήσω μία σκηνή, θα προσπαθήσω να σκηνοθετήσω όλο τον χώρο -από το τι κάνει ο "πρωταγωνιστής", μέχρι το πώς συμπεριφέρονται οι υπόλοιποι παρευρεθέντες και τα αντικείμενα που παρεμβάλλονται. Σ' αυτές τις περιπτώσεις ειδικά είναι που μπορεί να προκύψει κάτι τελείως διαφορετικό από αυτό που είχα οραματιστεί, και συνήθως πολύ πιο ωραίο.
Όσον αφορά τις φωτογραφίες ανθρώπων, ποιο είναι το χαρακτηριστικό που είναι δυσκολότερο να αποτυπωθεί πιστά;
Σίγουρα τα ανθρώπινα χέρια. Γενικά, η δημιουργία εικόνων με χέρια είναι πρόκληση για τα μοντέλα "machine learning" όπως το Midjourney, επειδή τα χέρια απαιτούν υψηλό επίπεδο λεπτομέρειας και ακρίβειας για να απεικονιστούν ρεαλιστικά. Επίσης, έχουν μεγάλο βαθμό "ελευθερίας", άρα είναι δύσκολο για το AI να προβλέψει την ακριβή θέση και στάση τους με βάση μόνο μια περιγραφή κειμένου. Για να δημιουργηθούν με ακρίβεια εικόνες ανθρώπινων χεριών, το μοντέλο πρέπει να εκπαιδευτεί σε ένα μεγάλο σύνολο δεδομένων προκειμένου να παράξει πιο προηγμένους αλγόριθμους. Το καλό όμως με την τεχνολογία AI είναι πως συνεχώς εξελίσσεται και μαθαίνει.
Όσο εξερευνάς το Midjourney νιώθεις πως οι δυνατότητες ενός προγράμματος που συνεχώς εξελίσσεται είναι απεριόριστες ή έχεις αντιληφθεί κάποιους περιορισμούς;
Δεν είμαι φωτογράφος ή εικονογράφος, και πιστεύω πως το AI δεν μπορεί να αντικαταστήσει σε κανένα βαθμό την καλλιτεχνική ευφυΐα και δημιουργικότητα. Αν και εξελίσσεται συνεχώς (η 4η εκδοχή του "ξέρει" π.χ. τι είναι όμορφο για τους ανθρώπους, δίνοντας προσοχή στη λεπτομέρεια και τη σύνθεση), δεν έχει την ανθρώπινη "πινελιά" και τη συναισθηματική έκφραση που συναντάμε στις παραδοσιακές μορφές τέχνης. Θεωρώ πως δεν θα είναι -και δεν πρέπει να είναι- ποτέ εξίσου ευέλικτο στην αντίληψη καταστάσεων όσο ένας άνθρωπος. Μπορεί ωστόσο να χρησιμοποιηθεί από τον άνθρωπο, και να αποτελέσει ένα πολύτιμο εργαλείο στην παραγωγή υψηλής ποιότητας περιεχομένου, γρήγορα και αποτελεσματικά.
Μπορείτε να δείτε τη δουλειά του Τάσου Παπαναγιώτου στη σελίδα του στο instagram, @midjourneytogreece.