ΑΥΤΉ Η ΚΙΝΟΎΜΕΝΗ MONA LISA ΔΗΜΙΟΥΡΓΉΘΗΚΕ ΑΠΌ ΤΟ AI ΚΑΙ ΕΊΝΑΙ ΤΡΟΜΑΚΤΙΚΌ

Send

Το αινιγματικό, ζωγραφισμένο χαμόγελο της "Μόνας Λίζα" είναι γνωστό σε όλο τον κόσμο, αλλά αυτό το διάσημο πρόσωπο έδειξε πρόσφατα μια εκπληκτική νέα έκφραση, ευγένεια της τεχνητής νοημοσύνης (AI).

Σε μια βίντεο που μοιράστηκε στο YouTube στις 21 Μαΐου, τρία βίντεο κλιπ δείχνουν ενοχλητικά παραδείγματα της Mona Lisa καθώς κινείται στα χείλη της και γυρίζει το κεφάλι της. Δημιουργήθηκε από ένα συνελικτικό νευρικό δίκτυο - ένας τύπος AI που επεξεργάζεται τις πληροφορίες πολύ όπως κάνει ο ανθρώπινος εγκέφαλος, αναλύει και επεξεργάζεται εικόνες.

Οι ερευνητές εκπαίδευσαν τον αλγόριθμο για να κατανοήσουν τα γενικά σχήματα των χαρακτηριστικών του προσώπου και τον τρόπο με τον οποίο συμπεριφέρονται σε σχέση με τον άλλον, και στη συνέχεια να εφαρμόσουν αυτές τις πληροφορίες σε ακίνητες εικόνες. Το αποτέλεσμα ήταν μια ρεαλιστική ακολουθία βίντεο νέων εκφράσεων του προσώπου από ένα μόνο πλαίσιο.

Για τα βίντεο της Mona Lisa, το AI "έμαθε" την κίνηση του προσώπου από σύνολα δεδομένων τριών ανθρώπων, δημιουργώντας τρία πολύ διαφορετικά κινούμενα σχέδια. Ενώ κάθε ένας από τους τρεις κλιπ ήταν ακόμα αναγνωρίσιμος ως Mona Lisa, οι παραλλαγές στην εμφάνιση και τη συμπεριφορά των μοντέλων εκπαίδευσης έδωσαν ξεχωριστές "προσωπικότητες" στα "ζωντανά πορτραίτα", Egor Zakharov, μηχανικός στο Ινστιτούτο Επιστήμης και Τεχνολογίας του Skolkovo το Samsung AI Center (και οι δύο βρίσκονται στη Μόσχα), εξηγείται στο βίντεο.

Ο Ζαχάροφ και οι συνάδελφοί του δημιούργησαν κινούμενα σχέδια από φωτογραφίες πολιτιστικών εικόνων του 20ου αιώνα όπως οι Albert Einstein, Marilyn Monroe και Salvador Dali. Οι ερευνητές περιέγραψαν τα ευρήματά τους, τα οποία δεν εξετάστηκαν από ομοτίμους, σε μια μελέτη που δημοσιεύθηκε στις 20 Μαΐου στο περιοδικό preprint arXiv.

Γνωστά πρόσωπα παίρνουν άγνωστες εκφράσεις. (Εικόνα: E. Zakharov et al.)

Η παραγωγή αυθεντικών βίντεο, όπως αυτά, γνωστά ως deepfakes, δεν είναι εύκολη. Τα ανθρώπινα κεφάλια είναι γεωμετρικά πολύπλοκα και εξαιρετικά δυναμικά. Τα τρισδιάστατα μοντέλα των κεφαλών έχουν "δεκάδες εκατομμύρια παραμέτρους", γράφουν οι συγγραφείς της μελέτης.

Επιπλέον, το ανθρώπινο σύστημα όρασης είναι πολύ καλό στο να εντοπίζει "ακόμη και μικρά λάθη" σε ανθρώπινα κεφάλια με 3D μοντέλα, σύμφωνα με τη μελέτη. Βλέποντας κάτι που μοιάζει σχεδόν ανθρώπινο - αλλά όχι αρκετά - προκαλεί μια αίσθηση βαθιάς ανησυχίας που είναι γνωστή ως το απίθανο φαινόμενο της κοιλάδας.

Το AI έχει αποδείξει προηγουμένως ότι είναι δυνατή η παραγωγή πειστικών βαθύτερων, αλλά απαιτούνται πολλαπλές γωνίες του επιθυμητού αντικειμένου. Για τη νέα μελέτη, οι μηχανικοί εισήγαγαν το AI σε ένα πολύ μεγάλο σύνολο δεδομένων βίντεο που δείχνουν ανθρώπινα πρόσωπα σε δράση. Οι επιστήμονες δημιούργησαν μάρκες προσώπου που θα μπορούσαν να εφαρμοστούν σε οποιοδήποτε πρόσωπο, να διδάξουν στο νευρικό δίκτυο πώς συμπεριφέρονται τα πρόσωπα γενικά.

Στη συνέχεια, εκπαίδευσαν τον AI να χρησιμοποιήσει τις εκφράσεις αναφοράς για να χαρτογραφήσει την κίνηση των χαρακτηριστικών της πηγής. Αυτό επέτρεψε στο AI να δημιουργήσει ένα deepfake ακόμη και όταν είχε μόνο μία εικόνα για να εργαστεί από, οι ερευνητές ανέφεραν.

Και περισσότερες εικόνες πηγής έδωσαν ένα ακόμη πιο λεπτομερές αποτέλεσμα στην τελική κίνηση. Τα βίντεο που δημιουργήθηκαν από 32 εικόνες, και όχι μόνο ένα, πέτυχαν "τέλειο ρεαλισμό" σε μια μελέτη χρηστών, γράφουν οι επιστήμονες.

Send