Μόλις λίγες ημέρες μετά την ολοκλήρωση δευτερογενούς πώλησης μετοχών ύψους 6,6 δισ. δολαρίων που αποτίμησε την OpenAI στα 500 δισ. δολάρια –καθιστώντας την την πιο πολύτιμη ιδιωτική εταιρεία παγκοσμίως– το νέο εργαλείο της εταιρείας κάνει ήδη πάταγο. Το Sora 2, το βελτιωμένο AI μοντέλο δημιουργίας βίντεο, τροφοδοτεί την εφαρμογή τύπου TikTok της OpenAI, η οποία εκτοξεύτηκε στο νούμερο 3 του App Store της Apple, παρά το γεγονός ότι διατίθεται μόνο με κωδικό πρόσκλησης.
Το αποτέλεσμα: ένας καταιγισμός ρεαλιστικών βίντεο που έχουν ήδη γίνει viral - από σατιρικά deepfakes του CEO Σαμ Άλτμαν (με την άδειά του), μέχρι σκοτεινές απεικονίσεις δημοφιλών χαρακτήρων όπως ο Pikachu και ο SpongeBob.
Ταυτόχρονα, έχει ξεσπάσει νέα συζήτηση γύρω από τα όρια ανάμεσα στη δημιουργική ελευθερία και τη λογοκρισία.
Τα «δίχτυα ασφαλείας» και οι παρακάμψεις
Η OpenAI υποστηρίζει ότι το Sora διαθέτει πολλαπλά επίπεδα προστασίας: φιλτράρισμα προτροπών, έλεγχο εξόδου σε βίντεο και ήχο, απαγόρευση ακατάλληλου περιεχομένου, προπαγάνδας ή αυτοτραυματισμού, καθώς και υδατογραφήματα και απαγόρευση απεικόνισης πραγματικών προσώπων χωρίς άδεια.
Ωστόσο, όπως αποδεικνύεται, οι χρήστες βρίσκουν ήδη τρόπους να παρακάμπτουν αυτά τα εμπόδια.
Η συζήτηση στο εσωτερικό της OpenAI παραμένει έντονη: χρειάζονται αυστηρότερες δικλείδες ασφαλείας ή αυτό οδηγεί σε «υπερβολική λογοκρισία»;
Η εταιρεία έχει ιστορικό ταχύτατων λανσαρισμάτων, με την κουλτούρα του «πρώτα βγάζουμε το εργαλείο, μετά προσαρμόζεται το κοινό» να παραμένει κυρίαρχη.
Η κούρσα με τον ανταγωνισμό
Η κυκλοφορία του Sora 2 έρχεται λίγο μετά την εμφάνιση του DeepSeek από την Κίνα, που προκάλεσε εντύπωση με την ταχύτητα και το χαμηλό κόστος ανάπτυξής του. Η απάντηση της OpenAI ήταν σχεδόν άμεση, με την παρουσίαση νέων μοντέλων σε χρόνο-ρεκόρ.
Σήμερα, η εταιρεία επενδύει περαιτέρω 850 δισ. δολάρια σε υποδομές και επόμενης γενιάς συστήματα, διευρύνοντας το τεχνολογικό της πλεονέκτημα.
Παράλληλα, οι ανταγωνιστές κινούνται επιθετικά: η Meta παρουσίασε το Vibes, η Google το Veo 3, ενώ ByteDance και Alibaba ετοιμάζουν αντίστοιχα εργαλεία. Ο ανταγωνισμός για το ποιος θα κυριαρχήσει στο AI video είναι πιο σκληρός από ποτέ.
Γιατί το βίντεο είναι κρίσιμο για την AI
Σύμφωνα με τον καθηγητή Hao Li, κορυφαίο ερευνητή στη σύνθεση βίντεο, το μέλλον της τεχνητής νοημοσύνης περνά αναγκαστικά από τα οπτικοακουστικά δεδομένα. «Τα περισσότερα AI εκπαιδεύονται σε κείμενο. Για να φτάσουν στη γενική νοημοσύνη, πρέπει να μάθουν όπως τα μωρά: μέσω εικόνας και ήχου», σημειώνει.
Η παραγωγή βίντεο δεν είναι μόνο εργαλείο δημιουργίας περιεχομένου, αλλά και πηγή συνθετικών δεδομένων για την περαιτέρω εκπαίδευση μοντέλων. Η κυκλική αυτή διαδικασία μπορεί να φέρει την τεχνητή νοημοσύνη πιο κοντά στη μίμηση ανθρώπινης σκέψης.
Το πρώην στέλεχος της OpenAI, Zack Kass, εκτιμά ότι τα ρίσκα του πρώιμου λανσαρίσματος υπερκαλύπτονται από το όφελος της δημόσιας χρήσης:
«Υπάρχουν δύο εναλλακτικές: να μη χτίζεις ή να χτίζεις κρυφά. Και οι δύο είναι χειρότερες. Όταν έχουμε μια τεχνολογία-τομή, πρέπει να τη μοιραζόμαστε με τον κόσμο».
Αυτό, ωστόσο, σημαίνει ότι η κοινωνία έρχεται αντιμέτωπη με νέες μορφές παραπληροφόρησης, deepfakes και διαμάχες περί πνευματικών δικαιωμάτων, ζητήματα που ήδη απασχολούν τα δικαστήρια.