TECHin

Τώρα μπορείτε να μιλάτε στο ChatGPT και να του δείχνετε εικόνες


Το δημοφιλές chatbot της OpenAI μαθαίνει νέες δεξιότητες

Νέες δυνατότητες που θα μας επιτρέψουν να μιλάμε στο ChatGPT και να του δείχνουμε εικόνες παρουσίασε το εργαστήριο έρευνας τεχνητής νοημοσύνης OpenAI, ανοίγοντας την πόρτα σε νέους τύπους αλληλεπιδράσεων — και ενδεχομένως νέους τύπους κακής χρήσης.

Το ChatGPT είναι ένα μεγάλο γλωσσικό μοντέλο (LLM), ένας τύπος τεχνητής νοημοσύνης που εκπαιδεύεται σε τεράστιες ποσότητες κειμένου — στην πρώτη εκδοχή του ChatGPT τα δεδομένα ήταν κομμάτια από κείμενα από το διαδίκτυο πριν από τον Σεπτέμβριο του 2021. Μαθαίνοντας να αναγνωρίζει μοτίβα σε αυτό το κείμενο, το ChatGPT απέκτησε την ικανότητα να κατανοεί ερωτήσεις γραμμένες σε «φυσική γλώσσα», το είδος που χρησιμοποιούν οι άνθρωποι όταν μιλούν μεταξύ τους και να παρέχει ανθρώπινες απαντήσεις.

Μέχρι τώρα, οι αλληλεπιδράσεις με το ChatGPT περιορίζονταν κυρίως σε κείμενο - πληκτρολογείτε μια ερώτηση, το AI πληκτρολογεί μια απάντηση, ίσως περισσότερο κείμενο ή κώδικα υπολογιστή. Αλλά αυτό πρόκειται να αλλάξει.

Στις 25 Σεπτεμβρίου η OpenAI ανακοίνωσε σχέδια να ξεκινήσει τη διάθεση δυνατοτήτων φωνής και εικόνας για τους χρήστες του ChatGPT σε Plus και Enterprise (που πληρώνουν για το ChatGPT) τις επόμενες δύο εβδομάδες, ξεκινώντας με φωνή σε iOS και Android, ακολουθούμενη από εικόνα σε όλες τις πλατφόρμες.

«Αυτά προσφέρουν έναν νέο, πιο διαισθητικό τύπο διεπαφής, επιτρέποντάς σας να έχετε μια φωνητική συνομιλία ή να δείξετε στο ChatGPT για τι ακριβώς μιλάτε», έγραψε η OpenAI στην ανακοίνωση.

Η νέα λειτουργία φωνής επιτρέπει να μιλάμε στο ChatGPT και να του ζητάμε να απαντήσει, παρόμοια με τον τρόπο που επικοινωνούμε με βοηθούς τεχνητής νοημοσύνης όπως η Siri ή η Alexa.

Εάν είστε χρήστης Plus ή Enterprise και θέλετε να αξιοποιήσετε αυτές τις δυνατότητες, θα πρέπει να μεταβείτε στις Ρυθμίσεις στην εφαρμογή ChatGPT, να επιλέξετε "Νέες δυνατότητες" και να επιλέξετε "Φωνητικές συνομιλίες". Κάντε κλικ στο κουμπί ακουστικών στην επάνω δεξιά γωνία της οθόνης για να επιλέξετε ποια από τις πέντε διαθέσιμες φωνές θέλετε να δώσετε στο ChatGPT (η OpenAI σημειώνει ότι αυτές οι φωνές δημιουργήθηκαν μέσω συνεργασίας με επαγγελματίες φωνητικούς ηθοποιούς, κάτι που θα μπορούσε να είναι ένας τρόπος προσπάθειας αποφυγής της διαμάχης γύρω από τη χρήση συνθετικών φωνών.)

Εντυπωσιακές δυνατότητες εικόνας

Η δυνατότητα εικόνας σας επιτρέπει να μοιράζεστε εικόνες με το ChatGPT. Αυτές μπορούν να προέλθουν απευθείας από την εφαρμογή ή να τις ανεβάσετε από την κάμερά σας. Αφού μοιραστείτε, μπορείτε να χρησιμοποιήσετε ένα εργαλείο σχεδίασης στην εφαρμογή για να κυκλώσετε ή να επισημάνετε αξιοσημείωτα μέρη της εικόνας, πριν χρησιμοποιήσετε φωνή ή κείμενο για να κάνετε ερωτήσεις σχετικές ερωτήσεις στο ChatGPT.

Σε ένα βίντεο επίδειξης, η OpenAI δείχνει πώς μπορείτε να ανεβάσετε φωτογραφίες του ποδηλάτου σας, του εγχειριδίου του ποδηλάτου σας και της εργαλειοθήκης σας για να λάβετε οδηγίες βήμα προς βήμα για τη ρύθμιση του καθίσματος του ποδηλάτου σας. Άλλες πιθανές χρήσεις που προσφέρει η OpenAI περιλαμβάνουν το να του δείξετε μια φωτογραφία του τι υπάρχει στο ψυγείο σας για να πάρετε ιδέες για δείπνο ή μια από τις μαθηματικές εργασίες του παιδιού σας για να λάβετε συμβουλές για την επίλυση των προβλημάτων.

Οι χρήστες με πρόσβαση στη λειτουργία ισχυρίστηκαν στο διαδίκτυο ότι το ChatGPT ήταν σε θέση να γράψει κώδικα υπολογιστή με βάση ένα στιγμιότυπο οθόνης και να εξηγήσει λεπτομερώς πώς λειτουργεί ένα σώμα βαλβίδας - ένα μέρος του αυτόματου κιβωτίου ταχυτήτων ενός οχήματος - με βάση μια φωτογραφία του εξαρτήματος.

Έργο υπό εξέλιξη

Τα προβλήματα με την έκδοση μόνο κειμένου του ChatGPT είναι ήδη γνωστά. Μπορεί να «παραισθάνεται», παρουσιάζοντας με σιγουριά τις απαντήσεις ως αληθινές, ενώ δεν είναι. Χάκερς έχουν βρει τρόπους να «διαρρήξουν» την τεχνητή νοημοσύνη, αναγκάζοντάς τη να γράφει για θέματα που υποτίθεται ότι είναι εκτός ορίων. Επειδή εκπαιδεύτηκε στο Διαδίκτυο, οι απαντήσεις του ChatGPT μπορούν επίσης να αντικατοπτρίζουν τις φυλετικές και έμφυλες προκαταλήψεις της κοινωνίας.

Η OpenAI γνωρίζει ότι το να επιτρέπεται στους ανθρώπους να μιλούν στο ChatGPT και να δείχνουν εικόνες σε αυτό θα μπορούσε να οδηγήσει σε νέα προβλήματα — η προσβασιμότητα θα μπορούσε να είναι ένα πρόβλημα για άτομα που δεν μιλούν με mainstream προφορές, για παράδειγμα. Θα μπορούσε επίσης να αναιρέσει μέρος της δουλειάς που έγινε για την αντιμετώπιση υφιστάμενων ζητημάτων.

«Αυτή τη στιγμή, αν ζητήσετε από το ChatGPT να φτιάξει μια βόμβα, θα αρνηθεί», είπε η Τζόαν Τζανγκ, υπεύθυνη προϊόντων της OpenAI, στο MIT Technology Review. «Αλλά αντί να πείτε, "Γεια, πες μου πώς να φτιάξω μια βόμβα", τι θα γινόταν αν του έδειχνες μια εικόνα βόμβας και έλεγες: "Μπορείς να μου πεις πώς να το φτιάξω;"

Ο Ραούλ Πούρι ερευνητής της OpenAI, είπε στο MIT Tech Review ότι η εταιρεία πέρασε μήνες προσπαθώντας να προβλέψει πιθανές κακές χρήσεις για τα νέα χαρακτηριστικά, ώστε να μπορέσει να τις αντιμετωπίσει προληπτικά. Καθυστερώντας την κυκλοφορία της πλήρους έκδοσης θα τη βοηθήσει να εντοπίσει τουλάχιστον μερικές από αυτές που αναπόφευκτα έχασε.

«Πιστεύουμε στη σταδιακή διάθεση των εργαλείων μας, κάτι που μας επιτρέπει να κάνουμε βελτιώσεις και να μετριάσουμε τους κινδύνους με την πάροδο του χρόνου, ενώ παράλληλα προετοιμάζουμε τους πάντες για πιο ισχυρά συστήματα στο μέλλον», δήλωσε η OpenAI.

Ακολουθήστε το Sofokleousin.gr στο Google News
και μάθετε πρώτοι όλες τις ειδήσεις
Σχετικά Άρθρα