Πολιτική

Big Data: Απίθανες χρήσεις και... σημεία των καιρών


Ο υπερπληθωρισμός δεδομένων είναι ένα σχετικά καινούργιο φαινόμενο. Το 2000, μόλις το ένα τέταρτο των πληροφοριών που καταγράφονταν σε όλο τον κόσμο βρισκόταν σε ψηφιακή μορφή. Χαρτί, φιλμ και αναλογικά μέσα μοιράζονταν το υπόλοιπο. Εξαιτίας της έκρηξης των ψηφιακών αρχείων –ο όγκος τους διπλασιάζεται κάθε τρία χρόνια– η κατάσταση αντιστράφηκε με πρωτοφανείς ρυθμούς.

Το 2013, πάνω από το 98% του συνόλου των δεδομένων ήταν ψηφιακά. Οι Αγγλοσάξωνες επινόησαν έναν όρο προκειμένου να ορίσουν αυτή την τεράστια μάζα, που έχει γιγαντωθεί τόσο πολύ ώστε απειλεί να ξεφύγει από τον έλεγχο των κυβερνώντων και των πολιτών: big data ή μαζικά δεδομένα.

Αυτή  η καταγραφή των ανθρώπινων δραστηριοτήτων  μπορεί να προσφέρει άφθονες πληροφορίες. Παραδείγματος χάριν, ο εντοπισμός μιας τοποθεσίας ή ενός ατόμου αρχικά δεδομενοποιήθηκε μια πρώτη φορά από τη διασταύρωση του γεωγραφικού μήκους και πλάτους και στη συνέχεια από τη δορυφορική και ψηφιακή διαδικασία του Παγκόσμιου Συστήματος Εντοπισμού Θέσης (Global Positioning System, GPS).

Μέσω του Facebook, ακόμη και οι προσωπικές προτιμήσεις, οι φιλικές σχέσεις και τα «μ’ αρέσει » μετατρέπονται σε δεδομένα που εγγράφονται στην εικονική μνήμη των υπολογιστών.

Ούτε και οι λέξεις μπορούν να ξεφύγουν από τη μεταχείρισή τους ως στοιχεία πληροφόρησης, από τη στιγμή που οι υπολογιστές διερευνούν αιώνες ψηφιοποιημένης λογοτεχνίας απ’ όλο τον κόσμο.

Οι βάσεις δεδομένων που συντίθενται με αυτό τον τρόπο προσφέρονται για όλων των ειδών τις απίθανες χρήσεις, οι οποίες γίνονται εφικτές εξαιτίας της όλο και φθηνότερης υπολογιστικής μνήμης, των ολοένα και πιο ισχυρών επεξεργαστών, των όλο και πιο εξελιγμένων αλγορίθμων, καθώς και από τον χειρισμό των θεμελιωδών αρχών του στατιστικού λογισμού.

Αντί να μάθουμε σε έναν υπολογιστή να εκτελεί μια πράξη, όπως να οδηγεί ένα αυτοκίνητο ή να μεταφράζει ένα κείμενο –έναν στόχο πάνω στο οποίο ορδές ειδικών στην τεχνητή νοημοσύνη έχουν σπάσει τα μούτρα τους εδώ και δεκαετίες– η νέα προσέγγιση συνίσταται στο «μπούκωμά» του με μια ποσότητα δεδομένων αρκετή ώστε να υπολογίσει την πιθανότητα ένας φωτεινός σηματοδότης μια συγκεκριμένη στιγμή να είναι πράσινος αντί για κόκκινος ή σε ποιο πλαίσιο θα μεταφράζαμε την αγγλική λέξη light ως «φως» αντί για «ελαφρύς».