Ερευνητές στη Δανία λένε ότι χρησιμοποιούν ισχυρούς αλγόριθμους μηχανικής μάθησης για να προβλέπουν με ακρίβεια πτυχές της ανθρώπινης ζωής, συμπεριλαμβανομένου του πόσο νωρίς είναι πιθανό να πεθάνει κάποιος.
Η μελέτη τους, που δημοσιεύτηκε στο περιοδικό Nature Computational Science, περιγράφει λεπτομερώς πώς ένα μοντέλο αλγορίθμου μηχανικής μάθησης που ονομάζεται life2vec προέβλεψε την έκβαση της ζωής ενός ατόμου και τις πράξεις του όταν του δόθηκαν πολύ συγκεκριμένα δεδομένα για αυτόν.
Με αυτά τα δεδομένα, «μπορούμε να κάνουμε κάθε είδους πρόβλεψη», δήλωσε η Sune Lehmann, επικεφαλής σύνταξης της μελέτης και καθηγήτρια στο Πολυτεχνείο. Ωστόσο, οι ερευνητές σημειώνουν ότι πρόκειται για «πρωτότυπο έρευνας» και δεν μπορεί να εκτελέσει καμία «πραγματική εργασία» στην κατάσταση στην οποία βρίσκεται σήμερα.
Η Lehmann και οι υπόλοιποι συντάκτες της μελέτης χρησιμοποίησαν δεδομένα από ένα εθνικό μητρώο στη Δανία που περιέχει λεπτομερή στοιχεία για μια ομάδα 6 εκατομμυρίων ανθρώπων. Τα στοιχεία αυτά περιλάμβαναν πληροφορίες από το 2008 έως το 2016 που σχετίζονταν με σημαντικές πτυχές της ζωής, όπως η εκπαίδευση, η υγεία, το εισόδημα και το επάγγελμα.
Οι ερευνητές προσάρμοσαν τεχνικές επεξεργασίας γλώσσας και δημιούργησαν ένα λεξιλόγιο για γεγονότα της ζωής, ώστε το life2vec να μπορεί να ερμηνεύει προτάσεις με βάση τα δεδομένα, όπως «τον Σεπτέμβριο του 2012, ο Φρανσίσκο έλαβε είκοσι χιλιάδες κορώνες Δανίας ως φρουρός σε ένα κάστρο στην Ελσινόρη» ή «κατά τη διάρκεια του τρίτου έτους της στο γυμνάσιο, η Ερμιόνη παρακολούθησε πέντε μαθήματα επιλογής».
Στη συνέχεια, ο αλγόριθμος έμαθε από αυτά τα δεδομένα, λέει η Lehmann, και μπόρεσε να κάνει προβλέψεις για ορισμένες πτυχές της ζωής των ανθρώπων, συμπεριλαμβανομένου του πώς θα μπορούσαν να σκέφτονται, να αισθάνονται και να συμπεριφέρονται, ακόμη και αν το άτομο θα μπορούσε να πεθάνει τα επόμενα χρόνια.
Για να προβλέψει πόσο νωρίς μπορεί να πεθάνει κάποιος, η ομάδα χρησιμοποίησε δεδομένα από την 1η Ιανουαρίου 2008 έως τις 31 Δεκεμβρίου 2015 σε μια ομάδα άνω των 2,3 εκατομμυρίων ατόμων ηλικίας μεταξύ 35 και 65 ετών. Επέλεξαν μάλιστα τη συγκεκριμένη ομάδα, γιατί η θνησιμότητα σε αυτές τις ηλικίες είναι πιο δύσκολο να προβλεφθεί, ανέφερε η Lehmann.
Το Life2vec χρησιμοποίησε τα δεδομένα για να εξάγει συμπέρασμα σχετικά με τις πιθανότητες που είχε κάθε άτομο να επιβιώσει μία τετραετία μετά το 2016.
«Για να ελέγξουμε πόσο καλό είναι [το life2vec], επιλέγουμε μια ομάδα 100.000 ατόμων όπου τα μισά επιβιώνουν και τα μισά πεθαίνουν», ανέφερε η Lehmann. Οι ερευνητές γνώριζαν ποιοι άνθρωποι είχαν πεθάνει μετά το 2016, αλλά ο αλγόριθμος δεν το γνώριζε.
Μετά, το έβαλαν σε δοκιμή. Έβαλαν τον αλγόριθμο να κάνει ατομικές προβλέψεις σχετικά με το αν κάποιος ζούσε ή όχι και μετά το 2016. Τα αποτελέσματα ήταν εντυπωσιακά: ο αλγόριθμος ήταν σωστός στο 78% των περιπτώσεων.
Το Life2vec ξεπέρασε επίσης άλλα τελευταίας τεχνολογίας μοντέλα κατά τουλάχιστον 11% προβλέποντας τα αποτελέσματα θνησιμότητας με μεγαλύτερη ακρίβεια, ανέφερε η έκθεση.
Οι άντρες είχαν περισσότερες πιθανότητες να πεθάνουν μετά το 2016. Το να είσαι εξειδικευμένος εργάτης, π.χ. μηχανικός, ή η διάγνωση ενός προβλήματος ψυχικής υγείας, όπως η κατάθλιψη ή το άγχος, οδηγούσε επίσης σε πρόωρο θάνατο, διαπίστωσαν οι ερευνητές. Εν τω μεταξύ, το να έχεις διευθυντική θέση ή υψηλό εισόδημα συχνά ωθούσε τους ανθρώπους προς τη στήλη της «επιβίωσης».
Οι περιορισμοί της έρευνας
Ωστόσο, η έρευνα είχε αρκετούς περιορισμούς.
«Σημειώνουμε ότι τα πειράματα δεν ήταν τυχαιοποιημένα και οι ερευνητές δεν έκαναν «τυφλή» κατανομή κατά τη διάρκεια των πειραμάτων και της αξιολόγησης των αποτελεσμάτων», επισημαίνεται στην έκθεση.
Οι ερευνητές εξέτασαν δεδομένα μόνο για μια περίοδο οκτώ ετών και μπορεί να υπάρχουν κοινωνικοδημογραφικοί περιορισμοί στη δειγματοληψία, παρόλο που όλοι στη Δανία είναι εγγεγραμμένοι στο εθνικό μητρώο.
«Εάν κάποιος δεν έχει μισθό – ή επιλέξει να μην ασχοληθεί με τα συστήματα υγειονομικής περίθαλψης – δεν έχουμε πρόσβαση στα δεδομένα του», ανέφεραν οι ερευνητές.
Η μελέτη διεξήχθη σε μια πλούσια χώρα που διαθέτει ισχυρές υποδομές και ένας σύστημα υγειονομικής περίθαλψης, σημειώνουν επίσης οι συγγραφείς. Δεν είναι σαφές εάν τα ευρήματα του life2vec μπορούν να εφαρμοστούν σε άλλες χώρες, όπως οι Ηνωμένες Πολιτείες, δεδομένων των διαφορών που υπάρχουν σε οικονομικό και κοινωνικό επίπεδο μεταξύ των δύο χωρών.
Η Lehmann λέει ότι ξέρει ότι ο αλγόριθμος ακούγεται «δυσοίωνος και τρελός, αλλά στην πραγματικότητα είναι κάτι για το οποίο έχει γίνει πολλή δουλειά, κυρίως από ασφαλιστικές εταιρείες».
Φωτογραφία: iStock