Οι αριθμοί δεν μπορούν να μιλήσουν για τους εαυτούς τους. Μιλάμε εμείς για αυτούς. Εμείς τους δίνουμε νόημα. Αυτό ισχυρίζεται ο αμερικανός στατιστικός Nate Silver στο βιβλίο του The Signal and the Noise. Χρησιμοποιούμε λοιπόν την επιστήμη της Στατιστικής για να απαντήσουμε ερωτήματα που εμφανίζονται όταν προσπαθούμε να αναλύσουμε δεδομένα -τους αριθμούς που λέει ο Silver – για να κατανοήσουμε καλύτερα τον κόσμο. Πρόσφατα τέτοια ερωτήματα στον ευρύτερο χώρο των βιολογικών επιστημών, περιλαμβάνουν την αποτελεσματικότητα των εμβολίων και των φαρμάκων που αναπτύχθηκαν για την αντιμετώπιση του SARS-CoV-2, την επίδραση της βιολογικής ποικιλότητας στη λειτουργία των φυσικών οικοσυστημάτων και άλλα τέτοια.
Βικτωριανές «ρίζες»
Η εφαρμογή των στατιστικών μεθόδων στη μελέτη βιολογικών ζητημάτων – πέραν αυτών της ανθρωπολογίας – έχει τις απαρχές της στις εργασίες του Sir Francis Galton, ενός άγγλου πολυμαθούς της βικτωριανής εποχής. O Galton ενδιαφερόταν ιδιαίτερα για ζητήματα που σχετίζονται με την κληρονομικότητα. Το θεωρητικό του αυτό ενδιαφέρον μπόρεσε να μετουσιωθεί σε πράξη με την ευκαιρία που του έδωσε ο εξάδελφός του, Κάρολος Δαρβίνος. Εκείνη την εποχή, ο μεγάλος εξελικτικός βιολόγος πρότεινε τη θεωρία της κληρονομικότητας των επίκτητων χρήσιμων μεταβολών, που ονομάστηκε «παγγένεση» (pangenesis). Αυτή ακριβώς η αντίληψη του Galton για τη χρήση στατιστικών μεθόδων για τον έλεγχο και τη διερεύνηση της υπόθεσης της παγγένεσης αναπτύχθηκε περαιτέρω και αποτέλεσε το πρώτο σχετικό με τη Στατιστική βιβλίο που δημοσίευσε ο Galton. Τα γενικά μαθηματικά θεμέλια της στατιστικής επιστήμης τέθηκαν, αναμφίβολα, από τον Γάλλο Laplace και τον Γερμανό Gauss και κάποια πρόοδος στην εφαρμογή αυτών κυρίως στις κοινωνικές επιστήμες έγινε από τον Βέλγο Quetelet. Αλλά κανένας από αυτούς τους επιστήμονες δεν είχε ασχοληθεί συγκεκριμένα με τη μέτρηση αυτών που σήμερα είναι γνωστές ως συσχετιζόμενες μεταβλητότητες (correlated variations). Ο Galton μπορεί να θεωρηθεί πατέρας της βιομετρίας και το έργο του θεμελιακό για τη μετέπειτα εργασία διακεκριμένων επιστημόνων, όπως οι Karl Pearson και Raphael Weldon.
Απαραίτητη στη βιολογία
Η βιοστατιστική, γνωστή και ως βιομετρία, είναι ο κλάδος της Στατιστικής που εστιάζει στη μελέτη βιολογικών ζητημάτων, αξιοποιώντας δεδομένα που αφορούν έμβιους οργανισμούς. Ενα σημαντικό πεδίο της βιοστατιστικής αφορά τη διασύνδεση δεδομένων δημόσιας υγείας και κλινικών δοκιμών και τη μετατροπή τους σε αξιοποιήσιμη γνώση. Κλινικές δοκιμές που επιδιώκουν να μετρήσουν την απόκριση των ασθενών σε νέες θεραπείες ή διαγνωστικές μεθόδους, σχεδιάζονται βάσει των αρχών της βιοστατιστικής. Η πρόοδος στον κρίσιμο τομέα της επιδημιολογίας – τη ραχοκοκαλιά της προληπτικής ιατρικής και βασικό συστατικό της ανάπτυξης και εφαρμογής πολιτικών στον τομέα της δημόσιας υγείας σε ευρύτατες κλίμακες – έχει τη βάση της στη βιοστατιστική, η οποία αναζητεί τη διασύνδεση μεταξύ αιτίας – αποτελέσματος των ασθενειών, τους παράγοντες που συμβάλλουν στην ευρύτερη εξάπλωση μιας νόσου, τη χωρική κατανομή μιας νόσου και των παραγόντων κινδύνου, ή την υπόδειξη της έλλειψης σύνδεσης μεταξύ των υποθετικών αιτιών μιας νόσου, επιτρέποντας στους ερευνητές να μετατοπίσουν την εστίασή τους προκειμένου να εξαλείψουν τους παράγοντες κινδύνου. Σε τοπικό επίπεδο, η βιοστατιστική μπορεί να συμβάλει στη βελτίωση της φροντίδας των ασθενών, μέσω, για παράδειγμα, της δημιουργίας εξατομικευμένων σχεδίων φροντίδας ασθενών. Τέλος, σημαντικός είναι ο ρόλος της στη γονιδιωματική, τη μελέτη του γενετικού υλικού (γονιδίωμα) που σχετίζεται με ασθένειες και θεραπείες, καθώς και στη γενετική του ανθρώπου.
Επιπρόσθετα, συμβάλλει επίσης στην απάντηση ερωτημάτων στην επιστήμη της βιολογίας και οικολογίας οργανισμών και συστημάτων, σχετιζομένων, μεταξύ άλλων, με την ανάλυση επιβίωσης ατόμων από πληθυσμούς φυτικών και ζωικών ειδών, την επίδραση της κλιματικής αλλαγής, της εξάπλωσης ασθενειών, και άλλων απειλών στη βιοποικιλότητα. Για παράδειγμα, η αποκωδικοποίηση της πληροφορίας που εξάγεται από DNA προερχόμενο από χαυλιόδοντες και περιττώματα ελεφάντων έχει καταστήσει εφικτό τον εντοπισμό περιοχών που λαμβάνει χώρα λαθροθηρία στην Αφρική, παρέχοντας στις αρχές επιβολής του νόμου και στους οργανισμούς διατήρησης της φύσης τα απαραίτητα εργαλεία για την καταπολέμηση του παράνομου εμπορίου της άγριας ζωής.
«Κλειδί» για την ανάλυση δεδομένων
Ο κλάδος της βιοστατιστικής αποκτά όλο και μεγαλύτερη σημασία, δεδομένων των απαιτήσεων της σύγχρονης βιολογικής επιστήμης για την ολοκληρωμένη μελέτη της πολυπλοκότητας των βιολογικών συστημάτων. Κάθε βιολογικό σύστημα ή οργανισμός αποτελείται από δεκάδες χιλιάδες συστατικά στοιχεία, τα οποία μπορούν να βρίσκονται σε διαφορετικές καταστάσεις, και να αλληλεπιδρούν με πολλούς τρόπους. Η σύγχρονη βιολογία στοχεύει στην κατανόηση τέτοιων συστημάτων με την απόκτηση ολοκληρωμένων – και άρα πολυδιάστατων – δεδομένων στο χρονικό και χωρικό τους πλαίσιο, με πολλαπλές συμμεταβλητές και αλληλεπιδράσεις. Η απόκτηση δεδομένων είναι κρίσιμης σημασίας και γι’ αυτό σειρά πειραματικών μελετών, μελετών παρατήρησης ή άλλου τύπου βιολογικών μελετών είναι απαραίτητο να αναπτυχθούν. Πολλές φορές δεν απαιτείται η απόκτηση καινούργιων δεδομένων, αλλά η «μετα-ανάλυση» του συνόλου των δεδομένων προγενέστερων μελετών, η οποία θεωρείται εξέχουσας σημασίας. Για παράδειγμα, στην οικολογία έχει συμβάλει στην εκτίμηση των επιπτώσεων των βασικών περιβαλλοντικών παραγόντων μεταβολής, όπως η κλιματική αλλαγή, ο κατακερματισμός των ενδιαιτημάτων, η ρύπανση και οι βιολογικές εισβολές, στη σύγκριση αυτών των επιπτώσεων σε διαφορετικές χρονικές και χωρικές κλίμακες, οργανισμούς και οικοσυστήματα, καθώς και στην αξιολόγηση στρατηγικών διαχείρισης και διατήρησης. Η πρόκληση της μελέτης της βιολογικής πολυπλοκότητας μέσω της ανάλυσης δεδομένων υψηλής πολυπλοκότητας και ετερογένειας απαιτεί ευέλικτα εργαλεία ανάλυσης. Η γλώσσα προγραμματισμού R θεωρείται η σύγχρονη απάντηση σε αυτή την πρόκληση. Μολονότι η γλώσσα R δεν είναι η μοναδική γλώσσα που είναι κατάλληλη για χειρισμό και ανάλυση δεδομένων (υπάρχουν, μεταξύ άλλων, η Python και η Julia) φαίνεται να κερδίζει τον ανταγωνισμό, διαθέτοντας χιλιάδες έτοιμες βιβλιοθήκες για τη μελέτη συγκεκριμένων προβλημάτων.
Η στατιστική επιστήμη παίζει σημαντικό ρόλο στις ζωές μας και αλλάζει προσαρμοζόμενη στον όγκο και την ποιότητα των δεδομένων που μας γίνονται διαθέσιμα. Ο στατιστικός αλφαβητισμός των μαθητών και των φοιτητών μας θα αποτελέσει ένα εργαλείο που θα προετοιμάσει ολοκληρωμένους πολίτες για την κριτική ανάγνωση των ολοένα αυξανόμενων διαθέσιμων πληροφοριών.
O κ. Παναγιώτης Δημητρακόπουλος είναι καθηγητής Λειτουργικής Οικολογίας στο Τμήμα Περιβάλλοντος και κοσμήτορας της Σχολής Περιβάλλοντος του Πανεπιστημίου Αιγαίου.
O κ. Γιώργος Κόκκορης είναι αναπληρωτής καθηγητής Στατιστικής και Μαθηματικής Οικολογίας στο Τμήμα Ωκεανογραφίας και Θαλασσίων Βιοεπιστημών του Πανεπιστημίου Αιγαίου.
Οι κ.κ. Κόκκορης και Δημητρακόπουλος απέδωσαν στην ελληνική γλώσσα και επιμελήθηκαν το βιβλίο των Jan Leps και Petr Smilauer «Βιοστατιστική με την R, μια εισαγωγή για τις βιολογικές επιστήμες», για λογαριασμό των εκδόσεων Ροπή.