Δανειζόμενοι τεχνικές που αναπτύχθηκαν για προγράμματα αναγνώρισης της ανθρώπινης ομιλίας, βρετανοί ερευνητές δημιούργησαν λογισμικό που αναγνωρίζει εκατοντάδες είδη πτηνών από το τραγούδι τους, ακόμα και αν κελαηδούν όλα μαζί.
Χάρη σε νέες συσκευές ηχογράφησης που μπορούν να λειτουργούν για μέρες ολόκληρες στο ανοιχτό πεδίο, οι ορνιθολόγοι συγκεντρώνουν τα τελευταία χρόνια ωκεανούς ακουστικών δεδομένων, τα οποία είναι πρακτικά δύσκολο να αναλυθούν από ανθρώπους.
Το νέο λογισμό που αναπτύχθηκε στο Πανεπιστήμιο Queen Mary του Λονδίνου θα μπορούσε να αυτοματοποιήσει την ταυτοποίηση των πτηνών και να βοηθήσει έτσι στην παρακολούθηση των πληθυσμών τους.
«Η αυτόματη ταξινόμηση ήχων από πτηνά είναι χρήσιμη όταν κανείς προσπαθεί να μετρήσει πόσα πτηνά και τι είδη απαντά σε μια συγκεκριμένη τοποθεσία» αναφέρει ο Νταν Στόουελ, πρώτος συγγραφέας της μελέτης στην επιθεώρηση «PeerJ».
Από την ανθρώπινη ομιλία στα… τιτιβίσματα
Η αξιοποίηση τεχνικών που αναπτύχθηκαν για προγράμματα αναγνώρισης της ανθρώπινης ομιλίας είναι εφικτή επειδή «τα τραγούδια των πτηνών έχουν πολλά κοινά με την ανθρώπινη γλώσσα, παρόλο που εξελίχθηκαν ανεξάρτητα […] Μπορούν να μας βοηθήσουν να κατανοήσουνε καλύτερα το πώς εξελίχθηκε η ανθρώπινη γλώσσα και η κοινωνική οργάνωση σε ομάδες ζώων» εξηγεί ο ερευνητής.
Προηγούμενα προγράμματα που είχαν αναπτυχθεί από ορνιθολόγους έπρεπε να εκπαιδευτούν από ανθρώπους για να αναγνωρίζουν συγκεκριμένα είδη, για παράδειγμα από το εύρος συχνοτήτων στο οποίο κελαηδούν.
Αντίθετα, το νέο πρόγραμμα μαθαίνει μόνο του να ξεχωρίζει τα είδη αναλύοντας βάσεις δεδομένων με ήχους οι οποίοι έχουν ήδη ταξινομηθεί από ανθρώπους. Το λογισμικό αποφασίσει μόνο του ποια κριτήρια θα χρησιμοποιήσει, όπως για παράδειγμα την απότομη άνοδο ή πτώση της συχνότητας ενός τραγουδιού.
Το πρόγραμμα εκπαιδεύτηκε με τα τραγούδια πτηνών που περιλαμβάνει το Αρχείο Ήχου της Βρετανικής Βιβλιοθήκης, και στη συνέχεια συμμετείχε σε έναν ανοιχτό διαγωνισμό αναγνώρισης πτηνών, ο οποίος διεξάγεται με ένα σετ ηχογραφήσεων 501 πτηνών στη Βραζιλία.
Το λογισμικό πέτυχε ακρίβεια 85,4%, ποσοστό που το έφερε στη δεύτερη θέση των νικητών.
Οι ερευνητές θα προσπαθήσουν τώρα να το τελειοποιήσουν για να το φέρουν στην πρώτη θέση και να του αναθέσουν να αναλύσει νέες ηχογραφήσεις.