Τι κοινό έχουν μια τριανταφυλλιά, μια ροδακινιά, μια αμυγδαλιά, μια φράουλα και ένας πυράκανθος;

Ανήκουν στην ίδια οικογένεια φυτών, τα ροδοειδή, και όσο και αν, σε περίπτωση που δεν διαθέτετε ειδικές γνώσεις, δυσκολεύεστε να εντοπίσετε αμέσως ομοιότητες ανάμεσά τους, ένα σύστημα που αναπτύχθηκε από ερευνητές στις Ηνωμένες Πολιτείες κάνει ακριβώς αυτό.

«Κοιτάζοντας» μόνο ένα φύλλο από ένα φυτό που δεν έχει ξαναδεί ποτέ μπορεί αμέσως να το ταξινομήσει στη σωστή οικογένεια εντοπίζοντας βασικά εξελικτικά χαρακτηριστικά του.

Ο αλγόριθμος επιτελεί το δύσκολο ακόμη και για έμπειρους βοτανολόγους έργο του «μαθαίνοντας» συνεχώς και βελτιώνοντας τις επιδόσεις του καθώς βλέπει όλο και περισσότερα φύλλα.

Οταν οι γνώσεις του εμπλουτιστούν επαρκώς θα βοηθήσει στην ταυτοποίηση χιλιάδων απολιθωμάτων τα οποία σήμερα βρίσκονται στα μουσεία χωρίς να έχουν ταυτοποιηθεί ενώ παράλληλα θα προσφέρει πολύτιμες γνώσεις για την εξέλιξη των φυτών συμβάλλοντας στην καλύτερη προστασία τους.

Ο αριθμός των ειδών των φυτών που υπάρχουν στη Γη δεν έχει προσδιοριστεί με ακρίβεια. Νέα είδη εξακολουθούν να ανακαλύπτονται ενώ πολλά από αυτά που είναι ήδη γνωστά έχουν διαφορετικό όνομα από τόπο σε τόπο, περιπλέκοντας την ακριβή απαρίθμησή τους.

Παρ’ όλα αυτά, οι ειδικοί υπολογίζουν ότι ο πλανήτης φιλοξενεί γύρω στα 300.000 ως 400.000 είδη και το 80% από αυτά είναι φυτά που ανθοφορούν – ανήκουν δηλαδή στην τεράστια συνομοταξία των αγγειόσπερμων.

Τα άνθη και οι καρποί των φυτών αυτών είναι μάλιστα εκείνα που κατά κύριο λόγο βοηθούν τους βοτανολόγους να τα ταξινομήσουν γιατί τα φύλλα είναι πολύ δύσκολο να αναγνωριστούν.

Ο παλαιοβοτανολόγος Πίτερ Γουίλφ, καθηγητής Γεωεπιστημών στο Πολιτειακό Πανεπιστήμιο της Πενσιλβάνια, είναι ωστόσο αναγκασμένος να μελετά συνήθως φύλλα, μια και άνθη και καρποί σώζονται σπάνια σαν απολιθώματα.

Οταν λοιπόν, πριν από περίπου μια δεκαετία, διάβασε μια μελέτη σχετικά με την ταξινόμηση εικόνων από υπολογιστές, σκέφτηκε να ζητήσει τη βοήθεια του συγγραφέα της, του Τομά Σερ, ειδικού στην υπολογιστική όραση, ο οποίος τότε βρισκόταν στο Ινστιτούτο Τεχνολογίας της Μασαχουσέτης και σήμερα είναι επίκουρος καθηγητής Γνωσιακών, Γλωσσολογικών και Ψυχολογικών Μελετών στο Πανεπιστήμιο Μπράουν.

«Το να χαρακτηρίσεις ένα μεμονωμένο φύλλο είναι πολύ δύσκολο. Το σύστημα που χρησιμοποιούμε για τη μελέτη της αρχιτεκτονικής των φύλλων είναι ουσιαστικά του 19ου αιώνα, χωρίς να έχει υποστεί μεγάλες μεταβολές γιατί ο εντοπισμός των σημαντικών χαρακτηριστικών σε ένα φύλλο είναι εξαιρετικά πολύπλοκη υπόθεση» λέει ο κ. Γουίλφ μιλώντας στο «Βήμα». «Βλέποντας τη μελέτη του Τομά σκέφτηκα πως ίσως για τους υπολογιστές αυτή η δουλειά να ήταν πιο εύκολη».

Μαθήματα βοτανολογίας

Οι δυο ερευνητές εργάστηκαν επί εννέα χρόνια και τελικά κατόρθωσαν να αναπτύξουν ένα σύστημα το οποίο όντως μπορεί να κάνει αυτή τη δουλειά, αν όχι καλύτερα, τουλάχιστον σίγουρα με πολύ μεγαλύτερη ευκολία και ταχύτητα από τους ανθρώπους.

Ο κ. Γουίλφ και ο κ. Σερ, ο οποίος αναπτύσσει τα υπολογιστικά μοντέλα του μελετώντας το οπτικό σύστημα του ανθρώπινου εγκεφάλου, συνδύασαν την υπολογιστική όραση και την τεχνολογία της μηχανικής μάθησης για να δημιουργήσουν έναν αλγόριθμο ο οποίος «μαθαίνει» από τις εικόνες που βλέπει και εφαρμόζει τις γνώσεις που αποκτά για να αναγνωρίσει και να κατηγοριοποιήσει εικόνες οι οποίες είναι καινούργιες για αυτόν.

Οι επιστήμονες πήραν δείγματα φύλλων από τις συλλογές διαφόρων μουσείων (μεγάλο μέρος προήλθε από το Μουσείο Φυσικής Ιστορίας του Ινστιτούτου Σμιθσόνιαν).

Συγκέντρωσαν φύλλα από 19 οικογένειες φυτών (συνολικά 2001 γένη και περίπου 6.000 είδη) και τα «ξέπλυναν» για να δημιουργήσουν 7.600 ψηφιακές εικόνες στις οποίες δινόταν έμφαση στο σχήμα και στη νεύρωση του κάθε φύλλου.

Οι μισές εικόνες δόθηκαν στο σύστημα ως «μάθημα» και οι άλλες μισές χρησιμοποιήθηκαν ως «άγνωστες» για να τεστάρουν τις επιδόσεις του.

Οπως αναφέρουν στη δημοσίευσή τους στην επιθεώρηση «Proceedings of the National Academy of Sciences» (PNAS) ο αλγόριθμος ταξινόμησε τα φύλλα στη σωστή οικογένεια με ακρίβεια 72% (όταν το τυχαίο είναι 5%) και στη σωστή τάξη με ακρίβεια 60%.

Ηταν μάλιστα σε θέση να αναγνωρίσει με υψηλές επιδόσεις ακόμη και οικογένειες οι οποίες εν γένει θεωρείται ότι δεν μπορούν να αναγνωριστούν μόνο από μεμονωμένα φύλλα τους, όπως αυτή των Combretaceae, στην οποία περιλαμβάνονται περίπου 600 είδη δέντρων και θάμνων των τροπικών και υποτροπικών περιοχών.

Οικογενειακό πάρτι

Η επίδοση είναι εντυπωσιακή αν σκεφτεί κανείς ότι η ταυτοποίηση της οικογένειας είναι πολύ πιο δύσκολη από την ταυτοποίηση του είδους – το σύστημα θα πρέπει να εντοπίσει τα κοινά γνωρίσματα μέσα σε μια πληθώρα παρόμοιων και πολύπλοκων χαρακτηριστικών.

«Σε ένα μόνο φύλλο υπάρχουν δεκάδες χιλιάδες διακλαδώσεις νεύρων. Και ακόμη και στο ίδιο δέντρο αυτές διαφέρουν αρκετά.

Αν κοιτάξετε δε δύο είδη που έχουν στενή συγγένεια μεταξύ τους θα δείτε ακόμη μεγαλύτερη διαφοροποίηση, είναι περίπου σαν τις ομοιότητες και τις διαφορές που μπορείτε να δείτε ανάμεσα σε δυο αδελφές» εξηγεί ο κ. Γουίλφ.

«Φανταστείτε, είναι σαν να κάνετε μια συγκέντρωση με όλους τους συγγενείς σας, ακόμη και τους πιο μακρινούς, 500 άτομα. Και να έρθει ένα ρομπότ το οποίο θα γνωρίσει τυχαία τους μισούς από αυτούς.

Υστερα το ρομπότ θα πάει σε μια άλλη οικογενειακή συγκέντρωση και θα γνωρίσει και εκεί τυχαία τους μισούς συγγενείς και ούτω καθεξής. Και μετά το ρομπότ θα δει κάποιον άνθρωπο που δεν έχει ξαναδεί ποτέ και θα είναι σε θέση να πει σε ποια οικογένεια ανήκει.

Μπορείτε να φανταστείτε έναν υπολογιστή ο οποίος έχει απλώς δει την αδελφή σας, τον δέκατο έκτο εξάδελφό σας, την αδελφή του προ-προπάππου σας και μια ανιψιά σας και, όταν βλέπει για πρώτη φορά εσάς, μπορεί να πει ότι είστε συγγενής με όλους αυτούς τους ανθρώπους; Αυτό θελήσαμε να κάνουμε με το σύστημά μας».

Οπως μας εξηγεί ο καθηγητής, η δημοσίευση στο PNAS ήταν μόνο ένα πρώτο βήμα. Η δουλειά θα συνεχιστεί και ο αλγόριθμος θα εξακολουθήσει να διευρύνει τις γνώσεις του – βελτιώνοντας παράλληλα και την ακρίβειά του – ώστε να είναι σε θέση να αναγνωρίσει όλο και περισσότερα φύλλα.

Μαθητής και δάσκαλος

Ο μεγάλος στόχος είναι η χρήση του για την ταυτοποίηση των χιλιάδων απολιθωμάτων που παραμένουν αταξινόμητα ή… παραγνωρισμένα και συχνά ανήκουν σε είδη τα οποία έχουν εξαφανιστεί.

«Δεν θα κάνει βεβαίως τη δουλειά αντί για εμάς, όμως θα μας διευκολύνει σημαντικά με τις υποδείξεις του» λέει.

Η διευκόλυνση μάλιστα δεν σταματάει εδώ αφού, όπως φαίνεται, ο αλγόριθμος, εκτός του ότι μαθαίνει, είναι επίσης σε θέση και να διδάξει τους επιστήμονες.

Κάνοντας την ταυτοποίηση το σύστημα επισημαίνει τα κοινά χαρακτηριστικά που εντοπίζει και οι ερευνητές ανακάλυψαν ότι εστιάζει σε σημεία τα οποία ως τώρα δεν θεωρούνταν σημαντικά.

Ετσι ίσως θα δούμε τη μέθοδο του 19ου αιώνα να «ανακαινίζεται» στον 21ο για να προσφέρει νέες γνώσεις, όχι μόνο για την ταυτοποίηση αλλά και για την εξέλιξη των φυτών.

«Τα φύλλα περιέχουν σημαντικές εξελικτικές πληροφορίες» λέει ο κ. Γουίλφ. «Αρκετά από τα χαρακτηριστικά που εντοπίζει το σύστημα δεν τα είχαμε ξαναδεί και δεν τα έχουμε περιγράψει – δεν έχουμε ονόματα για αυτά.

Μπορούμε όμως να αρχίσουμε να τα εξετάζουμε και να μάθουμε καινούργια στοιχεία για την εξέλιξη των φυτών, πώς π.χ. ένα φυτό προσαρμόστηκε σε διαφορετικά περιβάλλοντα, στην έλλειψη νερού και ούτω καθεξής.

Ο μηχανισμός της προσαρμογής των φυτών είναι για εμάς μια θεμελιώδης γνώση την οποία επιζητούμε να αποκτήσουμε και το σύστημά μας ίσως μπορεί να βοηθήσει σε αυτό».

Το Leafsnap είναι μια εφαρμογή που έκανε την εμφάνισή της στα έξυπνα κινητά πριν από μερικά χρόνια με μεγάλη επιτυχία. Ο χρήστης φωτογραφίζει ένα φύλλο με το τηλέφωνό του και η εφαρμογή τού λέει αμέσως τι φυτό είναι.

Παρά το γεγονός ότι εκ πρώτης όψεως φαίνεται να μοιάζει με το σύστημα του Πίτερ Γουίλφ και του Τομά Σερ, στην πραγματικότητα η δημοφιλής εφαρμογή είναι εντελώς διαφορετική.

Το Leafsnap απλώς συγκρίνει την εικόνα που βλέπει με μια βάση δεδομένων (περίπου 200 είδη, τα οποία επιλέγονται ανάλογα με την περιοχή) και αναγνωρίζει το είδος ενός φυτού.

Δεν μαθαίνει κάθε φορά που βλέπει ένα καινούργιο φυτό, δεν αναγνωρίζει οικογένειες και σε καμία περίπτωση δεν μπορεί να ταυτοποιήσει «αγνώστους» που δεν περιλαμβάνονται στη βάση δεδομένων του, όπως κάνει το σύστημα των δύο ερευνητών.

«Το Leafsnap είναι ένα app. Και νομίζω ότι είναι ένα πολύ ωραίο app, όμως εμείς κάναμε κάτι εντελώς διαφορετικό» λέει ο κ. Γουίλφ.

«Θελήσαμε να πάμε ένα βήμα πιο πέρα προσπαθώντας να δημιουργήσουμε ένα σύστημα το οποίο κατανοεί τα χαρακτηριστικά των φύλλων μέσα σε ένα εξελικτικό πλαίσιο. Και αυτό είναι κάτι άλλο».