Μετά τα γνωστά –omics (proteomics, transcriptomics, genomics, metabolomics, lipidomics, and epigenomics) έρχεται το Imageomics (εικον-ομική).
Πρόκειται για ένα νέο διεπιστημονικό πεδίο που επικεντρώνεται στη χρήση εργαλείων μηχανικής μάθησης για την κατανόηση της βιολογίας των οργανισμών, ιδιαίτερα των βιολογικών χαρακτηριστικών, μέσα από εικόνες.
Η Tanya Berger-Wolf, διευθύντρια του Ινστιτούτου Αναλύσεων Μεταφραστικών Δεδομένων στο Πανεπιστήμιο του Οχάιο, περιέγραψε τον νέο κλάδο σε μια παρουσίαση, κατά την ετήσια συνάντηση της Αμερικανικής Ένωσης για την Πρόοδο της Επιστήμης, στις 17 Φεβρουαρίου.
«Το Imageomics ενηλικιώνεται και είναι έτοιμο για τις πρώτες σημαντικές ανακαλύψεις του», δήλωσε σε συνέντευξή πριν από τη συνάντηση.
«Αυτές οι εικόνες μπορούν να προέρχονται από κάμερες, δορυφόρους, drones, ακόμη και από τις φωτογραφίες διακοπών, όπου οι τουρίστες τραβούν ζώα όπως ζέβρες και φάλαινες», συμπλήρωσε η Berger-Wolf, η οποία από το 2021 «τρέχει» το Ινστιτούτο Imageomics στο πανεπιστήμιο του Οχάιο.
Οι εικόνες περιέχουν μια πληθώρα πληροφοριών που οι επιστήμονες δεν μπορούσαν να αναλύσουν και να χρησιμοποιήσουν πλήρως πριν από την ανάπτυξη της τεχνητής νοημοσύνης και της μηχανικής μάθησης.
Ένας σημαντικός τομέας μελέτης που ολοκληρώνεται, αφορά τον τρόπο με τον οποίο οι φαινότυποι - τα παρατηρήσιμα χαρακτηριστικά των ζώων που φαίνονται στις εικόνες - σχετίζονται με το γονιδίωμά τους, δηλαδή με την αλληλουχία DNA που κωδικοποιεί αυτά τα χαρακτηριστικά.
«Είμαστε στο κατώφλι της κατανόησης της διασύνδεσης του παρατηρήσιμου φαινοτύπου με τον γονότυπο», είπε, «Δεν θα μπορούσαμε να το κάνουμε αυτό εύκολα χωρίς το imageomics.
Προωθεί τόσο την τεχνητή νοημοσύνη όσο και τη βιολογική επιστήμη», λέει η επιστήμονας.
Η Berger-Wolf ως ένα παράδειγμα της επιστημονικής προόδου μέσω του imageomics, ανέφερε τη νέα έρευνά της για τις πεταλούδες. Αυτή και οι συνεργάτες της μελετούν τους μιμητές (mimics)-είδη πεταλούδων τα οποία μιμούνται στη εμφάνιση ένα άλλο είδος, το οποίο αποφεύγουν τα πουλιά επειδή η γεύση του δεν είναι ελκυστική.
Σε αυτές τις περιπτώσεις, τα πουλιά, όπως και οι άνθρωποι, δεν μπορούν να ξεχωρίσουν τα είδη από την όψη τους.
Μόνο οι ίδιες οι πεταλούδες γνωρίζουν τη διαφορά. Ωστόσο, η μηχανική μάθηση μπορεί να αναλύσει εικόνες και να εντοπίσει τις πολύ λεπτές διαφορές στο χρώμα ή σε άλλα χαρακτηριστικά που διαφοροποιούν τους τύπους των πεταλούδων. «Δεν μπορούμε να τις ξεχωρίσουμε γιατί αυτές οι πεταλούδες δεν εξέλιξαν αυτά τα χαρακτηριστικά προς όφελός μας.
Εξελίχθηκαν για να δίνουν σήμα στο δικό τους είδος και στους θηρευτές τους», είπε η επιστήμονας, «Το σήμα είναι εκεί, απλά δεν μπορούμε να το δούμε.
Η μηχανική μάθηση μπορεί να μας επιτρέψει να μάθουμε ποιες είναι αυτές οι διαφορές. Αλλά περισσότερο από αυτό, μπορούμε να χρησιμοποιήσουμε το imageomics για να αλλάξουμε τις εικόνες των πεταλούδων και να προσδιορίσουμε πόσο εκτεταμένες πρέπει να είναι οι διαφορές των μιμητών για να ξεγελάσουν τα πουλιά».
Οι ερευνητές σχεδιάζουν να εκτυπώσουν ρεαλιστικές εικόνες των πεταλούδων με ανεπαίσθητες διαφορές για να δουν σε ποιες ανταποκρίνονται τα πουλιά στην πραγματικότητα. Αυτό παράγει κάτι νέο με την τεχνητή νοημοσύνη που δεν έχει ξαναγίνει. «Δεν χρησιμοποιούμε την τεχνητή νοημοσύνη για να ανακεφαλαιώσουμε απλώς αυτά που γνωρίζουμε.
Χρησιμοποιούμε την τεχνητή νοημοσύνη για να δημιουργήσουμε νέες επιστημονικές υποθέσεις που μπορούν πραγματικά να ελεγχθούν. Είναι συναρπαστικό», λέει η Berger-Wolf.
Οι ερευνητές προχωρούν ακόμη παραπέρα με το imageomics για να συνδέσουν αυτές τις λεπτές διαφορές στον φαινότυπο με τα πραγματικά γονίδια που τις καθορίζουν.
«Υπάρχουν πολλά που πρόκειται να μάθουμε τα επόμενα χρόνια τα οποία θα αξιοποιήσουν την δύναμη της εικόνας σε νέους τομείς που μόνο να τους φανταστούμε μπορούμε τώρα», είπε η Berger-Wolf. Ένας βασικός στόχος είναι να χρησιμοποιηθεί αυτή η νέα γνώση που δημιουργείται από το imageomics για να βρεθούν τρόποι προστασίας των απειλούμενων ειδών και των οικοτόπων όπου ζουν.
Νωρίτερα, ένας άλλος ερευνητής στο Ινστιτούτο Inageomics του πανεπιστημίου του Οχάιο, ο Samuel Stevens και οι συνεργάτες του επιμελήθηκαν και κυκλοφόρησαν για πρώτη φορά το μεγαλύτερο και πιο ποικίλο σύνολο δεδομένων εικόνων για μηχανική μάθηση στον κόσμο, το TreeOfLife-10M, το οποίο περιέχει πάνω από 10 εκατομμύρια εικόνες φυτών, ζώων και μυκήτων που καλύπτουν περισσότερα από 454.000 taxa στο δέντρο της ζωής.
Συγκριτικά, η προηγούμενη μεγαλύτερη βάση δεδομένων για μηχανική μάθηση περιέχει μόνο 2,7 εκατομμύρια εικόνες που καλύπτουν 10.000 taxa.
Στη συνέχεια ανέπτυξαν το BioCLIP, ένα νέο μοντέλο μηχανικής μάθησης που κυκλοφόρησε για ερευνητές τον περασμένο Δεκέμβριο και που σχεδιάστηκε για να εκπαιδεύεται από το σύνολο δεδομένων.
Οι ερευνητές δοκίμασαν το BioCLIP και διαπίστωσαν πόσο καλά μπορούσε να ταξινομήσει τις εικόνες στο δέντρο της ζωής, συμπεριλαμβανομένου ενός συνόλου σπάνιων ειδών που δεν είδε κατά τη διάρκεια της εκπαίδευσης. Τα αποτελέσματα έδειξαν καλύτερη απόδοση κατά 17%-20% από τα υπάρχοντα μοντέλα στην εργασία.
Η μελέτη δημοσιεύτηκε στην πλατφόρμα πρόσβασης arXiv. Το μοντέλο BioCLIP είναι δημόσια προσβάσιμο εδώ .
Ο Στίβενς είπε ότι το μοντέλο του, μπορεί επίσης από μια εικόνα να διακρίνει με ακρίβεια το είδος ενός οργανισμού που βρίσκεται είτε σε έναν τοπικό ζωολογικό κήπο, είτε μέσα στην αυλή μας.
*Η παρουσίαση στην AAAS της Berger-Wolf είχε τίτλο “ Imageomics: Images as the Source of Information About Life” και πραγματοποιήθηκε στο πλαίσιο της συνεδρίας “Imageomics: Powering Machine Learning for Understanding Biological Traits”