Με τη συμβολή επιστημόνων του Ιδρύματος Τεχνολογίας και Έρευνας (ΙΤΕ) σχετική μελέτη που δημοσιεύεται στο έγκριτο επιστημονικό περιοδικό Nature
Σημαντικά πρωτοποριακά εργαλεία βιοπληροφορικής που αναπτύχθηκαν από τη συνεργασία δύο επιστημονικών ομάδων από το Ινστιτούτο Πληροφορικής του Ιδρύματος Τεχνολογίας και Έρευνας (ΙΤΕ) και το Ινστιτούτο Θεωρητικών Σπουδών της Χαϊδελβέργης (HITS) συνέβαλαν στην εξήγηση της πολυπλοκότητας της εξέλιξης των πτηνών. Τα αποτελέσματα αυτής της έρευνας, που υλοποιήθηκε από μια διεθνή ομάδα επιστημόνων, δημοσιεύτηκαν στο υψηλού επιστημονικού κύρους περιοδικό Nature.
Ο επικεφαλής των ομάδων βιοπληροφορικής (ομάδα Υπολογιστικής Βιοποικιλότητας του Ινστιτούτου Πληροφορικής του ΙΤΕ, ομάδα Υπολογιστικής Μοριακής Εξέλιξης του HITS) Αλέξανδρος Σταματάκης είναι κάτοχος μιας θέσης ERA Chair στο ΙΤΕ που χρηματοδοτείται από την ΕΕ.
«Αυτό που κάνουμε κατά κύριο λόγο, είναι να διευκολύνουμε την έρευνα στην εξελικτική βιολογία μέσω της ανάπτυξης λογισμικού, αλγορίθμων και εξελικτικών μοντέλων», ανέφερε ο κ. Σταματάκης για την έρευνα που πραγματοποιούν οι ομάδες του. «Το λογισμικό ParGenes, για παράδειγμα, μπορεί να υπολογίσει σε σύντομο χρονικό διάστημα έναν τεράστιο αριθμό φυλογενετικών δέντρων για διαφορετικές περιοχές του γονιδιώματος σε μία συστοιχία υπολογιστών. Για να το καταφέρουμε αυτό, λύσαμε ένα κλασικό πρόβλημα της πληροφορικής, συγκεκριμένα το πώς μοιράζουμε αποτελεσματικά, στον ελάχιστο δυνατό χρόνο, έναν μεγάλο αριθμό υπολογισμών σε μία υπολογιστική συστοιχία.»
Το ParGenes είναι ένα λογισμικό ανοιχτού κώδικα που βασίζεται στην ενσωμάτωση δύο ακόμα λογισμικών ανοιχτού κώδικα που ονομάζονται RAxML-NG και Modeltest-NG. Το RAxML-NG είναι ένα πολύ δημοφιλές πρόγραμμα για τον υπολογισμό φυλογενετικών δέντρων από δεδομένα DNA που ανέπτυξαν οι δυο ερευνητικές ομάδες, στο Ηράκλειο και στην Χαϊδελβέργη. Ενώ το Modeltest-NG είναι ένα εργαλείο για την επιλογή του βέλτιστου στατιστικού μοντέλου εξέλιξης για δεδομένα DNA. Όλα τα εργαλεία μπορούν να τρέξουν ανάλογα με τον όγκο των δεδομένων τόσο σε ένα φορητό υπολογιστή όσο και στους υπερ-υπολογιστές (supercomputers). Με αυτά τα εργαλεία καθίσταται δυνατή η έρευνα σε διάφορους κλάδους των βιοεπιστημών. Να σημειωθεί ότι, κατά τη διάρκεια της πανδημίας, το RAxML-NG χρησιμοποιήθηκε από πολλούς επιστήμονες ανά τον κόσμο για την ανάλυση της εξέλιξης των στελεχών του ιού SARS-CoV-2.
Η συμβολή των εργαλείων βιοπληροφορικής στην εξελικτική βιολογία
Οι φυλογενετικές σχέσεις είναι το κλειδί για την κατανόηση της εξέλιξης των ειδών και συνήθως προσδιορίζονται συγκρίνοντας, μεταξύ άλλων, ομοιότητες στο DNA ή ανατομικά χαρακτηριστικά. Μια διεθνής ομάδα ερευνητών από το “Bird 10,000 Genomes Project” (B10K) ανέλυσε γονιδιώματα 363 ειδών πτηνών χρησιμοποιώντας συγκεκριμένες περιοχές του γονιδιώματός τους και μια πληθώρα υπολογιστικών μεθόδων. Το αποτέλεσμα είναι ένα καλά υποστηριζόμενο δέντρο της εξέλιξης των πτηνών, το οποίο όμως παρουσιάζει ταυτόχρονα έναν εκπληκτικό βαθμό εξελικτικών σχέσεων, οι οποίες δεν μπορούν, προς το παρόν, να επιλυθούν . Για την περαιτέρω εξαγωγή συμπερασμάτων, απαιτούνται πολλά επιπλέον δεδομένα ώστε να απαντηθούν τα ανοιχτά ερωτήματα. Οι δυσκολίες στην επίλυση συγκριμένων εξελικτικών σχέσεων μπορεί να οφείλονται στην ποικιλομορφία των ειδών που αναλύθηκαν, στην υπολογιστική φυλογενετική μέθοδο που χρησιμοποιείται, και στην επιλογή των γονιδιωματικών περιοχών.
«Οι νέες υπολογιστικές προσεγγίσεις μας επέτρεψαν να ανακατασκευάσουμε πάνω από 150.000 φυλογενετικά δέντρα για διαφορετικά τμήματα του γονιδιώματος. Το κάθε δέντρο ανοίγει ένα μικρό παράθυρο στην εξελικτική ιστορία των πτηνών» λέει η Josefin Stiller, μία από τους κύριους συγγραφείς της μελέτης και πρώην επισκέπτρια της ομάδας Υπολογιστικής Μοριακής Εξέλιξης (CME) στο Ινστιτούτο Θεωρητικών Σπουδών της Χαϊδελβέργης (HITS).
Μια σημαντική προσθήκη στη μελέτη ήταν η πρόβλεψη της φυλογενετικής δυσκολίας που αναπτύχθηκε από τη διδακτορική φοιτήτρια στην ομάδα της Χαϊδελβέργης (και συχνή επισκέπτρια στο ΙΤΕ) του κ. Σταματάκη, Julia Haag, χρησιμοποιώντας τεχνικές μηχανικής μάθησης.
«Καθώς η εργασία μας στο Nature επικεντρώνεται στην αξιολόγηση του φυλογενετικού και εξελικτικού σήματος σε διαφορετικές περιοχές του γονιδιώματος των πτηνών, ήταν μια πολύ χρήσιμη προσθήκη. Χάρη σε αυτήν την καινοτόμο μέθοδο μπορούμε να παρέχουμε βαθμολογίες φυλογενετικής δυσκολίας, οι οποίες δείχνουν τον βαθμό στον οποίο εμπιστευόμαστε το αποτέλεσμα για τις γονιδιωματικές περιοχές που αναλύθηκαν» καταλήγει ο κ. Σταματάκης.
To άρθρο στο περιοδικό Nature μπορείτε να το διαβάσετε: https://www.nature.com/articles/s41586-024-07323-1