Συνέντευξη: Σωτήρης Σκουλούδης

Μια ελληνική πρωτοβουλία φιλοδοξεί να βάλει «τάξη» στην επιστημονική γνώση για όλα όσα αφορούν στον Covid-19 και στην πανδημία, που έχει αλλάξει τον κόσμο όπως τον γνωρίζουμε. Το ζητούμενο για αξιόπιστα επιστημονικά δεδομένα και ανάδειξη της νέας γνώσης που προκύπτει από ερευνητές σε όλο τον κόσμο αποτελεί και τη μέγιστη προτεραιότητα αυτή την εποχή, εν αναμονή βεβαίως και των φαρμάκων ή του εμβολίου που θα θέσουν τέρμα στους χιλιάδες θανάτους καθημερινά, αλλά και στα πρωτοφανή μέτρα που ισχύουν σε πολλές χώρες του κόσμου, με αποτέλεσμα την καραντίνα, την κοινωνική απομόνωση και τον οικονομικό μαρασμό. 

ΔΙΑΦΗΜΙΣΤΙΚΟΣ ΧΩΡΟΣ

Πρόκειται για την πρωτοβουλία ερευνητών του Αριστοτέλειου Πανεπιστημίου Θεσσαλονίκης και του Πανεπιστημίου Duke των ΗΠΑ, που δημιούργησαν, αξιοποιώντας όλες τις σύγχρονες μεθόδους της Επιστήμης των Δεδομένων, έναν «γράφο» βιβλιογραφικών αναφορών, δηλαδή μία βάση δεδομένων με επιστημονικά άρθρα από όλον τον κόσμο, σχετικά με τη μελέτη του COVID-19.

Η πρωτοτυπία αυτής της βάσης έγκειται στο ότι τα άρθρα δεν απαριθμούνται μεμονωμένα, αλλά συνδέονται άμεσα με το σύνολο των παραπομπών και των αναφορών τους.

ΔΙΑΦΗΜΙΣΤΙΚΟΣ ΧΩΡΟΣ

Περισσότερα από 100.000 άρθρα -από τα οποία πάνω από χίλια έχουν δημοσιευτεί από τον Ιανουάριο του 2020 μέχρι σήμερα- και περίπου 1.000.000 σύνδεσμοι περιέχονται στον γράφο. Σύμφωνα με τους ερευνητές, ο αριθμός συνδέσεων ανά κόμβο είναι πολύ υψηλότερος από ό,τι συνήθως παρατηρείται σε άλλους γράφους αναφορών.

To zougla.gr επικοινώνησε με τον αν. καθηγητή και διευθυντή του Εργαστηρίου Αρχιτεκτονικής Υπολογιστικών Συστημάτων του Τμήματος Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών του ΑΠΘ, Νίκο Πιτσιάνη, ο οποίος μας περιέγραψε το εγχείρημα και μας επέδειξε τον τρόπο λειτουργίας του.

Δείτε τη συνέντευξη και την παρουσίαση της εφαρμογής:

 

Τα βιβλιογραφικά δεδομένα είναι διαθέσιμα στους ακόλουθους συνδέσμους:

https://lg-covid-19-hotp.cs.duke.edu

https://www.kaggle.com/nikospitsianis/lgcovid19hotp

https://dx.doi.org/10.5281/zenodo.3728215

Πώς λειτουργεί

Στον πρώτο σύνδεσμο προστίθενται καθημερινά νέα άρθρα, ενώ τα διαγράμματα ενημερώνονται εβδομαδιαία. Στους άλλους δύο συνδέσμους αποθηκεύονται τα βιβλιογραφικά δεδομένα, τα οποία ενημερώνονται σε εβδομαδιαία βάση.

Ιδιαίτερο ενδιαφέρον παρουσιάζουν οι αναλύσεις που βασίζονται στον γράφο βιβλιογραφικών αναφορών, όπως κατανομές και λίστες άρθρων με βάση τον αριθμό των ετεροαναφορών, καθώς και η οπτικοποιημένη απεικόνιση των άρθρων μέσα από τη δημιουργία μίας «σφαίρας μελέτης».

Η «σφαίρα μελέτης» βασίζεται στην τεχνική αναπαράστασης στοχαστικού γράφου (stochastic graph embedding), η οποία παρουσιάζεται σε πρόσφατα δημοσιευμένο έργο των ερευνητών (http://t-sne-pi.cs.duke.edu). Οι ομαδοποιήσεις στη «σφαίρα» απεικονίζουν ισχυρές διασυνδέσεις μεταξύ των ερευνητικών δραστηριοτήτων γειτονικών άρθρων.

Όπως σημειώνει ο αν. καθηγητής και διευθυντής του Εργαστηρίου Αρχιτεκτονικής Υπολογιστικών Συστημάτων του Τμήματος Ηλεκτρολόγων Μηχανικών και Μηχανικών Υπολογιστών του ΑΠΘ, Νίκος Πιτσιάνης, «δύο άρθρα, δηλαδή δύο σημεία της “σφαίρας” απεικονίζονται σε αυτή σε κοντινή απόσταση, εάν οι αναφορές τους ή οι αναφορές τρίτων άρθρων προς αυτά είναι αριθμητικά πολλές».

Στον πρώτο σύνδεσμο (https://lg-covid-19-hotp.cs.duke.edu) παρέχεται επιπρόσθετα μία διαδραστική έκδοση της «σφαίρας», που επιτρέπει στον χρήστη να βλέπει, να εντοπίζει και να εξερευνά τα άρθρα, σύμφωνα με τα ενδιαφέροντα και την τεχνογνωσία του. Έτσι ο χρήστης δεν περιορίζεται στους καταλόγους άρθρων που προσφέρει μια συμβατική μηχανή αναζήτησης.

Επόμενος στόχος των ερευνητών είναι η εκτεταμένη ανάλυση των δεδομένων με σκοπό την ανίχνευση κοινοτήτων και την ταξινόμηση των άρθρων σε θεματικές ενότητες, προκειμένου να διευκολυνθεί περαιτέρω η συνεχιζόμενη μελέτη του COVID-19.

σχόλια αναγνωστών
oδηγός χρήσης