Προτεινόμενη Διπλωματική εργασία Προπτυχιακού προγράμματος Σπουδών
H ανάπτυξη ενός Impact Tracking Agent για τη μέτρηση της "διάθεσης" (πόσα datasets έχουμε) στη μέτρηση της "αξίας" (τι αντίκτυπο έχουν).
Δημιουργία ενός agent/bot που:
(a) λαμβάνει το URL ενός συνόλου δεδομένων (dataset),
(b) αναζητά στο διαδίκτυο αναφορές/παραδείγματα χρήσης αυτού του URL (καταγράφοντας το πλήθος)· επιπλέον, πραγματοποιεί πιο εξειδικευμένη αναζήτηση στο GitHub για εφαρμογές ή τμήματα κώδικα που χρησιμοποιούν αυτό το URL/API,
(c) κατηγοριοποιεί τη χρήση κάθε αναφοράς (π.χ. πολιτικές, σχέδια, κανονισμοί, έρευνα ή υπηρεσίες), καταγράφοντας το πλήθος ανά κατηγορία, ενώ ταυτόχρονα διατηρεί μια σύντομη περιγραφή της κάθε περίπτωσης και 1–2 επιπλέον χρήσιμες λεπτομέρειες για σκοπούς επαλήθευσης,
(d) εντοπίζει τους σχετικούς τομείς/κλάδους (domains/sectors) και καταγράφει το πλήθος ανά τομέα,
(e) επιχειρεί να κατηγοριοποιήσει τον τύπο χρήσης σε: i. οικονομική, ii. κοινωνική και iii. επιστημονική αξία,
(f) επικυρώνει τα αποτελέσματα για 100 διαφορετικά URLs συνόλων δεδομένων, και επιπλέον (+++) προσπαθεί να κάνει εξαγωγή συμπερασμάτων και σε επίπεδο πύλης (portal), δηλαδή για το σύνολο των datasets που φιλοξενεί μια πλατφόρμα.
Τεχνολογία Λογισμικού
Προγραμματισμός Ι (python)
LLM. RAG
Garrigós et al., 2015. Towards an approach to measure how open data is reused Visualization of open data metrics.
Prieto et al., 2018. Supporting Open Dataset Publication Decisions Based on Open Source Software Reuse. International Workshop on Data Warehousing and OLAP.
Abella et al., 2020. Meloda 5: A metric to assess open data reusability. El Profesional de la Informacion.
Downs & Chen, 2015. Bridging Disciplines: Assessing the Interdisciplinary Impact of Open Data.
https://odimpact.org/files/open-data-impact-key-findings.pdf