Τίτλος Μαθήματος Ανάκτηση Πληροφορίας
Κωδικός Μαθήματος 321-10202
Εξάμηνο 8
ECTS 5
Ώρες (Θεωρία) 3
Ώρες (Εργαστηρίο)
Διδάσκοντας 321-10202

Ύλη μαθήματος

Εισαγωγή στα συστήματα ανάκτησης πληροφορίας. Ανάκτηση/φιλτράρισμα πληροφορίας και browsing. Μοντελοποίηση: συνολοθεωρητικά μοντέλα, αλγεβρικά μοντέλα, πιθανοτικά μοντέλα. Επεξεργασία και συμπίεση κειμένων. Νόμος του Zipf και νόμος του Heaps. Εισαγωγή στις markup γλώσσες. Μέθοδοι δεικτοδότησης: ανεστραμμένα αρχεία, δέντρα και πίνακες επιθεμάτων, αρχεία υπογραφών. Μέθοδοι απευθείας αναζήτησης. Αξιολόγηση συστημάτων ανάκτησης πληροφορίας, υπάρχουσες συλλογές αξιολόγησης. Ανάδραση σχετικότητας και επέκταση ερωτήματος. Αυτόματη ταξινόμηση και ομαδοποίηση κειμένων. Αναζήτηση στον παγκόσμιο ιστό: μηχανές αναζήτησης, τεχνικές crawling, τεχνικές βάσει συνδέσμων.

Επιδιωκόμενα μαθησιακά αποτελέσματα

Κατανόηση της διάκρισης μεταξύ ανάκτησης δεδομένων και ανάκτησης πληροφορίας. Εξοικείωση με την αρχιτεκτονική ενός συστήματος ανάκτησης πληροφορίας. Κατανόηση των ιδιοτήτων του δυαδικού, του διανυσματικού και του πιθανοτικού μοντέλου ανάκτησης πληροφορίας. Εξοικείωση με τις βασικές διεργασίες επεξεργασίας κειμένου και με τις βασικές ιδιότητες συλλογών κειμένων. Κατανόηση των πιο διαδεδομένων μεθόδων δεικτοδότησης στα συστήματα ανάκτησης πληροφορίας. Ικανότητα αξιολόγησης συστημάτων ανάκτησης πληροφορίας. Εξοικείωση με τις τεχνικές ανάδρασης χρήστη και επέκτασης ερωτήματος. Κατανόηση των ιδιαιτεροτήτων της ανάκτησης πληροφορίας στον Παγκόσμιο Ιστό. Εξοικείωση με τις τεχνικές web crawling.

Προαπαιτούμενα

Δεν απαιτούνται.

Εγχειρίδια του μαθήματος

1. Christopher Manning, Prabhakar Raghavan, Hinrich Schutze, «Εισαγωγή στην ανάκτηση πληροφοριών», Κλειδάριθμος, 2012.

Συμπληρωματική βιβλιογραφία

1. Baeza-Yates and Ribeiro-Neto, “Modern Information Retrieval”, Addision Wesley, 1999.
2. Witten, Moffat, and Bell, “Managing Gigabytes: Compressing and Indexing Documents and Images”, Morgan Kaufmann Publishing, 1999.
3. C. J. van Rijsbergen, “Information Retrieval”, 2nd edition, 1979.

Διδακτικές και μαθησιακές μέθοδοι

Δραστηριότητα Φόρτος Εργασίας Εξαμήνου
Διαλέξεις 39 ώρες

 
Προσωπική μελέτη 83 ώρες
 
Τελική εξέταση 3 ώρες
Σύνολο Μαθήματος 125 ώρες (5 ECTS)

Μέθοδοι αξιολόγησης / βαθμολόγησης

Τελική γραπτή εξέταση, ατομική εργασία.

Γλώσσα διδασκαλίας

Ελληνικά (Αγγλικά αν υπάρχουν φοιτητές/φοιτήτριες ERASMUS)

Τρόπος παράδοσης μαθήματος

Φυσική Παρουσία.