ΚΕΔΙΒΙΜ ΕΚΠΑ

NKUA CCE

ΨΗΦΙΑΚΗ ΔΙΑΧΡΟΝΙΑ

DIGITAL DIACHRONY

Υπολογιστικές Προσεγγίσεις στη Μελέτη της Γλωσσικής Εξέλιξης.
Ένα πρωτοποριακό πρόγραμμα που συνδυάζει τη Γλωσσολογία με την Επιστήμη Δεδομένων.

Computational Approaches to the Study of Language Evolution.
A pioneering program bridging Linguistics with Data Science.

ΕΚΔΗΛΩΣΗ ΕΝΔΙΑΦΕΡΟΝΤΟΣ EXPRESS INTEREST

8

ΜΗΝΕΣ / MONTHS

MONTHS / ΜΗΝΕΣ

12

ECTS UNITS

ECTS UNITS

300

ΩΡΕΣ ΔΙΔΑΣΚΑΛΙΑΣ

TEACHING HOURS

100%

ΕΞ ΑΠΟΣΤΑΣΕΩΣ

ONLINE LEARNING

ΕΠΙΣΤΗΜΟΝΙΚΟ ΠΛΑΙΣΙΟ

SCIENTIFIC CONTEXT

Το εκπαιδευτικό πρόγραμμα «Ψηφιακή Διαχρονία» έρχεται να καλύψει ένα σημαντικό κενό στη σύγχρονη ανθρωπιστική έρευνα: τη σύνδεση της ιστορικής γλωσσολογίας με τις ψηφιακές τεχνολογίες. Σε μια εποχή όπου ο όγκος των ψηφιακών δεδομένων αυξάνεται εκθετικά, η ικανότητα ανάλυσης μεγάλων σωμάτων κειμένων (Big Data) καθίσταται απαραίτητη δεξιότητα για τον σύγχρονο ερευνητή.

Μέσα από το πρόγραμμα, οι συμμετέχοντες θα εξοικειωθούν με τη χρήση υπολογιστικών εργαλείων για τη μελέτη της γλωσσικής αλλαγής, κατανοώντας πώς οι γλώσσες εξελίσσονται στον χρόνο μέσω ποσοτικών και ποιοτικών μεθόδων. Από την ανάλυση αρχαίων χειρογράφων έως τη χρήση στατιστικών μοντέλων, το πρόγραμμα προσφέρει μια ολοκληρωμένη επισκόπηση του πεδίου των Ψηφιακών Ανθρωπιστικών Επιστημών.

ΣΕ ΠΟΙΟΥΣ ΑΠΕΥΘΥΝΕΤΑΙ

Το πρόγραμμα απευθύνεται σε απόφοιτους Ανθρωπιστικών Επιστημών, φιλολόγους, γλωσσολόγους, ιστορικούς, αλλά και σε επιστήμονες πληροφορικής που επιθυμούν να εξειδικευτούν στην Επεξεργασία Φυσικής Γλώσσας (NLP) με έμφαση στα ιστορικά δεδομένα.

The "Digital Diachrony" educational program aims to bridge a significant gap in modern humanities research: the connection between historical linguistics and digital technologies. In an era where the volume of digital data is increasing exponentially, the ability to analyze large text corpora (Big Data) is becoming an essential skill for the modern researcher.

Through this program, participants will familiarize themselves with computational tools for studying language change, understanding how languages evolve over time through quantitative and qualitative methods. From analyzing ancient manuscripts to using statistical models, the program offers a comprehensive overview of the Digital Humanities field.

TARGET AUDIENCE

The program is designed for graduates of Humanities, philologists, linguists, historians, as well as computer scientists wishing to specialize in Natural Language Processing (NLP) with a focus on historical data.

Data Visualization Research Archives Ancient Texts Coding for Humanities

ΕΚΠΑΙΔΕΥΤΙΚΕΣ ΕΝΟΤΗΤΕΣ

EDUCATIONAL MODULES

01
CORE THEORY • 60 HOURS

Θεμέλια Διαχρονικής Γλωσσολογίας

Foundations of Diachronic Linguistics

Η ενότητα αυτή παρέχει το απαραίτητο θεωρητικό υπόβαθρο. Εξετάζονται οι μηχανισμοί της γλωσσικής αλλαγής (φωνητική, μορφολογική, συντακτική και λεξική αλλαγή), καθώς και η θεωρία της γραμματικοποίησης. Οι φοιτητές μελετούν την εξέλιξη των Ινδοευρωπαϊκών γλωσσών και παραδείγματα από την ιστορία της Ελληνικής, της Αγγλικής και άλλων γλωσσών, αναλύοντας πώς οι κοινωνικοί και ιστορικοί παράγοντες επηρεάζουν τη δομή της γλώσσας.

This module provides the necessary theoretical background. It examines the mechanisms of language change (phonological, morphological, syntactic, and lexical change) and the theory of grammaticalization. Students study the evolution of Indo-European languages and examples from the history of Greek, English, and other languages, analyzing how social and historical factors influence language structure.

02
TECHNICAL SKILLS • 60 HOURS

Υπολογιστικές Μέθοδοι & Εργαλεία

Computational Methods & Tools

Εισαγωγή στον προγραμματισμό με Python ειδικά σχεδιασμένη για γλωσσολόγους. Οι συμμετέχοντες μαθαίνουν να διαχειρίζονται ψηφιακά δεδομένα, να χρησιμοποιούν βιβλιοθήκες NLP (όπως NLTK και spaCy), να κάνουν εξόρυξη δεδομένων (web scraping) και να καθαρίζουν κείμενα για ανάλυση. Έμφαση δίνεται στη δημιουργία και διαχείριση γλωσσικών σωμάτων (corpora).

Introduction to Python programming specifically designed for linguists. Participants learn to manage digital data, use NLP libraries (such as NLTK and spaCy), perform web scraping, and clean texts for analysis. Emphasis is placed on the creation and management of language corpora.

03
DATA SCIENCE • 60 HOURS

Στατιστική Ανάλυση & Μοντελοποίηση

Statistical Analysis & Modeling

Η ενότητα εστιάζει στην ποσοτική έρευνα. Οι φοιτητές εκπαιδεύονται στη χρήση της γλώσσας R για στατιστική ανάλυση. Καλύπτονται θέματα όπως περιγραφική στατιστική, έλεγχοι υποθέσεων, παλινδρόμηση και οπτικοποίηση δεδομένων (ggplot2). Στόχος είναι η ικανότητα εξαγωγής ασφαλών συμπερασμάτων από μεγάλα σύνολα γλωσσικών δεδομένων.

This module focuses on quantitative research. Students are trained in using R for statistical analysis. Topics covered include descriptive statistics, hypothesis testing, regression, and data visualization (ggplot2). The goal is to enable the extraction of reliable conclusions from large linguistic datasets.

04
APPLIED RESEARCH • 60 HOURS

Εφαρμογές σε Ιστορικές Γλώσσες

Applications in Historical Languages

Πρακτική εφαρμογή των ψηφιακών εργαλείων σε ιστορικά κείμενα. Περιλαμβάνει την ψηφιοποίηση (OCR) παλαιών εκδόσεων, τη διαχείριση πολυτονικών κειμένων, την κωδικοποίηση κειμένων με το πρότυπο TEI/XML και τη δημιουργία ψηφιακών κριτικών εκδόσεων. Εξετάζονται επίσης ζητήματα ψηφιακής παλαιογραφίας.

Practical application of digital tools to historical texts. Includes digitization (OCR) of old editions, management of polytonic texts, text encoding with the TEI/XML standard, and the creation of digital critical editions. Issues of digital paleography are also examined.

05
FINAL PROJECT • 60 HOURS

Ερευνητικό Εργαστήριο

Research Lab

Η τελική ενότητα συνθέτει όλες τις γνώσεις. Οι εκπαιδευόμενοι αναλαμβάνουν ένα πρωτότυπο ερευνητικό έργο υπό την επίβλεψη των διδασκόντων. Το έργο μπορεί να είναι η δημιουργία ενός νέου γλωσσικού πόρου (dataset), η ανάπτυξη ενός εργαλείου λογισμικού ή η συγγραφή μιας επιστημονικής εργασίας προς δημοσίευση.

The final module synthesizes all knowledge. Trainees undertake an original research project under the supervision of instructors. The project can be the creation of a new linguistic resource (dataset), the development of a software tool, or the writing of a scientific paper for publication.

ΠΙΣΤΟΠΟΙΗΣΗ ΣΠΟΥΔΩΝ

CERTIFICATION

Πιστοποιητικό ΚΕΔΙΒΙΜ ΕΚΠΑ NKUA Certificate
Europass Supplement Europass Supplement
12 Μονάδες ECTS 12 ECTS Credits