
Information and Communication Technologies

Natural language text is everywhere, social networks, business, finance, medicine and biology are just few of the many sources of natural language text. However, computers are not fit to process natural language text. Indeed, Data Mining methods and algorithms, which operate on structured data, can not be directly applied to unstructured data for knowledge extraction. The Text Mining course, the last one of the Introduction to Data Mining pathway, introduces methods and tools for knowledge extraction from natural language text. The course assumes you are familiar with methods and models presented in the previous two courses, namely Data Mining: Classification and Data Mining: Clustering and Association. The course shows that Text Mining allows to formulate and solve problems in Business Intelligence, Finance, Recommendation, Medicine, Biomedicine, Social Networks, and Intelligence Gathering to mention just a few. In particular, the course introduces methods, models and algorithms for; natural language text preprocessing, text categorization, text clustering, topic modeling and information extraction.

Duration (weeks): 4
Workload (hrs/week): 35
Home Page:

Il corso di Probabilità e Statistica si propone di fornire gli strumenti matematici chiave per l’organizzazione e la rielaborazione di dati statistici, e per la formulazione e lo studio di modelli probabilistici in grado di fornire una base teorica per i dati alla mano. Il corso sarà strutturato in due parti principali. Nella prima parte, ed in particolare nei capitoli 2 e 3, il corso sarà focalizzato sulla Statistica descrittiva. Verrà primariamente introdotto il concetto di carattere e di frequenza di un valore, verranno mostrate varie possibili rappresentazioni grafiche dei dati, e quindi individuati alcuni parametri chiave nella descrizione globale di un insieme di dati. L’analisi statistica verrà poi estesa all’ambito bivariato con l’introduzione del concetto basilare di indipendenza per coppie di caratteri e la definizione di alcuni indici di dipendenza in relazione alle tipologie di caratteri analizzati. Nella seconda parte del corso, ed in particolare negli ultimi tre capitoli, il corso sarà focalizzato sulla teoria della probabilità, a partire dalle basi, ovvero dalla definizione di un opportuno spazio di probabilità, fino all’analisi asintotica che permette di considerare il comportamento globale di un grande insieme di dati. Come filo conduttore della trattazione verrà analizzato in dettaglio il modello astratto del lancio ripetuto di moneta e le sue applicazioni. In particolare, il capitolo 4 introdurrà il concetto di spazio campionario, di evento e  di probabilità di un evento, approfondendo alcuni esempi, come quelli relativi agli spazi uniformi, e ponendo le basi per il calcolo probabilistico più avanzato. Il capitolo 5 sarà invece focalizzato sulla definizione di variabili casuali, sulla caratterizzazione della loro legge, media e varianza, e su alcune applicazioni notevoli. Infine, nel capitolo 6, verranno enunciati ed utilizzati due tra i più importanti risultati teorici: la legge dei grandi numeri e il teorema del limite centrale.

Duration (weeks): 5
Workload (hrs/week): 35
Home Page:

The course will describe the process of construction of multidimensional indicators of poverty at regional and sub-regional level and the mapping of the results. It is composed of three modules:

  1. Multidimensional Poverty and Living Conditions Indicators
  2. Laeken Indicators and their computation on pseudo-populations
  3. Small Area Estimation.

The MOOC has been realized within the activities of Jean Monnet Chair 2018-2021.

Duration (weeks): 3
Workload (hrs/week): 7
Home Page:
Home Page:

Il corso fornisce una introduzione al software Stata in quattro sezioni, ciascuna composta da 3 lezioni. Nella prima Section vengono trattati i concetti base per la comprensione dell’ambiente Stata e delle funzioni base legate alla gestione dei vari formati di file e all’importazione di dati. Nella seconda sono illustrate le nozioni fondamentali per la gestione dei database: dai comandi di visualizzazione del contenuto delle variabili alle operazioni di unione di più database. Nella terza sono fornite le descrizioni del funzionamento dei comandi legati alla gestione (creazione, descrizione, rinominazione, modifica ecc.) delle variabili e alla produzione di tabelle di vario tipo. Nella quarta Sezione sono illustrati comandi più avanzati che rendono molto utile l’utilizzo del software.

Duration (weeks): 4
Workload (hrs/week): 8
Home Page:

Il corso fornisce una introduzione al software R, introducendo i concetti base e rendendo autonome le elaborazioni. Il corso si svolge in quattro Sezioni, ciascuna composta da 3 lezioni. Nella prima Section vengono trattati i concetti base per l'utilizzo di R e definiti i comandi per la generazione di oggetti semplici come i vettori. Nella seconda vengono illustrate le funzioni per la predisposizione di matrici e per la trasformazione ed evoluzione di alcuni oggetti. Inoltre, si definiscono le funzioni per importare database di diverso formato in R. Nella terza Sezione sono approfonditi tutti i comandi per la lavorazione di database e, dunque, per la ricodifica delle variabili, per la generazione di dummy, fattori, per le funzioni di riordino, merge ecc. Infine, nella Sezione conclusiva si presentano le funzioni per la generazione dei grafici e la loro personalizzazione.

Duration (weeks): 4
Workload (hrs/week): 8
Home Page:

Il corso fornisce un’introduzione al software QGIS. Esso permette agli studenti di creare mappe geografiche tematizzate, al fine di migliorare l’analisi dei dati all’interno di articoli, report e altri tipi di lavori accademici. Il corso si compone di quattro Sezioni. La prima introduce alcuni concetti fondamentali alla base degli strumenti GIS, come ad esempio il concetto di georeferenziazione, cartografia, sistemi di riferimento. La seconda sezione illustra le principali funzioni di base del software QGIS, unitamente alla funzione join tra tabelle. La terza sezione illustra possibili esempi di rappresentazioni cartografiche, discutendo inoltre altre funzioni più avanzate (ad esempio come apportare modifiche agli shapefile). L’ultima presenta altre finalità connesse all’utilizzo di QGIS, come ad esempio la rappresentazioni di punti o l’utilizzo del software unitamente ad R per sviluppare analisi di tipo spaziale.

Duration (weeks): 4
Workload (hrs/week): 8
Home Page:

Questo corso introduce il linguaggio di programmazione MATLAB. Di proprietà MathWorks, MATLAB permette calcolo matriciale, l’uso di interfacce grafiche per funzioni e dati, l’implementazione di algoritmi e la creazione di interfacce. Il corso si svolge in quattro Sezioni. Nella prima si introduce l’ambiente MATLAB e il linguaggio matriciale di base, insieme alle operazioni di base di tipo scalare, vettoriale e matriciale. Nella seconda si utilizzano le funzioni built-in, le espressioni di flusso (if, for, while) e si definiscono le modalità di creazione di m.files (script e funzioni). Nella successiva Section viene presentato il linguaggio per strumenti grafici. Infine, l’ultima Sezione verte su temi di tipo econometrico: simulazione di processi stocastici e prima analisi di serie storiche economiche.

Duration (weeks): 4
Workload (hrs/week): 8
Home Page:

Il corso si svolge in quattro Sezioni. Nella prima vengono trattati i concetti di base di creazione, formattazione e strutturazione di un documento Latex. Nella seconda si definiscono i concetti e i comandi utili ad inserire e formattare tabelle, figure e riferimenti incrociati ad esse e ad altri oggetti. Nella terza Sezione vengono trattati nel dettaglio la creazione e formattazione della bibliografia di un documento e l’introduzione di formule, equazioni ed espressioni matematiche. Nell’ultima sono, invece, discussi alcuni argomenti avanzati e la realizzazione di presentazioni.

Duration (weeks): 4
Workload (hrs/week): 8
Home Page:

The course provides the background on important topics of computer science: Algorithms, Programming and Databases.

Regarding algorithms, we introduce the concept of asympthotic notation, we describe simple data structures and we introduce different algorithms for ordering objects and visit graphs.

Regarding programming, we supply a general overview of the two most important programming paradigms (imperative and object-oriented). For each one we provide several usage examples.

Duration (weeks): 5
Workload (hrs/week): 12
Home Page:

Ziel des Kurses ist es, den Teilnehmerinnen und Teilnehmern ein umfassendes Bild der Informatik zugänglich zu machen und ein grundlegendes Verständnis für Prozesse und Vorgänge in der Informatik bzw. der Programmierung zu vermitteln. Es soll gezeigt werden, dass Informatik Spaß macht, stark mit Kreativität verbunden ist und spannende Fragen bereithält.

Duration (weeks): 6
Workload (hrs/week): 3
Home Page:

Die Digitale Revolution wirkt sich in vielfältiger Weise auf jedeN von uns und auf die gesamte Gesellschaft aus. In diesem MOOC beschäftigen Sie sich mit diesem Themenkomplex. In fünf Lektionen erhalten Sie neue Perspektiven auf die Digitale Transformation aus der Gesundheits- und Sozialforschung, den Rechtswissenschaften, der (Roboter-)Ethik, der Soziologie und Social-Media-Netzwerkforschung, der politischen Geografie und den Bildungswissenschaften.

Dabei spielen Individuen eine große Rolle: Ihre (aktiv oder passiv erzeugten) Daten werden von Algorithmen verarbeitet, was unterschiedlichste Auswirkungen hat, wie z.B. den Umgang mit unserem Körper, die Rolle des Rechts in ethischen Fragestellungen, sowie die Sicht auf Roboter als PartnerInnen oder DienstleisterInnen. Außerdem sind die Chancen und Grenzen gesellschaftlicher Teilhabe und (bestehende, vertiefte und neue) Machtverhältnisse ein Thema. Dabei lernen Sie Begriffe wie Datensouveränität, Datenpolitik, Algorithmen-Spielräume und Datenkörper kennen, sowie eine Definition von Robotern und vieles mehr. Diskutieren Sie die potenziellen Auswirkungen der Digitalen Revolution auf Zivilgesellschaft, Privatsphäre, Inklusion und demokratische Prozesse mit anderen Teilnehmenden und entwickeln Sie so Ihre eigene Position!

Zu den Themen des MOOC zählen u.a.:

  • Algorithmen bei Grenzkontrollen
  • Algorithmus zur Beurteilung Arbeitsloser: Fallbeispiel Österreich und die Datenschutz-Grundverordnung (DSGVO)
  • Autonomes Fahren im Spannungsverhältnis zur Straßenverkehrsordnung
  • Roboter und moralisches Handeln; Sexroboter
  • Cambridge Analytica Files
  • Soziologische Betrachtung von Technologie und deren Wirkung
  • Bewusster Umgang mit Diskriminierungsverhältnissen
Duration (weeks): 5
Workload (hrs/week): 4
Home Page:

In this course, you will achieve expertise in two topics, database modeling and database design. Databases are the fundamental technology adopted in all information systems worldwide, since they allow organizing, storing and retrieving digital data that are useful for both personal activities and decisions, and for core activities of enterprises and public administrations. Digital data managed in databases are at the basis of a huge amount of digital services and apps we use every day.

Referring to the modeling capability, the course introduces two models widely adopted to represent databases, the Relational model and the Entity relationship model. The Relational model is used by the majority of software systems that manage databases, while the Entity relationship model, that is provided of an user friendly diagrammatic representation, is adopted in the early stage of the database design process.

Referring to the design capability, the database design process starts usually with a natural language or pictorial description of user requirements; it is worthwhile to represent initially such description using the Entity Relationship model, that is understandable by users, and provides a rich set of semantic characteristics of data. The result of the design activity at this stage is a database schema. After that, the design can proceed translating the Entity Relationship schema into a logical schema in the relational model. Such translation has to be performed using several practical rules that have the goal to optimize the relational schema w.r.t. queries and transactions performed by users. Once obtained the logical schema, one can add to relations (last step) data that represent, in our case, the students, courses and exams.

The course assumes you are familiar with basic mathematical concepts such as set, subset, table, function, and domain of a function.

Duration (weeks): 5
Workload (hrs/week): 23
Home Page:
Duration (weeks): 12
Home Page:
This course introduces basic concepts and methods of Data Mining with specific reference to Clustering and Association Rules. We present concept and purposes of cluster analysis, together with its’ main components. Partitioning, hierarchical, density based, and graph based clustering methods are described. Particular attention is devoted to; cluster validity measures and clustering validation. The last part of the course introduces association rule discovery. The concepts of association rule, frequent itemset, support and confidence are given. Furthermore, we give a brief description of the Apriori algorithm for frequent itemset generation, and introduce the concepts of maximal and closed frequent itemset. Finally, different criteria, for evaluating the quality of association patterns, are introduced.


Duration (weeks): 4
Workload (hrs/week): 40
Home Page:
Learn how to formulate and solve classification problems for use in Data Mining and Business Intelligence applications such as; fraud detection, customer churning, network intrusion detection, etc... You will learn how to develop, validate and apply a data mining workflow to solve binary and non-binary classification problems. The course is self-contained, and it does not require any programming skills. Hands-on lectures are based on the KNIME open source software platform.
Duration (weeks): 4
Workload (hrs/week): 45
Home Page:
Start: 14/03/2022 - 04/06/2022
Duration (weeks): 12
Home Page:
Start: 02/03/2021 - 15/12/2021
Duration (weeks): 6
Workload (hrs/week): 3
Home Page:

Il corso base si propone di illustrare come utilizzare il linguaggio Python per il calcolo scientifico attraverso esempi ed applicazioni. L’approccio del corso è quello della programmazione con gli strumenti della matematica: dati vettoriali, algoritmi e la loro validazione mediante sperimentazione numerica. In particolare, il corso propone esempi ed esercizi per introdurre concetti chiave e strumenti pratici per il calcolo matriciale e la sua efficienza nei tempi di calcolo richiesti, l’interpretazione grafica dei risultati, la simulazione di modelli matematici, l’accelerazione delle performance tramite il calcolo parallelo su GPU.

Duration (weeks): 3
Workload (hrs/week): 30
Home Page:

Il corso avanzato si propone di illustrare metodi computazionali più complessi, che richiedono conoscenze matematiche più avanzate. In particolare questo corso presenta diversi algoritmi di ottimizzazione nonlineare, evidenziandone vantaggi e svantaggi a seconda delle applicazioni, ed espone i concetti base della simulazione di semplici modelli della meccanica del continuo, mediante differenze finite ed elementi finiti.

Duration (weeks): 2
Workload (hrs/week): 20
Home Page:

The course is designed to enhance your learning experience.

Each unit is motivated by a story based problem and focussed on providing the skills and techniques to solve it.

Be part of Captain Bayes' crew to sail the ocean of uncertainties and big data and help to succeed in her adventures of probability theory.
Get to know the ideas of your fellow crew comrades Bernoulli, Pascal, Laplace and many more that accompany you during your journey.

The adventures of Captain Bayes are followed by the content videos that deliver the theories and concepts of each unit. To familiarize you with the new learnings, interactive quizzes are integrated in the video to deepen your knowledge practically.

Furthermore listen to Ernesto, the parrot, that will guide you as your learning buddy throughout the course and provide you with learning tips and further material.

At the end of each unit you are ready to help Captain Bayes to solve the raised problems in a self-assessment (5-10 questions).

Hire now, meet Captain Bayes and proof yourself in her tough initial / recruiting task under the following link.

Duration (weeks): 9
Workload (hrs/week): 6
Home Page:
Start: 01/09/2021 - 12/05/2022
Duration (weeks): 15
Workload (hrs/week): 8
Home Page:

Combinazioni e disposizioni, spazio di probabilità, probabilità condizionata, eventi indipendenti, formula di probabilità totale, formula di Bayes. Nozione di variabile aleatoria (discreta e assolutamente continua), di media e varianza, standardizzazione. Covarianza e correlazione lineare di due variabili, variabili indipendenti. Le distribuzioni binomiale, di Poisson, normale e le distribuzioni t, chi quadrato ed F. Popolazione, campioni, funzioni dei dati e relativi gradi di libertà. Intervalli di fiducia per media e per proporzione. Errori di prima e seconda specie; test su una proporzione, su una media, sulla differenza di due medie, su più proporzioni, sul rapporto di varianze; inoltre calcolo del valore “p” mediante R. Retta dei minimi quadrati, coefficiente di correlazione lineare, coefficiente di determinazione lineare. Test di dipendenza lineare in termini di rapporto F e in termini di t di Student (test di Pearson). Mediante R attuazione del test di Kolmogorov-Smirnov sulla normalità dei residui, nonché intervalli di fiducia del coefficiente angolare e della correlazione.

Duration (weeks): 8
Workload (hrs/week): 20
Home Page: