Calendario e materiali per il Modulo su
Acquisizione Automatica di Lessico e Terminologia
Corso di Terminologia e Linguaggi Settoriali
Man mano che il corso procede, inserirò su questa pagina
brevi riassunti di quanto fatto a lezione, le cose da fare per la
settimana successiva, i miei handouts e i materiali disponibili in
formato elettronico.
Presentazione e programma del corso
La
pagina dei miei links
Calendario
Primo Anno
Materiali ulteriori per gli interpreti che seguono il percorso Estrazione Terminologica su Unix
Lista delle letture disponibili in formato elettronico
Lezione 0: 17/18 febbraio
Cosa abbiamo fatto
Da fare
- Vedi sopra nell'handout di presentazione del corso.
Materiali
Torna al Calendario
Lezione 1: 21 febbraio
Cosa abbiamo fatto
- Abbiamo fatto quasi tutto l'handout Lavorare con i Corpora (vedi
sotto nella sezione Materiali).
Materiali
Torna al Calendario
Lezione 2: 25 febbraio
Cosa abbiamo fatto
- La Legge di Zipf (handout della lezione precedente).
- Cenni di Teoria della Probabilità (handout di questa
lezione).
Da fare
- Formare gruppi, decidere dominio su cui lavorare e lista di parole
chiave del dominio.
- Ottenere Google API Key (seguendo istruzioni nella sezione
Materiali della Lezione 0).
- Vedi l'handout di presentazione del corso per i dettagli.
Materiali
Torna al Calendario
Soluzioni dei quesiti della Verifica 1
Torna al Calendario
Lezione 3: 28 febbraio/3 marzo
Cosa abbiamo fatto
- Scaricamento di corpora dal web con i BootCaT tools.
Da fare
- Riflettere su quanto abbiamo fatto; se necessario, ripetere la
procedura.
- Potrebbe essere un buon momento per cominciare a fare la prima
lettura (Distributions in text, vedi sotto).
Materiali
Torna al Calendario
Lezione 4: 7 marzo/10 marzo
Cosa abbiamo fatto
- Continua la procedura di scaricamento di corpora dal web con i
BootCaT tools.
- Abbiamo dato un'occhiata ai corpora così costruiti col
software TextSTAT.
Torna al Calendario
Lezione 5: 14 marzo/17 marzo
Cosa abbiamo fatto
- Abbiamo pos-taggato i corpora scaricati dal web e trattato un po' di teoria del pos-taggng.
Da fare
- Rileggete la parte fatta in classe dell'handout su come funziona il pos tagging.
- Se non lo avete ancora fatto, leggete il paper su Distributions in text (vedi sezione Letture).
Materiali
Torna al Calendario
Lezione 6: 22 marzo
Cosa abbiamo fatto
- Abbiamo finito l'handout teorico sul POS tagging, abbiamo
indicizzato i corpora con CWB, e abbiamo iniziato ad esplorarli con
cqp.
Da fare
Materiali
Torna al Calendario
Lezione 7: 7 aprile
Cosa abbiamo fatto
- Abbiamo fatto un po' di ripasso e abbiamo esplorato i nostri
corpora con cqp.
Da fare
- Dare un'occhiata al compito da svolgere e portare eventuali
domande alla prossima lezione.
Torna al Calendario
Lezione 8: 12 aprile (ultima lezione traduttori)
Cosa abbiamo fatto
- Ripasso e discussione della Verifica 2.
Torna al Calendario
Sia che stampiate il compito e me lo consegnate a mano, sia che me
lo spediate via email (all'indirizzo SSLMIT e all'indirizzo gmail), vi
pregherei di scaricare la verifica, e usarla come template in cui
inserire i vostri dati e le vostre risposte.
Torna al Calendario
Materiali ulteriori per gli interpreti che seguono il percorso Estrazione Terminologica su Unix
Torna al Calendario
Sia che stampiate il compito e me lo consegnate a mano, sia che me
lo spediate via email (all'indirizzo SSLMIT e all'indirizzo gmail), vi
pregherei di scaricare la verifica, e usarla come template in cui
inserire i vostri dati e le vostre risposte.
Torna al Calendario
Letture
Torna al Calendario
Secondo Anno
Materiali
Torna al Calendario
Torna alla
homepage del corso