Datorlingvistisk lexikografi
Schema och planering
| Lektion | Datum | Tid | Sal | Ämne | Litteratur | Lärare |
|---|---|---|---|---|---|---|
| F1 | Må 31/10 | 12-14 | 9-1016 | Kursintroduktion Lexikon |
[DL] 1-2 | GE, EP |
| F2 | On 2/11 | 10-12 | 2-K1072 | Informationssökning Lemmatisering |
[JM] 17; [DL] 12 | GE |
| L1 | On 2/11 | 13-15 | Chomsky | Länkning | [JT], [FOHN] | EP |
| F3 | To 3/11 | 10-12 | 9-1016 | Ord Lexikal semantik paradigmatiska relationer |
[JM] 16; [DL] 5 | GE |
| L2 | To 3/11 | 13-15 | Chomsky | Lemmatisering | EP | |
| F4 | Må 7/11 | 12-14 | 9-1017 | Syntagmatiska relationer, kasusroller, selektionsrestriktioner homonym- och polysemseparering |
[JM] 16:3, 17:1-2; [DL] 5 | GE |
| L3 | Må 7/11 | 15-17 | Chomsky | Lemmatisering (forts) | EP | |
| F5 | Ti 8/11 | 12-14 | 9-1017 | Lexikonstruktur, extraktion av lexikal information från ordböcker, lexikonpostparsning | [DL] 3, 8 | GE |
| F6 | On 9/11 | 12-14 | 9-1017 | Extraktion av lexikal kunskap från text | [DL] 10, 11 | GE |
| L4 | On 9/11 | 15-17 | Chomsky | Projektuppgift | EP | |
| F7 | Må 14/11 | 12-14 | 9-1017 | Ordrumsmodeller | [MS02], [MS05] | GE,MS |
| F8 | On 16/11 | 12-14 | 9-1017 | Svenskt OrdNät | [ÅV] | ÅV |
| L5 | Må 21/11 | 12-14 | 9-3036 (Språklabbet) | Svenskt OrdNät | [ÅV] | LW |
| F9 | On 23/11 | 12-14 | 9-1016 | Seminarium: Redovisning av projektuppgift | GE, EP | |
| F10 | To 24/11 | 15-17 | 6-0023 | Seminarium: Redovisning av projektuppgift | GE, EP |
Reservation för vissa ändringar!
Schemat senast ändrat 2005-10-25
Lärare
Eva Pettersson (EP), kursansvarigGunnar Eriksson (GE)
Åke Viberg (ÅV)
Lisa Wolff Foster (LW)
Magnus Sahlgren (MS)
Laborationsuppgifter
- Uppgift 1: Menings- och ordlänkning, deadline 11 november
- Uppgift 2: Lemmatisering av svensk text, deadline 18 november
- Uppgift 3: Svenskt OrdNät, deadline 25 november
Kurskrav och examination
Aktivt deltagande i undervisningen, genomförande av laborationsuppgifter med skriftlig rapportering samt en projektuppgift som redovisas såväl muntligt som skriftligt.Kursen innehåller tre laborationsuppgifter, som alla ska utföras individuellt. Därtill kommer en projektuppgift, som handleds av Eva Pettersson, och som även den ska utföras individuellt. Projektuppgiften kan utgöras av en utvidgning av någon av de två första laborationsuppgifterna, alternativt en valfri uppgift i samråd med handledaren.
Den som väljer att som projektuppgift utvidga någon av labbarna, har givetvis förlängd deadline på denna labb. Projektuppgiftsrapporten ska lämnas in i skriftlig form senast fredag 18 november, och redovisas muntligt på de avslutande seminarierna 23 november respektive 24 november.
Kurslitteratur
- [DL] Datorlingvistisk lexikografi
- Kompendium, http://ilias.sfs.uni-tuebingen.de/ilias/
- [JM] Daniel Jurafsky och James H. Martin, 2000
- Speech and Language Processing
Valda delar, i synnerhet kapitel 6, 16 och 17 - [ÅV] Åke Viberg, 2002
- Svenskt OrdNät
i: Holmboe, H. (red.) Nordisk Sprogteknologi 2002. København: Museum Tusculanum Forlag. Sid. 135-143
[pdf] - [JT] Jörg Tiedemann, 2003
- Combining Clues for Word Alignment
i Proceedings of the 10th Conference of the European Chapter of the Association for Computational Linguistics (EACL), s. 339-346
[pdf] - [FOHN] Franz Josef Och och Hermann Ney, 2000
- Improved Statistical Alignment Models
i Proceedings of ACL00, s. 440-447
[pdf] - [MS02] Magnus Sahlgren, 2002
- Towards a Flexible Model of Word Meaning
i Proceedings of the Workshop on Acquiring (and Using) Linguistic (and World) Knowledge for Information Access (AAAI), Spring Symposium 2002, 25-27 mars, Stanford University, Palo Alto, California, USA.
[ps] - [MS05] Magnus Sahlgren, 2005
- An Introduction to Random Indexing
i Proceedings of the Methods and Applications of Semantic Indexing Workshop at the 7th International Conference on Terminology and Knowledge Engineering (TKE), 16 augusti, 2005, Köpenhamn, Danmark.
[pdf]
Länkar
Länkning:- EUROPARL-korpusen (Philipp Koehn)
- GIZA++ (Franz Josef Och, Hermann Ney)
