Fördjupningskurs i korpuslingvistik, 5p VT 2005
Kurskod: 5LN08Kursansvarig lärare: Beata Bandmann Megyesi
Lärare: Filip Salomonsson
Nyheter
- 050330 Preliminärt
schema för presentationer av projektarbeten finns här.
- 050223 Information om projektarbetet finns här.
- 050214
Den stjärnmärkta föreläsningen som ges på
korpuslingvistikkursen den 11/3 är inställd.
Schema och planering
| Typ |
Datum | Tid | Lokal | Lärare |
Innehåll |
Att läsa |
|---|---|---|---|---|---|---|
| F1 |
2/2 |
10-12 |
2-0024 |
FS+BM |
Introduktion, grunder i python | DEM |
| L1 |
2/2 |
13-15 |
Chomsky |
FS |
Introduktion | |
| F* |
4/2 |
10-12 |
16-0041 |
EE |
INSTÄLLD |
|
| F2 |
9/2 |
10-12 |
2-K1028 |
FS |
tokenisering, mer om listor, filer | DEM MS 4.2 |
| L2 |
9/2 |
13-15 |
Chomsky |
FS |
tokenisering | |
| F3 |
11/2 |
10-12 |
16-0041 |
FS |
lexikon, n-gram | MS 4.2, 4.3, 4.4, 5.1, 6.1 |
| F4 |
16/2 |
10-12 |
2-K1024 |
FS |
språkmodellering, datatypen lexikon, protokoll, typemulering | DEM |
| L3 |
16/2 |
13-15 |
Chomsky |
FS |
språkmodellering | |
| F5 |
18/2 |
10-12 |
16-0041 |
FS+BM |
ordklasstaggning | MS 3.1, 10 |
| F6 |
23/2 |
10-12 |
16-0041 |
FS |
XML, operatorer, mer om typemulering | DEM |
| L4 |
23/2 |
13-15 |
Chomsky |
FS |
XML, mm. Mittkursvärdering | |
| F7 |
2/3 |
10-12 |
16-0041 |
FS+BM |
Inlämning
av PM för projektuppgift "Att skriva vetenskapliga artiklar" handledning av projektuppgift |
|
| L5 |
2/3 |
13-15 |
Chomsky |
FS+BM |
handledning
av projektuppgift |
|
| *F8 |
4/3 |
10-12 |
16-0041 |
BM |
INSTÄLLD pga sjukdom |
MS 3.2, 12.1 |
| F9 |
9/3 |
10-12 |
16-0041 |
FS |
frågor, projektuppgift, mm. |
|
| L6 |
9/3 |
13-15 |
Chomsky |
FS |
handledning
av projektuppgift |
|
| F* |
11/3 |
10-12 |
2-0024 |
BM |
INSTÄLLD |
|
| H |
21/3 |
10-16 |
9-2032 |
Alla |
handledning av slutuppgift efter överenskommelse per e-post | |
| *F |
23/3 |
10-12 |
16-0041 |
BM |
trädbanker, data-drivna
metoder, utvärdering |
MS 3.2, 12.1 |
| H |
23/3 |
13-16 |
9-2032 |
Alla |
handledning av slutuppgift efter överenskommelse per e-post | |
| 30/3 |
18.00 |
Alla |
INLÄMNING AV ARTIKEL (distribueras till opponenter + lärare) |
|||
| F10 |
6/4 |
13-17 |
6-0031 |
BM+FS |
PROJEKTREDOVISNING |
* Föreläsningar märkta med * är extra föreläsningar som ges på korpuslingvistikkursen om hur man bygger upp en annoterad korpus. Dessa föreläsningar får besökas för de som så önskar.
Innehåll och arbetssätt
Kursen består av föreläsningar och laborationer. Föreläsningar handlar om programmeringsspråket python och dess användning i korpuslingvistiska tillämpningar, se Filips kurssida. Laborationerna går ut på att lösa korpuslingvistiska uppgifter i programmeringsspråket python. Kursens sista del ger deltagarna färdighet i att skriva en vetenskaplig artikel inom ämnet korpuslingvistik. Dessutom får kursdeltagarna övning i att muntligt presentera sitt arbete samt opponera på en annans.Kurskrav och examination
Examination sker genom labbrapporter, en muntlig presentation av en lämplig projektuppgift vid någon av de 2 sista föreläsningarna, en skriftlig rapport som beskriver projektuppgiften och en opponering på en annan grupps arbete.Betyget bestäms av kvalitén på labbarna samt den
muntliga presentationen, den skriftliga rapporten av projektarbetet
samt av opponeringen på någon
annans arbete. Projektarbetet kan
genomföras enskilt eller i grupp om max 3 personer. I det
senare fallet måste det framgå
tydligt vem som har gjort vad. Alla i gruppen bör ta del av
den muntliga presentationen liksom opponeringen.
Kurslitteratur
[DEM] Allen B. Downey, Jeffrey Elkner and Chris Meyers (2002) How to Think like a Computer Scientist: Learning with Python Green Tea Press, April 2002 <http://www.thinkpython.com/>[MS] Manning, Christopher D. and Schütze, Hinrich (1999) Foundations of Statistical Natural Language Processing, Mit Press, May 1999
Kompletterande material kan tillkomma.
Kursvärderingar
Mitkursvärderingen visade i allmänhet positiv syn på hela kursen och på kurslitteraturen. Några efterlyste dock flera labbtillfällen. Av det skälet utökas antal labbar med två. Filip återkommer med datum.Länkar
The ACL Anthology: A digital archive for research papers in computational linguisticsNLP Resources: tools, dictionaries, corpora, morphological analyzers, taggers, chunkers, parsers
