Denna webbplats fungerar bättre i en webbläsare som stöder webbstandards, men är tillgänglig i alla webbläsare och andra typer av Interntapparater.

UPPSALA UNIVERSITET : Inst. f. lingvistik och filologi : STP
Uppsala universitet
Hoppa över länkar


Schema
Innehåll
Examination
Litteratur
Kursvärderingar
Länkar


Kursplaner
STP


Fördjupningskurs i korpuslingvistik, 5p VT 2005

Kurskod: 5LN08

Kursansvarig lärare: Beata Bandmann Megyesi
Lärare: Filip Salomonsson

Nyheter

Schema och planering

Typ
Datum Tid Lokal Lärare
Innehåll
Att läsa
F1
2/2
10-12
2-0024
FS+BM
Introduktion, grunder i python DEM
L1
2/2
13-15
Chomsky
FS
Introduktion
F*
4/2
10-12
16-0041
EE
INSTÄLLD

F2
9/2
10-12
2-K1028
FS
tokenisering, mer om listor, filer DEM
MS 4.2
L2
9/2
13-15
Chomsky
FS
tokenisering
F3
11/2
10-12
16-0041
FS
lexikon, n-gram MS 4.2, 4.3, 4.4, 5.1, 6.1
F4
16/2
10-12
2-K1024
FS
språkmodellering, datatypen lexikon,  protokoll, typemulering DEM
L3
16/2
13-15
Chomsky
FS
språkmodellering
F5
18/2
10-12
16-0041
FS+BM
ordklasstaggning MS 3.1, 10
F6
23/2
10-12
16-0041
FS
XML, operatorer, mer om typemulering DEM
L4
23/2
13-15
Chomsky
FS
XML, mm. Mittkursvärdering
F7
2/3
10-12
16-0041
FS+BM
Inlämning av PM för projektuppgift
"Att skriva vetenskapliga artiklar"
handledning av projektuppgift

L5
2/3
13-15
Chomsky
FS+BM
handledning av projektuppgift

*F8
4/3
10-12
16-0041
BM
INSTÄLLD pga sjukdom
MS 3.2, 12.1
F9
9/3
10-12
16-0041
FS
frågor, projektuppgift, mm.

L6
9/3
13-15
Chomsky
FS
handledning av projektuppgift

F*
11/3
10-12
2-0024
BM
INSTÄLLD

H
21/3
10-16
9-2032
Alla
handledning av slutuppgift efter överenskommelse per e-post
*F
23/3
10-12
16-0041
BM
trädbanker, data-drivna metoder, utvärdering
MS 3.2, 12.1
H
23/3
13-16
9-2032
Alla
handledning av slutuppgift efter överenskommelse per e-post

30/3
18.00

Alla
INLÄMNING AV ARTIKEL
(distribueras till opponenter + lärare)

F10
6/4
13-17
6-0031
BM+FS
PROJEKTREDOVISNING

* Föreläsningar märkta med * är extra föreläsningar som ges på korpuslingvistikkursen om hur man bygger upp en annoterad korpus. Dessa föreläsningar får besökas för de som så önskar. 

Innehåll och arbetssätt

Kursen består av föreläsningar och laborationer. Föreläsningar handlar om programmeringsspråket python och dess användning i korpuslingvistiska tillämpningar, se Filips kurssida. Laborationerna går ut på att lösa korpuslingvistiska uppgifter i programmeringsspråket python. Kursens sista del ger deltagarna färdighet i att skriva en vetenskaplig artikel inom ämnet korpuslingvistik. Dessutom får kursdeltagarna övning i att muntligt presentera sitt arbete samt opponera på en annans.

Kurskrav och examination

Examination sker genom labbrapporter, en muntlig presentation av en lämplig projektuppgift vid någon av de 2 sista föreläsningarna, en skriftlig rapport som beskriver projektuppgiften och en opponering på en annan grupps arbete.

Betyget bestäms av kvalitén på labbarna samt den muntliga presentationen, den skriftliga rapporten av projektarbetet samt av opponeringen på någon annans arbete. Projektarbetet kan genomföras enskilt eller i grupp om max 3 personer. I det senare fallet måste det framgå tydligt vem som har gjort vad. Alla i gruppen bör ta del av den muntliga presentationen liksom opponeringen.

Kurslitteratur

[DEM] Allen B. Downey, Jeffrey Elkner and Chris Meyers (2002) How to Think like a Computer Scientist: Learning with Python Green Tea Press, April 2002 <http://www.thinkpython.com/>

[MS] Manning, Christopher D. and Schütze, Hinrich (1999) Foundations of Statistical Natural Language Processing, Mit Press, May 1999

Kompletterande material kan tillkomma.

Kursvärderingar

Mitkursvärderingen visade i allmänhet positiv syn på hela kursen och på kurslitteraturen. Några efterlyste dock flera labbtillfällen. Av det skälet utökas antal labbar med två. Filip återkommer med datum.

Länkar

The ACL Anthology: A digital archive for research papers in computational linguistics
NLP Resources: tools, dictionaries, corpora, morphological analyzers, taggers, chunkers, parsers