Korpuslingvistik VT04
Nyheter
- senaste ändring:
- 040127: mejla förslag på fördjupningsuppgiften till <joerg@stp.ling.uu.se> (senast 2002-01-30)
- 040127: lab-uppgifterna för lab 2 (deadline: 2004-02-12)
- 040127: Mittkursutvärdering (tor 05 feb, L3)
- 040127: lab-uppgifterna för lab 3 (deadline: 2004-02-19)
- 040128: OH-bilderna för F1-F4 finns
- 040128: lab-uppgifterna för lab 4
- 040204: uppgifterna i lab 5 stryks (handledning av fördjupningsuppgiften istället)
- 040217: OH-bilder från F5-F8 finns
- 040217: korrigerade deadlines för projektuppgifterna
presentationer: 09/03!
inlämning av rapporten: 19/03!
- 040217: Kursutvärdering (tor 04 mar, L7)
- 040224: Föreläsning F11 stryks och ersätts med en extralaborationstillfälle för att jobba med fördjupninguppgiften!
- 040315: ny inlämningsdeadline för slutrapporten: 2004-03-26
Schema
| När | Var | Vad | Litteratur |
|---|---|---|---|
| tis 20 jan, 14-16 | 16-0041 | F1: Introduktion | CL kap.1 |
| tor 22 jan, 10-12 | 9-1016 | F2: Korpustyper, datainsamling | CL kap. 2 & 3 |
| tor 22 jan, 14-16 | L1: Översikt om fördjupningsuppgifterna | ||
| tis 27 jan, 10-12 | 16-0041 | F3: Korpuskodering, grundläggande textverktyg | CL kap. 2 |
| tis 27 jan, 14-16 | 16-0041 | F4: Korpusannotering, SGML, XML, Tipster, XML-verktyg | CL kap. 2, TEI, IBR |
| tor 29 jan, 14-16 | L2: GNU textverktyg och annat | ||
| tis 03 feb, 14-16 | 16-0041 | F5: Kvalitativa & kvantitativa analyser | CL kap. 3 & 6 |
| tor 05 feb, 14-16 | L3: Konkordansverktyg, korpussökning (Mittkursutvärdering) | ||
| tis 10 feb, 10-12 | 16-0041 | F6: Spåkvetenskaplig korpuslingvistik | CL kap. 4 |
| tis 10 jan, 14-16 | 16-0041 | F7: Språkteknologisk korpuslingvistik | CL kap. 5, AB, MS 4, 10, 16 |
| tor 12 feb, 14-16 | L4: XML-verktyg | ||
| tis 17 feb, 10-12 | 16-0041 | F8: Maskininlärning, data-drivna metoder | CL 5, MS 10, 16 |
| tor 19 feb, 14-16 | L5: Fördjupningsuppgift: handledning | ||
| tis 24 feb, 10-12 | 16-0041 | F9: Översättning och parallella korpusar | CL 5.7, MS 13 |
| tis 24 feb, 14-16 | 16-0041 | F10: Fördjupningsuppgift: framsteg och diskussion | |
| tor 26 jan, 14-16 | L6: Fördjupningsuppgift: handledning | ||
| tis 02 mar, 10-12 | 16-0041 | Extralab: Fördjupningsuppgift: handledning | |
| tor 04 mar, 14-16 | L7: Fördjupningsuppgift: handledning (Kursutvärdering) | ||
| tis 09 mar, 10-12 | 16-0041 | F12: Fördjupningsuppgift: presentationer | |
| tis 09 mar, 14-16 | 16-0041 | F13: Fördjupningsuppgift: presentationer |
Examination
Examination sker genom inlämning av labbrapporter, en muntlig presentation av en lämplig fördjupningsuppgift vid en av de sista 2 föreläsningar och en rapport som beskriva fördjupningsuppgiften.Samtliga labbrapporter måste vara godkända. Betyget bestäms av den muntliga presentationen (40%) och den skriftliga rapporten om fördjupningsuppgiften (60%). Fördjupningsuppgiften är skräddarsydda för att bearbeta i gruppor (se instruktionerna). Det måste vara tydligt vem som har gjort vad. Alla i gruppen bör också ha en del i den muntliga presentationen.
| tid | personer | tema |
|---|---|---|
| 10:15-10:55 | Terese, Marie, Magdalena, Annica | datorstödd språkinlärning med korpusmaterial |
| 11:15-11:35 | Yoko, Matthias | andraspråksinlärning för ryska och japanska |
| 11:40-11:50 | Annette | felsägningsdatabas |
| 14:15-14:45 | Filip, Fredrik, Adam | e-post filtrering |
| 15:00-15:40 | Johann, Patrik, Johannes, Stefan | ordpredicering för chat-språk |
Kurslitteratur
- [CL] McEnery, Tony & Andrew Wilson, 2001
- Corpus linguistics, 2nd edition. Edinburgh: Edinburgh University Press.
Kompletterande litteratur och läsrekommendationer
Länkar
- Corpus Linguistics (McEnery & Wilson - komplement till kursboken)
- Korpuslingvistik på Internet (Ylva Berglund)
- Corpus Linguistics (Michael Barlow)
- Introduction: Corpus Linguistics (W3-Corpora)
- British National Corpus
- International Corpus of Learner English - ICLE
- Uppsala Student English Corpus (USE)
- Språkbanken
- Projekt Runeberg
- The Oxford Text Archive
- WebCorp
- Web Concordancer
- Michigan Corpus of Academic Spoken English
- devoted to corpora (länkar)
- Text Encoding Initiative
- CES (Corpus Encoding Standard) och XCES (CES for XML)
- A short XSLT tutorial
- www.zvon.org (XML tutorial | DTD tutorial | XSLT tutorial | Tutorial för reguljära uttryck)
- The Alphabetic Soup
- Character sets
- CWB (Corpus Work Bench)
- LDC: annotation
