UPPSALA UNIVERSITET  
Inst. f. lingvistik och filologi Lärare: Mats Dahllöf.
Uppsala universitet
Hoppa över länkar
Kursplan

Materialmapp

Språkteknologi
och datorlingvistik


Algoritmer för syntaxanalys. VT 2008.

Nytt tillfälle 080604. Meddela mig snarast, senast dagen före 10.00, vilka duggor ni vill göra om den 4/6!

Gör kursutvärdering: formulär!

[Kurssida. Nytt utdelat material samlas i Materialmappen.]

Övningsduggor. Lite om Javakoden. NYTT 080515: Dependensparsing. Problemen med ShiftReduce fixade och exemplen korrigerade.

 Schema och planering (dag, tid, lokal, tema) [per 2008-07-30]
 1 2008-05-05 10-12 Eng7/0015 Introduktion. 
 2 2008-05-06 10-12 Eng7/0015 Recursive descent, tillståndsmaskiner. 
 3 2008-05-06 13-15 Lab. --- 
 4 2008-05-08 10-12 Eng7/0015 Recursive descent, tillståndsmaskiner, forts. 
 5 2008-05-08 13-15 Lab. --- 
 6 2008-05-13 10-12 Eng7/0015 Shift-reduce (bottom-up) 
 7 2008-05-13 13-15 Lab. --- 
 8 2008-05-15 10-12 Eng7/0015 Vänsterhörnsparsing (Dugga på recursive descent.) 
 9 2008-05-15 13-15 Lab. --- 
 10 2008-05-20 10-12 Eng7/0015 Dependensparsing (Dugga på shift reduce.) 
 11 2008-05-20 13-15 Lab. --- 
 12 2008-05-22 10-12 Eng7/0015 Chartparsing (Dugga på vänsterhörn.) 
 13 2008-05-22 13-15 Lab. --- 
 14 2008-05-27 10-12 Eng7/0015 Chartparsing, forts. (Dugga på dependensparsing.) 
 15 2008-05-27 13-15 Lab. --- 
 16 2008-05-29 10-12 Eng6/0023 Avslutning. (Dugga på chartparsing.) 
 17 2008-05-29 13-15 Lab. --- 
 18 2008-06-04 10-12 Eng9/2029. Extra uppsamling. Omduggor. 

Arbetssätt och examination

Arbetet på kursen och bearbetningen av materialet kommer främst att bestå i att vi implementerar grundläggande och viktiga parsingalgoritmer. Undervisningen kommer främst att utgå från Java, men studenter som är kunniga i och intresserade av något annat programspråk får gärna använda det.

Kursen examineras genom följande:

Laborationsuppgifter

Studenter och lärare fastställer tillsammans lämpliga val av uppgifter. Arbetsfördelningen vid samarbete skall klargöras. (Arbetsuppgifterna skall visa att studenten kan implementera denna typ algoritmer, samt testa och dokumentera sådana implementationer.) Titta på litteraturen, tidigare års kurssidor (06, 07) och sök på nätet tidigt på kursen för att komma fram till lämpliga uppgifter.

Inlämnade rapporter skall innehålla väldokumenterad kod. Om Java används, skall koden följa gängse konventioner och dess dokumentation skall bygga på Javadoc (se på utdelade exempel!). Om Prolog används, skall koden och dess dokumentation följa Covingtons instruktioner. Dessutom skall illustrativa körningsexempel ges. Laborationsrapporterna skall vara språkligt korrekta och ha ett typografiskt korrekt och tilltalande utseende. Titta på exempel. LaTeX-användning rekommenderas starkt. De skall inlämnas utskrivna på papper.

Kursens labbuppgifter tillåter alltså en hög grad av individuell anpassning. Betyg sätts utifrån de skriftliga provens utfall och en helhetsbedömning av de uppgifter som lämnats in. Deras svårighetsgrad och hur väl de utförts kommer att vägas in. Dokumentation är viktigt.

Kurslitteratur

Dahllöf, M., 1989, “En lexikonorienterad parser för svenska” (M.A. thesis), Göteborg University, Dept of Computational Linguistics. (Det som handlar om UCP, s. 2-9.)

Dahllöf, M., 2005, A Chart Parser in Prolog, föreläsningsanteckningar.

Earley, J. 1970, An efficient context-free parsing algorithm.

Hellwig, P. 2003, Natural Language Parsers, A “Course in Cooking”, Universität Heidelberg.

Grune D. och Ceriel J.H. Jacobs, 1990, Parsing Techniques - A Practical Guide.

Mellish, C., P. Whitelock och G. Ritchie, 1994, Techniques in Natural Language Processing. (PostScript) (länk), Department of AI, University of Edinburgh. [Kapitel 9-13. Tidigare kapitel bra repetition.]

Nivre, J. och Nilsson, J. (2003) Three Algorithms for Deterministic Dependency Parsing (finns här).

Nivre, J. och Scholz, M. (2004) Deterministic Dependency Parsing of English Text (finns här).

Pereira, F. och S. M. Shieber, 2002, Prolog and Natural-Language Analysis (Millenial reissue), Microtome Publishing. [Kapitel 6. Tidigare kapitel bra repetition.]

Striegnitz, K., m.fl. (2003) Algorithms for Computational Linguistics.

Sågvall Hein, Anna & Starbäck, Per: A Test Version of the Grammar Checker for Swedish, Deliverable 6.5.1. (Det som handlar om UCP, s. 4-9.)

Ytterligare material kan tillkomma.