UPPSALA UNIVERSITET : Inst. f. lingvistik och filologi : STP
Uppsala universitet
Hoppa över länkar

kurshemsida

Introduktion till språkteknologi • MD • HT 2008

Labb 1 • Frasstrukturgrammatik

Länkar till: (1) Natural Language Processing --- Analyzing Text with Python and the Natural Language Toolkit (Steven Bird, Ewan Klein, and Edward Loper), se Building Feature Based Grammars, och (2) filer som man kan utgå från för uppgiften.

Syfte

Skriv en grammatik för ett fragment av engelska eller svenska där ni åtminstone i någon mån gör någon egen insats under minst två av följande rubriker: kategoritilldelning, valensbindning, kongruens och kasusstyrning! Diskutera hur bra era sätt att hantera dessa saker är. (När det gäller grammatikformalisering så är det ju få saker som kan lösas perfekt.)

Laborationen utgör främst en övning och examination inriktad mot följande lärandemål (det bör vara tydligt och uppenbart):

(LM 6) redogöra för hur en särdragsgrammatikformalism kan användas för att formalisera kategoritilldelning, valensbindning, kongruens och kasusstyrning;

(LM 7) hantera något datorverktyg för arbete med formella grammatiker.

Allmänna ramar

Uppgiften kan lösas i grupper om max två studenter och skall redovisas i en (maskinskriven och prydlig) rapport och muntligen i klassrummet. Rapporten ska lämnas in på papper till Mats Dahllöf.

Komma igång med NLTK:s särdragsformalism

NLTK:s särdragsformalism är ett verktyg som kan användas, men välj gärna något annat.

De två givna filerna visar hur du kan komma igång och parsa en ordsekvens utifrån en grammatik:

linux> python testfrombook.py
(S[]
  (NP[NUM='sg'] (PropN[NUM='sg'] Kim))
  (VP[NUM='sg', TENSE='pres']
    (TV[NUM='sg', TENSE='pres'] likes)
    (NP[NUM='pl'] (N[NUM='pl'] children))))

(Svarstiden kan vara ganska lång.)