Uppsala universitet
Institutionen för lingvistik
Språkteknologiska delområden VT00
Anna Sågvall Hein
Laboration 6b:
Språkgranskning med Scarrie
Anm. Den här laborationen kan
utföras som ett alternativ till Laboration 6: Språkgranskning, som är inriktad
mot stavningskontroll.
Syftet
med denna laboration är att ge Dig insikt om vilka möjligheter och
begränsningar som vidlåder dagens system för datamaskinell språkgranskning
inklusive grammatikkontroll. Typiskt nog är grammatikkontrollfunktionerna
inriktade på att klara av en begränsad repertoar av formella fel. De bygger på
en kombination av någon form av begränsad analys och feligenkänning med hjälp
av särskilda feligenkänningsregler. Analysen kan vara begränsad "på bredden"
så att den bara omfattar delar av meningen (partiell) eller "på
djupet" (constraint grammar, taggning) så att den inte redogör för de
hierarkiska förhållandena i meningen. Så länge man arbetar med ofullständiga
meningsanalyser riskerar man både att missa fel (bristande täckning, recall)
och att ge falska alarm (bristande träffsäkerhet, precision); allt detta på
grund av de många flertydigheter som finns i språket och de många olika
textsammanhang, kontexter, i vilka en feltyp kan visa sig. Det kan sålunda vara
så att ett system som har ambitionen att klara av en viss feltyp inte gör det i
alla kontexter. Grammatikkontrollen bygger på tillgång till ordkontroll, och
ett lexikon med grammatisk information. Kvaliteten på ordkontrollen och de
ordbeskrivningar som den levererar till grammatikkontrollen spelar stor roll
för resultatet.
Uppgiften
är utformad som en utprovning av Scarrieprototypen på två olika texter, en
laborationstext som ges nedan och en som Du väljer själv. Resultatet av de två
delutprovningarna redovisas i den skriftliga rapporten. Rapporten skall ge svar
på de uppgifter som preciseras nedan.
Om
Du har tillgång till Word 2000 uppmuntras Du att också jämföra resultaten med
dem Word 2000:s språkgranskning ger. Den inbegriper den grammatikanalys för
svenska som utvecklats av Lingsoft (SWEGC).
3 Arbetsgång
Öppna
det publika webbgränssnittet till Scarrieprototypen (http://stp.ling.uu.se/~ljo/scarrie-pub/scarrie.html) och bekanta Dig med systemet genom att köra de
testexempel som ges. Granska resultatet.
A Kopiera in
laborationstexten "Drottning Kristinas särkar" i körfönstret och
kontrollera den med både ord- och grammatikkontroll.
Redogör för hur systemet har behandlat
sammansättningarna i texten.
1.
finns i lexikon; lista
dem
2.
har analyserats
tillfredsställande av systemets sammansättningsanalys;
lista dem
3.
har analyserats av
systemets sammansättningsanalys, men det finns viss
tveksamhet;
lista dem. Ange för var och en vari tveksamheten består.
Redogör för rödmarkeringarna.
1.
orden inte finns i
lexikonet; lista dem
2.
orden finns med
ersättningsförslag i lexikonet; lista dem
3.
orden är att betrakta
som fel; lista dem
4.
orden är att betrakta
som stilistiska varianter; lista dem
Redogör för gulmarkeringarna
Vilka olika typer av fenomen har systemet valt att
gulmarkera? Ge exempel på de olika typerna.
Redogör för grönmarkeringarna
1. Finns det något falskt alarm?
2. Om så är fallet, vad tror Du att det beror på?
3. Beskriv den lingvistiska kontexten och vad Du tror har
hänt.
4. Omforma uttrycket så att övergenereringen försvinner.
Kör om det och redogör för resultatet.
5. Omforma uttrycket så att felet blir adekvat. Kör om
det och redogör för resultatet.
6. Hur skulle Du välja att åtgärda problemet?
B Välj en egen text
på c:a 500 ord och kör den.
Gå igenom
resultatet på samma vis som laborationstexten.
C Överkurs för Dig
som har tillgång till Word2000
Kopiera in
laborationstexten "Drottning Kristinas särkar" i Word 2000 och låt
systemet granska den. Jämför resultatet med det Du fått genom att köra texten i
Scarrie. Redogör för likheter och skillnader både vad gäller ordkontroll och
grammatikkontroll (inkl. textkontroll).
Redovisning
lämnas i form av skriftlig rapport i Annas postfack eller via mail som ett
worddokument el. ev. i pdf-format el. ps-format senast den 30 mars.
Rapporten
ska behandla det som tas upp i uppgiftsbeskrivningen ovan. Ta också med Din
egen text. Följ i övrigt numreringen ovan under de respektive rubrikerna.
Rapporten kommer att ges
betyget godkänd, väl godkänd eller underkänd utifrån fullständighet, konkretion
och språklig kvalitet. Överkursen tillsammans med en i övrigt väl genomförd
laboration ger Väl godkänd. Överkursen är dock inget krav för VG.
Lycka till!
Se
föreläsningsanteckningar från F8 och litteraturlistan på kursens hemsida.
_____________________________________________________________________
6 Laborationstext
Drottning Kristinas särkar funna
Femtiofem brunsmutsiga tygbitar kanske inte verkar vara mycket för världen, men när textilfragmenten är drygt 300 år gamla och härrör från drottning Kristinas kläder ser det bruna trasorna genast mycket intressantare ut.
Denna historieskatt har nu kommit i Livrustkammarens vård efter att Liselott Lübeck-Eriksson med en eldsjäls oanade krafter och energi fått en kvinnoorganisation att skänka 100 000 kronor till projektet, som kallas Säkra Stinas särkar. Igår levererade Meta Berger från Swedish Women's Educational Association i Los Angeles den stora checken.
- Drottning Kristina har varit mitt stora intresse ända sedan tioårsåldern och det här är fantastiskt. Hon, drottningen, ger mig alltid då och då ett uppdrag, berättar Liselott Lübeck-Eriksson som gläds över att projektet \"Drottning Kristinas fragment\" nu kommit igång.
Textilfragmenten tillvaratogs 1965 vid den senaste öppningen av drottning Kristinas grav i Peterskyrkan i Rom. De unika textilbitarna togs in till Sverige med Vatikanens tillstånd, men försvann sedan i glömskans förgängelse under ett trettiotal år i ett magasin. När de återfanns låg de missfärgade och trötta i bruna kuvert och behövde vård snarast.
- Fragmenten var upptejpade och det bryter ned tyget. Därför måste tejpen bort och materialet göras rent, berättar projektledare Eva-Sofie Ernstell som håller i konserveringen. Sedan kommer all textil att fotograferas både av oss och Elisabeth Olsson som sponsrar projektet.
Redan nu finns mikroskopbilder av tygerna och där kan man se att trådarna lindats med metall.
- Vi kommer att försöka ta reda på hur man tillverkade de här trådarna, vilka olika färger som fanns i tyget och vilken vävteknik man brukat, säger Eva-Sofie Ernstell på Livrustkammaren.
En del fragment är så stora att det går att se vad de föreställer utan föregående vaskning. Dit hör en förgylld krona som klippts till och sannolikt funnits på många ställen av tyget och på gamla svartvita bilder från gravöppningen kan man få ytterligare ledtrådar.
Där syns en tämligen bastant drottning i svårt förstörda kläder, plagg som nu går att rekonstruera.
Hur textilproven ser ut efter rengöring och konservering kommer museet att visa för hela världen på sin hemsida. Där skall man från och med mitten av december steg för steg kunna följa arbetets gång.