Uppsala universitet
Institutionen för lingvistik
Språkteknologiska delområden VT00

Anna Sågvall Hein

 

 

Laboration 6b: Språkgranskning med Scarrie

 

Anm. Den här laborationen kan utföras som ett alternativ till Laboration 6: Språkgranskning, som är inriktad mot stavningskontroll.

 

Innehåll

  1. Syfte
  2. Uppgift
  3. Arbetsgång
  4. Redovisning
  5. Referenser
  6. Laborationstext

1 Syfte

Syftet med denna laboration är att ge Dig insikt om vilka möjligheter och begränsningar som vidlåder dagens system för datamaskinell språkgranskning inklusive grammatikkontroll. Typiskt nog är grammatikkontrollfunktionerna inriktade på att klara av en begränsad repertoar av formella fel. De bygger på en kombination av någon form av begränsad analys och feligenkänning med hjälp av särskilda feligenkänningsregler. Analysen kan vara begränsad "på bredden" så att den bara omfattar delar av meningen (partiell) eller "på djupet" (constraint grammar, taggning) så att den inte redogör för de hierarkiska förhållandena i meningen. Så länge man arbetar med ofullständiga meningsanalyser riskerar man både att missa fel (bristande täckning, recall) och att ge falska alarm (bristande träffsäkerhet, precision); allt detta på grund av de många flertydigheter som finns i språket och de många olika textsammanhang, kontexter, i vilka en feltyp kan visa sig. Det kan sålunda vara så att ett system som har ambitionen att klara av en viss feltyp inte gör det i alla kontexter. Grammatikkontrollen bygger på tillgång till ordkontroll, och ett lexikon med grammatisk information. Kvaliteten på ordkontrollen och de ordbeskrivningar som den levererar till grammatikkontrollen spelar stor roll för resultatet.

 


2 Uppgift

Uppgiften är utformad som en utprovning av Scarrieprototypen på två olika texter, en laborationstext som ges nedan och en som Du väljer själv. Resultatet av de två delutprovningarna redovisas i den skriftliga rapporten. Rapporten skall ge svar på de uppgifter som preciseras nedan.

 

Om Du har tillgång till Word 2000 uppmuntras Du att också jämföra resultaten med dem Word 2000:s språkgranskning ger. Den inbegriper den grammatikanalys för svenska som utvecklats av Lingsoft (SWEGC).

 

 

3 Arbetsgång

Öppna det publika webbgränssnittet till Scarrieprototypen (http://stp.ling.uu.se/~ljo/scarrie-pub/scarrie.html) och bekanta Dig med systemet genom att köra de testexempel som ges. Granska resultatet.

 

A Kopiera in laborationstexten "Drottning Kristinas särkar" i körfönstret och kontrollera den med både ord- och grammatikkontroll.

 

Redogör för hur systemet har behandlat sammansättningarna i texten.

1.                                            finns i lexikon; lista dem

2.                                            har analyserats tillfredsställande av systemets sammansättningsanalys;

   lista dem

3.                                            har analyserats av systemets sammansättningsanalys, men det finns viss

   tveksamhet; lista dem. Ange för var och en vari tveksamheten består.

 

Redogör för rödmarkeringarna.

1.                                            orden inte finns i lexikonet; lista dem

2.                                            orden finns med ersättningsförslag i lexikonet; lista dem

3.                                            orden är att betrakta som fel; lista dem

4.                                            orden är att betrakta som stilistiska varianter; lista dem

 

Redogör för gulmarkeringarna

Vilka olika typer av fenomen har systemet valt att gulmarkera? Ge exempel på de olika typerna.

 

Redogör för grönmarkeringarna

1.      Finns det något falskt alarm?

2.      Om så är fallet, vad tror Du att det beror på?

3.      Beskriv den lingvistiska kontexten och vad Du tror har hänt.

4.      Omforma uttrycket så att övergenereringen försvinner. Kör om det och redogör för resultatet.

5.      Omforma uttrycket så att felet blir adekvat. Kör om det och redogör för resultatet.

6.      Hur skulle Du välja att åtgärda problemet?

 

B Välj en egen text på c:a 500 ord och kör den.

 

Gå igenom resultatet på samma vis som laborationstexten.

 

 

C Överkurs för Dig som har tillgång till Word2000

 

Kopiera in laborationstexten "Drottning Kristinas särkar" i Word 2000 och låt systemet granska den. Jämför resultatet med det Du fått genom att köra texten i Scarrie. Redogör för likheter och skillnader både vad gäller ordkontroll och grammatikkontroll (inkl. textkontroll).


4 Redovisning

Redovisning lämnas i form av skriftlig rapport i Annas postfack eller via mail som ett worddokument el. ev. i pdf-format el. ps-format senast den 30 mars.

 

Rapporten ska behandla det som tas upp i uppgiftsbeskrivningen ovan. Ta också med Din egen text. Följ i övrigt numreringen ovan under de respektive rubrikerna.

 

Rapporten kommer att ges betyget godkänd, väl godkänd eller underkänd utifrån fullständighet, konkretion och språklig kvalitet. Överkursen tillsammans med en i övrigt väl genomförd laboration ger Väl godkänd. Överkursen är dock inget krav för VG.

 

Lycka till!


5 Referenser

Se föreläsningsanteckningar från F8 och litteraturlistan på kursens hemsida.

_____________________________________________________________________

6 Laborationstext

 

Drottning Kristinas särkar funna

 

Femtiofem brunsmutsiga tygbitar kanske inte verkar vara mycket för världen, men när textilfragmenten är drygt 300 år gamla och härrör från drottning Kristinas kläder ser det bruna trasorna genast mycket intressantare ut.

Denna historieskatt har nu kommit i Livrustkammarens vård efter att Liselott Lübeck-Eriksson med en eldsjäls oanade krafter och energi fått en kvinnoorganisation att skänka 100 000 kronor till projektet, som kallas Säkra Stinas särkar. Igår levererade Meta Berger från Swedish Women's Educational Association i Los Angeles den stora checken.

- Drottning Kristina har varit mitt stora intresse ända sedan tioårsåldern och det här är fantastiskt. Hon, drottningen, ger mig alltid då och då ett uppdrag, berättar Liselott Lübeck-Eriksson som gläds över att projektet \"Drottning Kristinas fragment\" nu kommit igång.

 

Textilfragmenten tillvaratogs 1965 vid den senaste öppningen av drottning Kristinas grav i Peterskyrkan i Rom. De unika textilbitarna togs in till Sverige med Vatikanens tillstånd, men försvann sedan i glömskans förgängelse under ett trettiotal år i ett magasin. När de återfanns låg de missfärgade och trötta i bruna kuvert och behövde vård snarast.

- Fragmenten var upptejpade och det bryter ned tyget. Därför måste tejpen bort och materialet göras rent, berättar projektledare Eva-Sofie Ernstell som håller i konserveringen. Sedan kommer all textil att fotograferas både av oss och Elisabeth Olsson som sponsrar projektet.

 

Redan nu finns mikroskopbilder av tygerna och där kan man se att trådarna lindats med metall.

- Vi kommer att försöka ta reda på hur man tillverkade de här trådarna, vilka olika färger som fanns i tyget och vilken vävteknik man brukat, säger Eva-Sofie Ernstell på Livrustkammaren.

En del fragment är så stora att det går att se vad de föreställer utan föregående vaskning. Dit hör en förgylld krona som klippts till och sannolikt funnits på många ställen av tyget och på gamla svartvita bilder från gravöppningen kan man få ytterligare ledtrådar.

Där syns en tämligen bastant drottning i svårt förstörda kläder, plagg som nu går att rekonstruera.

 

Hur textilproven ser ut efter rengöring och konservering kommer museet att visa för hela världen på sin hemsida. Där skall man från och med mitten av december steg för steg kunna följa arbetets gång.