UPPSALA UNIVERSITET : Inst. f. lingvistik och filologi : STP : Datorerna
Uppsala universitet
Hoppa över länkar

Nyheter
Lösenord, grupper
Ordbehandling
Köra utifrån, ssh, scp
TeX, LaTeX
Utskrifter
Datorpost
WWW
Disk
Programmering
Lingvistiska program
KOM

Lingvistiska program

NLTK

NLTK (Natural Language Toolkit) är en serie programmoduler och korpusar för forskning och undervisning i NLP i Python. Se mer här.

Diverse program

Inget nytt program har lagts till denna lista sen 1999, så ta det för vad det är.

[Brill] [CLEARS] [HUM] [JFLAP]

Brill

Eric Brill har skrivit en taggare som inte verkar ha nåt mer specifikt namn än "Rule Based Tagger". Se dess anvisningar om upphovsrätt i /local/ling/brill/RBT/COPYRIGHT. Den utgår lite fånigt från att man står i en viss katalog när man ska använda den, så man kan göra så här för att använda den:

Argumenten är LEXICON YOUR-CORPUS BIGRAMS LEXICALRULEFILE CONTEXTUALRULEFILE. Det gör det behändigt att ge argument som är filer i den katalogen, t.ex. "LEXICON.BROWN" som lexikon, men för andra filer, såsom dina egna, t.ex. själva korpusen, innebär det att du måste ge ett fullständigt filnamn.

Mer information finns i katalogen /local/ling/brill/RBT/Docs/.

CLEARS

På Linguistlistan i augusti 1996 presenterade Holger Maier programmet CLEARS, a freely available education and research tool for computational semantics. Det gjordes under ett projekt FraCaS som varade 1994–1996. Programmet har inte uppdaterats sedan 1996 och den sida om programmet som det refereras till i dokumentationen finns inte kvar, så det verkar lite dött. Men det går att köra i alla fall, och finns installerat här. Det är skrivet i Prolog och Tcl/Tk.

Anvisningar

Kör det med "clears". Det tar ett tag att ladda upp medan en massa grojs laddas in, och sen följer man instruktionerna. Man kör det inifrån Sicstus Prolog, så avsluta med "halt." (inklusive punkten).

Det finns en användarhandledning som ligger som /local/fracas/userman.ps.

HUM - Concordance and textual analysis package

This is the "hum" concordance and textual analysis package done by Bill Tuthill when he was at Berkeley (1981). A package of programs for literary and linguistic computing, emphasizing the preparation of concordances and supporting documents. Both keyword in context and keyword and line generators are provided, as well as exclusion routines, a reverse concordance module, formatting programs, a dictionary maker, and lemmatization facilities. There are also word, character, and digraph frequency counting programs, word length tabulation routines, a cross reference generator, and other related utilities. The programs are written in the C programming language.
Det är som sagt skrivet 1981, och därför ganska stenåldersaktigt. Finns att hämta på ftp://crl.nmsu.edu/CLR/tools/concordances/. De olika komponenterna i det är separata program som man kombinerar från sitt skal. I original är det tänkt att man ska ha dessa program för sig nånstans och de har en egen sektion av man-sidorna för sin dokumentation. Men jag tyckte de hade för "allmängiltiga" namn, och har istället lagt till "hum-" i början på varje sådant kommando. Så skriv "hum-" följt av TAB för att se vad det finns för sådana kommandon, och bli inte förvirrad av att "man hum-kwic" (t.ex.) talar om kommandot som om det bara hette "kwic".

Automatateori - JFLAP

JFLAP är ett program med vilket man kan designa och simulera Turingmaskiner och andra automater som används i automatateori. Det startas med "jflap". Mer information finns i en README-fil som följer med programmet och på programmets officiella sida. Exempelmaskiner att ladda in finns i /local/jflap/examples/.