Lingvistiska program
NLTK
NLTK (Natural Language Toolkit) är en serie programmoduler och korpusar för forskning och undervisning i NLP i Python. Se mer här.
Diverse program
Inget nytt program har lagts till denna lista sen 1999, så ta det för vad det är.
[Brill] [CLEARS] [HUM] [JFLAP]
Brill
Eric Brill har skrivit en
taggare som inte verkar ha nåt mer specifikt namn än "Rule Based Tagger".
Se dess anvisningar om upphovsrätt i
/local/ling/brill/RBT/COPYRIGHT.
Den utgår lite fånigt från att man står i en viss katalog när man ska
använda den, så man kan göra så här för att använda den:
- cd /local/ling/brill/RBT/Bin_and_Data
- ./tagger diverse argument
Argumenten är LEXICON YOUR-CORPUS BIGRAMS LEXICALRULEFILE CONTEXTUALRULEFILE. Det gör det behändigt att ge argument som är filer i den katalogen, t.ex. "LEXICON.BROWN" som lexikon, men för andra filer, såsom dina egna, t.ex. själva korpusen, innebär det att du måste ge ett fullständigt filnamn.
Mer information finns i katalogen
/local/ling/brill/RBT/Docs/.
CLEARS
På Linguistlistan i augusti 1996
presenterade
Holger Maier programmet CLEARS, a freely available education and
research tool for computational semantics
. Det gjordes under ett
projekt FraCaS
som varade 1994–1996. Programmet har inte uppdaterats sedan 1996 och den
sida om programmet som det refereras till i dokumentationen finns inte
kvar, så det verkar lite dött.
Men det går att köra i alla fall, och finns installerat här.
Det är skrivet i Prolog och Tcl/Tk.
Anvisningar
Kör det med "clears". Det tar ett tag att ladda upp medan en massa grojs laddas in, och sen följer man instruktionerna. Man kör det inifrån Sicstus Prolog, så avsluta med "halt." (inklusive punkten).
Det finns en användarhandledning som ligger som
/local/fracas/userman.ps.
HUM - Concordance and textual analysis package
This is the "hum" concordance and textual analysis package done by Bill Tuthill when he was at Berkeley (1981). A package of programs for literary and linguistic computing, emphasizing the preparation of concordances and supporting documents. Both keyword in context and keyword and line generators are provided, as well as exclusion routines, a reverse concordance module, formatting programs, a dictionary maker, and lemmatization facilities. There are also word, character, and digraph frequency counting programs, word length tabulation routines, a cross reference generator, and other related utilities. The programs are written in the C programming language.Det är som sagt skrivet 1981, och därför ganska stenåldersaktigt. Finns att hämta på ftp://crl.nmsu.edu/CLR/tools/concordances/. De olika komponenterna i det är separata program som man kombinerar från sitt skal. I original är det tänkt att man ska ha dessa program för sig nånstans och de har en egen sektion av man-sidorna för sin dokumentation. Men jag tyckte de hade för "allmängiltiga" namn, och har istället lagt till "hum-" i början på varje sådant kommando. Så skriv "hum-" följt av TAB för att se vad det finns för sådana kommandon, och bli inte förvirrad av att "man hum-kwic" (t.ex.) talar om kommandot som om det bara hette "kwic".
Automatateori - JFLAP
JFLAP är ett program med vilket man kan designa och
simulera Turingmaskiner och andra automater som används i
automatateori. Det startas med "jflap". Mer information finns
i en README-fil som följer med
programmet och på programmets officiella
sida.
Exempelmaskiner att ladda in finns i /local/jflap/examples/.
