 |
ISBN til elektronisk utgave: 82-8088-317-7

Persistent URL: http://www.ub.uib.no/elpub/2004/h/516001/Hovedoppgave.pdf
Format:

Samandrag
Denne hovudfagsoppgåva tek utgangspunkt i bussruteopplysningssystemet
BussTUC – eit databasesystem med eit grensesnitt basert på innputt i from
av naturleg språk, det vil seie norske og engelske setningar. Systemet
vart utvikla i tilknyting til NTNU i løpet av 1996 og er i dag
tilgjengeleg via Internett og SMS. Oppgåva tek føre seg problemområde det
framleis gjenstår å få bukt med i tilknyting til sjølve grensesnittet og
språkprosesseringa; I første rekke problem relaterte til disambiguering.
Ulike løysingstilnærmingar vert presenterte og enkelte av desse prøvde ut
i praksis. Fokus vert i stor grad retta mot parsingdelen av systemet: Den
opprinnelege parsaren, ein innebygd prologparsar som arbeider topp-ned med
tilbakesporing, vert bytta ut med ein kartparsar. Målet er å finna ut om
ein kartparsingmodul kan føra til betre resultat med omsyn til fleirtydige
og ufullstendige innputt, samt om det er mogleg å få han like effektiv som
den opprinnelege parsingmodulen.
Nøkkelord: Språkprosessering, ambiguitet,
kartparsing, naturlegspråklege grensesnitt, ekstraposisjonsgrammatikk,
kategorialgrammatikk, databasegrensesnitt baserte på naturleg språk
Abstract
The point of departure for this thesis is the bus route information system
BusTUC – a database system with an interface based on input in natural
language, i.e. sentences in Norwegian and English. The system was
developed in connection to NTNU during 1996 and is now available to the
public both on the Internet and per SMS. The thesis discusses problem
areas tied to the interface and the language processing part of the system
which still remain to be taken care of; first and foremost problems
related to disambiguation. Different potential solutions are presented and
some of these tried out in practice. The main focus is directed towards
the parsing part of the system. The original parser, a built-in Prolog
parser working top-down with backtracking, is replaced by a chart parser.
The goal is to make a parsing module that leads to better results with
regard to ambiguous input, and that works as effective as the original
parser.
Key words: Natural Language Processing (NLP),
ambiguity, chart parsing, Natural Language Interfaces (NLI), extraposition
grammar, categorial grammar, Natural Language Interfaces to Databases (NLIBD)
|