A hipertext számítógépes nyelvészeti alkalmazási lehetőségei
Hipertextuális szövegértelmezés
- eredeti szöveg elolvasása
- kapcsolatok, kapcsolódási pontok keresése
(kulcsszavak kiválasztása,
konkordanciák
keresése, szövegrészletek kiválasztása)
- háttértudás hozzákapcsolása a szöveghez,
"együttolvasás"
Azt hiszem, Emerson írta valahol, hogy a könyvtár holtakkal teli varázsverem. Ám azok a holtak újjászülethetnek, feltámadhatnak, ha felütjük lapjaikat. [...] Mert mi önmagában egy könyv? Valós tárgy a valós tárgyak világában. Holt jelek sora. Aztán feltűnik a megfelelő olvasó, s életre kelnek a szavak -- vagy helyesebben a szavak mögötti költészet, hisz maguk a szavak csupán jelek --, és feltámad előttünk a szó. (Borges 2002:7-8)
A vers- és szövegértelmezésben használt modell ("jéghegy" paradigma)
Általánosan megfogalmazva kutatásunk tárgyát, az alapfeladat természetes nyelvű szövegek feldolgozása számítógépes támogatással, a konkrét feladat pedig a szövegértelmezés támogatása
hipermediális, "webes" felületen hozzáférhető interaktív konkordancia-szótárak
kifejlesztésével.
Kutatásaink szempontjából a természetes nyelvű szövegek feldolgozásának alapproblémája úgy fogalmazható meg, hogy egy természetes nyelvű szöveg csak "a jéghegy csúcsa", önmagában nem értelmezhető -- ehhez további háttérismeretekre van szükség, amit a következő modellel ábrázolhatunk:
- értelmezett szöveg, "a jéghegy csúcsa"
- intertextuális rétegek (a szöveg megértéséhez szükséges tudás)
- "hipertextuális rétegek (a szöveg értelmezéséhez szükséges "hozzáadott" tudás)
- korpusz: kiválasztott szövegek / szövegrészletek, "a jéghegy felszín alatti régetei" (pl. digitális szövegek, képek stb.)
- elsődleges szövegek (pl. az adott szerző művei, a kortárs szerzők művei, az adott kultúra alapművei, például a Biblia, a görög-római és kelta mitológia, Shakespeare művei stb.)
- másodlagos szövegek (pl. informatív referátumok, tömörítvények, szemlék stb.)
- metakognitív tudás (kortörténeti leírások; kritikák, értékelések stb.)
- konkordancia szótár, "index" (hipertextuális kapcsolatok kialakítása a szövegek között)
- vertikális kapcsolatok: kulcsszavak és konkordanciák rendszerezése (pl. a konkordanciák csoportosítása adott jelentésmezőkben;
MINTA: SZIMBÓLUMTÁR)
- horizontális kapcsolatok: a konkordanciákhoz az eredeti szöveg hozzákapcsolása (MINTA: VERSTÁR)
A természetes nyelvű szövegek értelmezési problémájának egyik lehetséges megoldása tehát olyan komplex
hipertext struktúra kialakítása a szövegek köré, amely a megértéshez és értelmezéshez szükséges legfontosabb információkat és kapcsolatokat tartalmazza. Ebben az interaktív konkordancia-szótárak mintegy "hidat" képeznek az értelmezendő szövegek és az értelmezéshez szükséges háttérismereteket modellező korpusz(ok) között.
A szövegértelmezést ilyen értelemben tekinthetjük egyfajta tanulási folyamatnak is. Ennek során fokozatosan egy "tudásbázist" alakítunk ki, amelyben az információk visszakeresését a feldolgozott szövegek konkordancia szótára alapján tudjuk végrehajtani.
Ha a költészetben döntő szerephez jutnak a
paradigmatikus viszonyok,
akkor ez annyit is jelent, hogy az irodalmi mű valamely másik, az olvasói tapasztalatban már előzetesen meglevő szövegre, illetve szövegrészre utalhat vissza. [...]
Amennyiben valóban helytálló e föltevés, igazat kell adnunk az anagrammákat vizsgáló Saussure-nek avagy a szürrealistáknak: a szavak mögött is szavak vannak. (Szegedy-Maszák 1992:122)
A kutatási cél
Kutatásaink célja webes felületen hozzáférhető hipertext (hipermédia) alapú "tudásbázisok" kialakítása és folyamatos bővítése -- mind tartalmi szempontból, mind a tudásbázisban kialakított hipertext kapcsolatok, "linkek" számát illetően.
A kifejlesztendő hipertext tudásbázisok a következő főbb komponensekből tevődnek össze:
- természetes nyelvű és multimediális korpuszok,
- interaktív konkordancia-szótárak,
- a tudásbázis "belépési" pontjait képező alapszövegek,
- a tudásbázis interaktív használatát lehetővé tevő hipertextuális kapcsolatok,
- valamint interaktív keresési és statisztikai kiértékelő felületek.
A kutatás kivitelezésének terve
A kutatási célként kitűzött hipertext (hipermédia) alapú tudásbázisok kialakításának lépései nagy vonalakban a következők:
- a hipertextuális szövegértelmezéshez szükséges háttérismereteket modellező (digitális) korpuszok kialakítása és folyamatos bővítése; a hipertext alapú korpuszok struktúrájának megtervezése és webes megvalósítása;
- a korpuszok interaktív konkordancia-szótárának kialakítása;
- a vizsgálandó szövegek kiválasztása; a kiválasztott szövegek témájának megfelelő kulcsszórendszer kialakítása; a korpuszok és a konkordancia-szótárak folyamatos, célzott bővítése a kulcsszavakat hasonló jelentésben (és/vagy szövegkörnyezetben) tartalmazó természetes nyelvű és multimediális szövegekkel és ezekből származó konkordanciákkal;
- hipertext struktúra szervezése a kiválasztott szövegek köré a megfelelő kulcsszavak konkordanciáin keresztül;
- a különböző forrásokból származó szövegekből felépített komplex hiperszöveg szövegszerűségének (koherenciájának stb.) ellenőrzése, és szükség esetén értelmező megjegyzések, kommentárok beillesztése;
- kutatási hipotézisek felállítása és tesztelése; a kialakított tudásbázisok vizsgálata különböző szempontok szerint, például statisztikai mutatók definiálásával és vizsgálatával.
A kutatás várható eredményei
A kutatási projekt fő eredményei a fentiekben részletezett hipertext (hipermédia) alapú tudásbázisok, amelyek magukban foglalják a következőket:
- metaadatrendszer és hipertext alapú korpusz;
- nyilvánosan, webes felületen hozzáférhető
interaktív konkordancia szótárak (min. 3);
- Java alapú interaktív kereső és szövegstatisztikai elemző felület.
Emellett tervezzük a kutatási eredményeket összefoglaló monográfia kiadását is.
Az elképzelések bemutatása egy rövid példán keresztül
A Radnóti Miklós
verseiből készített konkordancia szótár
(*)
egy részlete:
A fenti konkordanciákat kiegészítettük más szövegekből vett további idézetekkel és egy szócikkben
foglaltuk össze:
*
Boda István Károly - Porkoláb Judit: Interaktív konkordancia szótár
Radnóti Miklós verseiből. (http://www.inf.unideb.hu/~bodai/concord2/concord.html)
Boda István Károly & Porkoláb Judit, 2010