Örültem a cikk közreadásának. Valóban rávilágít egy nagyon fontos fejlődési tendenciára, és nem lebecsülendő, hogy ezt mindenkinek érthető formában, egy világlap hasábjain.
Egyben módot ad arra, hogy vele összefüggésben megemlítsem a ma még csak kialakuló félben levő névterek jelentőségét.
A névterek egyik jelentősége (a nyelvi kulturális örökség feldolgozott, strukturált közreadása mellett) éppen az, hogy jobban hasznosítható keresést biztosíthatnak az interneten. Bizonyos értelemben egyszerre folytatói a besorolási adatok állományainak, és a hagyományos (nyomtatottan közreadott) értelmező szótáraknak, csak összehasonlíthatatlanul gazdagabb szemantikai szerkezetben.
A névtereken belül maguk a nevek a tárgyi (elsődleges) adatok. A rájuk vonatkozó adatok ebben az esetben másodlagos vagy metaadatok (a szöveges meghatározásoktól kezdve névtípusokon át a statisztikai tényadatokig). Velük részletesen tagolható a névállomány. Például a földrajzi névállomány tipizálásával eleve előre feldolgozott forrásállományok (ún. nyelvi korpuszok) keletkeznek. Ilyen például a víznevek, ezen belül a vízfolyásnevek, ezen belül a magyarországi, ezen belül a Heves megyei víznevek összessége, melyeknek a környezetvédelemben kitüntetett jelentősége van.
Amikor a neveket a kereséshez keresőszóként felhasználjuk, a kapott találatokban ezek a nevek lesznek a metaadatok Ezek jellemzik ugyanis a talált dokumentumok tartalmát. Az egyes korpuszokat keresőszavakként használva tehát maguk a talált dokumentumállományok is válogatott forrásállományt (dokumentumkorpuszokat) fognak alkotni. Például az összes Heves megyei vízfolyásnévvel és a „vízszennyezettség" keresőszóval találatok egymással megfeleltethető Heves megyei halmazát.
Ungváry Rudolf
From: Katalist [mailto:katalist-bounces@listserv.niif.hu] On Behalf Of Péter Mátyás Eötvös
Sent: Monday, March 09, 2015 1:53 PM
To: KATALIST (KATALIST@LISTSERV.NIIF.HU)
Subject: [KATALIST] Cikk az ember által épített adatbázisok szükségességéről
Kedves Listaolvasó Kollégák!
Kényszerű betegszabadságon voltam, és már kínomban nem tudtam mit kitalálni, olvastam, olvastam, olvastam - akár lázasan is.
Véletlenül akadtam rá erre a cikkre (már nem emlékszem hol, hisz linkről linkre ugrál az ember), ami azt fejtegeti, hogy pusztán a google-lel nem lehet célt érni, az ember (könyvtáros) által épített adatbázisok nélkül nem lehet boldogulni. Azért a Washington Post nem bulvárlap kategória. :-)
http://www.washingtonpost.com/posteverything/wp/2015/02/17/i-tried-to-use-the-internet-to-do-historical-research-it-was-nearly-impossible/
Ezek szerint – közhiedelemmel ellentétben – a mi munkánkat nem tudja elvégezni a „homok" (mikrochip, processzor – mert póriasan fogalmazva homokból készül). Remélem minél tovább így marad ez, és szükség lesz ránk. A cikket meg jól esett olvasni.
Természetesen a fenti pár sor magánvélemény.
Eötvös Péter Mátyás