2018. augusztus 30., csütörtök

Re: [KATALIST] Új rendszerhez új zsargont!

Tóvári Judit válasza a Katalist nehézkes reprezentációja miatt elkerülte a figyelmemet, és külön levélként se kaptam meg. Elnézését kérve most írom a válaszomat. Én is egyben csatolok, noha ez nem Katalistbarát dolog, de a rendszer csak nagyon primitíven jelenít meg, és nem alkalmas valójában ilyen mélységű vitára. Mégis, a szakmai közvélemény megérdemli, hogy erről a kérdésről legalább tudomása legyen. A figyelmet mindenkinek köszönöm. Ezért aki tényleg az egész választ szeretné elolvasni, kérem, hogy valahogy próbálja a csatolmányt megjeleníteni, vagy a Katalist Feed formát olvasni.

Részemről a vitát nem egészében a 2016-os tervezet fordítása váltotta ki, mert az hézagpótló, elismerésre méltó teljesítmény.

A fordításban két olyan szóhasználat szerepel, melyet kifogásolok.

Az egyik az „authority", a másik az „authorized" javasolt magyar megfeleltetése.

Példa az elsőre:

The 2009 Statement of Principles replaced and explicitly broadened the scope of the Paris Principles from just textual resources to all types of resources, and from just the choice and form of entry to all aspects of bibliographic and authority data used in library catalogues.

A 2009-ben kiadott alapelv-nyilatkozat felváltotta és határozottan kibővítette a „Párizsi alapelvek" alkalmazási területét a csupán szöveges forrásoktól a források valamennyi típusáig és a könyvtári katalógusokba történő belépés megválasztásától és formájától a bibliográfiai és az autorizált adatok minden aspektusáig.

Példa a másodikra:

Példa a másodikra:

Authorized access points for works and expressions (controlled) embodied in the resource, the title of the manifestation (usually uncontrolled), and the authorized access points for the creators of works, should be included as access points to bibliographic data.

Mint hozzáférési pontokat kell hozzáadni a bibliográfiai adathoz a forrásban (kontrolláltan) megtestesülő művek és kifejezési formák autorizált hozzáférési pontjait, amelyek a megjelenési forma (rendszerint nem kontrollált) címéből és a művek létrehozóinak autorizált hozzáférési pontjaiból állnak.

A 3440-es magyar szabványcsaládban használt besorolási kifejezés annak idején a kézi katalógusok világában született, szükségképpen csak a megjelenítési formát tarthatta szem előtt. Nem foglalkozhatott még a besorolási adatok összefüggéseivel, a besorolási rekord részeit alkotó adatelemekkel, azaz a teljes logikai szerkezettel. Ezért is csak besorolási tételről beszélt.

Nem tárgyalhatta például azt az egyszerű tényt se, hogy mind a rekord, mind annak elemei adatok, adott esetben besorolási adatok, és csak összetettségükben különböznek egymástól. Ezért is beszélünk az érthetőség kedvéért rekordról és a rekord adatelemeiről. Ha majd nem lesznek rekordok, akkor lehet, hogy már tényleg csak adatokról fognak beszélni. Egyelőre a rekord kifejezést bibliográfiai vonatkozásban még az ICP is természetes módon használja, és a MARC-ban elengedhetetlen. A MARC-ot felválta majd más, de ez a tény változatlan marad.

Attól azonban, hogy a besorolási rekorddal összefüggésben a 3440-ben nem tárgyalták a rekord (belső) logikai szerkezetét, az akkori besorolási adat és rekord és a mai is változatlanul angolul „authority data/record".

Az angol névhasználatban az újdonság, hogy megjelent az angol nyelvhasználatban az „authorized" kifejezés. Ez azonban nem azért történt, mert az újabb informatikai lehetőségeknek akartak nyelvileg eleget tenni, hanem azért, hogy ne az egészen általános „standardized", vagy a „normalized" kifejezést használják, amikor arra akarnak utalni, hogy a hozzáférési pontok esetében is az „authority" szabványos voltáról van szó. Ugyanis az „authority" így értelemezendő, és nem úgy, hogy hitelesített. És angolban az „authorized" természetes, endogén nyelvi fejlemény, nem névátvétel vagy hasonló. A latin alapú, román nyelvben ehhez könnyű volt alkalmazkodni, számos más nyelvben pedig nem alakult ki a korai időkben az „authority" fogalmára belső nyelvi kifejezés (mint a magyarban a „besorolási adat" és a németben a „Normdaten"), és ezért természetes volt a névátvétel.

Magyarban azonban a „besorolásiból" lehet igét képezni, az a „besorolt". De mert a „besorolt" konnotációja a fogalmak terjedelmébe való besorolás esetében nem szokásos, (szemben a „besorolással", mely szilárdan őrzi a helyét a fogalmak terjedelmébe való besorolás jelentésével), célszerűbb eltekinteni a használatától.

Magyarán: meg kell oldani, hogy az „authorized" minek feleljen meg magyarul. Azaz valójába nem azt, hogy az „authority" minek feleljen meg, mert az angolul 1966-ban is, és ma is ugyanazt jelenti, ahogy a „besorolási" a 3440-es szabványok alkotásakor is ugyanazt jelentette, mint ma, csak akkor szűkebb keretek között tárgyalták. De jelentésének akkor is, ma is a „fogalom terjedelmébe való besorolást" jelentette.

Azt állítom, hogy teljesen szükségtelen bevezetni az „autorizált" erőltetett nyelvi importját, és nem (elsősorban) nyelvvédő buzgalomból teszem ezt.

Helyette a szövegkörnyezet függvényében használható a „besorolási adat", a „besorolási (adattal képviselt) hozzáférési pont", vagy a „szabványos adat", „szabványos hozzáférési pont" kifejezés, mert az „autorized" jelentése a mi esetünkben se „hitelesített"-t jelent. Ahogy a 2016-os tervezet első fordításában, tapadva az „autorizálás" hagyományos magyar jelentéséhez, félreértésből fordították. Tóvári Juditnak igaza volt, amikor ezt a „hitelesített" fordítási változatot kifogásolta.

A besorolási adat és a hozzáférési pont között az a különbség, hogy a mi vitánk kérdésében más szempontból nevezik meg ugyanazt. (Azért a mi vitánkon belül, mert egészen általánosan bármi lehet hozzáférési pont. A Google különféle rejtélyes algoritmusok szerint tálalt webes világában például semmiféle szabványos, vagy „autorized" hozzáférési pontnak elvileg nem kell lennie, hanem hatalmas salátáskert az egész, melyben bárki kedvére legelészhet.)

És ezért a besorolási adat (alias egykori tételfej), és a besorolási hozzáférési pont között is csak ez a nézőpont különbség. A besorolási adaton, ezen belül a besorolási rekordon ma a teljes logikai szerkezetet, tehát az összes (többek között a MARC mindenki által hallgatólagosan elfogadott szabványos) adatelemét, az azokon belüli összefüggéseket, és a rekordok közötti kapcsolatokat értjük. És egy ilyen adatösszesség (a MARC-rekord) tételfeje, vezérszava, vagy a rekord tárgyszava lesz a „látható" hozzáférési pont a MARC-rekord minden olyan kiegészítőként használt adatával (pl. kronologikus, foglalkozási stb. adat) együtt, amely még szükséges ahhoz, hogy a laikus felhasználó értse, a besorolási adat láttán milyen névről van szó.

Egyetértek Tóvári Judittal: a mű és a kifejezési forma ismérveit a megjelenési forma adataitól függetlenül kell tudni összegyűjteni, ahogy ő írja, a „hitelességüket" (=szabványosságukat) biztosítani és az így szekesztett hozzáférési pontokat összekapcsolni (felhasználni) az információforrás megjelenési formáját leíró bibliográfiai rekordban. Azaz a „hitelessített" („authorized") is szabványosságot, normativitás jelent, és nem „autorizálást". Egészen általános értelemben természetesen minden szabvány hitelesít, de ilyen általánosan ennek nincs sok értelme.

Tóvári Judit példája

Márai Sándor (1900-1989). A gyertyák csonkig égnek (angol)‎

nem azt igazolja, hogy ez egy egykori besorolási adat, ezzel szemben  ma az információforrás „autority rekordja" (vele hozzáférési pontja) nem ez, mert többet kell, hogy tartalmazzon, és ezért „autorizált". De attól, hogy a logikai rekord mindig többet tartalmaz, mint a leegyszerűsített megjelenítési formája, a több adatot tartalmazó hozzáférési pont egyben továbbra is magyarul besorolási adat. És attól, hogy a hozzáférési pontként használandó „authorized" adatban ma több adatelem (egyszerűen: adat) szükséges, csak annyi a változás, hogy a besorolási adatban ma több adatnak kell szerepelnie, hogy megfelelő hozzáférési pont legyen, mint egykor  a kézi katalógusokban. De ettől még nem kell egy másik, rosszul csengő nevet használni hozzá (hogy „autorizát"). Különösen azért nem, mert nem hitelesített, hanem ugyancsak szabványos, tehát besorolási adatról van szó.

Mivel egy teljes cím rekord meglehetősen nagy, példaként földrajzi nevet választottam. Az alábbi MARC21 besorolási rekordban (authority record-ban)

Tag ii $ nz  n #   3.

000  #####nz  22#####n 4500

001  <rekordazonosító>

005  20080713231232.0

008  000103│#n#an│g##ba│#n###│#####│###n#│ana##│####

040 ## $aOSZK $bhu $fGeotaurusz

151 ## $aKulcs$cFejér megye)

551 ## $wg $aFejér megyei kistelepülés

551 ## $wh $aFejér megye

551 ## $wj $aAdonyi kistérség

551 ## $wk $aCsászártanya (Kulcs)

551 ## $wk $aKishalompuszta

551 ## $wn $bRácalmás

551  $wz $a47.05 : 18.9166667

678  $a1950-ben önállósult Rácalmásból

670  $aRévai, 2003

az alábbi rész

Tag ii $ nz  n #   3.

000  #####nz  22#####n 4500

001  <rekordazonosító>

005  20080713231232.0

008  000103│#n#an│g##ba│#n###│#####│###n#│ana##│####

040 ## $aOSZK $bhu $fGeotaurusz

151 ## $aKulcs$cFejér megye)

678  $a1950-ben önállósult Rácalmásból

670  $aRévai, 2003

a szűkebb értelemben vett földrajzinév-rekord (egyben a hozzáférési pont logikai szerkezetét alkotó besorolási rekord). Vagy ha tetszik, e hozzáférési pont mögött meghúzódó teljes metaadat-szerkezet. Ebben valójában felesleges alkalmazni a hagyományosan szükséges $c kiegészítő adatot.

A hozzáférési pont klasszikusan:

Kulcs (Fejér megye)

Ma a hozzáférési pont:

Kulcs

Mivel a Fejér megye, mint önálló entitást megnevező szabványos besorolási adat és egyben hozzáférési pont a normalizált  egyed-reláció-tulajdonság (azaz entity-relation-attribute) szerkezet alapján kezelés jóvoltából kapcsolódik vele össze. Ezért valójában már nem is kellene alkalmazni. A rendszer ui. azzal a képességgel rendelkezik, hogy „ha több hozzáférési pontnak ugyanaz a neve, akkor hozzáférési pontként megjelenítve hozzá kapcsolódik földrajzi nevek esetében a hierarchikusan első partitív egésze". Ez persze algoritmikusan, "if...then" állítás formájában működik. (A „normalizált" itt a relációs kezelőrendszerek speciális fogalma, nem azonos az „authorized" fogalmával.)

A Tóvári Judit szavaival entitás-kapcsolat elvű, informatikai eszközöket használó feldolgozásban a hozzáférési pont sem a tudományrendszerbe, sem a betűrendbe nem sorol be, hanem a bibliográfiai és az authority rekordokban megtestesülő entitásokhoz enged hozzáférést. Igen, mert ebből a szempontból nevezi meg az „authoritry record", azaz a besorolási rekord ama részét, melyet hozzáférési pontként kell használni. Az „authority data", a besorolási adat pedig az adat és az információforrás kapcsolatának szempontjából nevez meg.

Maga Tóvár Judit írja, hogy „a hozzáférési pont egységességét a szabványos szerkezet (köztük a név forrásadatai mint a logikai rekord részei) biztosítják". De a hozzáférési pont a használatban kapcsolódik az információforráshoz, hiszen annak megtalálását teszi lehetővé. És ezt a kapcsolódást bizony létre kell előbb valahogy hozni (ami persze lehet majd automatikus is), és ez a létrehozás nem egyéb, mint besorolás. Enélkül nincs megbízhatóan használható hozzáférési pont. Minden könyvtári osztályozó/indexelő a tanúm rá.

Amit az FRBR, a FRAD, az FRSAD, az LRM stb. képviselnek, annak az semmiben nem mond ellent, hogy magyarul az  „authority" és az „authorized" kifejezést nem „autorizált"-nak fordítjuk, hanem besorolásinak, szabványosnak, szövegkörnyezettől függően. Aminek ellentmond, az az a félreértés, ami az „authorized" angol megjelenését kísérte a szakma egy részében. E félreértés értékes, derűlátásra okot adó alapon született meg, mert arról tanúskodik, hogy továbbra is vannak motivált szakemberek a szakmánkban, akik vigyázó szeműket a korszerűségre és a lépéstartásra vetik. Tisztelettel kérem, vegyék fontolóra az érveimet.

Ungváry Rudolf