2011. október 10., hétfő

[KATALIST] A Google és a Murányi Vénusz

Alább szó szerint idézem Kerekes Pál blogbejegyzését.
( http://konyvkonnektor.hu/?p=1186 )

Elgondolkodtató. Különösen annak fényében, amiről az elmúlt hetekben
volt szó a listán...

Büki Balázs
könyvtári informatikus

A Google és a Murányi Vénusz
2011. október 8. Kerekes Pál

A magyar könyvek rosszul járnak a Google Books-on.

A Google e-könykereskedése (eBookstore) tegnaptól elérhetővé tett
jelentős magyar nyelvű állományt. A bővítés is folyamatos a projktleírás
szerint. Ez nagyszerű és természetesen üdvözlendő.

A Google azt tűzte ki célul, hogy szinte a világ teljes nyomtatott
könyvtermését digitalizálja. A projekt része, hogy nem csak elérhetővé,
de kereshetővé is teszi a szövegeket. A művekben való böngészés túlmutat
a szokásos bolti forgalmazáson, és természetesen a hagyományos könyvtári
szolgáltatásokon.

Az előnyök mellett szólni kell a hátrányokról is.

A legegyszerűbb, ha az ember kézbe vesz valóságosan egy könyvet, és
teszteli, hogyan is néz ki az adott mű a Google virtuális állományában.

Az előző bejegyzésemben már említettem, hogy első látásra is feltűnő,
hogy a címek és szerzők nevei gyakran tévesen szerepelnek a web-es
címlapon. Ez alapkérdés. Nyilván a gépileg szkennelt címlapokból generál
a rendszer webes felvezetést: ha a szkennelés hibás, a borító is az
lesz. Vörösmarty minden munkáiból így lesz mindeu munkái, Petőfi Sándor
életrajza helyett Petőfi Sándor électrjza.

A szkennelésen kívül leküzdhetetlen akadálynak tűnik az á és az ő betű
is. Petőfi például gyakran S?andor Petőfi-ként jelenik meg. Pech, ha
éppen Gyulai Pál Petőfi életrajzáról van szó, így mindkét érintett
személy csúnya bakival látható (P?al Gyulai). Ugyanakkor van, amikor
hibátlanul jelenítik meg halhatatlan költőnk nevét.

Látható az is, hogy nem tud következetes lenni a Google a szerzők
keresztnév és családi név sorrendiségének kérdésében sem. Teljesen
véletlenszerűen szerepelnek a változatok, hol a keresztnév van elől, hol
a vezetéknév. Nem tudtam rájönni, hogy a szkennelt oldal névvariációját
miért cseréli fel a rendszer. Miért nem teszi be egy táblázatba úgy,
ahogy a címlapon olvasható. Ha katalógizálásról lenne szó, akkor
érthető, hogy szelektál a szoftver, hiszen ott minden esetben a szerző
vezetéknevének kell elől állnia. De itt gépi keresés van, teljesen
mindegy, milyen sorrendben jönnek a nevek, a lényeg, hogy ott legyenek,
és helyes formában, mégha az angol ábécében nem szereplő betűk is
alkotják a név egyes elemeit.

De nézzünk konkrétan egy könyvet. Gyöngyösi István: Mársal társalkodó
Murányi Vénus. Az 1674-ben íródott mű 1767-es Landerer kiadása alapján
vetem össze a virtuális verziót. A Google könyv is a Landerer kiadás
alapján lett szkennelve, ez kiderül már a könyv felvezetéséből. Maga a
cím majdnem pontos, egy ékezethiba még elmegy (Vénus helyett Venus). A
szerző neve is helyes. Az meglepő, hogy megadja az oldalszámot: 110 lap
a terjedelem. Csakhogy ebben a könyvben nincs oldalszámozás. Még a
hagyományos őrszó segíti az olvasót a tájékozódásban. (A lap alján
olvasható a következő oldal első egy-két szava.). Mit tehettem,
megszámoltam kézzel: stimmel, címlappal és egy latin nyelvű versezettel
a végén pontosan 110. Valami azért megbicsaklik: ha a könyvet a
monitoron olvassuk, látjuk, hogy a 104. oldalon fejeződik be. Na, most
akkor hova tűnt hat oldal? Azért fonák: 110 oldal terjedelmet ad meg a
Google, és maga a gépi lapozás hat oldallal kevesebb. Ha nem lapozunk,
hanem a csúszkát használjuk, megáll a skála a 104. lapnál. Nem tűnt fel,
ebből az látszik: személyes ellenőrzés nincs, gépek számolnak. Mindegyik
a maga módján.

Nagyobb hiba – és ez talán magyarázat lehet az eltűnt oldalakra –, hogy
az elektronikus könyv nem az elején kezdődik. Kimarad a címlap és az
ajánlás. Szegény hajdani szerző, ha a Google-on keresztül küldte volna
meg művét a szponzoroknak, lemaradt volna a támogatásról, hiszen a művet
maguknak a szereplőknek ajánlja egy egész oldalban. A végén ez áll:
„Tekéntetes és Nagyságos Gróf Rimai Szétsi Mária asszonynak. Az ő
Nagysága szerelmes Házastársának. Az én kegyelmes Úramnak, és
Asszonyomnak. Egészséges hoszszú életet kívánok alázatossan."

Az olvasó a szkennelt oldalt látja, ebből kiviláglik, hogy elég rozzant
példányból dolgoztak. Sok helyütt az oldalak javítottak, ragasztottak. A
címlap helyett a bevezető az első oldal. Ott nagy stemplivel rajta:
Staatsbibliothek München. Az utolsó oldalon másik pecsét: Erdélyi
Múzeum, 1788.

Kalandos példány. Nem lett volna egyszerűbb egy magyar könyvtári
állományból venni a kötetet?

_______________________________________________
Katalist mailing list
Katalist@listserv.niif.hu
https://listserv.niif.hu/mailman/listinfo/katalist