2014. január 11., szombat

Re: [KATALIST] szavazas - KIT Hirlevel (ETO vs. targyszavak)

PS: Egy kis önkritikát azért gyakorolnék.
Egyrészt hivatkoztam arra, hogy egyes anyagokat magáncégek digitalizálnak. (pl. Arcanum) Ezek elérése, feltárása pontosan ugyanolyan "problémát" okoz a könyvtáraknak, mint a keresőmotoroknak. (Nincs forja a könyvtáraknak ebben se anyagilag, sem hozzáférhetőség-feltárás szempontjából.)
Másrészt elsősorban szakmai anyagokra, háttéranyagokra és "szürke irodalomra" hivatkoztam. Azért tisztában vagyok vele én is, hogy ezek jelentős része úgy 2006 óta már csak digitális formában jelenik meg a különböző intézmények honlapjain. (Kivéve a bizalmas terjesztésűnek szánt dokumentumokat, amelyek bizonyos átfutási idővel 5-10 év után jelennek meg a szakkönyvtárakban és/vagy levéltárakban.) S nem a könyvtáraknál jelennek meg első ízben. Itt is felmerül azonban 2 probléma, ha már a Google az alapfelvetés. Ad 1. Olyan szinten el vannak néha ezek "dugva", hogy beütve a keresőbe a Google észre sem fogja venni. De ha ez a probléma záros határidőn belül meg is oldódik (sejtéseim szerint igen!)... Ad 2. Egyelőre még ezek a keresőmotorok elég távol állnak attól, mint említettem, hogy képesek legyenek ilyen típusú, komolyabb (!) anyagokat tartalmilag feltárni, akár tárgyszavak szintjén, akár ETO-jelzetek formájában. (90%-ban fals FŐ kulcsszavakat dobna ki, ide a rozsdás bökőt) 


2014. január 11. 2:12 Zoltán Kovács írta, <zkovacszoltan86@gmail.com>:
Tisztelt Mikulás Gábor!

Ungváry Rudolfnak címzett levelére reagálva.

Lehet nagy hülyeségeket fogok írni, ebben az esetben nézzék el amatőrségemet/kezdőségemet.

De, ha jól értem a felvetését:

Szerintem még egy digitalizált (pl. beszkennelt stb.) dokumentum esetében is vannak kétségeim a Google keresőmotorjának alkalmazásával kapcsolatban.

Rendben, Agatha Christie-t valószínűleg be tudja sorolni a Google. Esetleg a Klorofil-A-ról szóló kutatást is a MTA Balaton Limnológiai Intézet (Tihany) esetében is. De mit kezd egy olyannal, hogy a Magyar Kormány XY.rendelete értelmében a BIT (ez a Balatoni Intézkedési Terv fedőneve, de esetek 90%-ban csak BIT) 9/a. pontjának megfelelő témában végzett kutatási jelentés. Most mondtam egy házszámot. (BIT 9/a-nak utána ne nézzen most senki. Mert lehet egy 10 oldalas dologra utaltam.:-) Csak vannak 130 oldalas ilyen típusú dokumentumok is.) De lehet egy ilyen jelentés 30 különféle dologgal foglalkozik, emellett a harmada légi felvétel és statisztikai adat, végén mondjuk egy bekezdésnyi összefoglalóval.

(S nem 1 db ilyen dokumentumról van szó. Némelyik pedig akár 700 oldalas.)

Ezzel mit fog kezdeni a Google keresőmotorja? Mert egy szakképzett tartalmi feltárással foglalkozó szakember, ha nem is 2 másodperc alatt, de 3-20 perc alatt be tudja sorolni és tárgyszavazza. De mi a Google szerint a kulcsszó??? Súlyozás alapján mit fedne le?

Kétlem, hogy a lényeget. Lehet túl specifikusnak érezni a kérdést. De nemcsak a szépirodalomból, tankönyvekből meg A szürke ötven árnyalatából áll a dokumentumok világa. És most egy 100%-ig digitalizált (beszkennelt stb.) dokumentumról beszélünk, amelyet a Google szabadon tár fel.(Ráadásul a digitalizálás egy részét is magáncégek végzik. Ld. Arcanum. Akik nem valószínű, hogy örülnének, ha a fizetős Hidrológiai Közlöny elmúlt 50 évében a Google szabadon "garázdálkodhatna".)

Nyilván ez a tendencia. De azért még rengeteg könyv van, amely bizonyos okokból kimaradt ebből a körből. Így közel sem lenne teljes a lefedettség. Sőt.

Egy még nem digitalizált, még "könyvformátumú könyvről" vagy spirálozott kiadványról elég kevés információt fog kisajtolni a Google.

Leginkább Mándy Gábor felvetésével értek egyet. Hogy a kettő egymás élése mellett. (Amely még tartani fog teszem azt 5-10 évig min.) A Google "bevonása", (alá)segítése lehet egy épkézláb erőfeszítés a már tartalmilag feltárt anyagok deszkriptorainak egy exportált dokumentumban való közzétételével.

Tisztelettel:

Kovács Zoltán