2014. január 11., szombat

Re: [KATALIST] szavazas - KIT Hirlevel (ETO vs. targyszavak)

Nagyot fordult a világ attól, hogy „tisztességes könyvtáros nem használja az internetet” (hallottam egyetemi informatikus-könyvtáros képzésem során, 1997-ben). Mára a hagyományos könyvtárosi tevékenység szinte minden egyes elemére hihetetlen tőkeerejű versenytársak érkeztek, s az általunk megszokott eljárásokat gyakran kikerülve sokszor meglepő módszerekkel automatizálnak. A feltárásban is.

 

Ilyen példákat Ungváry Rudolf is mondott régente óráin: pl. egy dokumentum nyelvének szinte 100%-osan pontos meghatározása a betűsorból alul ill. felül kilógó karakterek arányából. De mára van már gépi tartalomelemzés, fordítás, absztraktkészítés, melyet nap mint nap használhatunk – mint a porszívót (amely hasznos eszköz, de azért kézi vezérlést igényel :-). (Móka: „A pápa halála megrendítette egész Olaszországot” mondatot az automatikus tartalomelemző földrengésnek értelmezte, ahol az áldozatok száma: 1 fő.) Ugyanakkor lássuk: van már önjáró porszívó is, ahogyan egyre hatékonyabb automatikus tartalomelemző eszközök is. További infó pl. www.kereses.blog.hu)    

 

Semmi okom kételkedni abban, hogy a Google (vagy hasonló vállalkozások) az automatizált visszakeresés mellett az automatizált tartalomfeltárásban is egyre jobban vitézkednek.

 

A tömeges automatizálás átlagos minőségű tömegtermékeket hoz (bár a fejlesztések rohamosak), mely a legtöbb használónak általában megfelelő. Mi, könyvtárosok aligha tudunk e középkategóriában versenyezni. Annál inkább a „kézi” munkát igénylő, testre szabottabb információs és közösségi-szociális feladatok ellátásában, mely azonban a feltárás mellett az ügyfélismeretre fókuszál (amiről jellemzően nagyon keveset beszélünk – nem úgy a versenytársaink!). A személyre szabott információszolgáltatást az üzleti ügyfelek meg is fizetik általában -- nem könyvtárhoz fordulva. Maradnak a nem üzleti, de testreszabott szolgáltatást igénylő használók, mint célcsoport, akik viszont általában véve(!) alacsonyabb igénnyel jelentkeznek.

 

A másik lehetőséget Mándy Gábor is említette: együttműködés a profitérdekelt szolgáltatókkal. Ha ügyesek vagyunk, és a lehetséges partnernek szüksége van rá, együttműködhetünk abban, hogy egy tizedes osztályozást (mondjuk az ETO-t) mondjuk a Google alá toljuk.

 

De azon is tűnődjünk el, hogy a Google-féle vállalkozás jóval több és többféle dokumentumot keres vissza, mint könyvek összessége, olyanokkal amelyekkel mi jóval kevésbé foglalkozunk (blogok, képek, hang- és videó stb.). A hagyományos könyvtári dokumentumok arányaiban egyre kisebb – bár tudományos és üzleti szempontból fontos – hányadét képviselik az emberek által fogyasztott információnak. Tehát ahol szolgáltatásunkat kínálhatjuk, az a terület egyre inkább zsugorodik.

 

Ne hagyományos könyvtári dokumentumok piacán, hanem a teljes információpiacon is vizslassuk részesedésünket. S keressük piaci résünket J Szóval, van tere a töprenkedésnek és a mielőbbi cselekvésnek.

 

Szerintem van még lehetőségünk.

 

Mikulás Gábor

 

 

 

From: katalist-bounces@listserv.niif.hu [mailto:katalist-bounces@listserv.niif.hu] On Behalf Of Zoltán Kovács
Sent: Saturday, January 11, 2014 3:43 AM
To: katalist@listserv.niif.hu
Subject: Re: [KATALIST] szavazas - KIT Hirlevel (ETO vs. targyszavak)

 

Így kb. nem képesek helyettesíteni az IKR-eket (ahogy Ön fogalmazott) szerintem, egyelőre.

 

2014. január 11. 3:39 Zoltán Kovács írta, <zkovacszoltan86@gmail.com>:

PS: Egy kis önkritikát azért gyakorolnék.
Egyrészt hivatkoztam arra, hogy egyes anyagokat magáncégek digitalizálnak. (pl. Arcanum) Ezek elérése, feltárása pontosan ugyanolyan "problémát" okoz a könyvtáraknak, mint a keresőmotoroknak. (Nincs forja a könyvtáraknak ebben se anyagilag, sem hozzáférhetőség-feltárás szempontjából.)
Másrészt elsősorban szakmai anyagokra, háttéranyagokra és "szürke irodalomra" hivatkoztam. Azért tisztában vagyok vele én is, hogy ezek jelentős része úgy 2006 óta már csak digitális formában jelenik meg a különböző intézmények honlapjain. (Kivéve a bizalmas terjesztésűnek szánt dokumentumokat, amelyek bizonyos átfutási idővel 5-10 év után jelennek meg a szakkönyvtárakban és/vagy levéltárakban.) S nem a könyvtáraknál jelennek meg első ízben. Itt is felmerül azonban 2 probléma, ha már a Google az alapfelvetés. Ad 1. Olyan szinten el vannak néha ezek "dugva", hogy beütve a keresőbe a Google észre sem fogja venni. De ha ez a probléma záros határidőn belül meg is oldódik (sejtéseim szerint igen!)... Ad 2. Egyelőre még ezek a keresőmotorok elég távol állnak attól, mint említettem, hogy képesek legyenek ilyen típusú, komolyabb (!) anyagokat tartalmilag feltárni, akár tárgyszavak szintjén, akár ETO-jelzetek formájában. (90%-ban fals FŐ kulcsszavakat dobna ki, ide a rozsdás bökőt) 

 

2014. január 11. 2:12 Zoltán Kovács írta, <zkovacszoltan86@gmail.com>:

 

Tisztelt Mikulás Gábor!

 

Ungváry Rudolfnak címzett levelére reagálva.

Lehet nagy hülyeségeket fogok írni, ebben az esetben nézzék el amatőrségemet/kezdőségemet.

De, ha jól értem a felvetését:

Szerintem még egy digitalizált (pl. beszkennelt stb.) dokumentum esetében is vannak kétségeim a Google keresőmotorjának alkalmazásával kapcsolatban.

Rendben, Agatha Christie-t valószínűleg be tudja sorolni a Google. Esetleg a Klorofil-A-ról szóló kutatást is a MTA Balaton Limnológiai Intézet (Tihany) esetében is. De mit kezd egy olyannal, hogy a Magyar Kormány XY.rendelete értelmében a BIT (ez a Balatoni Intézkedési Terv fedőneve, de esetek 90%-ban csak BIT) 9/a. pontjának megfelelő témában végzett kutatási jelentés. Most mondtam egy házszámot. (BIT 9/a-nak utána ne nézzen most senki. Mert lehet egy 10 oldalas dologra utaltam.:-) Csak vannak 130 oldalas ilyen típusú dokumentumok is.) De lehet egy ilyen jelentés 30 különféle dologgal foglalkozik, emellett a harmada légi felvétel és statisztikai adat, végén mondjuk egy bekezdésnyi összefoglalóval.

(S nem 1 db ilyen dokumentumról van szó. Némelyik pedig akár 700 oldalas.)

Ezzel mit fog kezdeni a Google keresőmotorja? Mert egy szakképzett tartalmi feltárással foglalkozó szakember, ha nem is 2 másodperc alatt, de 3-20 perc alatt be tudja sorolni és tárgyszavazza. De mi a Google szerint a kulcsszó??? Súlyozás alapján mit fedne le?

Kétlem, hogy a lényeget. Lehet túl specifikusnak érezni a kérdést. De nemcsak a szépirodalomból, tankönyvekből meg A szürke ötven árnyalatából áll a dokumentumok világa. És most egy 100%-ig digitalizált (beszkennelt stb.) dokumentumról beszélünk, amelyet a Google szabadon tár fel.(Ráadásul a digitalizálás egy részét is magáncégek végzik. Ld. Arcanum. Akik nem valószínű, hogy örülnének, ha a fizetős Hidrológiai Közlöny elmúlt 50 évében a Google szabadon "garázdálkodhatna".)

Nyilván ez a tendencia. De azért még rengeteg könyv van, amely bizonyos okokból kimaradt ebből a körből. Így közel sem lenne teljes a lefedettség. Sőt.

Egy még nem digitalizált, még "könyvformátumú könyvről" vagy spirálozott kiadványról elég kevés információt fog kisajtolni a Google.

Leginkább Mándy Gábor felvetésével értek egyet. Hogy a kettő egymás élése mellett. (Amely még tartani fog teszem azt 5-10 évig min.) A Google "bevonása", (alá)segítése lehet egy épkézláb erőfeszítés a már tartalmilag feltárt anyagok deszkriptorainak egy exportált dokumentumban való közzétételével.

Tisztelettel:

Kovács Zoltán