KATALIST Feed: [KATALIST] Megjelent a Code4Lib Journal 58. száma

Tisztelt Katalist!

Örömmel számolok be róla, hogy megjelent a Code4Lib Journal legújabb, 58. száma.

The Code4Lib Journal
Issue 58, 2023-12-04
https://journal.code4lib.org/

Rengeteg nagyszerű cikk-javaslatot kaptunk aminek az eredménye
rekordhosszúságú, 16 tanulmányból álló tartalomjegyzék. Ebből most
csak az utolsót emelem ki, amit egy ismert genti (Belgium) könyvtári
programozó, Patrick Hochstenbach és még nevesebb szerzőtársai, Ruben
Verborgh és Herbert Van de Sompel jegyeznek. Van de Sompelt néhány éve
az amerikai Colatiion for Networked Information életmúdíjjal
jutalmazta. A ceremónián felvázolt egy víziót a tudomány-kommunikáció
- részben a magyar származású kanadai tudós Stevan Hernad, részben az
internet létrehozója, Tim Berners-Lee akkoriban indított és az egész
internet decentralizálását célzó Solid projektétől ihletett - új
típusú megközelítéséről, mely az adat gazdájának és nem a platformnak
biztosít teljes kontrolt [1]. Hochstenbach jelen cikke (mely a doktori
kutatásának része) a vízió egy részének gyakorlatba ültetéséről szól,
és megmutatja, hogy az utóbbi években kidolgozott, így immár
rendelkezésre álló kommunikációs protokollok, adatcsere szabványok és
szoftverek segítségével hogyan lehet elérni, hogy az adat a
létrehzozóhoz, vagy tulajdonoshoz, ne pedig egy konkrét
szolgáltatáshoz kötődjön (szemben a nagy cégek szolgáltatásaival).
Nagyon élvezetes cikk, remélem más szoftverfejlesztők is ihletet
merítenek belőle új típusú működési modellek kidolgozására.

Részletes tartalomjegyzék magyar összefoglalókkal (a cikkek angol nyelvűek):

Editorial
Brighid M. Gonzales
https://journal.code4lib.org/articles/18007

A Code4Lib Journal 58. száma arra hoz példákat, hogy a könyvtárak
hogyan hoznak létre új műszaki megoldásokat, hogyan használják ki a
meglévőket valamint a mesterséges intelligenciát a könyvtári munka
javára. Ebben a negyedévben soha nem látott számú cikk-javaslat
érkezett be, és az így létrejött szám 16 tanulmányt tartalmaz, amelyek
részletesen bemutatják azokat az egyedi és innovatív technológiai
projekteket, amelyeken a könyvtárak napjainkban dolgoznak.

Enhancing Serials Holdings Data: A Pymarc-Powered Clean-Up Project
Minyoung Chung and Phani Chaitanya Pendyala
https://journal.code4lib.org/articles/17839

Following the recent transition from Inmagic to Ex Libris Alma, the
Technical Services department at the University of Southern California
(USC) in Los Angeles undertook a post-migration cleanup initiative.
This article introduces methodologies aimed at improving irregular
summary holdings data within serials records using Pymarc, regular
expressions, and the Alma API in MarcEdit. The challenge identified
was the confinement of serials' holdings information exclusively to
the 866 MARC tag for textual holdings.

To address this challenge, Pymarc and regular expressions were
leveraged to parse and identify various patterns within the holdings
data, offering a nuanced understanding of the intricacies embedded in
the 866 field. Subsequently, the script generated a new 853 field for
captions and patterns, along with multiple instances of the 863 field
for coded enumeration and chronology data, derived from the existing
data in the 866 field.

The final step involved utilizing the Alma API via MarcEdit,
streamlining the restructuring of holdings data and updating nearly
5,000 records for serials. This article illustrates the application of
Pymarc for both data analysis and creation, emphasizing its utility in
generating data in the MARC format. Furthermore, it posits the
potential application of Pymarc to enhance data within library and
archive contexts.

Az Inmagicról az Ex Libris Alma rendszerre való közelmúltbeli átállást
követően a Los Angeles-i University of Southern California (USC)
technikai szolgáltatási részlege adattisztításba kezdett. A cikk olyan
módszereket mutat be, amelyek célja a periodika-rekordok szabálytalan
állományadatainak javítása Pymarc, reguláris kifejezések, a MarcEdit
valamint az Alma API segítségével. A kihívást az jelentette, hogy az
állományadatokat kizárólag a 866-os MARC mezőn belül rögzítették. A
megoldás érdekében a Pymarc és a reguláris kifejezések segítségével
elemezték és azonosították a tartalmi adatokon belüli különféle
mintákat, ami az 866-os mezőbe ágyazott bonyolult értékek árnyaltabb
megértéséhez vezetett. Ezt követően a szkript - 866-os mezőből kinyert
adatokból - egy új 853-as mezőt generált a címek és minták számára,
valamint a 863-as mező több példányát a kódolt felsorolási és
kronológiai adatok számára. Az utolsó lépés az Alma API MarcEdit-en
keresztül történő felhasználása volt, amely egyszerűsítette az
állományadatok átstrukturálását, és közel 5000 periodikarekordot
frissített. A cikk bemutatja a Pymarc-nak az adatelemzésben és az
adatok létrehozásában való alkalmazását. Felveti továbbá a Pymarc
lehetséges alkalmazását a könyvtári és levéltári adatok javításával
kapcsolatban.

The Use of Python to Support Technical Services Work in Academic Libraries
Maria Collins, Xiaoyan Song, and Sherri Schon
https://journal.code4lib.org/articles/17701

Az egyetemi könyvtárak műszaki szolgáltató szakemberei szilárdan
elkötelezettek a digitális átalakulás mellett, és olyan technológiákat
és adatszolgáltatási gyakorlatokat alkalmaznak, amelyek hatékonyabbá,
megbízhatóbbá és skálázhatóbbá teszik munkájukat. A fejlődő
rendszerek, az állandóan változó munkafolyamatok és a nagyméretű
adatok kezelése a technikai szolgáltatások állandó szereplői. Az ilyen
környezetben való hatékony munkavégzés képességének fenntartása
magában foglalja a folyamatos tanulási ciklusok elfogadását és az új
készségek beépítését - ami valójában azt jelenti, hogy az embereket
más módon kell képezni, és újra kell gondolni, hogy a könyvtárak
hogyan nyújtanak támogatást a műszaki szolgáltatások munkájához. A
cikk a Python technikai szolgáltatási környezetben történő használatát
vizsgálva mikro-szemszögből mutatja be ezt a területet. A szerzők két
felmérést és tizenegy utólagos interjút készítettek megvizsgálandó,
hogyan használják a Pythont a technikai szolgáltatások munkájának
támogatására az egyetemi könyvtárakban, valamint hogy jobban
megismerjék meg a képzés és a szervezeti támogatás helyzetét az
egyetemi könyvtári közösségben. A kutatáshoz végzett felmérések és
interjúk azt mutatják, hogy a kultúra és a szervezeti támogatás tágabb
kontextusának megértése nagy jelentőséggel bír a technikai
szolgáltatások e tanulási térének bonyodalmainak bemutatásában.
Következésképpen ez a cikk a technikai szolgáltatások
készségfejlesztését mikro- és makroszinten egyaránt befolyásoló
témákkal foglalkozik.

Pipeline or Pipe Dream: Building a Scaled Automated Metadata Creation
and Ingest Workflow Using Web Scraping Tools
Matthew Krc and Anna Oates Schlaack
https://journal.code4lib.org/articles/17932

A FRASER Digitális Könyvtár 2004 óta biztosít ingyenes hozzáférést a
gazdaság-, pénzügy- és banktörténettel, valamint a Federal Reserve
Systemmel kapcsolatos kiadványokhoz és archívumokhoz. A FRASER
digitális eszközkezelő rendszerét támogató agilis webfejlesztő csapat
elindított egy, az amerikai kormányzati forrásokból származó
dokumentumok és metaadatok internetes gyűjtésének automatizálását
célzó kezdeményezést. Ezen tartalmak weboldalakon jelennek meg, de a
metaadatok és a dokumentumlinkeket API-n vagy más szemantikus webes
technológián keresztül nem érhetőek el, így az automatizálás kihívást
jelent. A FRASER Recurring Downloads projekt harmadik féltől származó
szoftverek, felhőszolgáltatások és egyedi Python-kód kombinációjának
felhasználásával a korábban munkaigényes napi folyamatot olyan
metaadat-előállítási és -beviteli munkafolyamattá alakította át, amely
minimális emberi beavatkozást vagy minőségellenőrzést igényel. A cikk
áttekintést nyújt a Recurring Downloads munkafolyamathoz használt
szoftverekről és szolgáltatásokról, azokról a nehézségekről, amellyel
a csapat a tervezési és építési folyamat során találkozott, valamint a
produktum jelenlegi használatáról. A projekt az eredetileg
tervezettnél és dokumentáltnál részletesebb tervet igényelt, ugyanis a
teljesen manuális folyamatot létrehozásakkor nem tervezték
automatizálni, egy átfogóbb, az adatmodellt meghatározó, a különleges
eseteket dokumentáló és stratégiát megfogalmazó terv megkönnyíthette
volna az iteratív fejlesztési folyamatot, az igénybe vett
felhőszolgáltatások kezdeti elemzése meghatározta volna e
szolgáltatások korlátait, és a projekttervben figyelembe lehetett
volna venni a megoldási lehetőségeket. Bár a munkaigényes kézi
munkafolyamat jelentősen csökkent, az automatizált munkafolyamat
hatékony fenntartásához szükséges készségek és a feladatmegosztás
kihívást jelentenek a könyvtárosok és a fejlesztők között. A cikk
részletesen ismerteti a több mint 50 forrásból származó weboldalak
elemzésére épülő, ismétlődő félautomatizált munkafolyamatra való
áttérés és az ennek szabványosítása során fellépő kihívásokat és
korlátokat, valamint a munkafolyamat lehetséges jövőbeli
fejlesztéseit.

A practical method for searching scholarly papers in the General Index
without a high-performance computer
Emily Cukier
https://journal.code4lib.org/articles/17663

A General Index (Általános Index) egy ingyenes adatbázis, amely
egyedülálló hozzáférést biztosít több mint 107 millió tudományos cikk
teljes szövegéből származó kulcsszavaihoz és n-gramjaihoz.
Legegyszerűbb felhasználása az érdeklődésre számot tartó kifejezést
tartalmazó cikkek keresése, de az adathalmaz elég nagy a
szövegbányászat és a korpusznyelvészet számára is. Annak ellenére,
hogy közhasznú programként pozícionálják, nincs felhasználói felület;
le kell tölteni, lekérdezni és kinyerni az eredményeket a nyers
adattáblákból. Nemcsak a számítástechnikai ismeretek jelentenek
akadályt a használatban, de a fájlméretek is túl nagyok ahhoz, hogy a
legtöbb asztali számítógép kezelni tudja őket. Ez a cikk a GI
használatának gyakorlatias módját mutatja be a mérsékelt készségekkel
és erőforrásokkal rendelkező kutatók számára. Egyszerű R programozási
parancsok és egy szerényen felszerelt asztali számítógép segítségével
végigjárja a cikkek bibliográfiájának elkészítését és egy téma éves
gyakoriságának vizualizálását (a kód elérhető a https://osf.io/s39n7/
oldalon). Röviden kitér arra is, hogy mit lehet még tenni (és hogyan)
nagyobb teljesítményű számítási erőforrásokkal.

Using Scalable Vector Graphics (SVG) and Google Sheets to Build a
Visual Tool Location Web App
Jonathan Bradley
https://journal.code4lib.org/articles/17697

A Virginia Tech egyetemi könyvtárában nemrégiben egy vizuális kioszk
alkalmazást készítettek, amely a makerspace-ben (szerszámokkal
felszerelt nyitott könyvtári barkácsműhely) tartózkodó felhasználóknak
segít megtalálni a szükséges eszközöket, valamint segíti
munkatársainkat a szerszámok, gépek és fogyóeszközök
visszaszolgáltatásában és leltározásában. Az alkalmazás a Svelte
programban készült, és a Google Sheets "csv-ként közzétenni a webre"
funkcióját használja az adatok lekérdezéséhez a munkatársak által
karbantartott eszközök listájáról. Mindez egy skálázható, JavaScript
és CSS vezérelt vektorgrafikus (SVG) fájlhoz van kötve, amely
tulajdonképpen a polcok és a tárolóhelyek interaktív térképe, kiemelve
azokat a tárolókat, ahol a látogatók kiválasztják az adott
felszerelést a kioszk kereshető listájából, kiegészítve az egyes
felszerelések fotóival. A cikkbúl megtudható, miért készült az
alkalmazás, milyen problémákat oldott meg, miért választottak bizonyos
technológiákat míg másokat miért nem, milyen kihívások merültek fel a
fejlesztés során, továbbá hogy merre tart a projekt.

Bringing it All Together: Data from Everywhere to Build Dashboards
David Schuster
https://journal.code4lib.org/articles/17693

A cikk azt ismerteti, hogy a Binghamton-i Egyetem hogyan hozott létre
különféle forrásból (MySQL, beszállítói e-mailek, az Alma Analytics és
egyebek) származó adathalmazokat összekötő adat-műszerfalat. A Power
BI, a Power Automate és egy Microsoft átjáró segítségével láthatjuk,
hogy az adatokhoz való könnyű, a összes eltérő rendszert ismeretét nem
megkívánó hozzáférés milyen erőt képvisel. A szerzők ismertetik a
projekt célját, a kivetelezés egyes részleteit és szót ejtenek az
adatvédelmi aggályokról.

Real-Time Reporting Using the Alma API and Google Apps Script
David Fulmer
https://journal.code4lib.org/articles/17695

Amikor a Michigani Egyetem Könyvtára az Aleph integrált könyvtári
rendszerről (ILS) az Alma Library Services Platformra (LSP) váltott,
számos kihívás merült fel a munkafolyamatok átállítása során. Az
előbbi egy többszintű, kliens/szerver struktúrájú ILS, amely egy házon
belül hosztolt szerverrel rendelkezett, és amelyhez a személyzet egy
dedikált kliens segítségével férhetett hozzá, az utóbbi egy felhőalapú
LSP, amelyhez a személyzet egy böngészőn keresztül férhetett hozzá. A
kihívások között szerepeltek az új LSP időszerű jelentési funkcióinak
hiányosságai, valamint a jelenleg használt, helyben népszerű
makroszoftverrel való inkompatibilitás. Bár az Alma LSP tartalmaz egy
átfogó üzleti intelligencia eszközt, az Alma Analytics-et amely számos
beépített és igény szerinti jelentést tartalmaz, van egy nagy korlátja
is: a jelentések alapjául szolgáló adatok az Alma-ból az éjszaka alatt
kinyert adatok másolatai. Ha az Almából származó adatokról kell friss
jelentést készíteni, az Analytics nem megfelelő. Ezek a problémák
szükségessé tették egy olyan alkalmazás kifejlesztését, amely egyesíti
az Alma API-k hasznosságát és a Google Apps Script platform kényelmét.
A cikk az így létrejött eszközt tárgyalja, amely a Google Apps Script
platform segítségével valós idejű jelentést készít az Almában tárolt
számlaadatokról.

Using Airtable to download and parse Digital Humanities Data
William K. Dewey
https://journal.code4lib.org/articles/17914

Az Airtable egyre népszerűbb felhőalapú formátum a kutatási adatok
bevitelére és tárolására, különösen a digitális bölcsészet területén.
Egyesíti a CSV-hez vagy az Excelhez hasonló táblázatkezelők
egyszerűségét a relációs adatbázisok kapcsolatmodellezési és
rekord-kapcsolási képességével. A nebraskai Center for Digital
Research in the Humanities (CDRH) két projekthez, az African Poetics
(africanpoetics.unl.edu) és a Petitioning for Freedom
(petitioningforfreedom.unl.edu) projekthez használja az Airtable
adatait. Az első projektben az adatok az afrikai költőkre és a róluk
szóló hírekre, a másodikban pedig a Habeas Corpus beadványokra és az
ügyekben érintett személyekre összpontosítanak. A CDRH meglévő (a
megjelenítés és a felfedezés megkönnyítésére tervezett)
szoftvercsomagja számos formátumban, többek között CSV-ben is képes
adatokat fogadni, Ruby szkriptekkel elemezni és az Elasticsearch
keresőindexen alapuló API-ba bevinni. Az Airtable-adatok használatának
első lépése az adatok letöltése és használható adatformátumba való
konvertálása. A cikk sorba veszi a parancssori eszközöket amelyekkel
le lehet tölteni az Airtable táblákat, a letölthető formátumokat
(automatizáláshoz legkényelmesebb a JSON), valamint a táblák
hozzáférésének kezelését és a hitelesítését. A Python szkriptek
képesek átalakítani a JSON adatokat más rendszerekbe való bevitelre
alkalmas CSV formátumba. A cikk a továbbiakban azt tárgyalja, hogy ez
az adatfeldolgozás hogyan működhet. Kitér a join táblákból, az
Airtable relációs adatbázis-szerű funkcionalitásából származó
információk exportálására is. A join-adatok exportáláskor nem ember
által olvashatók, de az Airtable-ben előfeldolgozhatók elemezhető
formátumokra. A cikk bemutatja, hogy a CDRH API mezői hogyan töltődnek
fel az egyszerű értékekből és a bonyolultabb struktúrákból (pl.
Markdown-stílusú hivatkozások). Végül az Airtable adatkezelési
előnyeit és hátrányait tárgyalja a fejlesztő szemszögéből.

Leveraging Aviary for Past and Future Audiovisual Collections
Tyler Mobley and Heather Gilbert
https://journal.code4lib.org/articles/17818

Most, hogy az audio- és videofelvevő hardverek könnyen használhatóak,
rendkívül hordozhatóak, megfizethetőek és képesek kiváló minőségű
tartalmak előállítására, sok egyetem érzékel szóbeli történelmi (oral
history) projektek és programok iránti növekvő keresletet. Az
összetett formátum a megőrzése és a hozzáférés biztosítása általában a
könyvtárra hárul, de gyakran a könyvtár munkatársainak előzetes
bevonása vagy a velük való konzultáció nélkül. Kihívást jelenthet, ha
sok könyvtári dolgozónak nincs hivatalos képzése a szóbeli
történelemmel kapcsolatban és csak felületesen ismeri a formátumot. A
probléma megoldására a College of Charleston könyvtárosai az
AVPreserve audiovizuális tartalomszolgáltató platformját, az Aviary-t
alkalmazták. A szerzők új szóbeli történelmi programok kiépítéséről
osztják meg tapasztalataikat, amelyek a régebbi rendszerekből átvett
audiovizuális anyagok mellett léteznek. Részletesen bemutatják, hogyan
közelítették meg az örökölt szóbeli történetek kötegelt (batch)
formában történő átvitelét, hogyan használták ki az Aviary API-ját és
beágyazási funkcióit, annak érdekében, hogy az Aviary audiovizuális
anyagokat zökkenőmentesen mutassák be más közgyűjteményi anyagok
mellett egy egységes, kereshető katalógusban. A cikk kitér az egyetemi
partnerektől érkező szóbeli történetek befogadásának kezelésére
szolgáló technikákra is és részletesen ismerteti, hogyan lehet a
lehető legjobb felhasználói élmény érdekében hatékonyan használni az
időkódolt átiratokat és indexeket.

Standing Up Vendor-Provided Web Hosting Services at Florida State
University Libraries: A Case Study
Matthew E. Hunter, Devin Soper, and Sarah Stanley
https://journal.code4lib.org/articles/17766

A CreateFSU a Florida State University (FSU) könyvtárak web-hosting
szolgáltatása, mely az FSU jelenlegi oktatói, alkalmazottai és néhány
hallgatója számára biztosít webdomaineket és több mint 150 népszerű
nyílt forráskódú tartalomkezelő rendszert köztük a Wordpress, a
Drupal, a Scalar és az Omeka rendszereket. A szolgáltatás 2021.
szeptemberi elindítása óta a könyvtárak az egyetem különböző érdekelt
feleivel tárgyaltak az igényeikről, bővítették a célközönséget,
támogatást nyújtottak, finomították munkafolyamatokat és
dokumentációkat, hogy a szolgáltatás megfeleljen az egyetemi
igényeknek. A szolgáltatás használatával az FSU közösség tagjai a
kutatásaik gyümölcseit széles közönség számára hozzáférhető és vonzó
módon mutathatják be. További munkát igényel a CreateFSU
népszerűsítése, és meg kell határozni a szolgáltatásnak a meglévő
kutatási és tanulási munkafolyamatokba való integrálásának
lehetőségeit. A szolgáltatás új felhasználási esetekre való
kiterjesztése és skálázhatóságának biztosítása érdekében a könyvtárak
remélik, hogy meg tudják győzni az egyetemi partnereket a szolgáltatás
saját küldetésük szempontjából való hasznáról és arról, hogy a
finanszírozáshoz való hozzájárulásról. A cikk ismerteti a szolgáltatás
elindításával és az első két év működtetésével kapcsolatos
tapasztalatait, illetve javaslatokat tesz a jövőbeli fejlesztési és
növekedési lépésekre.

Islandora for archival access and discovery
Sarah Jones, Cory Lampert, Emily Lapworth, and Seth Shaw
https://journal.code4lib.org/articles/17929

A cikk egy, az Islandora 2 szoftvernek a Nevadai Egyetem (Las Vegas)
levéltári és különgyűjteményi anyagainak felfedezésére, hozzáférésére
és használatára szolgáló nyilvános online portál létrehozására való
alkalmazását leíró esettanulmány. A szerzők kifejtik, hogy a
felhasználók számára a különböző adatokhoz (segédletek, a digitális
objektumok) való egységes hozzáférési pontot biztosításának célja
hogyan vezetett az Islandora 2 kiválasztásához, valamint megvitatják a
nyílt forráskódú szoftver használatának előnyeit és kihívásait.
Ismertetik a megvalósítás különböző lépéseit, beleértve az egyéni
fejlesztést, a CONTENTdm-ről való áttérést, az ArchivesSpace-szel való
integrációt, valamint az Islandora hatékony használatához szükséges új
készségek és munkafolyamatok kialakítását. Mivel a visszatekintés
mindig további perspektívát nyújt, az esettanulmány az indulás óta
szerzett tapasztalatokról, a nyílt forráskódú adattárak
fenntarthatóságáról és a jövőbeli fejlesztések prioritásairól is szót
ejt.

Developing a Multi-Portal Digital Library System: A Case Study of the
new University of Florida Digital Collections
Todd Digby, Cliff Richmond, Dustin Durden, and Julio Munoz
https://journal.code4lib.org/articles/17857

A University of Florida (UF) 2006-ban indította el a UF Digitális
Gyűjtemények szolgáltatását. Azóta a rendszer több mint 18 millió
digitalizált oldalt tartalmaz. A helyben fejlesztett digitális
könyvtári rendszer egy integrált nyilvános felhasználói felületből és
egy ezt kiszolgáló háttérendszerből állt. a rendszer adaptálása és
módosítása az idő előrehaladtával és a gyűjtemények méretének
növekedésével, más monolitokhoz hasonlóan, egyre nehezebbé vált. A
háttérendszeri fejlesztések követték a digitalizálási folyamatok
változását, de a nyilvános felület elavulttá vált és egyre kevésbé
reagált a mobileszközökre. Döntés született egy új rendszer
kifejlesztéséről, amelynek első lépése a nyilvános felület és a
háttérrendszer szétválasztása lett. A cikk a digitális könyvtári
rendszerünk újragondolása és az új, több portálon keresztül működő,
nyilvános felületű rendszerük telepítése során szerzett
tapasztalatokat vizsgálja. A digitális könyvtári technológiák
vizsgálatát követően úgy döntöttek, hogy nem használnak egyetlen
jelenleg elérhető nyílt forráskódú digitális könyvtári rendszert sem.
Egy viszonylag új (a könyvtári ökoszisztémában is új) programozói
csapat létrehozása lehetővé tette a követelmények újragondolását
valamint új meglátásokat és fejlesztési lehetőségeket villantott fel.
A Python, API-k, ElasticSearch, ReactJS, PostgreSQL és egyéb
technológiák használata lehetővé tette egy rugalmas és alkalmazkodó
rendszer felépítését, valamint, hogy a jövőben olyan fejlesztőket is
alkalmazzanak, akiknek esetleg nincs tapasztalata digitális könyvtári
rendszerek kiépítésében.

Jupyter Notebooks and Institutional Repositories: A Landscape Analysis
of Realities, Opportunities and Paths Forward
Adrienne VandenBosch, Keith E. Maull, and Matthew Mayernik
https://journal.code4lib.org/articles/17751

A Jupyter jegyzetfüzetek (Jupyter Notebook) a modern tudomány fontos
outputjai, bár még mindig nem világos, hogy ezek az erőforrások milyen
hosszú életűek. A közösségek és alkotóik még nem értették meg
teljességében a számítási jegyzetfüzetek létrehozásával,
hozzáféréségével, megosztásával és megőrzésével kapcsolatos
problémákat, és az első osztályú tudományos digitális eszközöktől
(tanulmányok, disszertációk, tudományos adatok) eltérően
jegyzetfüzeteknek és a hozzájuk kapcsolódó elemeknek még nincs
megfelelő helye az intézményi repozitóriumokban. Ahhoz, hogy ez
megtörténhessen, az adattárkezelőknek és a kurátoroknak megfelelő
eszközökkel, metaadatsémákkal és legjobb gyakorlatokkal kell
rendelkezniük ahhoz, hogy a jegyzetfüzetek előnyeit a lehető legjobban
kihasználhassák az adattárakban és környezetükben. Jelen tanulmány a
Jupyter jegyzetfüzetek mai helyzetét vizsgálja, valamint az intézményi
adattárakba való beillesztésével kapcsolatos lehetőségekre és
kihívásokra összpontosít. Megvizsgálja, hogy a jegyzetfüzetek jelenleg
milyen mértékben csatlakoznak az intézményi adattárakhoz, és hogyan
könnyíthetik meg a befogadásukat a CodeMeta-hoz hasonló metaadatsémák.
A szerzők megvitatják a National Center for Atmospheric Research
kutatói által létrehozott Jupyter jegyzetfüzetek jellemzőit, további
betekintést nyújtva abba, hogyan lehet értékelni és csatlakoztatni a
jegyzetfüzetek és a kapcsolódó erőforrások intézményi adattárba való
felvételét.

Beyond the Hype Cycle: Experiments with ChatGPT's Advanced Data
Analysis at the Palo Alto City Library
M Ryan Hess and Chris Markman
https://journal.code4lib.org/articles/17867

2023 júniusában és júliusában a Palo Alto Városi Könyvtár Digitális
Szolgáltatások csapata a nagy nyelvi modellek (LLM) könyvtári
projektekben való alkalmazását vizsgálta. Ez a párbeszéd-átiratokkal
és kódmintákkal kiegészített cikk a ChatGPT Pro-nak a mindennapi
munkába való integrálása során tapasztalt kihívásokat, sikereket és
váratlan eredményeket mutatja be. A kísérletekben a ChatGPT Advanced
Data Analysis funkcióját (korábban Code Interpreter) használták. Az
első cél a ChatGPT bővítmények keresőoptimalizálási (SEO) lehetőségeit
tesztelte. A kísérlet másik célja az volt, hogy a BiblioCommons
taxonómia felülvizsgálatával javítsák a webes felhasználói élményt,
hogy az jobban megfeleljen az olvasók érdeklődési köreinek, és hogy a
tervezett személyre szabott ajánlások funkció relevánsabbá váljon. A
ChatGPT segítségével elvégezhettek egy egyébként időigényes elemzést
az olvasók katalógushasználatáról, meghatározva a használatnak jobban
megfelelő taxonómiai kifejezések listáját. Mindkét kísérlet
bebizonyította az LLM-ek könyvtári hasznát, valamint a könyvtárosi
készség- és hatékonyság-növelésben rejlő lehetőségeket. A kísérlet
izgalma a ChatGPT példátlan hatékonyságában, alkalmazkodóképességében
és kapacitásában rejlett. Megállapították, hogy könyvtári problémák
széles körét képes megoldani, és felgyorsítja a projektek
megvalósítását is. Az LLM hiányosságai azonban ugyanilyen érezhetőek
voltak. A kísérlet minden egyes napján megküzdöttek a prompt
engineering, a kontextuális megértés és az új AI asszisztensünkkel
való eseti félreértések egész sorával. Röviden, az információs
szakemberek készségeinek egy új osztálya került a figyelem
középpontjába.

Comparative analysis of automated speech recognition technologies for
enhanced audiovisual accessibility
Dave Rodriguez and Bryan J. Brown
https://journal.code4lib.org/articles/17820

A digitális audiovizuális (AV) gyűjtemények hozzáférhetősége olyan
nehéz jogi és etikai terület, amelyen egyszer szinte minden egyetemi
könyvtárnak keresztül kell navigálnia magát. Az olyan
AV-hozzáférhetőségi funkciók, mint a feliratok és átiratok beépítése
rendkívül előnyös a fogyatékkal élő felhasználók számára, de egyébként
is többletértéket biztosít a tár számára. A funkciók megvalósítása
azonban több szempontból is kihívást jelent. Az automatikus
beszédfelismerés (ASR) és a mögötte álló mesterséges intelligencia
(AI) technológia legújabb technológiai fejlesztései lehetőséget
kínálnak a könyvtárosok számára a hozzáférhetőbb gyűjtemények
gondozására. A cikk ezeket a lehetőségeket tárgyalja, bemutatva a
Floridai Állami Egyetem könyvtárainak különböző ASR-eszközök
teljesítményét értékelő kutatását. A szerzők továbbá áttekintést
nyújtanak az AV-hozzáférhetőséggel kapcsolatos alapvető fogalmakról, a
mesterséges intelligencia használatának etikai kérdéseiről, valamint
röviden tárgyalják a feliratozási formátumok műszaki kérdéseit.

Using Event Notifications, Solid and Orchestration for Decentralizing
and Decoupling Scholarly Communication
Patrick Hochstenbach, Ruben Verborgh and Herbert Van de Sompel
https://journal.code4lib.org/articles/17823

Az írás egy, a tudományos kommunikáció decentralizált és
függetlenített architektúráját bemutató esettanulmány. A szerzők
bemutatják az eseményértesítési (Event Notifications) protokollt,
amelyet többek közütt a nemzetközi COAR Notify kezdeményezésben és a
hollandiai memóriaintézmények NDE-Usable programjában használnak. A
tanulmány bemutatja, hogy hogyan lehet az eseményértesítést Solid
szerver segítségével implementálni. Az értesítések feldolgozását egy
bibliográfiai hivatkozásokat kinyerő és továbbító kísérletben a
Koreografeye nevű szervező-szolgáltatás segítségével automatizálták,
bemutatva az eszközök egymáshoz illesztésének lehetőségeit.

[1] Van de Sompel elüadásának magyar összefoglalása: Péter Király.
Adat a könyvtárban. In Hagyomány és újítás a 21. századi könyvtárban
(Erdélyi Évszázadok. A Kolozsvári Magyar Történeti Intézet Évkönyve.
III.) eds. Rüsz-Fogarasi Enikő, Monok István. Kolozsvár, 2018. ISBN
978-606-8886-1. pp. 49-74.
http://real.mtak.hu/92256/1/ErdEvsz_tordelt_nyomdaba.pdf

--
Péter Király
software developer
GWDG, Göttingen - Europeana - eXtensible Catalog - The Code4Lib Journal
http://linkedin.com/in/peterkiraly

_______________________________________________
Katalist mailing list
Katalist@listserv.niif.hu
https://listserv.niif.hu/mailman/listinfo/katalist

2023. december 5., kedd

[KATALIST] Megjelent a Code4Lib Journal 58. száma