2018. november 9., péntek

[KATALIST] Code4Lib 42. szám és szerkesztő-keresés

Tisztelt Katalist,

megjelent a Code4Lib Journal 42. száma.
Ezúttal két cikket emelek ki, amik hozzám különösen közel állnak (a
többit pusztán időhiány miatt nem ismertetem).

Itt a listán korábban volt egy eszmecsere az adattudomány könyvtári
alkalmazási lehetőségeiről. A Jim Hahn (Univ. of Illinois,
Urbana-Champagne) "Automated Playlist Continuation with Apache
PredictionIO" című cikke erről a területről való. 2009-ben Netflix
online filmoldal rendezett egy 1 millió dolláros fődíjú versenyt,
aminek tárgya a könyvtári világban is releváns: ha tudjuk a
felhasználók múltbeli kölcsönzéseit, akkor ennek alapján meg tudjuk-e
becsülni, hogy mi lesz a következő film amit megnéz. A Netflix egy
ajánlólistát kínál fel a nézőknek, a cél, hogy ez az ajánlólista minél
inkább a néző ízléséhez/érdeklődéséhez közelebb álló tételeket
tartalmazzon, és válasszon valamit ezek közül. Ha a felhasználó
klikkel, akkor a lista sikeres. A versenyben az nyert, aki a leginkább
tudja növelni az ajánlott filmek/megnézett filmek arányát. (A
kihívásra kidolgozott, mátrixműveletekre épülő algoritmuscsaládot az
adattudományi szakirodalomban Collaborative Filtering néven lehet
megtalálni). A Netflix nyomán több ilyen verseny is indult, a cikk a
Spotify zeneoldal hasonló versenyén induló csapat megoldási javaslatát
ismerteti. Az ő ötletük az volt, hogy a Spotify metaadatai nem
normalizáltak, a találati listák pontosságát azzal lehetne javítani,
hogy authority (vagy ha úgy tetszik besorolási) rekordokkal javítjuk a
pontosságot. A csapat a VIAF adatbázist használta. Az eredmény valóban
javította a találati lista pontosságát (a Spotify 3 metrikát is
alkalmazott az eredményesség mérésére), de az is kiderült, hogy
önmagában ez a módszer kevés a versenyen való sikeres szerepléshez.

Chris Diaz "Using Static Site Generators for Scholarly Publications
and Open Educational Resources" című cikke a statikus site-ok
készítését írja le sok referenciával és nagy részletességgel. Két
scenáriót is leír: az egyik egy weboldal, a másik egy online könyv. A
statikus oldalgenerátorok sajátossága, hogy nincs mögöttük semmiféle
adatbázis és az oldalakat nem programok generálják élőben, hanem a
készítő egyszer legenerálja a HTML változatot és azt teszi elérhetővé.

Végül: a Code4Lib új szerkesztőket keres. A pályázatokat dec. 7-ig
lehet beadni. Részletek:
https://journal.code4lib.org/call-for-editors.
A szerkesztői munka önkéntes, nem jár érte pénz, saját tapasztalatom
szerint heti 2-10 óra munkával jár. Cserébe viszont a szerkesztő a
leghamarabb értesül a közgyűjteményi technológiai fejlesztésekről,
remek szerzőkkel (és szerkesztőkkel) lehet megismerkedni, amire
esetleg későbbi szakmai kapcsolatokat, pályázatokat lehet építeni. Én
szeretném bátorítani a Katalist olvasóit a lehetőség megfontolására,
és természetesen bármilyen felmerülő kérdésre szívesen válaszolok.

A lapszám teljes tartalomjegyzéke:

Editorial Edit
Andrew Darby
https://journal.code4lib.org/articles/13988

EnviroPi: Taking a DIY Internet-of-Things approach to an environmental
monitoring system
Monica Maceli
https://journal.code4lib.org/articles/13943

Improving Enterprise Content Findability through Strategic Intervention
Rebecca Townsend, Camille Mathieu
https://journal.code4lib.org/articles/13877

Wayfinding Serendipity: The BKFNDr Mobile App
Valeda Dent, Kiichi Takeuchi, Ben Turner, Heather Ball, Caroline
Fuchs, Ann Jusino, Shilpa Karnik
https://journal.code4lib.org/articles/13811

Automated Playlist Continuation with Apache PredictionIO
Jim Hahn
https://journal.code4lib.org/articles/13850

Piloting a Homegrown Streaming Service with IaaS
Robert T. Wilson and Ellen Dubinsky
https://journal.code4lib.org/articles/13823

Preparing Existing Metadata for Repository Batch Import: A Recipe for
a Fickle Food
William Roy and Chris Gray
https://journal.code4lib.org/articles/13895

OneButton: A Link Resolving Application to Guide Users to Optimal
Fulfillment Options
Lauren Magnuson, Karl Stutzman, Roger Peters, Noah Brubaker
https://journal.code4lib.org/articles/13951

Analyzing EZproxy SPU Logs Using Python Data Analysis Tools
Brighid M. Gonzales
https://journal.code4lib.org/articles/13918

Alma Enumerator: Automating repetitive cataloging tasks with Python
Wesley Teal
https://journal.code4lib.org/articles/13947

Using Static Site Generators for Scholarly Publications and Open
Educational Resources
Chris Diaz
https://journal.code4lib.org/articles/13861

Analysis of 2018 International Linked Data Survey for Implementers
Karen Smith-Yoshimura
https://journal.code4lib.org/articles/13867

--
Péter Király
software developer
GWDG, Göttingen - Europeana - eXtensible Catalog - The Code4Lib Journal
http://linkedin.com/in/peterkiraly

_______________________________________________
Katalist mailing list
Katalist@listserv.niif.hu
https://listserv.niif.hu/mailman/listinfo/katalist