abonneren

Online bibliotheken: wat doen ze en welke zijn er?

Voor veel mensen is de bibliotheek of een stoffige plek met boeken waar ze als kind wel kwamen om boeken te huren, of een digitale verzameling muziek - aangezien Apple ook graag de term bibliotheek bezigt. Er zijn echter een heleboel online bibliotheken te vinden: databases vol met beelden, teksten, audio en video. Hier lees je waar dat vandaan komt en waarom je ze eigenlijk nooit op Google tegenkomt.

Een digitale bibliotheek is bedoeld om snel en gemakkelijk toegang te verlenen tot boeken, archieven en afbeeldingen. Dat kan zowel commercieel zijn als publiekelijk, zowel betaald als gratis. Een digitale bibliotheek is een stuk goedkoper dan een fysiek exemplaar, omdat je geen fysieke ruimte nodig hebt om de informatie op te slaan.

Je hebt natuurlijk wel een heleboel gigabyte of terabyte nodig om je elektronische bieb te runnen, maar geen panden, personeel en ingewikkelde zoeksystemen. De voordelen zijn ook voor de gebruiker enorm: je hoeft de deur niet uit, de bieb is 24/7 geopend, er kunnen meerdere mensen tegelijk van een document gebruikmaken en de boeken worden niet vies of raken nagenoeg niet kwijt.

Hoe digitale bibliotheken tot stand kwamen

In 1895 startte de eerste digitale bibliotheek al door Paul Otlet en Henri La Fontaine. Het idee was toen nog om de kennis van de wereld in een databank te zetten en zo hopelijk wereldvrede te kunnen bereiken. Een mooi streven, maar misschien iets te ambitieus. Toch worden online bibliotheken wel alsnog gemaakt met het idee dat er informatie beschikbaar moet zijn voor de hele wereld, dat zie je ook aan de voorbeelden in dit artikel.

J.C.R. Licklider heeft na 1956 een grote rol gespeeld in de online bibliotheken, door grootschalig onderzoek te doen en het boek Libraries of the Future te schrijven. Hierin beschrijft hij hoe hij het voor zich ziet dat computers en netwerken worden gebruikt om menselijke kennis beschikbaar te maken voor andere mensen. Het gaat wel echt om bibliotheken, geen archieven. Bij een archief gaat het om het primaire materiaal, dus echt het bronmateriaal, terwijl bibliotheken uit boeken of andere dingen van secundaire natuur bestaan.

Er kwam even later een Online Public Access Catalog (OPAC) en een Education Resources Information Center (ERIC) die ervoor zorgden dat er een weg werd gebaand voor de uiteindelijke online bibliotheken. OPAC wist bijvoorbeeld het ouderwetse kaartensysteem op de universiteit te vervangen. Toen er in 1994 door de Amerikaanse overheid ook nog eens een kleine 25 miljoen dollar werd geïnvesteerd in digitale bibliotheken voor zes grote universiteiten, was de online bieb pas echt groots.

Met grote bibliotheken is een heleboel data gemoeid en net als in de echte wereld geldt ook in de digitale wereld: kennis is macht. Vandaar dat enkele grote bedrijven zich al proberen vast te bijten in de bibliotheken. Google is er een goed voorbeeld van, maar recentelijk is Facebook ook met een eigen bibliotheek gekomen. Beide zeer nuttig, maar ook heel verschillend:

Google Arts & Culture

Google heeft een geweldige online bibliotheek vol kunst en cultuur. Zoek je op artsandculture.google.com bijvoorbeeld op Van Gogh, dan vind je niet alleen een heleboel schilderijen met uitleg, maar ook een heel portret over de schilder. Je kunt zijn schilderijen rangschikken op kleur, populariteit of tijdsbestek. Dat laatste wordt ook meteen prachtig in beeld gebracht met een tijdslijn, zodat je precies ziet in welke fase de schilder zich bevond in een bepaald jaar. Google is overigens met een heleboel meer bibliotheekprojecten bezig. Denk bijvoorbeeld aan een systeem waarin objecten van foto’s door AI kan worden waargenomen en herkend of het project waarin Google boeken aan het digitaliseren is.

Literacy Library

Facebook komt met een Literacy Library, een bibliotheek waarin mensen het echte nieuws kunnen terugvinden. Het gaat om een lesprogramma om jongeren het verschil tussen fake news en echt nieuws bij te brengen, maar het gaat verder dan dat: er wordt jongeren meer bijgebracht over bijvoorbeeld beveiliging, zodat ze leren herkennen wat phishing zou kunnen zijn. Er zit ook een gedeelte in over het aangaan van gezonde relaties op het internet en hoe je offline relaties juist gezond kunt houden.

Er zijn natuurlijk nog talloze online bibliotheken te noemen, zoals World Digital Library, Project Gutenberg, Bartleby en Open Library. Het succes van zo’n bibliotheek zit hem vaak niet in de eerste plaats om marketing of beschikbaarheid, maar vindbaarheid. Een elektronische catalogus maken mag dan een stuk makkelijker en minder tijdrovend zijn dan een fysieke variant, er zijn een heleboel criteria om rekening mee te houden. Je kunt natuurlijk zoeken op volledige tekst, maar je moet ook kunnen zoeken op pseudoniemen van auteurs, het verschil tussen parodieën en non-fictie (zoals Facebook doet) en in de gaten houden hoeveel versies je van een bepaald document hebt.

Verstopt in het deep web

Overigens zie je bibliotheken meestal niet terug op Google, omdat ze vaak van een deep web-bron gebruikmaken. Dat zorgt er bijvoorbeeld voor dat men zelf de zoekmechanismes, indexering en algoritmes onder controle houdt. Zo is dat niet in beïnvloedbaar door een externe partij. Via het Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH) delen bibliotheken met elkaar hun metadata en ook met speciale zoekmachines als Google Scholar en Scirus. Een logische keuze, want dat is uiteindelijk waar bibliotheken toch voornamelijk voor bedoeld zijn: onderzoek door bijvoorbeeld studenten.

Er wordt momenteel nog gewerkt aan de regels omtrent digitale auteursrechten. Ze zijn er gedeeltelijk al, maar niet zozeer voor bibliotheken. Het is een lastige kwestie die in geprint werk wel vastligt, maar in de digitale wereld voor grote conflicten zorgt tussen bibliotheken en uitgevers. Uitgevers willen de vrijheid hebben een boek nog eens commercieel als ebook uit te brengen, terwijl bibliotheken daar uiteraard heel anders instaan. En waar een bibliotheek één fysiek boek ongelimiteerd kan uitlenen, willen uitgevers op digitale boeken een soort restrictie van een x aantal downloads zetten. HarperCollins heeft dat gedaan: een boek mocht 26 keer worden ‘uitgeleend’. Een bieb moet dan weer ‘toegangsrechten’ betalen voor nog een keer het recht om het ebook te mogen uitlenen. Iets waar HarperCollins natuurlijk veel geld aan kan verdienen, maar bibliotheken iets minder over te spreken zijn.

Kortom, met deze grote wolken aan data zijn niet alleen grote bedrijven gemoeid, maar ook grote ethische vraagstukken. En grote datacenters, want volgens de informatiewetenschappers Peter Lyman en Hal Variant van universiteit Berkeley kost een jaar productie van alle print, film optische en magnetische content in de wereld maar liefst 1.5 miljard gigabytes aan opslag.

Geschreven door: Laura Kempenaar op

Category: Blog

Tags: online bibliotheken, Database, google, audio, video