abonneren

Verborgen informatie vinden op het Deep Web: Deel 2

Het Deep Web - niet te verwarren met het Dark Web - staat bomvol informatie die niet door standaard zoekmachines wordt geïndexeerd. Maar hoe kom je er dan bij, is de vraag. We zetten wat sites voor je op een rij die je daarbij helpen.

Op zoek gaan naar verborgen informatie die niet met een gewone zoekmachine of browser te vinden is, klinkt wat spannender dan het in praktijk is. Je kunt meegaan in de veelal nogal hijgerige artikelen en video’s over het Dark Web, maar in alle eerlijkheid tart het gros van het aanbod de geloofwaardigheid en is het nieuwe er snel af. Wat overblijft is waar een zoektocht door het Deep Web wat ons betreft eigenlijk echt om gaat.

Je komt dan in aanraking met een collectie zoekmachines en bronnen waar je echt andere informatie vindt, dan die met een reguliere zoekopdracht in je favoriete browser naar voren komt. De verschillende bronnen die academische informatie naar boven halen, helpen bijvoorbeeld om je in een specifiek veld van wetenschap verder te ontwikkelen.

Leuk voor een avond lichtzinniger vermaak zijn de verschillende indexen en zoekmachines waarmee je in het verleden van internet kan duiken en indexen die leiden naar kleinere webpagina’s die door de algoritmes van de internetreuzen onvindbaar gemaakt worden. Wat dat betreft levert browsen met een TOR-browser misschien niet de meest nuttige informatie, maar het geeft wel een heerlijk nostalgisch jaren ‘90 tintje aan internet.

Kortom: bezoek eens het Deep Web; er gaat een wereld voor je open. Kijk maar!

Startpage

Startpage.com, niet te verwarren met startpagina.nl, is niet direct gerelateerd aan het Deep Web, maar in een opsomming van unieke browsers wel het vernoemen waard. Dit is een in Nederland gevestigde zoekmachine die de resultaten van Google filtert zodat jouw persoonlijke gegevens en zoekgedrag niet geregistreerd worden.

Door de focus zo vol op privacy te leggen en gebruikers uit de wind te houden (gegevens worden niet langer dan 48 uur opgeslagen en zoekresultaten worden niet op oud gedrag gefilterd) is Startpage een uitmuntende zoekmachine om aan een ontdekkingsreis van het Deep Web te beginnen. Je kunt naar hartenlust details opzoeken zonder dat die gelijk opgeslagen worden in de archieven van de internetreuzen.

Gebruik van Startpage is gratis, het bedrijf geeft zelf aan de diensten te financieren met behulp van ‘gesponsorde links’ op basis van onder meer AdWords. Daarbij zou slechts het absolute minimum aan gegevens gedeeld worden om de privacy te waarborgen. In 2011 werd door de EU aan Startpagina.com het European Privacy Seal toegekend.

Torch

Torch beweert de grootste zoekmachine voor het Deep Web te zijn met een index van meer dan een miljoen ‘verborgen’ webadressen. Tijdens ons bezoek stelt de pagina dat er 299.167 Onion-pagina’s geïndexeerd zijn. Dit zijn pagina’s die gebouwd zijn om via het TOR-netwerk te bezoeken.

Torch is de oudste zoekmachine voor het TOR gedeelte van het Deep Web, de naam is een samenvoeging van TOR en search. Op het reguliere internet is een bezoek te brengen aan Torch via een normale webbrowser. Let op: een zoektocht naar Torch via Google brengt als resultaat ook de Torch Browser naar voren.

Met het TOR-netwerk, de TOR-browser en het Deep Web heeft deze browser echter niets te maken. Het is namelijk een op Chromium gebaseerde webbrowser die de focus legt op torrents downloaden en delen op sociale media. Wil je los van een TOR-browser iets meer inzicht in de mogelijkheden van het Deep Web, dan is een zoekmachine als Ahmia zeker ook het vermelden waard.

TouchGraph

TouchGraph is een complex maar krachtig stuk gereedschap waarmee je onderlinge relaties in datasets kunt visualiseren. Deze software gebruikt Java om datasets uit onder meer Excel en databases binnen te halen en daar de onderlinge relaties van bloot te leggen. Een experimentele module laat je zelfs binnen Facebook analyses maken en in beeld brengen wat de onderlinge relaties en connecties van je vrienden zijn.

De software is in te zetten om het Deep Web te onderzoeken door verschillende bronnen in te lezen en vervolgens de onderlinge relaties te visualiseren. Als je eenmaal verhoudingen hebt opgezet kun je simpelweg door te klikken en te zoomen in de details duiken. Met een apart uitbreiding kun je de resultaten van je zoektochten als analyses presenteren op je webpagina. Voor wie er mee aan de slag wil, biedt TouchGraph een testversie aan die dertig dagen geldig is.

Wolfram Alpha

De zoekmachine Wolfram|Alpha bracht bij lancering wat verwarring teweeg doordat er automatisch verondersteld werd dat hij met Google zou concurreren, maar dat is niet correct. Wolfram|Alpha gebruikt een rekenalgoritme om antwoorden op vragen te calculeren aan de hand van academische en commerciële bronnen. Het biedt een eigen unieke toegang tot informatie op het Deep Web.

Wolfram|Alpha laat je op basis van geboden resultaten verder zoeken en doet denken aan Business Intelligence oplossingen. Het verschil zit hem in de uitkomst. Zoek je op Google naar ‘gold price worldwide’, dan krijg je de prijs van goud op die dag te zien, algemene vragen over de goudprijs en links naar sites die iets met de prijs van goud te maken hebben.

Voer je dezelfde opdracht in op Wolfram|Alpha dan krijg je de huidige prijs van goud te zien, een grafiekje met het verloop van de goudprijs over de afgelopen eeuw en suggesties voor verdere vragen die te maken hebben met goud zoals bijvoorbeeld de atomaire massa van goud, maar ook een voorspelling van de termijnmarkt voor koper ten opzichte van die van zilver.

The WWW Virtual Library

Je kunt een zoektocht die langs de vergeten delen van internet gaat niet afsluiten zonder een bezoekje te brengen aan de oudste index. The WWW Virtual Library verzamelt al sinds 1991 links naar webpagina’s, georganiseerd in verschillende categorieën.

Deze bibliotheek is ook niet door de minste opgezet. Niemand minder dan Tim Berners-Lee, de uitvinder van het world wide web (het deel van de internetijsberg dat boven de zee uitsteekt) is indertijd met deze index begonnen. Eens in de zoveel tijd kwam er toen op de mailingslijst melding van iemand die een nieuwe server opgezet had. Tim zette deze dan met de hand in de index. Met succes.

Tussen juli en augustus 1991 kwamen er tien tot honderd ‘hits’ per dag binnen op deze index. Het staat in wat schril contrast met de 3,5 miljard zoekopdrachten per dag die Google tegenwoordig verwerk, maar alles begint ergens. Tim Berners-Lee besteedt zijn dagen niet met het up-to-date houden van de index. Het archiveerwerk wordt vrijwillig uitgevoerd door beheerders van de verschillende categorieën.

Geschreven door: Merijn Gelens op

Category: Nieuws, Internet

Tags: internet, Tor, startpage, deep web

Laatste Vacatures