- Classificatie van soorten internetzoekmachines
- 1- Hiërarchische zoekers (spin)
- Glijden
- Geïndexeerd
- Bereken relevantie
- Haal het resultaat op
- 2- Directory's
- 3- Hybride zoekmachines
- 4- Metazoekmachines
- Referenties
De classificatie van internetzoekmachines kan worden onderverdeeld in hiërarchische zoekmachines, directories, hybride zoekmachines en meta-zoekmachines.
Zoekmachines zijn een softwaresysteem dat is ontworpen om informatie op het World Wide Web te vinden. Ze gebruiken trefwoorden om documenten te zoeken die betrekking hebben op die woorden en rangschikken de resultaten vervolgens in volgorde van relevantie voor het onderwerp dat wordt doorzocht.
Internetzoekmachines proberen informatie te extraheren die hun gebruiker nodig heeft; dit is mogelijk dankzij een grote database die op internet beschikbaar is.
Ze zijn een hulpmiddel geworden voor dagelijks gebruik om informatie te vinden. Hierdoor is het momenteel heel gemakkelijk om informatie te vinden met zoekmachines zoals Google, AOL, Yahoo en Bing.
Er zijn duizenden verschillende zoekmachines beschikbaar op internet; elk heeft zijn verschillende capaciteiten en kenmerken.
De eerste ontwikkelde zoekmachine heette Archie en werd gebruikt om naar FTP-bestanden te zoeken; de eerste op tekst gebaseerde zoekmachine heette Veronica.
Gebruikers hebben toegang tot een zoekmachine via de browser op een computer, smartphone, tablet of andere elektronische apparatuur.
Classificatie van soorten internetzoekmachines
1- Hiërarchische zoekers (spin)
Dit type zoekmachine gebruikt een 'spider' om naar websites op internet te zoeken. Deze spider komt individuele webpagina's binnen, haalt de trefwoorden eruit en voegt de pagina's vervolgens toe aan de database van de internetzoekmachine.
De voordelen van dit type zoekmachine zijn dat ze een groot aantal pagina's bevatten en dat ze gemakkelijk te gebruiken zijn. Om deze reden is het heel gebruikelijk dat de gebruiker er vertrouwd mee raakt en het herhaaldelijk gebruikt.
Aan de andere kant zijn de nadelen dat omdat ze zoveel gegevens extraheren, het heel goed mogelijk is om te veel informatie te hebben.
De meeste populaire zoekmachines op internet zijn hiërarchisch, zoals Google, Bing, Yahoo, Baidu en Yandex.
Alle hiërarchische internetzoekmachines gebruiken een bot (spider) om nieuwe inhoud in de zoekdatabase te zoeken en te indexeren.
Er zijn vier basisstappen die elke hiërarchische zoekmachine volgt voordat een webpagina in de zoekresultaten wordt weergegeven:
Glijden
Zoekmachines doorzoeken het hele internet om beschikbare webpagina's te vinden. Dit wordt gedaan door een software genaamd spider; de frequentie tussen aardverschuivingen kan dagen duren.
Geïndexeerd
Het is het proces van het identificeren van de woorden en uitdrukkingen die de webpagina het beste beschrijven. De geïdentificeerde woorden worden trefwoorden genoemd en de pagina wordt aan de geïdentificeerde woorden toegewezen.
Bereken relevantie
De zoekmachine vergelijkt de zoekreeks in de vereiste reeks met de geïndexeerde pagina's van de database.
Omdat de kans groter is dat meer dan één pagina de zoekreeks bevat, begint de zoekmachine de relevantie van elk van de pagina's in zijn index te berekenen met de zoekreeks.
Er zijn verschillende algoritmen om de relevantie te berekenen. Elk van deze algoritmen heeft verschillende relatieve gewichten voor gemeenschappelijke factoren, zoals trefwoord of linkdichtheid.
Daarom geven alle zoekmachines verschillende pagina's met resultaten voor dezelfde zoekreeks.
Zoekmachines veranderen van tijd tot tijd hun algoritmen.
Haal het resultaat op
In feite toont het simpelweg de resultaten in de browser; de eindeloze pagina's met zoekresultaten die zijn gerangschikt van meest relevant naar minst belangrijk.
2- Directory's
Directory's zijn zoekmachines die voor hun vermeldingen afhankelijk zijn van menselijke activiteiten: een webpagina wordt aan de directory toegevoegd en de opname ervan moet worden goedgekeurd door het redactieteam.
Dit proces verloopt als volgt:
1-De eigenaar van de website voegt een korte beschrijving van zijn site toe aan de directory, samen met de categorie waarin deze moet worden vermeld.
2-De ingediende site wordt handmatig beoordeeld. Het kan vervolgens worden toegevoegd aan de juiste categorie of het kan worden afgewezen uit de lijst. Een site met goede inhoud wordt eerder toegevoegd dan een webpagina met slechte inhoud.
3-De trefwoorden die in het zoekvak zijn ingevoerd, worden vergeleken met de beschrijving van de webpagina. Dit betekent dat er geen rekening wordt gehouden met wijzigingen aan de inhoud van de site, aangezien alleen de beschrijving van de site ertoe doet.
Het voordeel is dat elke pagina wordt beoordeeld op relevantie en inhoud voordat deze wordt opgenomen. Minder resultaten betekenen vaak dat u sneller kunt vinden wat u zoekt.
Dat gezegd hebbende, het formaat en de lay-out zijn niet vriendelijk voor de meeste mensen en ze kunnen worstelen met minder vaak voorkomende zoekopdrachten. Een ander nadeel is dat er een vertraging is bij het maken van de webpagina en het opnemen ervan in de directory
Enkele bekende directories zijn het Open Dictionary Project, de Internet Public Library en de onlangs gesloten DMOZ.
3- Hybride zoekmachines
Deze zoekmachines gebruiken zowel hiërarchische zoekmachines als directories om webpagina's in zoekresultaten weer te geven.
De meeste spider-zoekmachines, zoals Google, gebruiken in feite hiërarchische zoekmachines als het primaire mechanisme en handmatige monitoring als het secundaire mechanisme.
Soms krijgt de gebruiker de mogelijkheid om op internet of in een directory te zoeken. Op andere momenten kan een gebruiker zowel door mensen samengestelde resultaten als hiërarchische resultaten ontvangen in dezelfde zoekopdracht; wanneer dit het geval is, worden de menselijke resultaten meestal als eerste vermeld.
Google en Yahoo zijn twee van de belangrijkste zoekmachines die in deze categorie vallen, hoewel steeds meer zoekmachines naar dit systeem migreren.
4- Metazoekmachines
Deze internetzoekmachines zijn zoekmachines die tegelijkertijd andere zoekmachines doorzoeken en de resultaten vervolgens combineren in één lijst.
Het voordeel is dat er meer resultaten worden behaald, maar hun relevantie en kwaliteit kunnen er aanzienlijk onder lijden.
Voorbeelden van meta-zoekmachines zijn Dogpile, Metacrawler en Clusty.
Referenties
- Wat zijn verschillende soorten zoekmachines (2016). Opgehaald van webnotes.com
- Zoeken op internet: soorten zoekmachines. Opgehaald van libguides.astate.edu
- Soorten zoekmachines (2008). Opgehaald van zeald.com
- Zoekmachines en zijn typen (2015). Opgehaald van slideshare.com
- Zoekmachine (2017). Hersteld van computerhope.com