Over de zoekfunctie in WordPress en waarom je er meer aandacht aan zou moeten besteden

Normaliter is een nieuwe versie van WordPress geen reden om erover te gaan bloggen. Sinds vandaag is echter WordPress 3.7 beschikbaar en die introduceert een aantal nieuwe functionaliteiten. Alle aandacht gaat vooral naar de automatische updatefunctie die nieuw is in deze versie en die uit zichzelf kritische beveiligingsupdates moet gaan installeren. Maar degene die ik zelf het meest interessant vind is de verbetering in de zoekfunctie in WordPress.

wp37_verbeterde zoekfunctie

In de blogpost van WordPress zelf over versie 3.7 staat die niet eens vermeld als verbetering en dat bevestigt helaas hoe weinig aandacht er door het ontwikkelteam van WordPress aan de zoekfunctie gegeven wordt.

Waarom is die zoekfunctie dan wel belangrijk?
Ik weet niet wat de precieze reden is maar WordPress is echt niet het eerste CMS (content management systeem) dat zich wel enorm focust op het aanbieden van content maar daarbij lijkt te vergeten dat gebruikers die content ook terug willen kunnen vinden. Alle energie gaat zitten in uitgebreide structuren van velden, taxonomieën, categorieën, tags. Zoveel mogelijk (automatische) metadata meegeven aan de content. Waarmee de gebruiker later die content kan sorteren, filteren en/of groeperen. Het geldt voor grote commerciële systemen als Sharepoint maar het geldt zeker ook voor WordPress.

Blogposts krijgen o.a. een titel mee, een auteur, 1 of meerdere categorieën en tags. Op de voorpagina van je blog komen de laatste 5 (of 10) blogposts te staan en daarna verdwijnt je content min of meer spoorloos uit het zicht van zowel jou als je bezoekers. Als je, kennelijk net als de makers van WordPress, van mening bent dat alleen je laatste blogpost telt dan zul je dit misschien geen probleem vinden. Zelf vind ik het bijzonder vreemd dat ik degene ben die alles in het werk moet stellen om zijn blogposts terugvindbaar te maken en te houden. En niet de blogsoftware.

Je kunt (en moet) goed nadenken over de categorieën die je gebruikt om je blogposts in te delen. Hetzelfde geldt ook voor de tags. Je bent echter volledig afhankelijk van of je bezoekers er aan denken om door te klikken op een categorie of een tag en op die manier je oudere content vinden uit dezelfde categorie of die voorzien is van dezelfde tag. Je kunt ook nog handmatig zelf je meest relevante blogposts rubriceren en als een soort dossiers aan je lezers aanbieden (voor wie bijv. meer wil lezen over auteursrecht). Maar het zijn allemaal handelingen die je vooral moet doen omdat WordPress geen goede zoekfunctie heeft.

Die zoekfunctie is namelijk zeer minimalistisch. Je tikt een zoekterm in het zoekbalkje (mits de blogger dat zoekbalkje heeft aangezet) en WordPress doorzoekt de titel en de tekst van (alle) blogposts en pagina’s. Komt de term in de titel en/of blogpost voor, dan laat WordPress alle gevonden blogposts en pagina’s zien in chronologische volgorde. Van recent naar oud.

En dat systeem was al verouderd voordat bijv. Google met zijn zoekmachine begon. Zoekmachines die content fulltext kunnen doorzoeken hoeven niet alleen te vertrouwen op de metadata die door een systeem of maker van die content is meegegeven. Nee, die indexeren alle woorden uit de content plus uit die aanwezige metadata en gaan nadenken over wanneer iets wel, minder of niet relevant is voor de zoekactie. Als ik zoek op ‘ebooks’ op mijn blog dan zou de zoekfunctie onderscheid moeten maken tussen blogposts waar ‘ebooks’ in de titel voorkomt en waar ze in de tekst van de blogpost voorkomt. Het zou onderscheid moeten maken tussen blogposts waar het woord ebooks drie keer in voorkomt en blogposts waar het tientallen keren in gebruikt wordt. Het zou moeten herkennen dat een blogpost waarschijnlijk relevanter is als ‘ebooks’ een categorie of een tag is. Of relatief veel reacties en views heeft. Relevance ranking heet dat als een zoekmachine in staat is om de zoekresultaten te ordenen op relevantie ipv alleen op datum.

De WordPress zoekfunctie heeft nu relevance ranking
Ook al vinden de ontwikkelaars het kennelijk nauwelijks de moeite van het vermelden waard, versie 3.7 wijzigt de zoekfunctie waardoor zoekresultaten nu op relevantie gerangschikt worden. Welke criteria hiervoor gebruikt worden is helaas niet duidelijk hoewel de introductiepagina van versie 3.7 vermeldt dat resultaten, waarbij de zoekterm in de titel staat, in elk geval bovenaan terecht komen. Ik ga er eigenlijk van uit dat er voor de rest alleen gekeken wordt naar de woordfrequentie: resultaten waarbij de zoekterm vaker voorkomt in de tekst komen hoger in de lijst te staan.

Google laat de mogelijkheid van geavanceerd zoeken langzamerhand verdwijnen maar in WordPress is het zelfs nooit geïntroduceerd. Je kunt niet zoeken op specifieke velden zoals auteur en titel (dat een zoekterm alleen voor mag komen in de titel). Je kunt niet zoeken op tags of categorieën. Of filteren op blogposts die in 2012 gepubliceerd zijn. Laat staan dat je de comments kunt doorzoeken.

Het is goed dat de zoekfunctie iets minder nutteloos is geworden met deze nieuwe update maar het is nog steeds een belabberde manier om de bezoekers van je blog bij je relevante content te krijgen die toevallig niet meer op de voorpagina te vinden is. Waarom investeren we wel (veel) tijd en moeite om blogposts via social media onder de aandacht te brengen en zo optimaal mogelijk terugvindbaar in Google te krijgen, maar niet om de zoekfunctie op de eigen blogs voor elkaar te krijgen? Waarom moet ik naar Google gaan om mijn eigen blogposts op mijn eigen blog terug te vinden?

Is hier een oplossing voor te bedenken? Zijn er plugins hiervoor zoals andere plugins ook essentiële functionaliteiten bieden waarvan ik niet snap waarom dat niet ingebouwd is in WordPress? Zoals een goede backupmogelijkheid. Of is er geen andere keus dan maar te blijven vertrouwen op zoekmachines zodat anderen en ik zelf mijn blogposts terug kunnen vinden?

#

Raymond Snijders

Sinds 1995 houdt Raymond zich bezig met de combinatie van ICT, bibliotheken en onderwijs vanuit het perspectief van (vooral) de bibliotheek en informatievoorziening. Thans is hij werkzaam bij de Hogeschool Windesheim als senior informatiebemiddelaar en houdt hij zich bezig met de digitale bibliotheek, contentlicenties, ebooks en auteursrecht. Over deze onderwerpen en de impact die ze (kunnen) hebben op het onderwijs en bibliotheken blogt hij sinds 2006 op zijn Vakblog. In 2013 won hij de Victorine van Schaickprijs voor zijn blog.

Comments (16) Write a comment

  1. Ik weet niet of je dat bedoelt, Raymond, maar de zoekfunctie van WordPress is inderdaad notoir slecht en ik gebruik de plugin ‘Search everything’ die de zoekfunctie naadloos overneemt. Veel beter.

    Reply

    • Die gaat ook op mijn lijst, dank Kitty! Ik ben nu Relevanssi aan het uitproberen en die bevalt al heel erg. Inclusief stopwoordenlijst, indexeren van alle comments en zelfs een synoniemenlijst om zoekers automatisch resultaten te laten vinden op populaire zoektermen die echter niet in jouw blogpost gebruikt worden.

      Ik voel alweer een nieuwe blogpost opborrelen.

      Reply

  2. Pingback: Verbeter de zoekfunctie in WordPress met Relevanssi | Vakblog

  3. Pingback: Je eigen zoekmachines gebruiken voor je favoriete sites in Chrome of Firefox | Vakblog

Leave a Reply

Required fields are marked *.


This site uses Akismet to reduce spam. Learn how your comment data is processed.

  • © 2006- 2019 Vakblog – werken met informatie
    Aangedreven door WordPress en duizenden liters koffie // Theme: Tatami van Elmastudio
Top