RankBrain: Google's machine learning algoritme voor zoekopdrachten
Op 27 oktober bracht Google via de internationale business nieuwssite Bloomberg het nieuws naar buiten dat ze gebruik gaan maken van een nieuw (stuk) algoritme: ‘RankBrain’. Een systeem waarbij er sprake is van kunstmatige intelligentie door middel van Machine Learning. Wat is het precies, hoe werkt en wat heb je eraan? De belangrijkste punten uit het interview tussen Bloomberg en Google op een rijtje.
Wat is RankBrain?
Zoals gezegd is RankBrain de naam van een vernieuwde manier van Google om met zoekresultaten om te gaan. Het gaat hierbij om Machine Learning op basis van kunstmatige intelligentie (Artificial Intelligence). Machine Learning is het fenomeen waarbij een computer zichzelf onderwijst/ slimmer maakt in plaats van dat de menselijke hand hierin een rol speelt. Het doel is betere voorspellingen te kunnen doen en daardoor kwalitatieve resultaten terug te geven aan de bezoeker.
In onderstaande video afkomstig van de site van Bloomberg, krijg je in 2 minuten een beeld van RankBrain.
RankBrain is slechts één onderdeel van de honderden elementen van Google’s algoritme Hummingbird. Het algoritme heet zo sinds september 2013 en is door Google zelf zo genoemd. Opvallend is dat Google in het interview met Bloomberg aangeeft dat RankBrain het ‘third most important signal contributing to the results of a search query’ is. Wat de andere twee zijn gaat Google niet op in, maar het heeft er alle schijn van dat het links en woorden/content zijn.
Wat doet het?
RankBrain gebruikt kunstmatige intelligentie om geschreven woorden via complexe wiskundige berekeningen om te zetten in getallen (vectors). Huh? Ja, precies. Het komt erop neer dat Google in staat is woorden uit een zoekopdracht die het algoritme niet kent, te relateren aan woorden die het wel kent. Op die manier kunnen ze goed omgaan met zoekopdrachten die nieuw zijn. Hoewel er dagelijks enkele miljarden zoekopdrachten worden gedaan, is nog steeds zo’n 15% daarvan (dagelijks) nieuw voor Google. Denk aan bijvoorbeeld complexe longtail zoekopdrachten die nog niet eerder ingevoerd zijn.
In de bovenstaande video wordt een herkenbaar beeld geschetst van hoe RankBrain werkt: Stel je staat in de kroeg en hebt een gesprek met iemand. Helaas lukt het je niet alles te verstaan (door het omgevingsgeluid), maar kun je wel de belangrijkste elementen van het gesprek opvangen. Doordat het menselijk brein in staat is ontbrekende puzzelstukjes in te vullen en verbanden te leggen, kan het gesprek toch doorgaan. Die mensenlijke skill komt in grote mate overeen met wat Google wil kunnen met RankBrain.
Praten tegen je apparaat
RankBrain komt op een mooi moment. Zoekopdrachten worden nou eenmaal langer en bestaan minder vaak uit één enkel woord. Dit kan goed samenhangen met spraakgestuurde software dat meer en meer ter beschikking komt en ook gebruikt wordt. Zo kun je via je mobiel een gesproken zoekopdracht indienen bij Google. De opkomst van smartwatches (waar je tegen kunt praten) zal het aantal langere zoekopdrachten alleen nog maar vergroten.
Voor wie trouwens een aantal regels geleden geraakt is door het verschijnsel vectors; hieronder zie je een voorbeeld van landen en hoofdsteden die omgezet zijn in een vector. Als je wiskundig bent aangelegd, kun je hier meer lezen over vectors.
Wat zie ik er in de praktijk van?
Helaas heeft Google geen voorbeelden gegeven van wat RankBrain in de praktijk doet. Op internationale blogs worden wel voorbeelden aangehaald van wat de ‘SEO gemeenschap’ er onder verstaat. Hoewel het gebruik van screenshots van zoekresultatenpagina’s in dit geval erg omstreden is, geven we hieronder toch het voorbeeld dat op internet rondcirkelt. Dit om je een beter beeld te geven wat er nou wordt bedoeld.
Stel je typt een zoekopdracht in als het onderstaande: “What’s the title of the consumer at the highest level of a food chain”. Google komt met onderstaande resultaten terug.
Nu stel je de vraag op een iets begrijpelijkere manier, namelijk: “Top level of the food chain”. Je ziet dat Google in grote mate met dezelfde resultaten terugkomt.
Dit zou dus een voorbeeld ‘kunnen’ zijn van hoe een complexe nieuwe zoekopdracht gerelateerd kan worden aan veel vaker voorkomende zoekopdrachten. De eerste zoekopdracht is dan wel ontzettend vaag, toch kan Google er wel wat mee. Als Google enkel keywordstyle zou kijken naar de termen zou alleen ‘level food chain’ in aanmerking komen. Als ik vanuit Nederland in Google.com deze zoekopdracht doe, zie ik iets totaal anders dan in de eerdere afbeeldingen (zie mijn resultaten in het screenshot hieronder). Dat zou dus kunnen verklaren dat Google verder kijkt dan deze termen. Maar nogmaals, dit soort testjes zijn op het randje en niet altijd betrouwbaar. Neem het dus vooral als voorbeeld mee, maar til er voorlopig niet te zwaar aan totdat we meer weten over RankBrain.
Hoe omstreden dit soort testen ook zijn, ik kon het toch niet laten te kijken hoe Google met hetzelfde voorbeeld in het Nederlands omgaat. Daar zie je niet hetzelfde gebeuren als je zoekt naar ‘Hoe heet de persoon die op het hoogste niveau staat in de voedselketen?’ en daarna naar ‘wie staat er bovenaan in de voedselketen?’. Op zich niet verbazingwekkend. Google geeft aan dat RankBrain wel wereldwijd is uitgerold maar zegt niets over in welke talen. Het zou niet vreemd zijn als onze taal nog niet ‘gevectord’ is naar mooie getallen, maar dat Google zich in eerste instantie op het Engels richt.
Wat moet ik er nu mee?
Hoewel het er de schijn naar heeft dat RankBrain nog geen Nederlands spreekt is het wel iets om rekening mee te gaan houden. Het is een volgende stap in de manier waarop Google omgaat met zoekopdrachten en complexe search queries. Google wil steeds slimmer worden en als een mens naar zaken kijken, dat zagen we al met Hummingbird, RankBrain is weer een upgrade van de motor.
Doordat Google woorden aan elkaar wil kunnen koppelen en verbanden wil kunnen zien moet je wel in thema’s gaan denken. RankBrain zou dan hopelijk het definiteve einde betekenen van het traditionele keyword denken. Je kunt je niet langer richten op één term per pagina en het daarmee doen. Je tekst is dan namelijk niet relevant voor de menselijke bezoeker en daarmee ook niet langer voor een zoekmachine als Google. Thematiek zal een basisplaats moeten krijgen in de aanpak van contentcreatie. Door nu al rekening hiermee te houden, ben je straks je concurrenten voor als de gevolgen van RankBrain in Nederland te zien zijn.
Hoe gaat het verder?
Zoals altijd bij Google updates duurt het even voordat we écht wijzer worden. De komende tijd zullen we vast veel meer te weten gaan komen over RankBrain, zij het doordat Google informatie naar buiten brengt, zij het doordat we zaken gaan ervaren. Zodra er extra nieuwswaardige informatie hierover is, zullen we daar zeker verslag van doen in een volgend blogartikel.