Google maakt steeds meer gebruik van artificial intelligence (AI) en machine learning (ML) om ons beter van dienst te kunnen zijn. Het snappen van menselijke taal is een belangrijk onderdeel van Googles inzet van AI en ML. We willen graag uitleggen hoe dat werkt, en wat je er mee moet als je teksten voor je website schrijft.
Om goed te kunnen begrijpen waar Google lerende machines inzet is het goed om kort uiteen te zetten hoe de zoekmachine ook alweer werkt. Googles algoritme werkt in vier stappen.
Taalbegrip is op twee momenten van het bovenstaande stappenplan heel belangrijk. Allereerst bij het parsen van een internetpagina. Want wat wordt er precies gezegd? Google vertelt zelf dat parsen een hele moeilijke stap is in het proces. Computers vinden het maar lastig menselijke taal te snappen. Dat komt omdat taal heel ambigue is. Een zin of passage kan veel verschillende betekenissen hebben. Context, intonatie, klemtoon: voor mensen is de betekenis van de gebruikte woorden snel helder. Maar computers hebben daar veel meer moeite mee.
Ook bij het leveren van de zoekresultaten is context is heel erg van belang. Als je een gesprek voert met een ander, kan hij vraag: “Is er morgen een concert in het Vondelpark?”. Die vraag lijkt misschien helder, maar kan tot meerdere antwoorden leiden:
Een mens kan de context van de vraag vaak wel snappen. Kennis van de gesprekspartner draag daaraan bij, de grotere context van het gesprek waarin de vraag werd gesteld ook en ook intonatie (op welk woord in de vraag ligt de klemtoon) helpen
En anders kun je altijd nog vragen: hoe bedoel je die vraag precies?
Google krijgt doorlopend vragen op zich afgevuurd die onduidelijk zijn, of op verschillende manieren te interpreteren. Ongeveer 15% van de zoekvragen die Google te verwerken krijgt, zijn zelfs nog nooit eerder gesteld. Om juist die vragen beter te kunnen beantwoorden ontwierp het bedrijf in 2013 Rankbrain. Hoe Rankbrain werkt, en wat het precies doet is onzeker.
Het gebruikt in elk geval vectoren. Dat zijn relaties tussen twee woorden waarvan een computer niet meteen hoeft te begrijpen wat deze woorden betekeken. Maar wat het wel snapt is dat
Berlijn staat tot Duitsland, als Amsterdam staat tot Nederland, als Rome staat tot Italië en Bangkok tot Thailand.
De relatie (hoofdstad – land) hoeft door Rankbrain niet begrepen te worden. Als de relatie maar wordt herkend.
En met die relaties
En Rankbrain is een AI-toepassing, Dat wil zeggen: hoe het ook precies moge werken, het proces probeert beter te worden door van de resultaten die het presenteerde en het klikgedrag van de gebruiker te leren.
Over Rankbrain. Een onderdeel daarvan zijn CTR’s. Als die beter worden, rankt Google je hoger. En dat hebben ze bij Wordstream inzichtelijk weten te maken: https://moz.com/blog/seo-trek-the-search-for-google-rankbrain-new-data
Foto: velkr0
Wees de eerste met een reactie