Hoe Google AI gebruikt om taal te begrijpen

Google maakt steeds meer gebruik van artificial intelligence (AI) en machine learning (ML) om ons beter van dienst te kunnen zijn. Het snappen van menselijke taal is een belangrijk onderdeel van Googles inzet van AI en ML. We willen graag uitleggen hoe dat werkt, en wat je er mee moet als je teksten voor je website schrijft.

Het Google algoritme

Om goed te kunnen begrijpen waar Google lerende machines inzet is het goed om kort uiteen te zetten hoe de zoekmachine ook alweer werkt. Googles algoritme werkt in vier stappen.

  1. Crawlen – het verzamelen van informatie (webpagina’s) op internet
  2. Parsen – het ontleden en analyseren van de informatie op die pagina’s
  3. Indexeren – het onderbrengen van alle gevonden internetpagina’s in een soort ‘inhoudsopgave / index van het internet’ door ze te koppelen aan woorden, begrippen en thema’s
  4. Het leveren van de zoekresultaten – een proces dat bestaat uit een aantal deelstappen namelijk
    1. Begrijpen van van de zoekopdracht van de gebruiker
    2. Het ophalen van alle relevante pagina’s uit de index die met de zoekopdracht te maken hebben
    3. Het filteren en clusteren van de opgehaalde pagina’s
    4. Bepalen welke pagina’s het meest geschikt zijn voor de gebruiker (ook wel ranking genoemd)
    5. Het presenteren van de resultaten in een zoekresultatenpagina in de gerankte volgorde

Parsen 2.0

Taalbegrip is op twee momenten van het bovenstaande stappenplan heel belangrijk. Allereerst bij het parsen van een internetpagina. Want wat wordt er precies gezegd? Google vertelt zelf dat parsen een hele moeilijke stap is in het proces. Computers vinden het maar lastig menselijke taal te snappen. Dat komt omdat taal heel ambigue is. Een zin of passage kan veel verschillende betekenissen hebben. Context, intonatie, klemtoon: voor mensen is de betekenis van de gebruikte woorden snel helder. Maar computers hebben daar veel meer moeite mee.

Rankbrain: hoe bedoel je precies?

Ook bij het leveren van de zoekresultaten is context is heel erg van belang. Als je een gesprek voert met een ander, kan hij vraag: “Is er morgen een concert in het Vondelpark?”. Die vraag lijkt misschien helder, maar kan tot meerdere antwoorden leiden:

  • Nee, dat concert is overmorgen.
  • Nee, er is morgen een voetbaltoernooi.
  • Nee, er is wel een concert in het Westerpark.

Een mens kan de context van de vraag vaak wel snappen. Kennis van de gesprekspartner draag daaraan bij, de grotere context van het gesprek waarin de vraag werd gesteld ook en ook intonatie (op welk woord in de vraag ligt de klemtoon) helpen

En anders kun je altijd nog vragen: hoe bedoel je die vraag precies?

Google krijgt doorlopend vragen op zich afgevuurd die onduidelijk zijn, of op verschillende manieren te interpreteren. Ongeveer 15% van de zoekvragen die Google te verwerken krijgt, zijn zelfs nog nooit eerder gesteld. Om juist die vragen beter te kunnen beantwoorden ontwierp het bedrijf in 2013 Rankbrain. Hoe Rankbrain werkt, en wat het precies doet is onzeker.

Het gebruikt in elk geval vectoren. Dat zijn relaties tussen twee woorden waarvan een computer niet meteen hoeft te begrijpen wat deze woorden betekeken. Maar wat het wel snapt is dat

Berlijn staat tot Duitsland, als Amsterdam staat tot Nederland, als Rome staat tot Italië en Bangkok tot Thailand.

De relatie (hoofdstad – land) hoeft door Rankbrain niet begrepen te worden. Als de relatie maar wordt herkend.

En met die relaties

En Rankbrain is een AI-toepassing, Dat wil zeggen: hoe het ook precies moge werken, het proces probeert beter te worden door van de resultaten die het presenteerde en het klikgedrag van de gebruiker te leren.

Over Rankbrain. Een onderdeel daarvan zijn CTR’s. Als die beter worden, rankt Google je hoger. En dat hebben ze bij Wordstream inzichtelijk weten te maken: https://moz.com/blog/seo-trek-the-search-for-google-rankbrain-new-data

tl;dr – wat moet ik weten

 

 

Foto: velkr0

 

 

 

Schrijf een reactie

Je e-mailadres wordt niet gepubliceerd.

Reacties

Wees de eerste met een reactie

Misschien vind je deze artikelen ook interessant

2 min

SEO in Hengelo… gaat het al wat beter Google?

In 2015 schreef ik voor New Black een blog. Daarin liet ik zien dat Google het lang niet altijd lukt…

5 min

Uit betrouwbare bron? Googles lokale zoekresultaten in elk geval niet

Wie een bedrijf heeft en lokale klanten bedient is afhankelijk van goede vindbaarheid van zijn website in Google. Een lokale…