GEO & AI SEO

Hoe AI-zoekmachines websites
begrijpen

AI-zoekmachines lezen je website anders dan Google. Googlebot kan JavaScript renderen, afbeeldingen analyseren en complexe pagina's begrijpen. AI-crawlers als OAI-SearchBot en PerplexityBot kunnen dat niet. Ze lezen de ruwe HTML en moeten het daarmee doen. Dat technische verschil heeft directe gevolgen voor je zichtbaarheid. In dit artikel lees je hoe AI-crawlers technisch werken, wat ze wel en niet kunnen lezen en hoe je je website optimaliseert zodat AI het begrijpt.

45 mrd

AI-zoeksessies per maand wereldwijd

7,2%

van sites heeft AI Discovery File

2,5x

meer AI-citaties met schema markup

0%

JavaScript-rendering door AI-crawlers

Hoe AI-zoekmachines anders lezen dan Google

Googlebot is een geavanceerde crawler die JavaScript kan renderen, afbeeldingen kan analyseren en de volledige visuele weergave van een pagina kan begrijpen. Als je website een React- of Next.js-applicatie is die content dynamisch laadt via JavaScript, kan Googlebot dat lezen. AI-crawlers kunnen dat niet.

OAI-SearchBot (van OpenAI/ChatGPT), PerplexityBot en andere AI-crawlers lezen de ruwe HTML-broncode van je pagina. Ze voeren geen JavaScript uit. Als je content pas zichtbaar wordt nadat JavaScript is geladen, is die content onzichtbaar voor AI-crawlers. Ze zien een lege pagina of een skeletstructuur zonder inhoud. Meer over hoe deze crawlers werken lees je in hoe AI websites crawlt.

Zichtbaar in Google, onzichtbaar voor AI

Dit is een fundamenteel technisch verschil dat veel website-eigenaren niet beseffen. Een website die perfect werkt in Google kan compleet onzichtbaar zijn voor AI-zoekmachines. Vooral websites gebouwd met frameworks als React, Angular of Vue zonder server-side rendering (SSR) lopen dit risico. De content bestaat alleen in de browser na JavaScript-executie, niet in de HTML-bron.

Googlebot vs. AI-crawlers

Googlebot

  • Rendert JavaScript volledig
  • Analyseert afbeeldingen en video's
  • Begrijpt CSS-layout en visuele structuur
  • Volgt interne links automatisch
  • Crawlt regelmatig en systematisch

AI-crawlers (OAI-SearchBot, PerplexityBot)

  • Leest alleen ruwe HTML
  • Kan geen JavaScript uitvoeren
  • Ziet geen afbeeldingen of video's
  • Leest structured data (JSON-LD)
  • Crawlt op basis van zoekresultaten

De AI-crawlers: wie leest wat?

OAI-SearchBot

De webcrawler van OpenAI voor ChatGPT's Browse-functie. Haalt pagina's op bij realtime zoekopdrachten. Leest HTML en JSON-LD. Respecteert robots.txt. Aparte user-agent van GPTBot (trainingsdata).

Controle: robots.txt User-agent: OAI-SearchBot

Google-Extended

Google's crawler voor AI-toepassingen (Gemini, AI Overviews). Deelt de index met Googlebot maar kan apart worden gecontroleerd. Heeft directe toegang tot Google's Knowledge Graph en Maps-data.

Controle: robots.txt User-agent: Google-Extended

PerplexityBot

De webcrawler van Perplexity. Zoekt bij elke vraag het web af en haalt relevante pagina's op. Groeit snel: 370% sinds 2025. Respecteert officieel robots.txt maar er zijn meldingen van ongedeclareerde crawlers.

Controle: robots.txt User-agent: PerplexityBot

ClaudeBot

De webcrawler van Anthropic voor Claude's zoekfunctie. Relatief nieuw en groeiend. Leest HTML en structured data. Respecteert robots.txt. Minder agressief dan OAI-SearchBot en PerplexityBot.

Controle: robots.txt User-agent: ClaudeBot

Wat AI-crawlers wel en niet kunnen lezen

AI-crawlers lezen tekst in HTML-elementen: paragrafen, koppen, lijsten, tabellen en links. Ze verwerken structured data in JSON-LD formaat. Ze lezen meta-tags (title, description). Ze verwerken de hierarchische structuur van je HTML: H1, H2, H3 koppen geven context over de relatie tussen secties.

Wat ze niet kunnen: JavaScript uitvoeren, afbeeldingen interpreteren (geen OCR of beeldherkenning), video- of audiocontent verwerken, content achter login-walls lezen of dynamisch geladen content ophalen. Als je productbeschrijvingen pas verschijnen na een AJAX-call, ziet de AI-crawler een lege pagina.

PDF's en niet-HTML content

PDF's vormen een grijs gebied. Sommige AI-platformen kunnen PDF's lezen wanneer ze direct worden gelinkt, maar de meeste crawlers geven de voorkeur aan HTML-content. Als je belangrijke informatie alleen in PDF-formaat hebt staan, is de kans klein dat AI het oppikt. Zet die informatie ook op een HTML-pagina.

De gevolgen zijn praktisch. Als je website een single-page application is (React, Angular, Vue) die content client-side rendert, dan is het cruciaal om server-side rendering (SSR) of static site generation (SSG) te implementeren. Zonder SSR is je content onzichtbaar voor alle AI-crawlers. Dat is een direct verlies aan AI-zichtbaarheid.

Alt-teksten op afbeeldingen helpen indirect. AI-crawlers lezen de alt-tekst als HTML-tekst, niet als beschrijving van de afbeelding. Maar een goede alt-tekst geeft context over wat de afbeelding toont, en die context kan AI helpen om je pagina beter te begrijpen. "Foto van ons team bij de opening van ons nieuwe kantoor in Amsterdam-Zuid" vertelt AI meer dan "team-foto-1.jpg."

AI-crawlers voeren geen JavaScript uit. Als je content pas na JS-loading verschijnt, is het onzichtbaar voor AI. Implementeer SSR of zorg dat je HTML de volledige content bevat. Meer over hoe AI je website leest in hoe AI websites leest.

Begrijpen AI-zoekmachines jouw website?

VestVale monitort automatisch of ChatGPT, Gemini, Claude en Google AI je bedrijf citeren. Ontdek of je technische setup AI-vriendelijk is.

Aan de slag | vanaf €19,95/mnd

Hoe AI je content semantisch begrijpt

AI-crawlers lezen niet alleen tekst, ze begrijpen betekenis. Traditionele zoekmachines werkten met keyword matching: als het zoekwoord op je pagina stond, was je relevant. AI-modellen werken met semantic understanding: ze begrijpen dat "goedkope loodgieter" en "betaalbare loodgietersdienst" hetzelfde betekenen, zelfs als de exacte woorden niet overeenkomen.

Dit werkt via embeddings: je tekst wordt omgezet in numerieke representaties die de betekenis vastleggen. Teksten met vergelijkbare betekenis liggen dicht bij elkaar in de embedding-ruimte, ongeacht de exacte woordkeuze. Dit is de reden dat AI je kan vinden op vragen die je nooit letterlijk op je website hebt staan, zolang de betekenis overeenkomt. Meer over hoe AI betekenis herkent lees je in hoe AI context begrijpt.

Schrijf voor de lezer, niet voor het zoekwoord

Voor bedrijven betekent dit dat je niet meer hoeft te optimaliseren voor exacte zoekwoorden. Je hoeft niet "beste loodgieter Amsterdam" letterlijk op je pagina te zetten. Als je pagina duidelijk beschrijft dat je een loodgietersbedrijf bent, in Amsterdam gevestigd en goed beoordeeld, dan begrijpt AI dat je relevant bent voor die vraag. Schrijf voor de lezer, niet voor het zoekwoord.

De rol van structured data wordt door semantisch begrip nog belangrijker. JSON-LD schema markup geeft AI ondubbelzinnige informatie. "type": "LocalBusiness", "name": "Loodgieter Van Dijk", "address": "Amsterdam" is voor AI duidelijker dan een zin als "Loodgieter Van Dijk, al 25 jaar actief vanuit het hart van Amsterdam." De structured data is feitelijk, de tekst is interpretatief. Beide zijn waardevol, maar structured data elimineert giswerk. Lees meer in waarom structured data belangrijk is.

Entiteiten spelen een groeiende rol. AI probeert je bedrijf te koppelen aan een "entiteit" in zijn kennisbank: een uniek herkenbaar ding met een naam, locatie, type en eigenschappen. Hoe consistenter je informatie op alle bronnen, hoe makkelijker AI je als entiteit herkent en aan de juiste vermeldingen koppelt. Meer hierover in hoe AI bedrijfsinformatie verzamelt.

HTML-structuur als AI-signaal

Tot slot: de hierarchische structuur van je HTML helpt AI om de relatie tussen secties te begrijpen. Een H1 kop gevolgd door H2 secties met elk H3 subsecties vertelt AI hoe de informatie is georganiseerd. Een platte pagina zonder koppenstructuur is moeilijker te verwerken. Goede HTML-semantiek is gratis en heeft direct effect op hoe AI je content begrijpt.

Technische checklist: is je website AI-vriendelijk?

Server-side rendering

Als je een JavaScript-framework gebruikt (React, Vue, Angular), implementeer SSR of SSG. AI-crawlers voeren geen JavaScript uit. Zonder SSR is je content onzichtbaar. Test door je pagina te bekijken met JavaScript uitgeschakeld.

Robots.txt configuratie

Controleer dat je robots.txt AI-crawlers toelaat: OAI-SearchBot, PerplexityBot, ClaudeBot en Google-Extended. Als je ze blokt, kan AI je content niet lezen. Blokkeer GPTBot alleen als je niet wilt dat je data voor training wordt gebruikt.

JSON-LD schema markup

Implementeer minimaal LocalBusiness (of Organization), Article met auteur, FAQPage en Service schema. Test met Google's Rich Results Test. Zorg dat de markup consistent is met je zichtbare content.

Semantische HTML-structuur

Gebruik H1 voor de paginatitel, H2 voor secties, H3 voor subsecties. Gebruik semantische elementen: article, section, nav, header, footer. Vermijd div-soep. Goede HTML-semantiek helpt AI de relatie tussen secties te begrijpen.

Snelle laadtijden

AI-crawlers hebben timeouts. Een trage pagina wordt mogelijk niet volledig geladen. Optimaliseer Core Web Vitals: LCP onder 2,5 seconden, CLS onder 0,1. Snelle pagina's worden beter gecrawld door alle crawlers.

Content in HTML, niet in media

Zet alle belangrijke informatie in HTML-tekst, niet alleen in afbeeldingen, video's of PDF's. AI-crawlers kunnen geen tekst in afbeeldingen lezen. Als je prijzen alleen in een infographic staan, ziet AI ze niet. Dupliceer die informatie als tekst.

Veelgestelde vragen

Waarom ziet AI mijn React/Vue-website niet?

AI-crawlers voeren geen JavaScript uit. Ze lezen alleen de ruwe HTML-broncode. Als je content pas verschijnt nadat JavaScript is geladen (client-side rendering), is die content onzichtbaar. Implementeer server-side rendering (SSR) of static site generation (SSG) om je content beschikbaar te maken in de HTML-bron.

Moet ik AI-crawlers toelaten in mijn robots.txt?

Als je wilt dat AI-zoekmachines je content citeren: ja. Controleer dat OAI-SearchBot, PerplexityBot en ClaudeBot niet geblokkeerd zijn. Google-Extended apart toelaten voor Gemini en AI Overviews. Blokkeer GPTBot alleen als je niet wilt dat je data voor modeltraining wordt gebruikt.

Kan AI afbeeldingen en video's op mijn website lezen?

Nee. AI-crawlers lezen geen visuele content. Ze lezen wel alt-teksten van afbeeldingen en transcripten van video's als die als HTML-tekst beschikbaar zijn. Zet alle belangrijke informatie altijd ook in tekstformaat op je pagina. Een infographic met prijzen is onzichtbaar voor AI als er geen tekst bij staat.

Hoe test ik of AI-crawlers mijn website kunnen lezen?

Bekijk je pagina met JavaScript uitgeschakeld in je browser: dat is wat AI-crawlers zien. Als je content verdwijnt, heb je een probleem. Check ook je robots.txt op blokkades voor AI user-agents. Test je structured data met Google's Rich Results Test. En stel vragen over je bedrijf aan ChatGPT en Perplexity om te zien of ze je content herkennen.

Begrijpen AI-zoekmachines jouw website?

VestVale monitort automatisch of ChatGPT, Gemini, Claude en Google AI je bedrijf citeren. Ontdek of je website door AI wordt begrepen.

Vanaf €19,95/mnd excl. btw. Maandelijks opzegbaar.