GEO & AI SEO

Hoe AI bronnen
kiest

Wanneer ChatGPT, Perplexity of Google AI een antwoord genereert, kiest het welke bronnen het citeert. Dat is geen willekeurig proces. AI doorloopt een selectiemechanisme dat bepaalt welke websites betrouwbaar genoeg zijn, welke content het meest relevant is en welke passages het best citeerbaar zijn. De top 15 domeinen pakken 68% van alle AI-citaties. In dit artikel lees je precies hoe dat selectieproces werkt, waarom je Domain Authority er nauwelijks toe doet en wat wel bepaalt of AI jou als bron kiest.

68%

van AI-citaties gaat naar de top 15 domeinen

r=0,81

correlatie tussen E-E-A-T en AI-citaties

4%

van AI-citaties voorspeld door Domain Authority

21,9

gemiddeld aantal bronnen per Perplexity-antwoord

De verschuiving van ranking naar bronselectie

Bij Google gaat het om ranking: welke pagina staat op positie 1? Bij AI-zoekmachines gaat het om bronselectie: welke pagina wordt geciteerd als bron in het antwoord? Dat zijn fundamenteel verschillende processen. Ranking is een vaste lijst. Bronselectie is een dynamische keuze die per vraag opnieuw wordt gemaakt. Dezelfde website kan voor de ene vraag als bron worden gekozen en voor een vergelijkbare vraag worden overgeslagen.

Het verschil wordt duidelijk als je naar de cijfers kijkt. Slechts 38% van de bronnen die in Google AI Overviews worden geciteerd, staat in de top 10 van de reguliere Google-zoekresultaten. Dat betekent dat 62% van de geciteerde bronnen pagina's zijn die je in een gewone Google-zoekopdracht niet eens op de eerste pagina zou tegenkomen. AI selecteert bronnen op andere criteria dan Google rankt. Lees meer over dit verschil in hoe AI Google verandert.

Domain Authority verliest terrein

Domain Authority, jarenlang een van de belangrijkste voorspellers van Google-ranking, voorspelt slechts 4% van AI-citaties. De correlatie is r=0,18. Dat is bijna verwaarloosbaar. Ter vergelijking: E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness) correleert met r=0,81 met AI-citaties. Dat is een enorm verschil. AI beloont expertise en betrouwbaarheid, niet domeingrootte.

Dit opent de deur voor kleinere bedrijven en nichesites. Een gespecialiseerde website over zonnepanelen met sterke E-E-A-T-signalen (auteursinformatie, expertcredentials, citaties in vakpublicaties) kan door AI worden verkozen boven een groot energieportaal met hoge Domain Authority maar generieke content. AI zoekt de beste bron per specifieke vraag, niet de grootste website in de branche.

Maar er is een keerzijde. De concentratie is hoog: de top 15 domeinen pakken 68% van alle AI-citaties. Reddit domineert met 40% van alle citaties over platforms heen. Wikipedia, YouTube en grote nieuwssites nemen een groot deel van de rest. Dat betekent dat er buiten deze top een relatief klein deel van de citaties overblijft voor de rest van het internet. Het is mogelijk om als kleinere site geciteerd te worden, maar je moet er specifiek voor optimaliseren.

De spelregels zijn veranderd. Domain Authority is niet langer de sleutel. E-E-A-T, semantische volledigheid en platform-specifieke optimalisatie bepalen nu of je als bron wordt gekozen.

Hoe RAG werkt: trainingsdata versus real-time retrieval

AI-zoekmachines gebruiken twee bronnen van kennis. De eerste is trainingsdata: de enorme hoeveelheid tekst waarop het model is getraind. ChatGPT, Gemini en Claude hebben tijdens hun training miljarden webpagina's, boeken en documenten verwerkt. Die kennis zit ingebakken in het model. Claude gebruikt daarnaast Brave Search voor real-time webzoeken, wat het een uniek bronselectieprofiel geeft (lees meer in onze gids over zichtbaar worden in Claude). Maar trainingsdata heeft een beperking: het is bevroren op het moment van training. Alles wat na de trainingsperiode is gepubliceerd, ontbreekt.

De tweede bron is RAG: Retrieval-Augmented Generation. Dit is het mechanisme waarmee AI real-time informatie van het web ophaalt. Wanneer je een vraag stelt aan Perplexity of ChatGPT met webzoekopdracht, doorloopt het systeem eerst een retrieval-stap: het zoekt relevante pagina's op het actuele web. Die pagina's worden verwerkt en de relevante passages worden als context meegegeven aan het taalmodel. Het model genereert vervolgens een antwoord op basis van zowel zijn trainingskennis als de opgehaalde pagina's.

De retrieval-stap als flessenhals

RAG is cruciaal voor bronselectie omdat het bepaalt welke pagina's daadwerkelijk worden opgehaald en verwerkt. Het retrieval-systeem is een soort voorfilter. Alleen pagina's die door de retrieval-stap komen, maken kans op citatie. 73% van de fouten in AI-antwoorden ontstaat in de retrieval-fase, niet in de generatie-fase. Dat betekent dat het probleem meestal niet is dat AI je content verkeerd interpreteert, maar dat het je content niet ophaalt.

De retrieval-stap werkt via een combinatie van zoekopdrachten en semantische matching. AI formuleert intern een of meerdere zoekopdrachten op basis van de gebruikersvraag. Het zoekt via een zoekindex (Perplexity en ChatGPT gebruiken onder andere Bing) en haalt de meest relevante resultaten op. Die resultaten worden vervolgens gefilterd op kwaliteit, relevantie en betrouwbaarheid.

Moderne RAG-systemen worden steeds geavanceerder. CRAG (Corrective RAG) controleert de kwaliteit van opgehaalde documenten en verwerpt bronnen die niet betrouwbaar genoeg zijn. RA-RAG schat de betrouwbaarheid van een bron in voordat het die als context aan het model doorgeeft. Deze systemen worden continu verbeterd, waardoor de lat voor bronselectie steeds hoger wordt gelegd.

73% van fouten in AI-antwoorden ontstaat in de retrieval-fase. Het probleem is meestal niet dat AI je verkeerd interpreteert, maar dat het je niet vindt.

Voor je zichtbaarheid betekent dit twee dingen. Ten eerste: je pagina moet vindbaar zijn in de zoekindex die AI gebruikt. Zorg dat je pagina geindexeerd is in Google en Bing, dat je sitemap up-to-date is en dat je pagina technisch toegankelijk is voor crawlers. Ten tweede: je pagina moet de kwaliteitsfilters overleven. Structured data, duidelijke auteursinformatie en semantisch complete content verhogen de kans dat je pagina niet wordt weggefilterd in de retrieval-stap. Meer over hoe AI je content verwerkt lees je in hoe AI content interpreteert.

Platform-verschillen: elk AI-systeem kiest anders

ChatGPT citeert gemiddeld 5 domeinen per antwoord en leunt zwaar op web-consensus. 87% van ChatGPT-citaties matcht met de top 10 resultaten van Bing. ChatGPT zoekt bevestiging: het prefereert bronnen die consistent worden genoemd over meerdere andere bronnen heen. Wikipedia is de dominante bron voor ChatGPT, gevolgd door gevestigde nieuwssites en encyclopedische platforms. Voor bedrijven betekent dit dat zichtbaarheid op Wikipedia en in grote mediapublicaties direct doorwerkt in ChatGPT-citaties.

Perplexity citeert fundamenteel anders. Met gemiddeld 21,9 bronnen per antwoord is het veruit het meest citatiedichte platform. Perplexity werkt als een klassieke zoekmachine met een AI-laag eroverheen. Het haalt content in real-time op, citeert uitgebreid en linkt direct naar bronpagina's. Reddit domineert bij Perplexity (46,7% van citaten). Perplexity waardeert diversiteit: het citeert bewust uit meerdere bronnen om een evenwichtig antwoord te geven. Voor bedrijven is Perplexity het meest toegankelijke platform om geciteerd te worden.

Google AI Overviews en schema markup

Google AI Overviews citeert gemiddeld 7,7 domeinen per antwoord en is het meest geintegreerd met de traditionele zoekindex. Het prefereert goed gestructureerde pagina's met schema markup en complete FAQ-secties. Google AI Overviews is het platform waar technische optimalisatie het meeste effect heeft, omdat het voortbouwt op dezelfde index als regulier Google Search.

Gemini citeert opvallend veel brand-owned domeinen: 52,15% van zijn citaties verwijst naar de eigen websites van de merken die in het antwoord worden genoemd. Dat is significant hoger dan bij andere platforms. Voor bedrijven betekent dit dat je eigen website een sterkere bron is voor Gemini dan voor ChatGPT of Perplexity. Investeren in je eigen website loont het meest voor Gemini-zichtbaarheid.

De diversiteit in bronvoorkeur is enorm. Slechts 11% van alle domeinen wordt door zowel ChatGPT als Perplexity geciteerd. Dat betekent dat 89% van de geciteerde domeinen platformspecifiek is. Een website die excellent presteert in Perplexity kan volledig afwezig zijn in ChatGPT, en andersom. Dat maakt een multi-platform strategie essentieel.

Bronvoorkeuren verschuiven snel

De bronvoorkeuren van AI-platforms verschuiven bovendien snel. Reddit is in 2026 opgeklommen tot 40% van alle AI-citaties, terwijl het twee jaar geleden nauwelijks voorkwam. Die volatiliteit betekent dat een strategie die vandaag werkt, over zes maanden achterhaald kan zijn. Monitoren welke bronnen AI daadwerkelijk citeert, is daarom geen luxe maar een noodzaak. Meer over monitoring lees je in hoe bedrijven AI kunnen monitoren.

Word jij als bron gekozen door AI?

VestVale monitort automatisch of ChatGPT, Gemini, Claude en Google AI je bedrijf citeren. Ontdek of AI jou als bron selecteert.

Aan de slag | vanaf €19,95/mnd

E-E-A-T en auteurskwaliteit: de nieuwe sleutel tot bronselectie

E-E-A-T correleert met r=0,81 met AI-citaties. Dat maakt het veruit de sterkste voorspeller van bronselectie. Maar wat meet AI precies als het E-E-A-T beoordeelt? Het kijkt naar een combinatie van signalen die samen het vertrouwensprofiel van een bron vormen.

Auteursinformatie is een van de sterkste signalen. Content met een benoemde auteur die credentials heeft (functietitel, opleiding, ervaring), scoort significant beter dan anonieme content. AI kan de auteur cross-referencen met andere bronnen: komt dezelfde auteur voor op LinkedIn, in vakpublicaties, op conferentiesprekers-lijsten? Hoe meer externe bevestiging van de expertise van de auteur, hoe sterker het E-E-A-T-signaal.

Auteursprofiel als rankingfactor

Voor Nederlandse bedrijven betekent dit concreet: zet auteursinformatie op elke contentpagina. Maak auteurspagina's aan met bio, foto, opleiding en publicaties. Gebruik Person-schema (JSON-LD) om deze informatie machineleesbaar te maken. Link de auteurspagina aan externe profielen (LinkedIn, brancheverenigingen). Hoe rijker het auteursprofiel, hoe sterker de E-E-A-T-score van alle content die door die auteur is geschreven.

Naast auteurskwaliteit kijkt AI naar organisatie-autoriteit. Wordt je bedrijf genoemd in vakpublicaties? Heb je awards of certificeringen? Worden je experts geciteerd door anderen? Elk van deze signalen versterkt de E-E-A-T van je hele website. Een accountantskantoor waarvan de oprichter regelmatig wordt geciteerd in het Financieele Dagblad, bouwt een autoriteitsignaal op dat alle content op de website van dat kantoor ten goede komt.

Ervaringssignalen worden steeds belangrijker. AI zoekt content die is geschreven vanuit directe ervaring. Casestudies, klantresultaten en praktijkvoorbeelden signaleren dat de auteur niet slechts over het onderwerp schrijft, maar het ook daadwerkelijk beoefent. Een marketingbureau dat beschrijft hoe het de AI-zichtbaarheid van een specifieke klant met 40% heeft verhoogd, inclusief de aanpak en de resultaten, levert sterkere ervaringssignalen dan een theoretisch artikel over dezelfde technieken.

Transparantie bouwt vertrouwen

Trustworthiness komt tot uiting in transparantie. AI waardeert bronnen die duidelijk maken wie er achter de content zit, hoe ze hun geld verdienen en welke belangen ze hebben. Een vergelijkingssite die transparant maakt dat ze affiliate-vergoedingen ontvangt, scoort beter dan een vergelijkingssite zonder die disclaimer. Transparantie bouwt vertrouwen op, zowel bij gebruikers als bij AI. Meer over de rankingfactoren die AI meeweegt lees je in wat AI belangrijk vindt voor rankings.

Semantische volledigheid: het complete antwoord wint

AI meet hoe volledig je content een onderwerp behandelt. Die meting heet semantic completeness en het is een van de sterkste voorspellers van bronselectie. Content met een semantic completeness score van 8,5 of hoger (op een schaal van 10) is 4,2 keer waarschijnlijker om geciteerd te worden dan content met een lagere score. AI prefereert bronnen die het onderwerp in een keer afdekken, zodat het niet uit meerdere bronnen een antwoord hoeft samen te stellen.

Semantic completeness gaat niet over woordaantal. Het gaat over coverage: behandel je alle relevante deelonderwerpen? Een artikel over "BV oprichten" dat alleen de stappen beschrijft maar niets zegt over kosten, belastingvoordelen, notariskosten, kapitaaleis en alternatieven (eenmanszaak, VOF), is semantisch incompleet. AI "weet" welke deelonderwerpen bij een onderwerp horen omdat het miljoenen documenten over dat onderwerp heeft verwerkt.

Completeness meten als checklist

Hoe meet je dit zelf? Kijk naar de koppen van de top 10 pagina's voor je onderwerp. Welke deelvragen worden consequent behandeld? Die deelvragen zijn de verwachte onderdelen van een compleet antwoord. Als jouw content al die deelvragen behandelt en er een paar unieke invalshoeken aan toevoegt, scoor je hoog op semantic completeness. Gebruik de koppenstructuur van je artikel als checklist: elke H2 zou een logisch deelonderwerp moeten afdekken.

Topical authority versterkt semantic completeness op websiteniveau. Een website met tien gerelateerde artikelen over een onderwerp, elk met cross-links naar de andere artikelen, bouwt een kenniscluster op dat AI herkent. AI citeert niet alleen individuele pagina's, het beoordeelt ook de bredere context van de website. Een website die consistent diepgaande content publiceert over een specifiek expertisegebied, wordt eerder als betrouwbare bron geselecteerd.

Een concreet voorbeeld: een adviesbureau voor cybersecurity dat artikelen heeft over risicobeoordeling, penetratietesten, incident response, compliance-vereisten, security awareness training en de laatste dreigingen, bouwt topical authority op over het hele onderwerp cybersecurity. Als iemand aan AI vraagt over een specifiek deelonderwerp, weegt AI mee dat deze bron het bredere onderwerp ook afdekt. Dat verhoogt de betrouwbaarheid van de individuele pagina.

Van losse artikelen naar kennisclusters

De strategie is duidelijk: schrijf niet een enkel artikel over je kernonderwerp. Bouw een cluster van gerelateerde artikelen, elk met een eigen invalshoek, die samen het hele onderwerp afdekken. Link ze onderling. Zorg dat elk artikel op zichzelf semantisch compleet is. Zo bouw je zowel pagina-level als website-level signalen op die AI meeneemt in de bronselectie.

Strategie: hoe je als bron wordt gekozen

Investeer in E-E-A-T

Auteursinformatie op elke pagina. Person-schema voor experts. Externe vermeldingen in vakpublicaties. Casestudies met concrete resultaten. E-E-A-T is de sterkste voorspeller van AI-citaties met een correlatie van r=0,81.

Optimaliseer per platform

ChatGPT volgt web-consensus: zorg dat je zichtbaar bent op Wikipedia en in grote media. Perplexity waardeert diversiteit en Reddit-vermeldingen. Gemini prefereert je eigen website. Google AI Overviews beloont schema markup en FAQ-secties.

Bouw content-clusters

Schrijf meerdere gerelateerde artikelen over je expertisegebied. Link ze onderling. Bouw topical authority op. Content met een semantic completeness score van 8,5+ is 4,2x waarschijnlijker om geciteerd te worden.

Wees vindbaar in de zoekindex

73% van RAG-fouten ontstaat in de retrieval-fase. Zorg dat je pagina geindexeerd is in Google en Bing. Houd je sitemap up-to-date. Maak je pagina technisch toegankelijk voor crawlers. Als AI je niet kan ophalen, kan het je niet citeren.

Monitor je citaties

Bronvoorkeuren verschuiven snel. Reddit is in twee jaar van marginaal naar 40% van alle citaties gegaan. Wat vandaag werkt, kan over zes maanden achterhaald zijn. Monitor welke platforms je citeren en pas je strategie aan op basis van actuele data.

Diversifieer je aanwezigheid

Slechts 11% van domeinen wordt door meerdere AI-platforms geciteerd. Zorg voor aanwezigheid op meerdere platforms: je eigen website, branchesites, reviewplatforms, forums en sociale media. Elk touchpoint is een potentiele bron voor een ander AI-platform.

Veelgestelde vragen

Waarom citeert AI mijn concurrent wel en mij niet?

Waarschijnlijk heeft je concurrent sterkere E-E-A-T-signalen: duidelijke auteursinformatie, vermeldingen in externe media, meer reviews of betere structured data. Domain Authority is bijna irrelevant (voorspelt slechts 4% van citaties). Check of je concurrent zichtbaarder is op platforms die AI-modellen als bron gebruiken, zoals Wikipedia, Reddit of branchepublicaties.

Verschilt bronselectie per AI-platform?

Ja, enorm. ChatGPT citeert gemiddeld 5 bronnen en volgt web-consensus via Bing. Perplexity citeert 21,9 bronnen en haalt content in real-time op. Gemini citeert 52% brand-owned websites. Google AI Overviews citeert 7,7 bronnen en leunt op de Google-index. Slechts 11% van domeinen wordt door meerdere platforms geciteerd.

Hoe snel kan mijn content geciteerd worden?

Bij Perplexity kan dat binnen uren dankzij real-time web retrieval. Bij Google AI Overviews hangt het af van de reguliere Google-indexering (dagen tot weken). Bij ChatGPT hangt het af van of je pagina via de Bing-index wordt opgehaald of deel uitmaakt van de trainingsdata. Een up-to-date sitemap en actieve indexering versnellen het proces.

Is het mogelijk om als klein bedrijf geciteerd te worden?

Ja, juist. Domain Authority voorspelt bijna niets voor AI-citaties. Een gespecialiseerde website met sterke E-E-A-T, semantisch complete content en goede structured data kan worden verkozen boven een groot domein met generieke content. AI beloont diepgang en expertise per specifiek onderwerp, niet domeingrootte. Focus op je niche en wees daar de beste bron.

Waarom domineert Reddit zo in AI-citaties?

Reddit bevat ervaringscontent: echte mensen die echte ervaringen delen. AI waardeert dat als sterke E-E-A-T (Experience). Reddit-threads bevatten vaak meerdere perspectieven, wat diversiteit biedt. Perplexity citeert Reddit in 46,7% van zijn antwoorden. Voor bedrijven betekent dit: wees actief op Reddit en vergelijkbare platforms waar je doelgroep ervaringen deelt.

Kiest AI jou als bron?

VestVale monitort automatisch of ChatGPT, Gemini, Claude en Google AI je bedrijf citeren. Ontdek of je als bron wordt geselecteerd en waar je kansen liggen.

Vanaf €19,95/mnd excl. btw. Maandelijks opzegbaar.