La maggior parte delle guide sull’AEO (Answer Engine Optimization, ovvero l’ottimizzazione per i motori di risposta) per WordPress ti dice di strutturare meglio i tuoi contenuti, aggiungere lo schema markup e scrivere risposte più chiare. Questi consigli non sono sbagliati. Ma manca il livello che determina se tutto questo lavoro viene visto.

I sistemi di intelligenza artificiale recuperano, analizzano, estraggono e sintetizzano i contenuti in tempo reale. Questo processo non dipende tanto da quanto è scritto bene un articolo, quanto dal fatto che la pagina possa essere recuperata, renderizzata e letta in modo affidabile da una macchina. Il tempo di risposta del server, la configurazione della cache, il rendering JavaScript, le regole CDN e le impostazioni di accesso dei bot sono le variabili che determinano se un crawler AI può raggiungere i tuoi contenuti.

Dopo aver monitorato il modo in cui i bot AI interagiscono con i siti WordPress a livello di infrastruttura, il problema più comune che abbiamo riscontrato in Kinsta è rappresentato da un sito che non può essere recuperato in modo affidabile, non da uno schema mancante o un contenuto mal strutturato.

Questo è l’obiettivo di questa guida. L’aspetto dei contenuti è importante e lo trattiamo in modo esaustivo. Ma il lato dell’infrastruttura è quello in cui la maggior parte dei siti WordPress sta perdendo terreno e in cui Kinsta ha qualcosa di specifico da dire.

AEO vs. SEO vs. GEO: la differenza

AEO, SEO e GEO (Generative Engine Optimization, l’ottimizzazione dei motori generativi) sono termini spesso utilizzati in modo intercambiabile e talvolta trattati come discipline completamente diverse. Nessuna delle due interpretazioni è corretta.

Abbiamo una guida dettagliata che spiega la differenza, ma la versione breve è che la SEO permette di posizionare le pagine nei risultati di ricerca tradizionali. L’AEO fa sì che i contenuti vengano estratti come risposta diretta nei featured snippet, nei risultati vocali e nelle panoramiche AI. La GEO serve per essere citati da sistemi di AI generativa come ChatGPT, Perplexity e Gemini.

L’aspetto più importante è che nessuno di questi tre elementi costituisce una strategia separata.

«C’è molta confusione intorno a questi acronimi, ma le basi non sono cambiate. È sempre necessario che il sito consenta il crawl dei bot (SEO), che sia chiaro (AEO) e che sia considerato affidabile in tutto il web (GEO). Si deve ancora scrivere per gli esseri umani e per le macchine. La differenza è che ora non si tratta solo di classifiche, ma anche di capire se i tuoi contenuti possono essere estratti e riutilizzati dall’intelligenza artificiale. Se riesci a fare questo, sei già a buon punto.» – Antonio Tinoco, SEO Team Lead di Kinsta

Perché WordPress è sia un vantaggio che una trappola

WordPress produce un HTML pulito e ben strutturato. Il suo sistema di categorie e tassonomie si adatta naturalmente ai cluster di argomenti preferiti dai motori di intelligenza artificiale. Ha un ecosistema di plugin che si è mosso rapidamente per supportare le esigenze specifiche dell’AEO. E poiché WordPress alimenta oltre il 40% del web, i motori di intelligenza artificiale effettuano costantemente il crawling delle installazioni del CMS, quindi possiamo dire che sanno come leggerlo.

Questo è davvero utile, ma crea anche un falso senso di sicurezza. Poiché WordPress gestisce così tante cose in modo automatico, i proprietari dei siti spesso pensano di essere al sicuro. Installano Yoast, vedono il cerchio verde e vanno avanti. Ma questo non è più sufficiente.

I pilastri che rendono un sito pronto per l’AEO vanno ben oltre la gestione predefinita dei plugin SEO. Ad esempio, tipi di schemi specifici, formattazione dei contenuti adatta all’AI, file llms.txt, gestione dei crawler dell’AI e una base tecnica in grado di gestire il traffico aggressivo dei bot senza deteriorarsi.

Analizziamo questi pilastri uno per uno.

Pilastro 1: contenuti pronti per essere recuperati

I motori di intelligenza artificiale non leggono una pagina come fa un essere umano. Non scorrono l’introduzione, non apprezzano la narrazione e non colgono le conclusioni implicite. Estraggono il testo in base alla struttura HTML, come titoli, paragrafi ed elenchi, e al modo in cui questi elementi si relazionano tra loro.

Come gli esseri umani leggono e come i motori AI estraggono i contenuti
Come gli esseri umani leggono e come i motori AI estraggono i contenuti

Pensa a quello che deve fare l’intelligenza artificiale: qualcuno fa una domanda, scansiona la tua pagina alla ricerca di una risposta chiara e citabile e decide se è abbastanza sicura da citarti. Se la risposta è sepolta a metà di un paragrafo denso, l’AI la ignora o sceglie una fonte più semplice.

A titolo di esempio, analizziamo due versioni diverse dello stesso contenuto:

La versione vaga: “Quando parliamo di featured snippet, c’è molto da considerare. Google sta evolvendo da anni il modo in cui vengono visualizzate le informazioni e per capire come vengono selezionate le risposte è necessario esaminare diversi fattori, tra cui la struttura dei contenuti, i segnali di rilevanza e il modo in cui le domande sono formulate nei titoli”.

La versione estraibile: “Un featured snippet è un breve estratto che Google estrae da una pagina web per rispondere a una query direttamente nei risultati di ricerca. Per apparire in uno di essi, il tuo contenuto deve rispondere alla domanda in modo chiaro, conciso e con un linguaggio semplice”.

La seconda versione è citabile. La prima richiede un’interpretazione. I sistemi di intelligenza artificiale favoriscono la seconda non perché sia più ottimizzata, ma perché la risposta è chiara e inequivocabile.

Ecco come applicare questo principio ai tuoi contenuti:

  1. Inizia con la risposta, poi espandi. Le prime due frasi dopo ogni sottotitolo (di solito un tag H2) devono indicare direttamente la risposta. I sistemi di intelligenza artificiale danno priorità ai contenuti che appaiono all’inizio della pagina.
  2. Scrivi i titoli come se fossero domande che le persone fanno davvero. “Cos’è l’ottimizzazione dei motori di risposta?” è meglio di “Panoramica”. Quando qualcuno chiede a ChatGPT “Che cos’è l’AEO?”, un titolo che rispecchia la domanda è un forte segnale di allineamento.
  3. Mantieni i paragrafi brevi. Una o due frasi. I paragrafi lunghi contengono più idee e i sistemi di intelligenza artificiale non sono sempre in grado di determinare quale frase sia la risposta vera e propria. I blocchi brevi e autocontenuti si estraggono in modo pulito.
  4. Usa le tabelle per i confronti, gli elenchi per i passaggi. Entrambi i formati sono strutturati in modo diverso dalla prosa scorrevole. Le panoramiche di AI utilizzano spesso elenchi e tabelle perché il formato fa già il lavoro di organizzazione.
  5. Non nascondere i contenuti dietro elementi interattivi. I crawler AI leggono solo quello che c’è nell’HTML quando la pagina viene caricata. Non cliccano né espandono nulla. Quindi, se le risposte alle FAQ si trovano all’interno di blocchi a fisarmonica o schede, assicurati che il testo della risposta sia ancora presente nell’HTML della pagina e non sia visibile solo dopo un’interazione con l’utente.

Pilastro 2: struttura leggibile dalla macchina

Lo schema markup (dati strutturati JSON-LD) è il modo in cui indichi esplicitamente ai sistemi di intelligenza artificiale quali sono i tuoi contenuti, utilizzando un vocabolario che sono stati costruiti per leggere. Invece di far supporre all’intelligenza artificiale che la tua pagina risponda a delle domande, lo dichiari direttamente.

Senza dati strutturati, i sistemi di intelligenza artificiale fanno più fatica a capire la tua pagina. E quando elaborano migliaia di fonti, scelgono sempre quella che facilita il loro lavoro.

Ad esempio, se la pagina FAQ del tuo concorrente ha lo schema FAQPage, può spesso aggiudicarsi la citazione rispetto alla tua pagina meglio scritta e senza schema.

Spiegazione dello schema FAQPage
Spiegazione dello schema FAQPage

I tipi di schema più importanti per AEO sono:

  • FAQPage contrassegna coppie specifiche di domande e risposte. Si tratta di uno schema ad alto impatto per AEO, in quanto le pagine che lo contengono hanno una probabilità significativamente maggiore di apparire nelle panoramiche dell’AI.
  • Article dichiara il tipo di contenuto, l’autore, la data di pubblicazione e la data di ultimo aggiornamento. Si tratta di segnali di fiducia fondamentali.
  • HowTo è molto utile per i contenuti passo-passo. I passaggi sono dichiarati esplicitamente nei dati strutturati, quindi i sistemi di intelligenza artificiale non devono interpretare la tua formattazione.
  • Organization stabilisce che il tuo brand è un’entità riconoscibile con un nome, un logo, un sito web e dei profili sociali. I sistemi di intelligenza artificiale costruiscono modelli di entità, non solo di pagine. Lo schema dell’organizzazione alimenta direttamente quel modello.

Per WordPress, il plugin Rank Math offre la configurazione dello schema più semplice. Per i JSON-LD personalizzati, il plugin WPCode permette di aggiungere lo schema markup a pagine specifiche senza modificare i file del tema.

Puoi far passare la pagina attraverso lo strumento Rich Results Testing di Google per vedere i tipi di Schema per cui il tuo post è idoneo.

Lo strumento Rich Results Testing di Google
Lo strumento Rich Results Testing di Google

Pilastro 3: Segnalazione dei contenuti AI con llms.txt

Il file di testo llms.txt si trova nella root del tuo dominio ed è scritto appositamente per i sistemi di intelligenza artificiale. Mentre il file robots.txt dice ai crawler a cosa possono accedere, llms.txt dice ai sistemi di intelligenza artificiale cosa vale la pena leggere.

Il concetto è stato proposto da Jeremy Howard di Answer.AI nel 2024 e da allora è stato adottato da aziende come Anthropic, Cloudflare e Stripe. Non è ancora uno standard ufficiale, ma la sua diffusione sta crescendo così rapidamente che a questo punto vale la pena perdere l’ora che ci vuole per implementarlo.

Spiegazione del formato Llms.txt
Spiegazione del formato Llms.txt

Come aggiungere il file llms.txt in WordPress

Esistono tre modi pratici per aggiungere un file llms.txt a un sito WordPress:

  • Utilizzando Yoast SEO (il più semplice se lo hai già). A partire da giugno 2025, Yoast include la generazione del file llms.txt sia nella versione gratuita che in quella premium. Yoast genera automaticamente il file in base ai tuoi contenuti.
  • Utilizzando il plugin Website LLMs.txt. Questo plugin ha oltre 30.000 installazioni attive ed è l’opzione più adatta a WordPress. Una volta attivato, genera automaticamente llms.txt e llms-full.txt nella root del tuo dominio.
  • Manualmente tramite FTP o File Manager. Crea un file di testo semplice chiamato llms.txt, scrivilo nel formato sopra indicato e caricalo nella directory principale del tuo sito (solitamente public_html) tramite FTP o il file manager del tuo hosting.

Come verificare che llms.txt sia funzionante

Visita il tuodominio.com/llms.txt nel browser. Dovresti vedere il file visualizzato come testo normale. Ad esempio, l’immagine qui sotto mostra il file Perplexity.ai:

Esempio di Llms.txt con Perplexity.ai
Esempio di Llms.txt con Perplexity.ai

Se ottieni un errore 404, il tuo server sta bloccando la visualizzazione del file. Assicurati di svuotare la cache e, se il risultato è ancora 404, controlla se un plugin di caching o il tuo CDN stanno intercettando l’URL.

Pilastro 4: Accessibilità ai crawl e governance dei bot AI

I motori di ricerca AI inviano i propri crawler, separati da Googlebot. Questi bot leggono i contenuti per elaborare risposte generate dall’intelligenza artificiale. I principali sono GPTBot (OpenAI), ClaudeBot (Anthropic), PerplexityBot e Google-Extended (Gemini).

Il tuo file robots.txt controlla quali di questi possono accedere al tuo sito. Se non hai mai aggiunto direttive esplicite per i crawler AI, potresti bloccarli accidentalmente. E se non riescono ad eseguire il crawl del tuo sito, non possono citarti.

Se utilizzi Cloudflare, potresti assicurarti che l’accesso ai crawler AI non sia disabilitato. Controlla in particolare le impostazioni della modalità Bot Fight di Cloudflare.

Bot flight mode Cloudflare settings
Impostazioni della modalità Bot fight di Cloudflare

I plugin di sicurezza sono altri colpevoli abbastanza comuni. Alcuni aggiungono ampie regole di blocco dei bot progettate per i bot spam che finiscono per catturare anche i crawler AI. Se stai utilizzando un filtro bot aggressivo, verifica che GPTBot e PerplexityBot non vengano segnalati.

L’approccio più sfumato consiste nel distinguere tra i bot AI orientati alla ricerca, che producono risultati di risposta e possono generare traffico di riferimento, e i bot di sola formazione, che scansionano i contenuti per l’addestramento dei modelli senza inviare traffico di ritorno. Puoi consentire l’accesso a uno e bloccare l’altro. I clienti di Kinsta possono farlo in MyKinsta tramite lo strumento Protezione bot.

Pilastro 5: affidabilità dell’infrastruttura

Questo è il pilastro che determina l’effettivo funzionamento di tutto il resto della guida. È anche quello che la maggior parte dei consigli AEO salta completamente.

I sistemi di intelligenza artificiale non si limitano a classificare le pagine, ma le recuperano. Questo processo di recupero è attivo e limitato nel tempo. Quando un utente pone una domanda a ChatGPT, il sistema invia un bot a recuperare le pagine pertinenti, analizzare l’HTML, estrarre la risposta e sintetizzare una risposta.

L’intero processo ha un budget di tempo. Le pagine che rispondono lentamente, che restituiscono errori o che richiedono l’esecuzione di JavaScript per rivelare il loro contenuto non vengono selezionate. Il bot passa oltre e il tuo contenuto non compare nella risposta. Questo non perché non fosse abbastanza buono, ma perché non era raggiungibile abbastanza velocemente.

Cosa osserviamo a livello di infrastruttura

Tra i siti WordPress ospitati da Kinsta, lo schema è coerente: gli ambienti più veloci e stabili attirano crawl AI più frequenti e completi. I siti più lenti ricevono meno visite, meno pagine indicizzate e meno citazioni come risultato diretto.

I bot lavorano in una coda di priorità, quindi i siti più performanti vengono rivisitati regolarmente, mentre quelli più lenti scendono nella lista.

Questo significa che il tuo hosting non è una preoccupazione secondaria per AEO: è una variabile primaria. Un tempo di risposta lento del server influisce su tutte le altre ottimizzazioni di questa guida.

I punti deboli specifici di WordPress

  1. Sovraccarico dei plugin. Ogni plugin attivo aggiunge un sovraccarico di esecuzione a ogni richiesta di pagina, comprese le richieste dei bot. Un’installazione di WordPress con 30 o più plugin è probabile che generi un carico significativo sul server ad ogni crawl. Dovresti controllare il tuo elenco di plugin e rimuovere quelli che non utilizzi attivamente. Il miglioramento delle prestazioni è immediato e influisce direttamente sulla capacità dei crawler dell’intelligenza artificiale di attraversare il tuo sito.
  2. Temi pesanti. Un tema che carica più file di script esterni, framework CSS di grandi dimensioni e font web per rendere un post del blog fa perdere tempo al crawler per risorse che i bot non usano e non possono rendere. Dal punto di vista del recupero, il peso della pagina è importante. Le pagine più leggere sono più veloci da recuperare, più veloci da analizzare e con maggiori probabilità di essere indicizzate completamente a ogni visita di crawling.
  3. Contenuti renderizzati con JavaScript. Questo è il punto di rottura tecnico più significativo per il recupero dell’AI. Se il tuo sito WordPress utilizza un page builder ad alto contenuto di JavaScript, un tema a blocchi con rendering lato client o qualsiasi altra configurazione in cui il contenuto si popola dopo l’esecuzione degli script da parte del browser, i crawler AI probabilmente vedranno una pagina incompleta. Leggono l’HTML restituito dal server, non il risultato dopo il rendering. Per verificare, apri una pagina importante nel browser, fai clic con il tasto destro del mouse e seleziona View Page Source. Se il testo dell’articolo non è visibile nell’HTML grezzo, i crawler AI non possono leggerlo. La soluzione consiste nell’assicurarsi che il contenuto sia presente nella risposta del server, non assemblato sul lato client.
  4. Configurazione errata della cache. Una cache ben configurata significa che i bot ricevono risposte veloci e coerenti e che le pagine vengono servite dalla cache anziché generate su richiesta. Ma c’è una modalità di fallimento specifica dei crawler AI: se i bot aggirano il tuo livello di cache e colpiscono invece gli endpoint dinamici di WordPress, attivano l’esecuzione completa di PHP e le query al database a ogni richiesta. Con gli schemi di richiesta aggressivi dei crawler AI, questo può generare un carico significativo sul server, rallentando le risposte, attivando il rate limit e causando crawl incompleti. L’obiettivo è quello di garantire che i crawler AI siano serviti dalla cache, non instradati intorno ad essa.
  5. Configurazione del CDN. Una CDN dovrebbe accelerare l’accesso dei crawler AI servendo i contenuti in cache da nodi periferici geograficamente vicini al crawler. Tuttavia, alcune configurazioni dei CDN, in particolare le regole aggressive di gestione dei bot, possono accidentalmente strozzare o bloccare i crawler AI nello stesso modo in cui bloccano i bot maligni. Se di recente hai cambiato le impostazioni del CDN o hai attivato le funzioni di gestione dei bot, verifica che i crawler AI continuino a ricevere risposte pulite e veloci.
  6. URL canonici. Ogni contenuto dovrebbe risolversi esattamente in un URL. Le pagine duplicate, come le varianti www vs. non-www, le versioni dei parametri URL e la paginazione, dividono l’attenzione e i segnali del sistema AI su più versioni dello stesso contenuto. Una canonicalizzazione pulita significa che la fiducia del crawler si concentra su un’unica pagina definitiva anziché diluirla.
  7. Valutazioni sulla sitemap XML. Alcuni crawler AI utilizzano le sitemap come meccanismo di scoperta dei contenuti che non hanno raggiunto attraverso i link interni. Una sitemap obsoleta significa che i contenuti pubblicati di recente potrebbero non essere scoperti per settimane. La maggior parte dei plugin SEO gestisce automaticamente la generazione della sitemap, ma conferma che i nuovi post appaiono subito dopo la pubblicazione.

Una corretta infrastruttura non garantisce le citazioni, poiché il contenuto deve ancora guadagnarsele. Tuttavia, non azzeccare quella giusta limita in modo significativo il numero di contenuti ottimizzati che vengono letti.

Il quadro completo

Abbiamo affrontato cinque pilastri che costituiscono il nucleo dell’AEO per WordPress. La maggior parte delle guide sull’AEO tratta questo problema come un problema di contenuti e di schemi.

Per quanto riguarda l’infrastruttura, il problema più comune è un sito che non può essere recuperato in modo affidabile. Un hosting veloce, un accesso pulito al crawl, un contenuto renderizzato sul server e uno schema corretto sono gli elementi che ti permettono di essere citato.

WordPress può gestire tutto questo. La questione è se ogni livello è stato deliberatamente predisposto.

Se vuoi che la parte infrastrutturale sia gestita al posto tuo, l’hosting gestito per WordPress di Kinsta è pensato proprio per questo. Potrai usufruire di tempi di risposta rapidi, di un caching completo delle pagine e di un’architettura che resiste al traffico aggressivo dei crawler AI senza subire rallentamenti per i tuoi visitatori effettivi.

Joel Olawanle Kinsta

Joel è uno Frontend developer che lavora in Kinsta come redattore tecnico. È un insegnante appassionato che ama l'open source e ha scritto oltre 200 articoli tecnici principalmente su JavaScript e i suoi framework.