I messaggi di errore in WordPress tendono a essere confusi e un po’ difficili da risolvere, ma l’errore “Your sitemap appears to be an HTML page”, cioè “La tua sitemap sembra essere una pagina HTML”, per fortuna, non è uno di questi.

Se avete riscontrato questo problema, probabilmente vi starete chiedendo cosa significa questo errore, cosa c’è di sbagliato nel fatto che la vostra sitemap sia in HTML, e come potete risolvere questo problema. E cosa succede se la vostra sitemap è già nel formato corretto e vedete ancora questo errore?

Vi spiegheremo tutto: come funziona una sitemap, il formato in cui dovrebbe essere, e alcuni modi diversi per risolvere il problema.

Date un’occhiata alla nostra video guida per risolvere l’errore “Your Sitemap Appears to Be An HTML Page”:

Cos’è una Sitemap?

Sapete come i motori di ricerca trovano il vostro sito? Con un piccolo bot chiamato web crawler, uno strumento automatico inviato dai motori di ricerca per indicizzare le pagine del vostro sito.

Esistono milioni di pagine sul web, e raccogliere informazioni su ogni sito internet sarebbe impossibile per un team di esseri umani. I web crawler scansionano internet, memorizzando le informazioni su ogni pagina e media che incontrano.

Sembra semplice, ma Google non sa automaticamente quando aggiungete una nuova pagina al vostro sito: non si rende subito conto, per esempio, che avete pubblicato un articolo sul blog o rilasciato un nuovo prodotto nel vostro negozio. I motori di ricerca mandano periodicamente in avanscoperta il web crawler affinché visiti il vostro sito e veda se qualcosa è cambiato. Ma il processo non è istantaneo.

Quando si ha un sito web enorme, è facile che il crawler perda le pagine chiave anche dopo più visite. Si tratta di un problema soprattutto quando queste pagine non vengono linkate spesso.

È qui che entrano in gioco le sitemap per aiutare i crawler. Questi file XML sono diversi da una normale pagina del vostro sito; sono generalmente illeggibili dagli esseri umani e non sono destinati a essere letti da chi visita le vostra pagine. Ma i web crawler possono usarli per assicurarsi che tutto venga indicizzato.

Un esempio di una Sitemap XML.
Un esempio di una Sitemap XML.

Come funzionano? In pratica elencano tutte le pagine del vostro sito insieme alla loro gerarchia di link, più altri file sul vostro sito come immagini e video. Questo assicura che Google veda tutto quello che è stato pubblicato sul vostro sito e migliori la SEO di conseguenza.

Se avete usato uno strumento come Google Analytics o Google Search Console, allora potreste aver visto un’opzione per collegare la vostra sitemap. Google farà prima riferimento a questa quando invierà i web crawler al vostro sito.

La homepage di Google Search Console.
La homepage di Google Search Console.

Differenze tra Sitemap HTML e XML

Ok, quindi la vostra sitemap è una pagina HTML, ma qual è esattamente il problema? Perché Google vuole farvela cambiare?

Le sitemap devono essere scritte in un formato particolare perché i web crawler le capiscano. Nella maggior parte dei casi, deve trattarsi di un file XML. Possono anche leggere un RSS, Atom, KML, o un file di testo, ma XML è la scelta più comune.

Un esempio di feed RSS.
Un esempio di feed RSS.

XML sta per “Extensible Markup Language”. È un linguaggio web molto simile all’HTML. La differenza sta nel suo uso: è leggibile dall’uomo ma la sua funzione primaria è quella di aiutare le macchine a codificare documenti e leggere dati.

In questo caso, deve aiutare un web crawler a capire dove si trovano le pagine e gli altri media sul vostro sito e come interagiscono tra loro.

Potreste aver visto usare il termine “sitemap” anche in un contesto molto diverso. Le sitemap HTML esistono, ma la grande differenza è che sono fatte per gli esseri umani, non per i web crawler.

Se vi è mai capitato di fare clic su un link per la navigazione di un sito e atterrare su una lista di pagine del sito leggibili e dal design curato, avete incontrato una sitemap. Ma anche se può essere utile ai vostri visitatori, non è il file che Google sta cercando.

Una sitemap XML compare davanti agli occhi degli utenti più come un groviglio di codice illeggibile o un enorme muro di link, quindi se volete aggiungere una pagina di navigazione utile al vostro sito, create pure una sitemap HTML… ma affiancatele anche una sitemap XML.

Un esempio di sitemap.
Un esempio di sitemap.

Altri Tipi di Sitemap

Quando pensate a una sitemap, quello che vi viene in mente potrebbe essere una semplice lista delle pagine del vostro sito. Ma Google usa diversi tipi di sitemap per catalogare varie informazioni. Questi includono:

  • Video: I video sul vostro sito possono essere indicizzati appositamente per apparire nei risultati di Google Video.
  • Immagini: Lo stesso vale per le immagini. Alcune immagini, come quelle incorporate nel codice Javascript, potrebbero non essere normalmente indicizzate. Una sitemap delle immagini può aiutare a garantire che il vostro sito appaia in Google Images.
  • Notizie: State curando una rubrica o scrivendo articoli? Google include una sezione dedicata nella sua area Google News, e una News Sitemap può permettervi di comparire correttamente in quell’area e ottenere più traffico.
  • Codice: Google indicizza gli snippet di codice per aiutare chi si occupa di programmazione a cercare codice e file.
  • Dati geografici: Potete usare una speciale sitemap KML per offrire a Google dati migliori sulla sede della vostra attività.

In genere, alcune di queste informazioni si trovano nella vostra sitemap principale. Altre devono avere la loro speciale sitemap dedicata. E alla fine, tutte devono essere opportunamente formattate in XML o in un altro formato supportato, non in HTML.

Come Generare una Sitemap XML

Se avete intenzionalmente inviato un link a una sitemap HTML, dovrete invece sostituirla con un file XML. Se non sapete come crearne una, ci sono diversi modi per crearla con plugin WordPress e generatori che potete trovare online.

Inoltre, se avete una sitemap XML che non funziona, rigenerare o inviare una sitemap diversa può risolvere il problema.

Ci sono due modi semplici per ottenere una sitemap: usare un plugin o un generatore di sitemap.

Generare una Sitemap con un Plugin

Con WordPress, il modo più semplice per avere una sitemap che si aggiorna dinamicamente sul vostro sito web è quello di scaricare un plugin. In questo modo, non dovrete caricare manualmente nessun file sul vostro server.

Ci sono alcuni plugin che generano una sitemap:

  • Yoast SEO: Il plugin SEO più popolare sul repository offre anche la funzionalità di generazione sitemap. Potete trovare le impostazioni sotto SEO > General > Features e XML Sitemaps.
  • RankMath: Oltre a una normale sitemap, questo plugin SEO può anche generare una sitemap WooCommerce e una sitemap di geodati KML. Andate su RankMath > Sitemap Settings.
  • XML Sitemaps: Come dice il nome, XML Sitemaps genererà una sitemap. Il plugin è 100% gratuito e open source, quindi non ci sono costi nascosti.
  • Sitemap XML e Google News: Questo plugin genera sia una sitemap XML che una sitemap di Google News. È anche facile da installare e impostare.
  • Companion Sitemap Generator – HTML & XML: Se volete generare una sitemap HTML insieme a una sitemap XML, questo è il plugin che fa per voi. Entrambi vengono aggiornati automaticamente, quindi non è necessario fare alcun lavoro manuale.

Siti Generatori di Sitemap

Invece di un plugin, potete usare un generatore di sitemap come XML-Sitemaps o XML Sitemap Generator. Potete poi caricarla sul vostro sito.

Passo 1: Generate una sitemap usando uno dei siti sopra o qualsiasi generatore di vostra scelta. Scaricate il documento XML.

Generatore di sitemap XML
Generatore di sitemap XML

Passo 2: Scaricate FileZilla o (se supportato) usate il vostro host web per connettervi al vostro sito via FTP.

Passo 3: Mettete il file XML nella cartella principale del vostro sito. La root è la directory più in alto del vostro sito, la stessa da cui iniziate quando vi connettete per la prima volta.

Come Risolvere l’Errore di Sitemap

L’errore della sitemap è spesso causato dall’invio accidentale di una pagina HTML piuttosto che di un file XML formattato correttamente. Ma se la vostra sitemap XML pretende ancora di essere una pagina HTML, potreste avere un problema più profondo.

Niente paura: il problema di solito risiede in un conflitto facile da risolvere tra i vostri plugin WordPress. Ecco alcuni suggerimenti per far funzionare di nuovo correttamente la vostra sitemap.

Controllare gli Errori e i Reindirizzamenti

È molto più facile diagnosticare il problema se avete un codice di errore esplicito da cercare. La prima cosa da fare è visitare la pagina della vostra sitemap e vedere se ci sono strani codici di errore.

La pagina di errore 404 di Kinsta.
La pagina di errore 404 di Kinsta.

Se notate un errore quando visitate la vostra sitemap, questo potrebbe indurre Google a pensare di trovarsi di fronte a una pagina HTML. Usate questo errore per aiutarvi nella risoluzione del problema. La nostra lista di codici di stato HTTP può aiutarvi.

Cosa succede se notate l’errore sitemap in modo intermittente, cioè a volte si presenta e a volte no? Può succedere se state generando dinamicamente una sitemap.

Piccoli blip e timeout del server saranno letti da Google come se la vostra sitemap fosse improvvisamente una pagina HTML, poiché mostra un messaggio di errore piuttosto che un file XML. Finché l’errore è raro e non è continuo o frequente, di solito non c’è motivo di preoccuparsi.

Un’altra cosa a cui fare attenzione sono i reindirizzamenti. Se visitate la pagina della sitemap e improvvisamente finite sulla homepage o in un loop di reindirizzamento infinito, anche questo causerà dei problemi.

Se trovate errori o reindirizzamenti che non scompaiono, il problema di solito risiede in un conflitto di plugin. I plugin che generano sitemap come Yoast possono causare un conflitto, oppure un plugin di caching potrebbe essere la fonte del problema.

A volte, anche plugin casuali possono causare conflitti. Servitevi del plugin Health Check & Troubleshooting per identificarli.

Il plugin Health Check & Troubleshooting dopo l'installazione.
Il plugin Health Check & Troubleshooting dopo l’installazione.

Se non è già presente, installatelo poi andate su Tools > Site Health > Troubleshooting Mode. Questo spegnerà temporaneamente tutti i plugin senza influenzare i vostri visitatori.

Controllate se l’errore o il reindirizzamento è sparito dal vostro sito. Se è così, riabilitate i plugin uno per uno finché il sito non si rompe di nuovo. In questo modo potete capire se esistono conflitti tra più plugin.

Ora potete contattare chi ha scritto il plugin per segnalare il bug e chiedere assistenza.

Disattivare la Cache

Una delle maggiori cause di conflitti si deve ai plugin di caching. Quando una sitemap viene memorizzata nella cache, potrebbe generare un conflitto per Google che la legge come una pagina HTML: i file XML non andrebbero memorizzati nella cache in questo modo.

La maggior parte dei plugin di caching eviterà il caching di una pagina sitemap proprio per questo motivo, ma potrebbero comunque farlo per sbaglio, specialmente se state usando un URL unico per la vostra sitemap.

Per fortuna, non è necessario disabilitare l’intero plugin di caching. Potete aggiungere un’eccezione e il problema dovrebbe risolversi automaticamente.

La documentazione del vostro plugin dovrebbe coprire questo aspetto, ma ecco come farlo con WP Super Cache e W3 Total Cache.

Per WP Super Cache, andate su Settings > WP Super Cache. Sotto la scheda Advanced, scorrete fino a Add here strings (not a filename) that forces a page not to be cached.

In questa sezione, inserite l’URL parziale della vostra sitemap. Per esempio, se la vostra sitemap si trova su “example-site.com/sitemap.xml”, inserite “/sitemap.xml”.

Per W3 Total Cache, andate a Performance > Page Cache, poi cercate Advanced > Never cache the following pages. Proprio come con WP Super Cache, inserite l’URL della sitemap.

Potreste anche aggiungerlo a Minify sotto Performance > Minify e Never minify the following pages perché questo può portare a problemi.

Controllare l’URL della Sitemap

Anche se questo è un suggerimento piccolo, vale sempre la pena ricontrollare: avete inviato il link corretto? È un errore banale, ma anche un solo carattere errato contribuirà a reindirizzare al posto sbagliato.

Controllate il link che avete inviato, sia tramite Google che in qualsiasi plugin SEO o sitemap.

Alcuni plugin potrebbero aggiungere una barra finale alla fine della vostra pagina sitemap (“example-site.com/sitemap/” invece di “example-site.com/sitemap”). Questo unico carattere può generare enormi problemi, specialmente se causa un loop di reindirizzamento.

Anche in questo caso, attivate la modalità troubleshooting nel plugin Health Check e cercate di trovare quale plugin sta causando questo problema. La maggior parte delle volte, è possibile risalire a un singolo plugin.

Rimuovere le Sitemap Extra

Finché i collegamenti alla pagina sono corretti, non ci saranno problemi; ma avere sitemap extra attive potrebbe causarvi problemi o confusione. Inoltre, il vostro server sta spendendo risorse aggiuntive per aggiornare diverse sitemap non necessarie.

I plugin possono aggiungere diverse sitemap, e potreste non sapere che anche WordPress genera le sue proprie sitemap. Dovreste controllarle e rimuoverle tutte tranne quella che volete usare. Qui ci sono alcuni URL che potete provare sul vostro sito:

  • /sitemap.xml – Una scelta comune per le sitemap generate dalla maggior parte dei plugin per sitemap.
  • /wp-sitemap.xml – Questa è la sitemap predefinita generata da WordPress versione 5.5.
  • /sitemap_index.xml – L’URL per sitemap generata da Yoast.

Inoltre, se avete scaricato altri plugin SEO o sitemap, questi potrebbero usare un URL completamente diverso. Controllate la documentazione e assicuratevi di disabilitare qualsiasi funzionalità sitemap che non vi serve.

Avete Davvero Bisogno di una Sitemap?

A volte le sitemap possono inspiegabilmente essere la fonte di un flusso costante di problemi. E una semplice correzione potrebbe non essere sufficiente per farli sparire. Se vi imbattete costantemente in problemi difficili da risolvere, potreste iniziare a mettere in dubbio l’importanza vitale di avere una sitemap.

Di solito la creazione di una sitemap è incoraggiata e lo stesso Google dice che non penalizzerà mai la vostra SEO per averlo fatto. Può solo aiutare a migliorare la SEO e a far indicizzare il vostro sito più velocemente.

Ma in certe situazioni non è obbligatorio averne una, e Google stesso suggerisce che alcuni siti non le usano.

Supponiamo che il vostro sito abbia meno di 500 pagine e che probabilmente non ne avrà mai di più. In questo caso, finché la struttura dei link interni è corretta (cosa a cui dovreste comunque prestare attenzione) e non avete molti file multimediali da mostrare in Google Images e Google Video, potrebbe non essere necessario avere una sitemap.

D’altra parte, avere una sitemap può davvero aiutare la vostra SEO e non c’è niente di male nell’averne una, quindi spingere e risolvere il problema non può fare altro che bene. Il vostro sito può essere piccolo ora, ma probabilmente non lo sarà per sempre.

Se non sapete come avanzare, potete sempre rivolgervi al supporto del vostro host per capire cosa potrebbe causare il problema.

Riepilogo

L’errore “Your sitemap appears to be an HTML page” può essere complesso da individuare, ma di solito è solo il risultato di una pagina formattata in modo improprio o di un conflitto di caching facilmente risolvibile. Una volta che avete capito il problema, risolverlo è solo una questione di pochi passi.

Con un errore spesso ne arriva un altro, quindi se avete ancora problemi con il vostro sito, provate a dare un’occhiata alla nostra guida completa a oltre 65 errori di WordPress e come risolverli.

Salman Ravoof

Salman Ravoof é uno sviluppatore web autodidatta, uno scrittore, un creatore e un grande ammiratore del Free and Open Source Software (FOSS). Oltre alla tecnologia, è appassionato di scienza, filosofia, fotografia, arte, gatti e cibo. Per saperne di più su di lui, visitate il suo sito web o contattate Salman su X.