Posts tagged googlebot

Link esterni rotti – External Broken Links

0

Grazie a Google Webmaster Tools ho notato in uno dei siti che seguo, in una nicchia molto concorrenziale e ad altissima resa economica, un numero elevato di LINK A PAGINE INESISTENTI che riportano l’errore 404 – page not found.

Dato che esistono delle penalizzazioni da parte di google per un alto numero di pagine non esistenti mi sono precipitato a capire il perchè, pensando subito ad un bug di Joomla. Quello che ho trovato invece è che i link provengono da altri domini che puntano a pagine inesistenti.

Dal momento che questi link provengono da siti di spam, forum infestati da spammers e quant’altro, e dato che le pagine verso cui i link puntano sono volontariamente simili ma non uguali a quelle di punta del mio sito, ho capito di essere sotto uno strano tipo di attacco di link spamming.

Stando a quanto sostengono gli esperti, avere “external broken links“, cioè link errati provenienti da siti esterni, non è un problema, in quanto se lo fosse sarebbe davvero facile far penalizzare un altro sito web.

Tuttavia so di avere a che fare con uno spammer professionista, un blackhat seo che riesce continuamente a posizionare il suo sito di 10 pagine davanti a colossi di 10.000 pagine, aggirando i controlli di Google su spam e cloaking, per cui il sospetto che questo deliberato inserimento di link sbagliati su siti di spam possa portare il mio sito ad una penalità mi tiene in allarme.

Come reagire a questo strano attacco di link spamming?

La mia prima reazione è stata quella di creare una pagina ad hoc per ogni link non trovato, giovando così del prezioso lavoro fatto dallo spammer.

Mi è anche stato suggerito da alcuni esperti di rispondere alla richiesta di GoogleBot con un http status code 410 – Gone, ma leggendo le specifiche credo sia preferibile evitare questa soluzione.

Essendo abbastanza paranoico sul rischio di penalizzazioni di Google ho quindi deciso di lasciare le cose esattamente come stanno, tenendo d’occhio la situazione quotidianamente.

Se avete avuto esperienze analoghe con spammer che hanno tentato di danneggiare il vostro posizionamento con link di spam, vi prego di segnalarlo nei commenti.

301 permanent Redirect da non-www a www

1

Un problema molto comune quando si analizza un sito a livello SEO è la presenza di contenuti duplicati.
Dal momento che Googlebot e gli altri spider considerano matteogiannone.com e www.matteogiannone.com due siti diversi, è necessario spiegare a Google e agli altri motori di ricerca che si tratta dello stesso sito.
La soluzione al problema è un Redirect 301 (Permanent Redirect) che spiega ai motori di ricerca la destinazione corretta.

Vediamo come risolvere il problema se si sta utilizzando il webserver Apache con installato mod_rewrite.

Apache con mod_rewrite

Inserire le seguenti righe nel file .htaccess e posizionatelo all’interno della directory root ( / ), inserendo l’indirizzo corretto del vostro sito web

RewriteEngine On
RewriteCond %{HTTP_HOST} ^matteogiannone\.com
rewriterule (.*) http://www.matteogiannone.com/$1 [R=301,L]

Provate ora ad accedere al vostro sito web senza il www (nel mio caso matteogiannone.com) e vedrete che il vostro browser verrà reindirizzato all’indirizzo con il www (www.matteogiannone.com).
In caso di problemi controllate se il redirect funziona con il tool per il controllo dei redirect.

Altro

Go to Top