it-swarm.it

Esiste un modo per evitare che i motori di ricerca indicizzino una determinata sezione di una pagina?

Ho installato Blogger con il pannello Blog Archive mostrato su ogni pagina in modo che gli utenti possano facilmente accedere ai vecchi post. Il problema è che elenca il titolo di ciascuna pagina in questo pannello, il che significa che la pagina corrente sta ottenendo parole chiave non direttamente rilevanti per essa ma per una pagina diversa.

Ad esempio, potrei scrivere di arance, ma una settimana fa stavo scrivendo di mele. La pagina sulle arance è ora vista dai motori di ricerca per parlare anche di mele poiché c'è un link nel pannello Archivio al mio post di una settimana fa sulle mele. È vero anche il contrario dove la pagina delle mele sta indicizzando anche le parole chiave arancioni.

Esiste un modo per escludere una determinata sezione di una pagina dall'indicizzazione? (ad es. come avere un intero <div> che è etichettato come noindex o qualcosa di simile.)

So che Blogger ha un'opzione per rimuovere il titolo delle pagine nel pannello Archivio, ma preferirei che restassero lì in modo che gli utenti sappiano quali post sono disponibili.

13
Senseful

Presumibilmente puoi aggiungere la classe robots-nocontent agli elementi della tua pagina, in questo modo:

<div class="robots-nocontent">

    <p>Ignore this stuff.</p>

</div>

Yahoo lo rispetta , anche se non so se altri motori di ricerca lo rispettino. Sembra Google non lo supporta al momento. Ho il sospetto che se carichi i tuoi contenuti tramite Ajax, otterrai lo stesso effetto della loro assenza sulla pagina.

7
artlung

Non esiste un modo generale per farlo e personalmente non mi preoccuperei. I motori di ricerca sono abbastanza bravi a riconoscere il contenuto pertinente in una pagina e anche se quel contenuto potrebbe apparire nelle parole chiave che i motori di ricerca hanno trovato, ciò non significa che renderebbe la pagina pertinente per quelle parole chiave.

Se hai una pagina su "Fish" e una pagina su "Dogs" (che ha il link alla pagina su "Fish" da qualche parte nella barra laterale), i motori di ricerca saranno generalmente in grado di riconoscere che la pagina su "Fish" è molto più rilevante per "Fish" rispetto alla pagina "Dogs" che menziona "Fish" nella barra laterale. È possibile che entrambe le pagine possano essere trovate ad un certo punto, ma generalmente dato che per lo più una pagina del sito viene mostrata nei risultati di ricerca, non è qualcosa di cui preoccuparsi.

Non è necessario essere fantasiosi con questo, e i motori di ricerca rischiano di diventare più confusi se provi (ad esempio se usi JavaScript per nascondere il contenuto, non sai mai quando i motori di ricerca inizieranno a trovare quel contenuto a prescindere). Allo stesso modo, l'utilizzo di iframe con robots.txt non consente o AJAX peggiorerà frequentemente la qualità delle tue pagine per gli utenti (rallentandola o rendendola meno utilizzabile su una varietà di dispositivi), quindi a meno che non ci sia un ragione molto forte e comprovata che è necessario fare questo, consiglio vivamente di non preoccuparsene.

3
John Mueller

Credo che tu possa utilizzare un iFrame e il codice all'interno verrà indicizzato solo se consenti a Google di indicizzare quella pagina. Quindi se metti un nofollow nel tuo robots.txt per il file che viene caricato nell'iFrame dovresti essere a posto.

1
Ben Hoffman

Il testo della parola chiave in un collegamento è principalmente applicato alla pagina a cui punta il collegamento, non alla pagina su cui si trova il collegamento. Personalmente, non me ne preoccuperei troppo. Probabilmente starebbe peggio rimuovendo/occultando i titoli che lasciandolo.

0
Eric Petroelje

Google offre il suo modo di escludendo il testo indesiderato dall'indice .

Nel tuo esempio hai parlato dell'ancora, che Google offre questo esempio:

<!--googleoff: anchor-->
  <A href=sharks_rugby.html>shark</A>
<!--googleon: anchor-->

E ci sono alcune altre modalità.

0
lulalala