Belajar Ngeblog

There are 24 entries in this Category.

Duplicate Content

Masih menyoal update Algoritma Google. Pengalaman salah satu blog saya terkena dampak update algoritma Google Penguin atau mungkin Google Panda tempo hari meski cukup mengecewakan tapi tetap ada hikmahnya. Setidaknya saya terdorong untuk mencari tahu, kemungkinan-kemungkinan apa saja yang potensial menjadi penyebabnya. Dan ini secara tidak langsung menjadi media pembelajaran saya dalam hal ngeblog. Orang bijak bilang, pengalaman adalah guru terbaik. ;-)

Kalau tempo hari saya menduga penyebab potensialnya adalah masalah links (backlink), namun ternyata ada juga faktor lain yang selama ini tidak saya sadari yaitu masalah duplicate content (konten ganda). Ada dua kategori duplicate content, 1. external 2. Internal

Duplicate content external ini maksudnya konten ganda yang sumbernya dari luar. Dan untuk yang satu ini, saya mempubilkasikan 2 artikel kiriman yang memang sebelumnya sudah dipublikasikan di blog sang pengirim. Namun saya kira bukan ini yang menjadi penyebab, tapi duplicate content yang kedua yaitu duplicate content internal.

Ternyata tanpa saya sadari, blog saya itu menghasilkan banyak halaman yang meskipun judulnya beda tapi isinya sama saja (duplicate content internal). Halaman ini dibangun dari dua sumber 1. Dari tag, 2. Page pagination / permalink id halaman (bener nggak nih ?  :-) .Dan semuanya berstatus indexed, jadi terekam oleh robot google.

Hal ini saya ketahui setelah saya coba check di mesin pencari google dengan mengetikkan “site:namadomain.com”

Hasilnya kira-kira yang seperti ini banyak sekali:

Judul  blog – Part 71
www.namadomain.com/page/71
Deskripsi isi halaman

Judul  blog – Part 12
www.namadomain.com/page/12
Deskripsi isi halaman

Judul  blog – Part 60
www.namadomain.com/page/60
Deskripsi isi halaman

 

Ketiga contoh hasil pencarian diatas semua menuju ke satu halaman yang sama

 

Ditambah ketika saya check halaman sitemap yang dibuat oleh plugin Google Sitemap Generator, ternyata isinya bukan hanya post url dan page url, tapi juga termasuk tag url dan page id url

Seperti begini:

    1. http://www.namadomain.com/ini-postingan-pertama
    2. http://www.namadomain.com/ini-postingan-kedua
    3. http://www.namadomain.com/ini-halaman-about  (dstnya)

 

lalu dibawahnya ada

12. http://www.namadomain.com/page-1

13. http://www.namadomain.com/page-2  (dan masih banyak lagi)

 

Plus seperti ini

45. http://www.namadomain.com/tag/tag1

46. http://www.namadomain.com/tag-2    (dan banyak lagi)

 

Sama seperti diatas, dua contoh yang ini juga, kalau dibuka isinya sama persis

 

 

Kekeliruan

Ada dua kekeliruan yang saya sadari:

  1. Saat membuat xml sitemap menggunakan plugin Google xml sitemap generator ternyata box tag dan page ikut kecentang. Alhasil halaman sitemap.xml yang kemudian saya kirimkan ke webmaster google bukan hanya berisi postingan. Sitemap content
  2. Ternyata dalam theme wordpress saya saya pakai, navigator halaman tidak berfungsi dengan baik. Link navigasi halaman yang defaultnya dengan anchor text “Next” ini menggunakan permalink nomor id halaman dan jika diklik hanya menggenerate nomor halaman baru tapi tidak dengan isinya.

    Bisa dibayangkan berapa halaman ganda yang sudah terindex google? :-D

    Tapi tetap bersyukur, Kalau memang benar internal duplicate content ini yang menjadi penyebab penalty google, setidaknya hanya satu blog saja yang keliru begini, lainnya tidak.

    Bagaimana dengan blog anda? Apa ada internal duplicate content juga?