Apa Itu Situs Scraper? - Jawaban Semalt

Situs pengikis adalah situs web yang menyalin konten dari blog dan situs web lain menggunakan beberapa teknik pengikisan web. Konten ini dicerminkan dengan tujuan menghasilkan pendapatan, baik melalui iklan atau dengan menjual data pengguna. Berbagai situs pengikis berbeda berdasarkan bentuk dan jenis, mulai dari situs konten spam hingga agregasi harga dan outlet belanja di internet.

Mesin pencari yang berbeda terutama Google dapat dianggap sebagai situs pengikis. Mereka mengumpulkan konten dari berbagai situs web, menyimpannya dalam database, mengindeks dan menyajikan konten yang diekstraksi atau dikikis ke pengguna di internet. Bahkan, sebagian besar konten yang dikeruk atau diekstraksi oleh mesin pencari telah dilindungi hak cipta.

Dibuat untuk iklan:

Beberapa situs pengikis diciptakan untuk menghasilkan uang secara online menggunakan berbagai program periklanan. Dalam keadaan seperti itu, mereka dinamai Made for AdSense websites atau MFA. Istilah menghina mengacu pada situs yang tidak memiliki nilai penebusan yang diharapkan untuk menarik, memikat, dan melibatkan pengunjung ke situs web yang ditentukan untuk mendapatkan klik pada iklan. Situs web dan blog Made for AdSense dianggap sebagai spam mesin pencari yang kuat. Mereka mencairkan hasil pencarian dengan hasil yang kurang memuaskan. Beberapa situs scraper diketahui terhubung ke situs web lain dan bertujuan untuk meningkatkan peringkat mesin pencari melalui jaringan blog pribadi. Sebelum Google memperbarui algoritma pencariannya, berbagai jenis situs scraper dulu terkenal di kalangan pakar dan pemasar SEO topi hitam. Mereka menggunakan informasi ini untuk spamdexing dan melakukan berbagai fungsi.

Legalitas:

Situs scraper diketahui melanggar undang-undang hak cipta. Bahkan mengambil konten dari situs open source adalah pelanggaran hak cipta, jika dilakukan dengan cara yang tidak menghormati lisensi apa pun. Sebagai contoh, Lisensi Dokumentasi Bebas GNU dan lisensi Creative Commons ShareAlike digunakan di Wikipedia dan mengharuskan penerbit ulang Wikipedia untuk menginformasikan kepada pembaca bahwa kontennya disalin dari ensiklopedia.

Teknik:

Teknik atau metode yang ditargetkan situs pengikis bervariasi dari satu sumber ke yang lain. Misalnya, situs web dengan sejumlah besar data atau konten seperti elektronik konsumen, maskapai penerbangan, dan department store, dapat secara rutin ditargetkan oleh pesaing. Pesaing mereka ingin tetap mendapat informasi tentang harga saat ini dan nilai pasar suatu merek. Jenis pengikis lain menarik potongan dan teks dari situs yang berperingkat tinggi untuk kata kunci tertentu. Mereka cenderung meningkatkan peringkat mereka di halaman hasil mesin pencari (SERP) dan dukung-dukungan pada peringkat halaman web asli. Umpan RSS juga rentan terhadap pencakar. Pengikis biasanya dikaitkan dengan tambak tautan dan dirasakan saat situs pengikis menaut ke situs web yang sama berulang kali.

Pembajakan domain:

Programmer yang telah membuat situs scraper dapat membeli domain kadaluwarsa untuk menggunakannya kembali untuk keperluan SEO. Praktik semacam itu memungkinkan para pakar SEO memanfaatkan semua backlink dari nama domain itu. Beberapa spammer mencoba mencocokkan topik-topik situs yang kadaluwarsa dan / atau menyalin seluruh konten dari Internet Archive-nya, menjaga keaslian dan visibilitas situs tersebut. Layanan hosting sering menyediakan fasilitas untuk menemukan nama-nama domain yang kadaluwarsa, dan peretas atau spammer menggunakan informasi ini untuk mengembangkan situs web mereka sendiri.