Trang Chủ Viết blog Nội dung cạo là gì? - định nghĩa từ techopedia

Nội dung cạo là gì? - định nghĩa từ techopedia

Mục lục:

Anonim

Định nghĩa - Scraping có nghĩa là gì?

Quét nội dung là một cách đánh cắp nội dung gốc bất hợp pháp từ một trang web hợp pháp và đăng nội dung bị đánh cắp lên một trang web khác mà không có kiến ​​thức hoặc sự cho phép của chủ sở hữu nội dung. Những kẻ phá hoại nội dung thường cố gắng loại bỏ nội dung bị đánh cắp như của chính họ và không cung cấp quyền cho chủ sở hữu nội dung.


Quét nội dung có thể được thực hiện thông qua sao chép và dán thủ công hoặc có thể sử dụng các kỹ thuật phức tạp hơn, chẳng hạn như sử dụng phần mềm đặc biệt, lập trình HTTP hoặc trình phân tích cú pháp HTML hoặc DOM.


Phần lớn nội dung rơi vào tình trạng cào bằng là tài liệu có bản quyền; đăng lại mà không có sự cho phép của chủ sở hữu bản quyền là một hành vi phạm tội bị trừng phạt. Tuy nhiên, các trang web cạp được lưu trữ trên toàn thế giới và những người dọn dẹp được yêu cầu xóa nội dung có bản quyền chỉ có thể chuyển đổi tên miền hoặc biến mất.

Techopedia giải thích nội dung cào

Những người dọn dẹp nội dung có thể hướng lưu lượng truy cập đến trang web của họ bằng cách loại bỏ nội dung dày đặc, chất lượng từ khóa từ các trang web khác. Các blogger đặc biệt dễ bị ảnh hưởng bởi điều này, có thể là do các blogger cá nhân không có khả năng thực hiện một cuộc tấn công hợp pháp chống lại người dọn dẹp. Phế liệu được khuyến khích tiếp tục thực hành này vì các công cụ tìm kiếm chưa tìm ra cách hiệu quả để lọc nội dung độc đáo khỏi nội dung bị loại bỏ, cho phép người dọn rác tiếp tục hưởng lợi.


Quản trị viên trang web có thể tự bảo vệ mình khỏi việc cào bằng các biện pháp đơn giản, chẳng hạn như thêm liên kết đến trang web của riêng họ trong nội dung. Điều này ít nhất sẽ cho phép họ có được một số lưu lượng truy cập từ nội dung bị loại bỏ. Các phương pháp tinh vi hơn để xử lý cào bằng bot bao gồm:

  • Các ứng dụng chống bot thương mại
  • Bắt bot bằng honeypot và chặn địa chỉ IP của chúng
  • Chặn bot bằng mã JavaScript
Nội dung cạo là gì? - định nghĩa từ techopedia