Mục lục:
Định nghĩa - Web Scraping có nghĩa là gì?
Quét web là một thuật ngữ cho các phương pháp khác nhau được sử dụng để thu thập thông tin từ Internet. Nói chung, điều này được thực hiện với phần mềm mô phỏng lướt web của con người để thu thập các bit thông tin được chỉ định từ các trang web khác nhau. Những người sử dụng các chương trình quét web có thể đang tìm cách thu thập dữ liệu nhất định để bán cho người dùng khác hoặc sử dụng cho mục đích quảng cáo trên trang web.
Quét web cũng được gọi là trích xuất dữ liệu Web, quét màn hình hoặc thu hoạch Web.
Techopedia giải thích cào web
Quét web về cơ bản là một hình thức khai thác dữ liệu. Các mục như báo cáo thời tiết, chi tiết đấu giá, giá cả thị trường hoặc bất kỳ danh sách dữ liệu thu thập nào khác có thể được tìm kiếm trong các nỗ lực quét web.
Việc thực hành quét web đã thu hút rất nhiều tranh cãi bởi vì các điều khoản sử dụng cho một số trang web không cho phép một số loại khai thác dữ liệu nhất định. Bất chấp những thách thức pháp lý, việc quét web hứa hẹn sẽ trở thành một cách thu thập thông tin phổ biến khi các loại tài nguyên dữ liệu tổng hợp này trở nên có khả năng hơn.
