Quét dữ liệu có cấu trúc từ website bất kỳ.
Xem chi tiết
Phiên bản 1.1.0.1 tiếp tục hoàn thiện phần mềm lấy dữ liệu từ website Scan Web Pro. Trong phiên bản cập nhật này iClick bổ sung tính năng lấy bằng trình duyệt để giúp phần mềm lấy được nhiều website hơn và lấy tốt hơn. Ngoài ra còn nhiều cập nhật khác như xóa html code trong một trường dữ liệu, bấm nút xem số điện thoại trên một số website yêu cầu bấm nút mới xem được SĐT (như chợ tốt), cải thện tính năng tìm kiếm và chọn cấu hình quét.
Phần mềm Scan Web Pro phiên bản 1.1.0.1.
Để nâng cấp lên phiên bản này tốt hơn hết bạn nên gỡ phần mềm cũ ra và tải bản mới về cài đặt theo link bên dưới:
https://seoiclick.com/Download/ScanWebPro_setup.exe
Trong phiên bản 1.1.0.1 bổ sung tính năng quét link, quét dữ liệu bằng trình duyệt Google Chrome. Như vậy có hai cách lấy dữ liệu: Request và Trình duyệt.
Hai cách lấy dữ liệu: Request và Trình duyệt.
Cách lấy bằng Request có ưu điểm lấy nhanh, không bật trình duyệt nhưng nhược điểm một số trang như Chợ Tốt, còn cách lấy bằng trình duyệt lấy có thể chậm hơn, có bật trình duyệt Google Chrome trong quá trình lấy, không thể lấy song song 2 quá trình link và dữ liệu nhưng lại lấy tốt tất cả các trang, lấy được những trang yêu cầu bấm nút mới lấy được dữ liệu.
Dưới đây là ví dụ lấy bằng trình duyệt trang Chợ Tốt.
Trình duyệt Chrome mở lên và đến từng trang để lấy link, sau khi lấy xong số trang quy định trình duyệt sẽ tự đóng.
Tương tự quá trình lấy chi tiết bài viết cũng mở trình duyệt Chrome và vào từng bài viết để lấy thông tin.
Cách lấy bằng trình duyệt được áp dụng cho những website mà không thể lấy bằng request, những website yêu cầu bấm mới hiện dữ liệu.
Ví dụ bấm mới hiện dữ liệu SĐT trên trang Chợ Tốt.
Lưu ý không tắt, tương tác trình duyệt Chrome trong quá trình chạy.
Quy định một website là lấy bằng trình duyệt bằng cách:
Đặt mặc định lấy theo trình duyệt.
Lấy được bằng request thì có thể lấy được bằng trình duyệt và ngược lại.
Cải thiện tìm kiếm cấu hình quét bằng cách gõ từ khóa > bấm Enter để tìm kiếm > bấm F1 để chọn kết quả đầu tiên.
Chọn nhanh cấu hình quét dữ liệu website.
Bỏ bớt code html trong một số trường như Mô Tả để dữ liệu trả về là text ngắn gọn hơn.
Ví dụ: cài đặt bỏ html code trong trường Mô Tả.
Một số website yêu cầu người xem bấm nút mới xem được dữ liệu như trên Chợ Tốt yêu cầu Bấm để xem SĐT. Cài đặt bấm một nút trước khi bắt đầu quét dữ liệu như sau:
Cấu hình bấm nút theo CSS Selector.
Về CSS Selector vui lòng tìm kiếm Google.
Cần hỗ trợ thêm về bản cập nhật này cũng như phần mềm Scan Web Pro vui lòng liên hệ chúng tôi.
Tác giả: quanly | Đăng lúc: 15/05/18 10:59 | Lần sửa cuối: 15/05/18 10:59 | Số lượt xem: 8,945