Semalt tiết lộ Hướng dẫn xóa lưu lượng giả khỏi trang web của bạn

Thư rác giới thiệu là sản phẩm của spam gửi lưu lượng giả đến Google Analytics trực tiếp, do đó xuất hiện trong các báo cáo lưu lượng được tạo. Hãy hành động để xóa thư rác giới thiệu nếu bạn tìm thấy chúng trong các báo cáo GA để đạt được số liệu thống kê chính xác cho trang web.

Artem Ab Bun, Giám đốc thành công khách hàng cao cấp của Dịch vụ kỹ thuật số Semalt , chia sẻ ở đây một số vấn đề thực tế về vấn đề này.

Bot là gì?

Bots là các chương trình được phát triển để thực hiện các nhiệm vụ lặp đi lặp lại nhanh chóng và chính xác. Bots ban đầu được dành cho việc lập chỉ mục các trang trên internet bởi các công cụ tìm kiếm . Những người có mục đích xấu đã sử dụng bot trong nhiều năm để giúp họ tạo ra gian lận bằng cách nhấp, chuyển nội dung của trang web, phân phối phần mềm độc hại, tích lũy địa chỉ email và lưu lượng truy cập trang web quá mức.

Bots an toàn và độc hại

Một ví dụ về bot tốt là Googlebot thu thập dữ liệu và lập chỉ mục các trang cho người dùng. Các bot tìm kiếm không chạy JavaScript (hầu hết trong số chúng). Tuy nhiên, những người sử dụng nó thấy mình xuất hiện trên các báo cáo GA có thể ảnh hưởng đến đại diện số liệu. Nếu họ không chạy JavaScript, thì sẽ không có tác động đến các báo cáo, nhưng vẫn xuất hiện trên nhật ký máy chủ. Tuy nhiên, chúng có thể ảnh hưởng đến tốc độ tải vì chúng sử dụng hết tài nguyên máy chủ. Các bot an toàn tuân thủ các chỉ thị có trong tệp robots.txt. Các bot độc hại, mặt khác, thực hiện các chiến lược khác nhau để ghi đè các hướng dẫn này.

Bots thư rác

Mục tiêu chính của họ là truy cập càng nhiều trang web càng tốt và gửi thư rác với các tiêu đề giới thiệu khuôn mặt để tránh bị phát hiện. Tiêu đề người giới thiệu giả mạo nhúng một liên kết chuyển hướng đến trang web mà họ muốn quảng cáo. Các yêu cầu HTTP từ bot như vậy xuất hiện trong nhật ký máy chủ và được Google lập chỉ mục. Nó hoạt động như một liên kết ngược đến trang web khi nó xuất hiện trong nhật ký máy chủ. Google đã thực hiện các thay đổi đối với thuật toán của họ để không lập chỉ mục dữ liệu từ nhật ký máy chủ, do đó cản trở nỗ lực của các nhà phát triển spambot. Các bot spam chạy JavaScript có thể vượt qua các bộ lọc GA, đó là lý do tại sao chúng phản ánh trong các báo cáo.

Mạng lưới

Botnet bao gồm một số máy tính bị nhiễm để tạo thành một mạng được kiểm soát bởi người gửi thư rác. Nó sử dụng các IP khác nhau để tấn công một trang web. Botnet càng lớn, tỷ lệ xâm nhập càng cao. Lưu lượng truy cập từ botnet xuất hiện dưới dạng lưu lượng truy cập trực tiếp vì nó đến từ một máy tính khác, khiến cho việc phát hiện khó khăn hơn. Chặn một, sẽ không có nhiều tác động khi người khác diễn ra.

Bots Spam độc hại cao

Mục đích chính của họ là tuyển dụng một máy tính là một phần của mạng botnet bằng cách lây nhiễm phần mềm độc hại. Sau đó, máy tính được sử dụng để phân phối cùng một phần mềm độc hại cho các máy tính khác. Chặn một mạng botnet có thể ức chế lưu lượng truy cập đến từ khách truy cập thực tế. Chuyển hướng đáng ngờ từ báo cáo lưu lượng truy cập giới thiệu chủ yếu dẫn đến các trang web lây nhiễm phần mềm độc hại này. Tránh nhấp vào các liên kết như vậy trừ khi có phần mềm chống phần mềm độc hại hiệu quả được cài đặt hoặc một máy tính riêng.

Bots thư rác thông minh

Các trang web này gửi lưu lượng truy cập đến Google Analytics bằng cách sử dụng mã theo dõi của nó cùng với ID trang web. Chúng cũng bao gồm một số người giới thiệu giả mạo trong báo cáo giao thông, có thể không bị ảnh hưởng. Các hoạt động của chúng không bao giờ xuất hiện trong nhật ký máy chủ và không có cách nào chặn chúng vì chúng gửi dữ liệu trực tiếp đến công cụ phân tích. Những người không sử dụng Trình quản lý thẻ của Google có mã theo dõi GA trên trang web của họ, hoạt động như một định danh thuộc tính web. Trình quản lý thẻ của Google là một công cụ hiệu quả để xóa thư rác giới thiệu trong trường hợp này. Spamb chủ yếu tấn công các trang web bị đánh cắp các lỗ hổng trong mã nguồn hoặc những trang có các biện pháp bảo mật hạn chế.

Phát hiện nguồn thư rác

Điều hướng đến các báo cáo lưu lượng truy cập của Google và sử dụng tỷ lệ thoát làm yếu tố sắp xếp, theo thứ tự giảm dần. Những người có tỷ lệ thoát 100% hoặc 0% nên nghi ngờ gửi thư rác. Ngoài ra, có một danh sách đầy đủ các spammer đã được thiết lập mà bạn có thể so sánh, mà không phải thực hiện bất kỳ phân tích thủ công nào. Bước tiếp theo là chặn chúng.

Đảm bảo tạo một ký hiệu trên biểu đồ của báo cáo giải thích nơi có lưu lượng truy cập bùng nổ tại thời điểm đó.

1. Sử dụng công cụ viết lại cho tệp .htaccess và sử dụng Khả năng Spambot để xóa thư rác giới thiệu bằng cách thay đổi nó. Nếu chắc chắn về địa chỉ IP mà spambot sử dụng, hãy đưa nó vào mã và từ chối truy cập. Khả năng có thể được sử dụng để chặn phạm vi địa chỉ IP. Chỉ làm điều này nếu bạn chắc chắn rằng spambot sử dụng một số địa chỉ IP để thực hiện một hành động. Ngoài ra, ngăn chặn người dùng biết sử dụng spam bots.

2. Tính năng lọc Bot: chọn hộp nhắc nhở để loại trừ các bot và nhện đã biết.

3. Theo dõi Nhật ký Máy chủ: hù dọa các bot bằng cách truy cập trang web thường xuyên. Sử dụng tường lửa để bảo vệ máy tính khỏi không gian ảo bằng cách lọc các nguồn web từ spam bots.

4. Quản trị viên của hệ thống phải ở trong một vị trí để cung cấp hỗ trợ chuyên nghiệp.

5. Mã ItSAlive giúp giữ cho các số liệu từ Google và Yandex không bị can thiệp bởi spam bots.

6. Google Chrome có khả năng phát hiện phần mềm độc hại và phù hợp để duyệt nếu không có tường lửa.

7. Thông báo người dùng là các thông báo được cá nhân hóa từ Google sẽ thông báo khi có sự đột biến về lưu lượng truy cập.

8. Bộ lọc Google Analytics. Tạo các bộ lọc mới trong phần xem của tab Quản trị viên trong GA.

mass gmail