Sử dụng các trang có thể được viết bởi người dùng trên toàn thế giới
Các website có thể được biên tập bởi những người sử dụng như Wikis, các trang blog cho phép các bình luận được đăng tải...có thể được dùng để chèn các link nhằm spam các sites nếu các công cụ chống spam thích hợp không được áp dụng.
Spam trong các trang blog. Đây là việc đặt hoặc xúi giục đặt các đường link một cách ngẫu nhiên trên các site khác, đặt một từ khóa mong muốn vào đoạn text của đường liên kết trong đường liên kết bên trong website. Các quyển sách, diễn đàn, trang blog, và bất cứ website nào chấp nhận các bình luận của khách ghé thăm là các mục tiêu đặc biệt và thường là các nạn nhân của chương trình spam tự động tạo ra các bài viết vớ vẩn có các đường liên kết thường là không liên quan và không mong muốn.
Spam bình luận. Comment spam là một dạng link spam mà xuất hiện nhiều trong các trang web cho phép người sử dụng năng động biên tập như wikis, các blog và các loại sách có thể biên tập. Điều này khó có thể giải quyết được bởi vì các agent có thể được viết và tự động lựa chọn ngẫu nhiên một trang web được biên tập bởi người sử dụng ví dụ như một bài viết trên Wikipedia và thêm vào các đường link dành cho việc spam.
Wiki spam. Sử dụng khả năng biên tập mở của các hệ thống wiki để đặt các đường link từ site wiki đến site spam. Chủ đề của site spam thường không liên quan đến trang wiki nơi mà đường link được thêm vào. Vào đầu năm 2005, Wikipedia đã thực hiện giá trị “nofollow” đối với thuộc tính HTML “rel”. Các đường link có thuộc tính này bị thuật toán Google PageRank lờ đi. Những nhà điều hành của diễn đàn và Wiki có thể dùng những điều này để chấm dứt hoặc hạn chế Wiki spam.
Referrer log spamming. Khi ai đó truy cập một trang web, ví dụ phần tham khảo, bằng việc theo một đường link từ trang web khác, giả dụ người tham khảo, thì phần tham khảo được đưa ra địa chỉ của người tham khảo bằng trình duyệt internet của người này. Bằng việc truy cập ngẫu nhiên nhiều website đủ số lần nhất định, với một địa chỉ đặc biệt hoặc một thông điệp được đưa ra như người tham khảo, thì thông điệp hay địa chỉ internet đó rồi sẽ xuất hiện trong phần log tham khảo của những site có các referrer log. Từ khi một số bộ máy tìm kiếm căn cứ vào tầm quan trọng của các site bằng số lượng các site khác nhau liên kết đến chúng, thì referer-log spam được sử dụng để làm tăng thứ hạng trên các bộ máy tìm kiếm của các site của spammer, bằng việc có các refferer logs của nhiều site liên kết đến chúng.
Các loại spamdexing
Mirror websites. Lưu trữ nhiều website với nội dung tương tự nhau nhưng sử dụng các đường dẫn URL khác nhau. Một số bộ máy tìm kiếm mang lại thứ hạng cao hơn cho các kết quả mà từ khóa được tìm kiếm nằm trong URL.
Định hướng lại URL . Đưa người sử dụng đến trang khác mà không phải theo chủ ý của họ ví dụ sử dụng các thẻ refresh META, Jave, Java Script hoặc định hướng lại Server side.
Cloaking. Cloaking tham chiếu đến bất cứ phương tiện nào để phục vụ một trang dành cho spider của công cụ tìm kiếm. Điều này khác hẳn với trang dành cho người đọc. Nó có thể là một nỗ lực để đánh lừa các bộ máy tìm kiếm liên quan đến nội dung trên một trang web đặc biệt. Tuy nhiên, cloaking có thể cũng được sử dụng để tăng sự truy cập vào một site đối với người sử dụng khuyết tật hoặc cung cấp cho người sử dụng các nội dung mà các bộ máy tìm kiếm không thể xử lý hoặc phân tích cú pháp. Nó cũng được sử dụng để chuyển nội dung được dựa trên địa điểm của người sử dụng. Bản thân Google sử dụng việc chuyển giao địa chỉ IP, một dạng của cloaking, để chuyển giao các kết quả. Dạng khác của cloaking là code swapping, ví dụ tối ưu hóa một trang để lọt vào các thứ hạng hàng đầu rồi lại đặt trang khác tại vị trí đạt được thứ hạng hàng đầu.
Tác giả: Joseph Alvini Việt Hoằng 3C dịch 3C “ Trang CNTT hàng đầu Việt Nam – 1001 Software & Ebooks download miễn phí" www.3c.com.vn
|