Nội dung trùng lặp lén lút

nội dung trùng lăpl

Nội dung trùng lặp là một chủ đề lớn trong không gian SEO. Khi chúng tôi nghe về các vấn đề trùng lặp, chủ yếu là do Google phạt. Nhưng tác dụng phụ tiềm ẩn này của việc trùng lặp nội dung không chỉ bị phóng đại mà còn hầu như không phải là hậu quả nghiêm trọng nhất của vấn đề.

Không có hình phạt nội dung trùng lặp như vậy

Google hầu như không bao giờ phạt các trang web vì nội dung trùng lặp. Trở lại năm 2013, Matt Cutts đã chỉ ra rằng khoảng 25 đến 30% nội dung của tất cả các trang web là trùng lặp. Vì vậy, không có cách nào để coi tất cả là thư rác, bởi vì các bản sao luôn xảy ra. Sự trùng lặp có thể xảy ra trên các trang điều khoản và chính sách bản quyền, khi xuất bản lại các đoạn trích để xây dựng liên kết hoặc quảng cáo, đưa ra các chú thích và trích dẫn. Chắc chắn, Google sẽ không coi tất cả chúng là thư rác.

Không có hình phạt nội dung trùng lặp như vậy

Google có thể phân biệt sự khác biệt giữa các trang có một số nội dung được sao chép, miễn là chúng có một số nội dung độc đáo khác làm tăng giá trị cho người dùng. Do đó, cả hai trang được sao chép một phần nội dung đều có cơ hội xếp hạng và hiển thị ngang nhau nếu có liên quan đến truy vấn của người tìm kiếm.

Lãng phí ngân sách thu thập thông tin

Nếu nội dung trùng lặp xuất hiện nội bộ trên trang web của bạnó . Được đảm bảo sẽ lãng phí một số ngân sách thu thập thông tin của bạn. Điều này có nghĩa là các trang quan trọng trên trang web của bạn sẽ ít được thu thập thông tin hơn.

Liên kết pha loãng nước trái cây

Đối với sự trùng lặp nội dung bên ngoài và bên trong. Việc pha loãng liên kết là một trong những nhược điểm lớn nhất của SEO. Theo thời gian, cả hai URL có thể xây dựng các liên kết ngược trỏ đến chúng. Và trừ khi một trong số chúng có liên kết chuẩn (hoặc chuyển hướng 301) trỏ đến đoạn gốc. Các liên kết có giá trị sẽ giúp xếp hạng trang gốc cao hơn sẽ được phân phối giữa cả hai Các URL.

Chỉ một trong các trang xếp hạng cho các từ khóa mục tiêu

Khi Google tìm thấy nội dung trùng lặp hoặc các trường hợp nội dung được sao chép. Nó thường sẽ chỉ hiển thị một trong số chúng để phản hồi lại các truy vấn tìm kiếm. Và không có gì đảm bảo rằng nó sẽ là nội dung bạn muốn xếp hạng.

Nhưng tất cả những trường hợp này đều có thể ngăn ngừa được nếu bạn biết nơi nội dung trùng lặp có thể ẩn. Cách phát hiện và cách đối phó với nội dung trùng lặp. Trong bài viết này, trước hết tôi sẽ trình bày sơ lược về ‘Nội dung trùng lặp là gì’. Cùng với loại nội dung trùng lặp phổ biến – và sau đó là xử lý nội dung trùng lặp.

Scraped content

Scraped content

Nội dung cóp nhặt về cơ bản là một phần nội dung nguyên bản trên một trang web. Đã được sao chép từ một trang web khác mà không được phép. Như tôi đã nói trước đó, không phải lúc nào Google cũng có thể phân biệt được đâu là nội dung gốc và đâu là nội dung trùng lặp. Vì vậy, nhiệm vụ của chủ sở hữu trang web là đề phòng những kẻ cóp nhặt. Và biết phải làm gì nếu nội dung của họ bị đánh cắp.

Đọc thêm  Trang web vệ tinh

Syndicated content

Syndicated content

Dưới sự cho phép của tác giả của tác phẩm gốc. Nội dung được đăng lại trên một trang web khác được gọi là Syndicated content. Đây là nội dung trùng lặp hợp pháp. Nhằm để đưa nội dung của bạn được cung cấp đến với khán giả mới. Quan trọng ở đây là phải đặt ra các nguyên tắc viết bài cho các nhà xuất bản bạn đang cùng làm việc. Để đảm bảo việc cung cấp nội dung không trở thành bản sao của người khác.

Gợi ý liên quan:

  • SEO trên WordPress
  • Dịch vụ tối ưu hóa Website
  • Social Backlink

HTTP và HTTPS

HTTP và HTTPS

HTTPS và sử dụng các URL tương đối là một trong trang của bạn 

Việc sử dụng một trang bảo mật hay thư mục trên HTTP khác là một điều rất hợp lý. Tuy nhiên, có  điều quan trọng ở đây là các trang đều liên kết nội bộ. 

Tuyệt đối: https://seonoidung.com/thuat-toan-cua-google/

Tương đối: https:/thuat-toan-cua-google/

Chuyển toàn bộ sang HTTPS, nhưng HTTP vẫn có thể truy cập 

Điều này chỉ thể xảy ra khi liên kết ngược trang  khác trỏ đến trang HTTP. Hay một số liên kết nội bộ của bạn vẫn có giao thức cũ. Không chuyển hướng khách truy cập đến trang bảo mật. Để tránh làm loãng đi giá trị liên kết và lãng phí ngân sách thu thập thông tin. Bạn nên sử dụng chuyển hướng 301 với tất cả các trang HTTP. Đảm bảo liên kết nội bộ của bạn đều được chỉ định thông qua URL tương đối.

Các trang WWW và không phải WWW

Các trang WWW và không phải WWW

Một trong những nguyên nhân lâu đời nhất gây ra nội dung trùng lặp trong sách. Là khi cả hai phiên bản WWW và không phải WWW của miền đều có thể truy cập được. Giống như với HTTPS gây ra trùng lặp nội dung. Nội dung trùng lặp này. Thường có thể được khắc phục bằng cách triển khai chuyển hướng 301.

Để kiểm tra xem có các trường hợp trùng lặp như vậy trên trang web của bạn hay không, hãy xem các phiên bản cố định www và không phải www (trong Chuyển hướng ) trong dự án WebSite Auditor của bạn.

Tham số URL được tạo động

Tham số URL được tạo động

Các tham số được tạo động thường được sử dụng để lưu trữ thông tin nhất định về người dùng (chẳng hạn như ID phiên). Hoặc để hiển thị một phiên bản hơi khác của cùng một trang (chẳng hạn như phiên bản có điều chỉnh sắp xếp hoặc lọc được thực hiện).

Để kiểm tra các URL trùng lặp trên trang web của bạn, hãy chuyển đến dự án WebSite Auditor. Và nhấp vào Xây dựng lại Dự án . Ở Bước 1, chọn hộp Bật tùy chọn chuyên gia. Ở bước tiếp theo, chọn Googlebot trong tùy chọn Làm theo hướng dẫn trong robots.txt cho… .

Thiết lập này sẽ cho phép bạn thu thập dữ liệu trang web của mình giống như Google sẽ làm (theo hướng dẫn robots.txt dành cho Googlebot). Và coi các URL có thông số duy nhất là các trang riêng biệt. Nhấp vào Tiếp theo và thực hiện các bước tiếp theo như bình thường để bắt đầu thu thập thông tin. Khi WebSite Auditor hoàn tất việc thu thập thông tin. Hãy chuyển sang bảng điều khiển Trang và sắp xếp kết quả theo cột Trang. Bằng cách nhấp vào tiêu đề của nó. Điều này sẽ cho phép bạn dễ dàng phát hiện các trang trùng lặp. Hoặc nội dung được sao chép với các tham số trong URL.

Đường dẫn thân thiện với thiết bị di động

Các vấn đề về nội dung trùng lặp có thể xảy ra khi bạn tạo phiên bản thân thiện với thiết bị di động cho trang web dành cho máy tính để bàn. 

Đọc thêm  71 câu hỏi và câu trả lời phỏng vấn SEO

Nếu bạn chỉ chuẩn bị khởi chạy một trang web hoàn toàn mới. Thay vào đó hãy nghĩ đến việc triển khai thiết kế đáp ứng để giảm thiểu các vấn đề về nội dung trùng lặp. Liên quan đến khả năng sử dụng trên thiết bị di động.

Một số trang web sử dụng công nghệ AMP (Trang trên thiết bị di động được tăng tốc). Các trang bị lược bỏ của nội dung chính sẽ nhẹ hơn. Cho phép chúng tải nhanh hơn trên trang kết quả tìm kiếm. Công nghệ này cũng dẫn đến nội dung trùng lặp trừ khi các trang AMP được triển khai một cách thích hợp. Thẻ ‘rel = amphtml’  phải được thêm vào trang không phải AMP. Phiên bản AMP phải bao gồm thẻ ‘rel = canonical’  trỏ đến nội dung chính.

Thân thiện với máy in

Nếu nhiều trang trên trang web của bạn có các phiên bản thân thiện với máy in. Có thể truy cập thông qua các URL riêng biệt. Google sẽ dễ dàng tìm và thu thập thông tin các trang đó thông qua các liên kết nội bộ. Rõ ràng, bản thân nội dung trên trang. Và phiên bản thân thiện với máy in của nó sẽ giống hệt nhau. Do đó làm lãng phí ngân sách thu thập thông tin của bạn một lần nữa.

Các trang thẻ trùng lặp

Đôi khi bạn có thể muốn sử dụng các thẻ trên trang web của mình để cải thiện khả năng truy cập và khả năng sử dụng của nó. Thẻ nhằm mục đích liên kết các bài viết liên quan theo một số chủ đề chung. Không giống như danh mục, thẻ không bắt buộc. Nó chỉ là một tùy chọn để nâng cao cấu trúc trang web của bạn. Đối với mỗi thẻ, một trang riêng biệt được tạo để liệt kê tất cả các bài viết được gắn thẻ. Đôi khi có những trường hợp các trang thẻ trùng lặp được tạo.

Lời khuyên là không nên sử dụng quá nhiều thẻ. Chỉ cần có một bộ thẻ giới hạn, mỗi thẻ tương ứng với một số lượng lớn các bài viết trên trang web của bạn. Nếu vẫn tìm thấy trang thẻ trùng lặp. Bạn có thể không cho phép trang đó trong tệp robot.txt hoặc đóng trang đó bằng thẻ meta ngăn lập chỉ mục.

Nội dung tương tự

Nội dung tương tự

Khi mọi người nói về sự trùng lặp nội dung. Họ thường ám chỉ nội dung hoàn toàn giống hệt nhau. Tuy nhiên, các phần nội dung rất giống nhau cũng thuộc định nghĩa của Google về nội dung gần như trùng lặp.

Những vấn đề như vậy có thể thường xuyên xảy ra với các trang web thương mại điện tử. Với mô tả sản phẩm cho các sản phẩm tương tự chỉ khác nhau ở một vài thông số kỹ thuật. Để giải quyết vấn đề này và tránh rắc rối với thứ hạng của công cụ tìm kiếm. Hãy cố gắng làm cho các trang sản phẩm của bạn đa dạng về mọi lĩnh vực ngoài phần mô tả: đánh giá của người dùng là một cách tuyệt vời để đạt được điều này.

Nội dung mỏng – trùng lặp

Trên blog, các vấn đề về nội dung trùng lặp có thể phát sinh khi bạn lấy một phần nội dung cũ hơn. Thêm một số cập nhật và làm lại văn bản của nó thành một bài đăng mới. Trong trường hợp này, sử dụng liên kết chuẩn (hoặc chuyển hướng 301) trên bài viết cũ hơn là giải pháp tốt nhất.

Sự cố chuyển hướng 301 bị mất

Nói về vấn đề nội dung trùng lặp như một hình phạt đã xuất hiện sau khi thuật toán Panda được triển khai vào năm 2011. Panda nhằm thưởng cho các trang web có giá trị lớn hơn cho người dùng. Tuy nhiên, bản cập nhật không chỉ gây ảnh hưởng nặng nề đến các trang web spam. Panda khiến chủ sở hữu trang web thực sự lo ngại về việc có nội dung chất lượng thấp. Chẳng hạn như các trang mỏng, nội dung sao chép, thẻ tiêu đề trùng lặp và mô tả meta.

Đọc thêm  Cách tăng khách hàng tiềm năng và khả năng chuyển đổi

Để kiểm tra nội dung trùng lặp trên toàn bộ trang web của bạn cũng như để viết lại nội dung. Bạn cũng có thể chạy Trình kiểm tra trang web. Việc kiểm tra SEO trên toàn bộ trang web nhanh chóng sẽ phát hiện ra các thẻ meta. Và mô tả meta trùng lặp.

Các bản sao trong tiêu đề và mô tả meta

Trên hết, mô-đun Phân tích Nội dung cho phép bạn thực hiện kiểm tra từng trang để viết một bản sao tốt hơn của nó. Và sau đó xuất bản lại (hoặc tạo một trang hoàn toàn mới từ đầu).

Trong một thế giới hoàn toàn liên quan đến SEO. Một trong những phương pháp cổ điển là quay bài báo với sự trợ giúp của các công cụ tự động hóa. Spinners tự động sửa đổi các bài viết bằng cách thay thế các từ cụ thể bằng một số phiên bản thay thế. Mặc dù, AI hiện đại khá thích hợp để viết các bài báo có chất lượng đáng tin cậy. Thậm chí vượt qua sự kiểm duyệt của con người. Đây là điều mà bạn thực sự không nên làm.

Trước hết, Google vẫn có thể phát hiện ra các bài báo có nội dung trùng lặp gần như trùng lặp. Mặt tối nhất của nó, nội dung được viết lại ồ ạt nhiều lần ở đây. Và ở đó mang lại rất ít hoặc không có giá trị gì cho người dùng. Điều đó có nghĩa là sẽ có lưu lượng truy cập thấp, quyền hạn thấp và cuối cùng trang web sẽ đi vào bế tắc.

Các trang được bản địa hóa

Nếu bạn có nội dung giống hệt nhau trên một số tên miền trong oneTLD (tên miền cấp cao nhất). Ví dụ: .com, Google thường sẽ phát hiện nội dung trùng lặp. Nhưng khi bạn có một số trang gần như trùng lặp trong nhiều TLD. Chúng sẽ không bị phân loại là spam trong mọi trường hợp. Google coi nó như một phiên bản bản địa hóa được hiển thị ở một vị trí cụ thể. Vì vậy công cụ tìm kiếm sẽ cố gắng tìm ra biến thể trang nào phù hợp với một người tìm kiếm cụ thể. Trong trường hợp này, nên thêm các tính năng bản địa hóa . Ví dụ: các cửa hàng thương mại điện tử có thể có các đơn vị tiền tệ khác nhau cho các quốc gia khác nhau hoặc các biến thể chính tả.

Bạn có thể thực hiện bản địa hóa với sự trợ giúp của các thẻ html. Thêm thuộc tính hreflang trên các trang được bản địa hóa. Và để thêm thẻ hreflang một cách nhanh chóng. Hãy sử dụng tạo Sơ đồ trang web trong Trình kiểm tra trang web. Đi tới Công cụ quản trị trang web và chọn Tạo Sơ đồ trang web . Sau đó, chọn các trang mà bạn muốn đưa vào Sơ đồ trang web của mình và thêm bản địa hóa vào từng trang thích hợp. Xác định ngôn ngữ và quốc gia. Tại đây, hãy tải xuống Sơ đồ trang web của bạn và gửi nó để thu thập thông tin.

Kết luận

Nội dung trùng lặp cụ thể SEO có thể là một khó khăn đối với những người làm việc với SEO. Vì nó làm loãng nguồn liên kết của các trang của bạn (hay còn gọi là sức mạnh xếp hạng). Và tiêu hao ngân sách thu thập thông tin, ngăn các trang mới được thu thập thông tin và lập chỉ mục. Hãy nhớ rằng các công cụ tốt nhất của bạn để chống lại vấn đề là thẻ chuẩn, chuyển hướng 301 và robots.txt. Đồng thời kết hợp kiểm tra nội dung trùng lặp vào quy trình kiểm tra trang web của bạn để cải thiện chỉ mục và xếp hạng.

Xem thêm: Thuật ngữ SEO

Chat Facebook