Kiểm tra trùng lặp nội dung

Khi bạn nhận một dự án SEO hoặc tiếp nhận và SEO một trang web chứa nhiều nội dung thì việc kiểm tra trùng lặp nội dung là điều cần thiết. Công cụ tìm kiếm có thể gặp khó khăn khi xác định nội dung nào phù hợp hơn với truy vấn khi nội dung quá giống nhau.

Điều tệ hại nhất khi bạn bị trùng lặp nội dung đó là google sẽ phạt bạn bằng cách hạ xếp hạng trang của bạn hoặc bằng cách xóa trang web của bạn hoàn toàn khỏi các tìm kiếm. 

Cách tốt nhất là bạn nên tự tạo ra nội dung gốc cho website của bạn. Nhưng điều đó cũng không đảm bảo khi bạn tạo ra nhiều nội dung giống nhau trên nhiều bài viết. Bạn cần các công cụ để kiểm tra trùng lặp nội dung, bạn cần xử lý chúng và cải thiện thứ hạng các từ khóa của mình.

Danh mục

Table of Contents

Nội dung trùng lặp là gì?

Với cùng một nội dung, sự trùng lặp sẽ Open nếu nó Open ở nhiều website khác nhau, kể cả trang của bạn lẫn của người khác .

  • Nếu bạn lấy nội dung của trang này và ghép vào nhiều trang khác trên website của bạn, đây chính là trùng lặp nội dung.
  • Nếu người khác sao chép nội dung của bạn và đưa vào website của họ, đây cũng là một sự trùng lặp nội dung – nó còn được gọi là đạo văn

Nội dung trùng lặp trong trang web của riêng bạn

Google không đề cập tới chuyện sẽ trừng phạt trực tiếp khi xảy ra nội dung trùng lặp trên trang web riêng của bạn. Nhưng nó có thể ảnh hưởng đến thứ hạng trang web tổng thể của bạn nếu Google không biết nên xếp hạng trang nào.

Các công cụ tìm kiếm sẽ gặp khó khăn trong việc tìm ra trang web nào phù hợp hơn với người dùng. 

Có nhiều nguyên nhân gây ra sự trùng lặp nội dung trên trang của riêng bạn, dù cố ý hay vô ý. 

  • Lấy nội dung giống nhau và chèn vào các bài viết khác nhau trên website của bạn, nói nhiều trang web đang nói về cùng một chủ đề
  • Trùng lặp do các tiền tố phía trước như http, https, www và non-www
  • Một đường dẫn danh mục và một đường dẫn không có danh mục nhưng có cùng slug
  • Trùng lặp do phân trang không trỏ Canonical đúng, …

Trùng lặp nội dung trên website khác – Đạo văn

Người khác lấy nội dung trên trang web của bạn và đưa lên website của họ – Đây gọi là đạo văn và cũng có thể gọi là nội dung trùng lặp ngoại tuyến. Khi bạn có nhiều trang lên top trên Serp thì điều này sẽ thường xuyên xảy ra.

Tham khảo bài viết “Serp là gì? Tăng lượt nhấp hữu cơ với 13 tính năng Serp” để có thể hiểu rõ các vị trí mà bài viết của bạn có thể xuất hiện ngay trang nhất

Ngược lại với nội dung trùng lặp nội bộ, khi bị cáo buộc vì tội đạo văn thì bạn sẽ nhận án phạt rất nặng. Ở Việt Nam bất quá trang web bị biến mất khỏi top google, còn ở nước ngoài, bạn có thể bị kiện ra tòa. 

Có nhiều cách để ăn cắp nội dung trên một website. Bạn có thể copy cả một đoạn trên website khác và đưa vào website của bạn, sử dụng tool – bot quét hàng loạt nội dung (bao gồm cả ảnh, URL đính kèm nếu không chỉnh sửa), lấy mô tả sản phẩm của nhà sản xuất mà không có chỉnh sửa nào, ….

Dù có bị phạt hay không bạn cũng không nên làm như vậy, sẽ không tốt cho website của bạn sau này .

Nguyên nhân và tác hại của nội dung trùng lặp là gì?

Có hai tác hại chính mà nội dung trùng lặp sẽ mang tới cho bạn

  • Thứ hạng của bạn sẽ bị giảm và bị kìm hãm trên công cụ tìm kiếm của google
  • Trang bài viết của bạn sẽ biến mất khỏi công cụ tìm kiếm của google (như một hình phạt)

Có nhiều phiên bản khác nhau trên trang web của bạn nhưng chúng có cùng một nội dung. Điều này sẽ làm cho google bối rối và họ không biết phiên bản nào sẽ hiển thị trong kết quả tìm kiếm.

Số lượng các trang trùng lặp nội dung của bạn ít, google vẫn sẽ xếp hạng nội dung nhưng thực tế, sẽ không cao. Nói dễ hiểu một chút, google chỉ cần nội dung chất lượng và độc nhất để phục vụ người đọc. Và vấn đề bạn xây dựng 2 phiên bản cùng một nội dung là bạn đang phá vỡ quy tắc vàng của google và họ sẽ ngăn cản bạn lại

Và nếu số lượng nội dung trùng lặp quá lớn, bạn sẽ chẳng thể xếp hạng cho từ khóa nào, bởi lẽ google coi nội dung của bạn là rác. Đây được hiểu như là một hình phạt google ưu ái cho bạn

Ngoài ra, nếu như một website khác đánh cắp nội dung trên website của bạn, bạn hoàn toàn có thể mất thứ hạng hoặc thậm chí còn bị report không thương tiếc .

Cụ thể, website ăn cắp nội dung có thẩm quyền hơn website của bạn, hiển nhiên thứ hạng của bạn sẽ bị đẩy xuống với chính website đó. Ngoài ra, khi trang của họ index trước hoặc có đầy đủ thông tin hơn chứng minh đó là nội dung của họ, bạn sẽ bị google ruồng bỏ, hay đá khỏi công cụ tìm kiếm

Cách kiểm tra trùng lặp nội dung

Kiểm tra trùng lặp nội dung bằng cách thủ công

Bạn sẽ bắt đầu với Google Search Box. Lấy hơn 10 từ ở đầu mỗi câu, có thể bất kỳ vị trí nào, càng nhiều càng tốt và sẽ hơi tốn thời gian. Đặt giữa dấu ngoặc kép, đưa vào google Search Box và tìm kiếm.

  1. Nếu như chỉ 2 đến 3 trang của bạn có câu này thì vấn đề sẽ không lớn. 
  2. Nếu như quá nhiều phiên bản của bạn chưa câu này thì tôi nghĩ bạn nên xử lý lại 
  3. Nếu như bạn thấy một trang web khác cũng chưa câu này và nó không xê xích nhiều với thứ hạng của bạn. Người khác đang đạo văn đấy!

Kiểm tra trùng lặp nội dung bằng cách thủ công

Đây là cách mà google đề xuất để bạn giải quyết vấn đề trùng lặp nội dung. Lặp lại với các câu tiếp theo nếu bạn cảm thấy không chắc chắn. Đây là một quá trình dài dằng dặc và nó sẽ khiến bạn cảm thấy nản chí

Công cụ kiểm tra trùng lặp nội dung

Copyscape 

Copyscape là một công cụ kiểm tra trùng lặp nội dung cho phép bạn kiểm tra xem website khác có đạo văn của bạn hay không. Công cụ này cho phép bạn check miễn phí nhưng có sự giới hạn. 

Cụ thể, khi vào thẳng trang chủ của Copyscape, nhập URL của bạn và check. Giới hạn chỉ có 10 kết quả hiển thị và chỉ cần Click vào đường dẫn, bạn sẽ biết nguồn đã copy nội dung của bạn

Copyscape là một công cụ kiểm tra trùng lặp nội dung

Ngoài ra, nếu bạn muốn kiểm tra trùng lặp nội dung trên chính website của bạn, bạn có thể sử dụng công cụ Free Comparison. Nhập URL hoặc văn bản của 2 phiên bản mà bạn nghi ngờ trùng lặp nội dung. Ô tuyệt, nó sẽ chỉ ra cho bạn số lượng từ đang bị trùng lặp.

Bạn có thể mở rộng lên 10 ngàn trang với Copyscape Premium

Duplichecker 

Duplichecker là một công cụ kiểm tra đạo văn hoàn toàn miễn phí, cho phép bạn kiểm tra trùng lặp nội dung lên tới 1 ngàn từ. Khi bạn vào ngay trang chủ của Duplichecker, bạn có hai lựa chọn, kiểm tra đạo văn theo cách chèn văn bản có khối lượng 1000 từ hoặc đặt URL của bạn để cho tool check.

Duplichecker là một công cụ kiểm tra đạo vănBạn cũng hoàn toàn có thể sử dụng công cụ này với số lượng giới hạn 10 ngàn từ nếu bạn tăng cấp thông tin tài khoản .

Siteliner 

Siteliner lại là một công cụ hoàn toàn thiên về việc kiểm tra trùng lặp nội dung trên chính trang web của bạn. Siteliner có thể phát hiện các đoạn văn trùng lặp xuất hiện ở bất kỳ trang nào trên website của bạn và bôi màu cho chúng. Phát hiện các liên kết bị hỏng, làm ảnh hưởng tới trải nghiệm người dùng.

Siteliner kiểm tra nội dung trùng lặp

Siteliner miễn phí cho phép bạn kiểm tra trùng lặp nội dung cho tối đa 250 trang và bạn chỉ cần nhập URL vào thì công cụ sẽ hoạt động. Và nếu bạn nâng cấp tài khoản của mình, số lượng đó sẽ là 25 ngàn trang

Smallseotools 

Smallseotools là một công cụ kiểm tra đạo văn, kiểm tra chính tả miễn phí. Bạn có thể nhập văn bản hoặc một URL cụ thể để kiểm tra trùng lặp nội dung. Giới hạn kiểm tra là 1000 từ.

Smallseotools là một công cụ kiểm tra đạo văn

Điều đặc biệt là bạn không thể tìm thấy giới hạn nâng cấp tài khoản, có nghĩa là công cụ này miễn phí và chỉ cho phép tối đa 1000 từ. Ngoài ra Smallseotools còn kiểm tra rất nhiều vấn đề khác nữa, đây có lẽ là lý do họ lấy số lượng bù chất lượng

Grammarly 

Grammarly là một công cụ kiểm tra đạo văn và các lỗi chính tả, ngữ pháp. Nó có tính năng miễn phí nhưng chỉ dùng để kiểm tra lỗi chính tả và ngữ pháp. Để có thể sử dụng kiểm tra đạo văn, yêu cầu chỉnh sửa, .. thì bạn cần nâng cấp tài khoản của bạn lên. 

Grammarly còn có ứng dụng tiện ích Google Chrome

Không giới hạn số từ kiểm tra trùng lặp nội dung. Đó là một điều tuyệt vời mà ít có tool nào có thể thực hiện được. Ngoài ra, Grammarly còn có ứng dụng tiện ích Google Chrome, bạn có thể sử dụng công cụ này một cách thoải mái và thuận tiện

Cách đối phó với nội dung trùng lặp

Xử lý nội dung trùng lặp do lỗi kỹ thuật của nền tảng web của bạn

URL Canonical

Một URL Canonical được thêm vào phần HEAD của một trang và cho các công cụ tìm kiếm biết đâu là URL ưu tiên cho trang cụ thể. Url canonical có thể thược trỏ về chính nó hoặc một trang khác bất kỳ.

Thường thì khi có một mã ở phía sau các URL như “? dir = asc, ? price = 10, ?color=white, … ” thì bạn sẽ dễ dàng bị trùng lặp nội dung. Và những cái mã này thường xuất hiện trên các trang thương mại điện tử là nhiều và nếu không để ý, google sẽ kìm hãm phần lớn các từ khóa của bạn.

Vì đơn thuần rằng, google chỉ coi những thứ này là thuộc tính của hạng mục gốc ( đặt canonical là URL gốc )
Một URL Canonical được thêm vào phần HEAD của một trang

Đảm bảo rằng URL Canonical (trong của mã nguồn) giống với URL danh mục cơ sở sẽ ngăn các công cụ tìm kiếm lập chỉ mục các URL trùng lặp này.

Ví dụ tôi có một website như sau :
https://iseo1.com/products/shoes/?color=white ( 1 )
và trang hạng mục của tôi là :
https://iseo1.com/products/shoes/ ( 2 )

Hai URL có cùng tiêu đề, cùng Meta Description, cùng hiển thị những đôi giày giống nhau nhưng khác màu. Mặc định google sẽ xem hai trang này là trùng lặp và để giải quyết điều này, bạn cần đặt canonical của (1) là (2).

ID phiên

– ?sid=, đây là đuôi biểu thị thuộc tính ID Phiên, nó dùng để theo dõi hành vi của người dùng. Nhưng người nghĩ là một chuyện và google nghĩ lại là chuyện khác. Google xem đây là một bản sao của URL cốt lõi, những URL dang áp dụng thuộc tính ID phiên.

thuộc tính ID Phiên

Bạn có thấy nó giống với những gì tôi đề cập ở phần Canonical không? Nếu bạn đã áp dụng thuộc tính ID phiên cho URL, chỉ cần đặt canonical về URL cốt lõi là ổn. 

Một cách khác đó là bạn sử dụng cookies để theo dõi phiên của người dùng. Bạn không cần thiết phải đặt thuộc tính ID phiên vào URL nữa

Trang giỏ hàng

Với một trang giỏ hàng thì sao? 

Khi người mua hàng thêm sản phẩm vào giỏ hàng, website sẽ tự động thêm các mã đằng sau để phân biệt với các giỏ hàng từ người mua hàng khác.

Và biện pháp tối ưu là gì?

Đặt thẻ URL Canonical trỏ về trang chính giỏ hàng

  • Đặt thẻ URL Canonical trỏ về trang chính “giỏ hàng
  • Đặt thẻ “noindex, nofollow” cho trang giỏ hàng, như vậy, bạn sẽ ngăn không cho google lập chỉ mục trang giỏ hàng. Và vậy đấy, vấn đề trùng lặp sẽ không xảy ra.

Tìm kiếm trong website của bạn

Nhiều trang web tạo ra một cơ chế tự động cho các ô tìm kiếm của họ. Có nghĩa là khi người dùng tìm kiếm sản phẩm trên website của họ, sẽ có một URL hiện ra và có thêm một mã thuộc tính ở phía sau.

Tương tự trang giỏ hàng, trang này không có nội dung cố định.

Việc lập chỉ mục cho trang này là không cần thiết và cũng chẳng có tác dụng gì. Google chỉ thích những trang nội dung hữu ích. Ngoài ra, nếu để google index, bạn sẽ có một đống nội dung trùng lặp.

Nhiều trang web tạo ra một cơ chế tự động cho các ô tìm kiếm

  • Đặt thẻ “noindex, nofollow”  cho các trang xuất hiện sau tìm kiếm có mã thuộc tính, bạn sẽ ngăn cản được google lập chỉ mục và tránh lỗi trùng lặp nội dung
  • Sử dụng thẻ canonical trỏ về trang chính “tìm kiếm

Đường dẫn URL trùng lặp

Với một trang thương mại điện tử, bạn có 1 sản phẩm nhưng vô tình hay cố ý tạo ra hai đường dẫn đều chứa sản phẩm này. Rõ ràng hai trang này cùng một sản phẩm, nội dung giống nhau và dĩ nhiên, google xem đây là nội dung trùng lặp.

  • https://iseo1.com/product/san-pham-A    (1)
  • https://iseo1.com/brandt/san-pham-A      (2)

Làm cách nào để xử lý trường hợp này?

Bỏ cấp danh mục trên URL, có nghĩa là bạn sẽ chỉ để slug là tên sản phẩm, bỏ tên danh mục khỏi URL. Ví dụ với (1) và (2), bạn bỏ Product và Brand đi, chỉ để như thế này:

https://iseo1.com/san-pham-A

Cách thứ hai bạn có thể áp dụng và không cần phải bỏ danh mục ra khỏi đường dẫn URL, chỉ dùng đường dẫn chứa một danh mục duy nhất. Để hiểu rõ hơn bạn có thể xem mẫu bên dưới: 

  • Danh mục Product – Sản phẩm A  >>>> https://iseo1.com/product/san-pham-A
  • Danh mục Brand – Sản phẩm A  >>>>> https://iseo1.com/product/san-pham-A

Có nghĩa là dù bất kể hạng mục nào chứa mẫu sản phẩm, bạn chỉ cần chỉ định URL cho 1 hạng mục duy nhất

Và cách cuối cùng bạn có thể làm đó là sử dụng thẻ canonical.

Xét hai danh mục product và Brand. Bạn muốn URL nào là URL gốc và được google xếp hạng thì chỉ cần trỏ canonical về URL đó. 

  • https://iseo1.com/product/san-pham-A >> >> Canonical = https://iseo1.com/product/san-pham-A
  • https://iseo1.com/brandt/san-pham-A >> >> > Canonical = https://iseo1.com/product/san-pham-A

Phân Trang nhận xét – đánh giá sản phẩm

Phía dưới các sản phẩm, bài viết blog, … thường sẽ được tính hợp các đánh giá, nhận xét từ người dùng. Tương tự như phân trang danh mục, phần bình luận cũng sẽ bị phân trang giống như vậy. 

  • Nếu bạn đang trong quá trình tạo website mới thì bạn hãy cho các bình luận chỉ xuất hiện trong một trang duy nhất
  • Nếu website của bạn bị phân trang bình luận, các trang này phải được canonical cho trang sản phẩm chính hoặc được đặt thành “noindex, follow” thông qua thẻ meta rô bốt. 

Tôi vẫn khuyên các bạn nên canonical về trang sản phẩm chính hoặc bài viết chính thì hơn. Các bình luận của khách hàng google sẽ quét qua và đó là một sự uy tín dành cho bài viết.

Ngoài ra nếu có backlink trỏ về phân trang bình luận, đó là một lợi thế khi trang chính vẫn sẽ nhận được nguồn sức mạnh của backlink trỏ về phân trang bình luận

Non-www so với www

Sẽ có hai biến thể tương quan tới www đó là

  • www.serpseoaz.com
  • serpseoaz.com

Cả hai biến thể đều có thể truy cập được. Vấn đề của bạn là chọn biến thể nào bạn ưa thích và giữ lại. Sau đó redirect 301 biến thể còn lại về biến thể bạn ưu thích. 

Nếu không làm như vậy, google mặc định đây là hai trang web khác nhau. Và bạn biết đấy, nó cùng nội dung và tất yếu sẽ dẫn tới trùng lặp nội dung

HTTPS với HTTP: Đường dẫn tương đối so với Đường dẫn tuyệt đối

Tương tự với trường hợp của www, https và http cũng là hai biến thể mà bạn đều có thể truy cập vào website. Google đã hợp thức hóa https và đưa nó trở thành một yếu tố ảnh hưởng đến ranking.

Điều đó đòi hỏi các trang web đang sử dụng http phải chuyển sang sử dụng giao thức https.

Tuy nhiên, vấn đề xảy ra hoặc vô ý, các quản trị viên website đã không redirect 301 từ giao thức http sang https

Corporate

Corporate


Google mặc định hai trang này là khác nhau nhưng nôi dung lại trọn vẹn giống nhau. Lỗi trùng lặp sẽ xảy ra, trang của bạn sẽ bị nhìn nhận kém và sẽ bị ngưng trệ thứ hạng, thậm chí còn là không được xếp hạng

Đọc thêm bài viết của tôi “Https là gì?” để có hiểu hiểu rõ hơn về Https và cách chuyển từ Http sang Https

Dấu gạch chéo trên URL

Các công cụ tìm kiếm coi những URL hiển thị có cả dấu gạch chéo và không có dấu, là những URL khác nhau :
https://iseo1.com/post/
https://iseo1.com/post

Như thường lệ, hai trang này cùng có chung nội dung nhưng google lại coi là hai URL khác nhau. Và dĩ nhiên, bạn bị lỗi trùng lặp nội dung rồi. 

Cách giải quyết tốt nhất để khắc phục sự cố này là Canonical cả hai thành một phiên bản duy nhất hoặc chuyển hướng 301 phiên bản này sang phiên bản kia.

Viết hoa và viết thường

Có thể bạn sẽ gặp trường hợp này :

  • https://iseo1.com/Post
  • https://iseo1.com/post

Khi bạn truy vấn vào 2 đường dẫn này thì sẽ ra cùng một nội dung. Có nghĩa hiểu theo cách hiểu của tất cả chúng ta thì hai URL này là một .

Nhưng thực tế google không nghĩ như vậy, nó coi hai URL này là hai phiên bản khác nhau. Bạn sẽ bị trùng lặp nội dung trong trường hợp này. 

Cách giải quyết đó là bạn phải canonical về phiên bản chữ thường (tôi khuyên bạn nên làm như vậy) hoặc chuyển hướng 301 phiên bản chữ hoa sang phiên bản chữ thường

Xử lý trùng lặp nội dung do lỗi biên tập của chính bạn

Mô tả sản phẩm tương tự

Với một trang thương mại điện tử, rất nhiều những loại sản phẩm có thuộc tính, đặc thù kỹ thuật, tính năng giống nhau. Thật tiện nghi khi copy hàng loạt miêu tả mẫu sản phẩm này và dán vào miêu tả của những loại sản phẩm còn lại .

Vâng, đây là dạng trùng lặp nội dung dễ thấy ở các trang thương mại điện tử. Vậy mà nhiều người nói với tôi rằng, google xem đây là đặc thù của ngành nên sẽ không bắt trùng lặp.

Thật không hề tưởng tượng nổi ! Đó là vì những đối thủ cạnh tranh của bạn cũng làm điều tựa như và google không tìm được ai tốt để đưa lên .
Với những thông tin, đặc thù kỹ thuật, tính năng của loại sản phẩm như vậy, hãy làm cho nội dung của bạn thật độc lạ. Google sẽ không làm bạn tuyệt vọng, đừng vì sự lười nhác và chủ quan mà làm hỏng đi những thứ hạng mà bạn đáng có .

Các trang danh mục

Một điều cũng dễ thấy ở các danh mục thương mại điện tử là các quản trị viên thường để trống nội dung và chỉ có tiêu đề cùng với lưới sản phẩm. Điều này có nghĩa là trang này không có nội dung độc đáo và duy nhất. Google không thích điều này. 

Thêm nội dung vào danh mục sản phẩmTốt nhất là bạn nên thêm những dòng nội dung độc lạ, duy nhất, chưa những từ khóa mà người dùng tìm kiếm nhiều. Và quan trọng là bạn nên để lên trên đầu của trang, phía trên lưới mẫu sản phẩm, google sẽ nhìn nhận cao đoạn mở màn mà .
Tôi thấy rất nhiều ông để nội dung phía dưới lưới mẫu sản phẩm, có tính năng gì khi mà tỉ lệ người dùng kéo xuống và thấy những nội dung này là rất thấp .

Không có số lượng từ hoặc ký tự kỳ diệu để sử dụng trên trang danh mục, nhưng có nội dung bạn sẽ có một nguồn sức mạnh lớn để cạnh tranh thứ hạng từ khóa. Nếu bạn lo lắng người dùng thấy quá nhiều nội dung và sản phẩm bị che lấp, số lượng từ tầm 200 đến 400 từ sẽ là hợp lý nhất

Xử lý trùng lặp nội dung gây ra bởi website bên ngoài – Đạo văn

Mô tả Sản phẩm của Nhà sản xuất

Các thông tin về mẫu sản phẩm đều nằm trên website của nhà phân phối. Thật dễ hiểu khi những đơn vị chức năng phân phối lấy những thông tin này để gán cho những loại sản phẩm trên website của họ. Nhưng thay vì viết một cách độc lạ, hấp dẫn, duy nhất họ lại bê y nguyên câu chữ, diễn đạt của nhà phân phối mẫu sản phẩm .

Khi bạn copy mô tả sản phẩm của nhà sản xuất, 2 loại nội dung này giống nhau nhưng nằm trên 2 trang web khác nhau. Khổ một cái là mô tả sản phẩm của nhà sản xuất có trước và đó là nội dung gốc. Và bạn sẽ bị xem là đạo văn.

Các nhà phân phối sẽ không kiện bạn vì bạn đang phân phối loại sản phẩm và tiếp thị cho họ kia mà. Còn google thì sao ? Google sẽ không nhìn nhận cao trang của bạn và hiệu quả là thứ hạng từ khóa tệ hại .

Khi tôi bắt đầu SEO sản phẩm, một mô tả của tôi sẽ có nhiều ảnh, có một cái video về sản phẩm, đoạn với mô tả đặc điểm kỹ thuật kèm theo là lợi ích mà các chi tiết này mang lại cho người dùng. 

Trùng lặp nội dung bởi các trang Demo, Development or Sandbox

Bản Demo gốc nằm trên trang web của nhà phát triển. Khi chúng ta cài đặt Theme vào website, sẽ có các tùy chọn Demo. Thường tôi thấy khá nhiều người add Demo xong thì để nguyên đó và khi nào rảnh thì mới xây dựng tiếp.

Điều này vô tình làm cho google quét trang của bạn và index các nội dung Demo.

Đây được xem như là bạn đạo văn và bạn phải mất thời gian khá lâu sau khi xây dựng nội dung mới bạn mới ngóc đầu lên được. Đó là trong trường hợp bạn đã xóa toàn bộ nội dung cũ. 

giải quyết trùng lặp nội dung bởi trang Demo

Đối với một website wordpress, các giải quyết đơn giản đó là khi tải demo về thì hãy chọn “setting >>> Reading >>> ngăn chặn công cụ tìm kiếm lập chỉ mục“. Khi nào xuất bản nội dung mới và xóa hết nội dung cũ, bạn mới nên cho google index

Đối với những website code, bạn hoàn toàn có thể

  • Thêm thẻ meta robot “noindex, nofollow” 
  • Có thể sử dụng lệnh “Disallow: /” trong tệp robot.txt chặn trình thu thập thông tin của công cụ tìm kiếm thu thập dữ liệu. Nếu như trang của bạn đã bị trùng lặp và đã được lập chỉ mục thì điều này không có tác dụng

Bê toàn bộ sản phẩm sang các bên thứ 3 để quảng bá

Ví dụ bạn đang có một quầy bán hàng bán quần áo. Bạn cũng đang SEO và đẩy top những từ khóa để bán hàng. Nhưng bạn lại mang loại sản phẩm của bạn, nội dung, miêu tả sang những trang thương mại điện tử lớn hơn ( Lazada ví dụ điển hình ) để tiếp thị .

Hậu quả là gì? 

Bạn đang tạo ra các trang trùng lặp bên ngoài cho chính trang web của bạn. Các trang như lazada, shopee có điểm thẩm quyền cao.

Khi đó với hai trang trùng lặp, cứ cho trang của bạn là nội dung gốc, nhưng từ khóa của trang lazada hay shopee sẽ có thứ hạng cao hơn trang gốc. Điều này sẽ gây tổn hại lớn khi SEO .

Cách giải quyết ở đây là gì? 

Vẹn toàn nhất là bạn hãy tạo một mô tả hoàn toàn khác với mô tả trên sản phẩm của bạn sau đó đưa lên các trang thương mại điện tử. Đây là cách giúp cho bạn tránh được nội dung trùng lặp và đáp ứng 2 kênh bán hàng giúp bạn tăng thêm thu nhập.

Không cung cấp nội dung đã có cho các nhà phân phối

Nếu trang của bạn là một website thương mại điện tử, bạn cũng tích hợp blog. Bạn tạo ra nội dung gốc của riêng bạn. Nhưng những đại lý phân phối, những blogger làm affiliate hoàn toàn có thể sẽ nhu yếu thông tin nội dung từ trang của bạn .

Không cung cấp bất kỳ nội dung đã xuất bản nào cho các nhà phân phối hay những người làm affiliate.

Nếu như trang web của đối tác có thẩm quyền tên miền cao hơn trang của bạn, đó là một điều tệ hại. Nếu trang web của bạn đang SEO thì tôi tin rằng, từ khóa đó sẽ bị chính các nhà phân phối của bạn chiếm lĩnh thứ hạng.

Một ví dụ cho dễ hiểu :

Tôi đang làm SEO cho thiết bị nhà bếp và cụ thể hơn là “Bếp từ Bosch“. Bạn gõ từ khóa “bếp từ bosch” lên Search Box, hãng Bosch không đứng đầu về từ khóa này, thay vào đó là các đại lý phân phối.

Dễ hiểu khi thẩm quyền tên miền của đại lý phân phối cao hơn nhiều so với trang của đơn vị sản xuất nhà bếp từ Bosch .
Không cung cấp nội dung đã có cho các nhà phân phối

Trong trường hợp các đại lý phân phối đòi hỏi quá về nội dung sản phẩm, bạn có thể xử lý theo 3 cách sau:

  • Yêu cầu các đại lý đặt Canonical trỏ về trang nội dung gốc
  • Đặt thẻ “noindex, follow” cho nội dung bạn cung cấp trên trang đại lý
  • Không tham gia quảng bá để tăng sứ mạnh cho trang được cung cấp nội dung

Nội dung sao chép

Khi bạn lên top đầu công cụ tìm kiếm ở nhiều từ khóa, việc bị sao chép nội dung là chuyện như cơm bữa. Nói lại một lần nữa, nếu thẩm quyền tên miền của họ cao, thứ hạng từ khóa của bạn sẽ bị đẩy xuống mà không cần bàn cãi thêm.

Rất nhiều hệ lụy sẽ xảy ra và đặc biệt quan trọng doanh thu bán hàng của bạn sẽ giảm

Cách tốt nhất để xử lý vấn đề này là gửi đơn khiếu nại DMCA với Google

Cách đối phó vấn nạn đạo văn

Áp dụng các công cụ mà tôi đã giới thiệu ở phía trên, bạn sẽ biết được website nào đang copy nội dung của bạn. Và khi đó bạn sẽ có 4 cách để xử lý vấn nạn đạo văn này

Báo cáo nó cho máy chủ web của họ

Một vài máy chủ web đề cao rất nhiều việc chống lại nạn đạo văn như Godaddy. Tập hợp tất cả  những bằng chứng cho vụ vi phạm, những chứng cứ chứng minh nội dung vi phạm đó có bản gốc là của bạn. 

Gửi ngay một email tới bộ phận Vi phạm Bản quyền của GoDaddy yêu cầu họ xóa tài liệu bị đánh cắp. Thậm chí trang đánh cắp nội dung sẽ không còn tồn tại nữa chứ đừng nói xuất hiện trên công cụ tìm kiếm. Cách này âm thầm và cao minh nhất.

Báo cáo nó cho Google

Tương tự như báo cáo cho máy chủ web, bạn cần tập hợp những chứng cứ chứng minh văn bản người khác copy có bản gốc là của bạn. Truy cập trang pháp lý của Google và điền vào biểu mẫu trực tuyến

Đâu đó trong một đến hai tuần chờ đợi google xử lý, trang bị cáo buộc đạo văn sẽ biến mất khỏi thứ hạng tìm kiếm của google. Nhược điểm của điều này là trong vòng 2 tuần đó, bạn sẽ mất kha khá chuyển đổi.

Sử dụng thẻ ‘rel = canonical’ trên nhiều miền

Bạn đã xem những trường hợp nội dung trùng lặp mà tôi đã đề cập ở phần trên chưa? Nếu chưa hãy đọc lại, có khi nào trang của bạn đang gặp những trường hợp đó!

Việc đặt URL Canonical cho phép bạn cho các công cụ tìm kiếm biết nên đưa URL nào vào kết quả tìm kiếm của chúng. Trong trường hợp ai đó sao chép trang web của bạn, URL chuẩn sẽ cho các công cụ tìm kiếm biết nguồn gốc là gì.

Ngoài ra khi các bạn copy bài viết và đăng lên social như facebook, instagram, … có URL canonical, google sẽ biết rằng các bài đăng này là bản sao của bài viết được đặt Canonical

Yêu cầu người đạo văn thêm nguồn ở phía dưới đoạn copy

Đây là một cách xử lý nhẹ nhàng cho người copy nội dung của bạn. Gửi một email hoặc tin nhắn tới địa chỉ liên hệ của họ và báo họ rằng họ đang copy nội dung của bạn. 

Yêu cầu nhẹ nhàng quản trị web thêm một đường link trỏ về bài viết gốc hoặc ghi rõ nguyền copy, bạn sẽ có một backlink trỏ về. Nếu họ không đồng ý chấp thuận, vận dụng những bước trên và xử đẹp họ thôi .

Kết luận cuối cùng với chủ đề kiểm tra trùng lặp nội dung

Một bài viết khá dài nhưng để nói hết về kiểm tra trùng lặp nội dung thì chúng ta còn phải nói rất nhiều. Có hai loại nội dung trùng lặp, trùng lặp nội dung trên chính trang web của bạn và loại thứ hai là trùng lặp nội dung xảy ra ở một trang web khác. 

Trùng lặp nội dung trên trang của chính bạn là do yếu tố kỹ thuật của nền tảng website và cũng có thể do chính sự biên tập nội dung của bạn. Trùng lặp nội dung trên một website khác là do bạn mang nội dung sang website đó hoặc do người khác đạo văn từ nội dung của bạn.

Dù là như thế nào, việc kiểm tra trùng lặp nội dung là không thể bỏ qua. Bạn phải giải quyết tất cả những gì xảy ra với trùng lặp nội dung

Không chỉ tác động ảnh hưởng tới thứ hạng những từ khóa, sự quy đổi, doanh thu, … việc tác động ảnh hưởng tới tên thương hiệu và sự uy tín là vô cùng lớn. Với những hướng dẫn ở trên, tôi nghĩ rằng bạn hoàn toàn có thể thuận tiện xử lý yếu tố này .

Source: https://iseo1.com
Category: Marketing

Trả lời

Email của bạn sẽ không được hiển thị công khai.