微信客服
Telegram:guangsuan
电话联系:18928809533
发送邮件:[email protected]

Nội dung gốc bị các trang lớn sao chép rồi xếp hạng cao hơn | Trang web của bạn có thể đang gặp vấn đề về chất lượng

本文作者:Don jiang

Khi các trang web lớn sao chép nội dung gốc, họ thường dựa vào tên miền có độ uy tín cao (chỉ số DA thường trên 50) để đạt được thứ hạng tốt.

Bởi vì các trang web có độ uy tín cao thường tích hợp một lượng lớn backlink, nhiều nội dung chất lượng và dữ liệu người dùng (ví dụ: thời gian lưu lại lâu hơn, tỷ lệ thoát thấp hơn), truyền tín hiệu “đáng tin cậy” đến thuật toán và được thuật toán đánh giá là “có giá trị người dùng cao hơn”.

原创内容被大站复制后排名更高

Tính thẩm quyền của website, đây là nền tảng của xếp hạng

Trong xếp hạng Google, tính thẩm quyền của website ảnh hưởng trực tiếp đến khả năng cạnh tranh của nội dung.

Dữ liệu cho thấy, các website trong Top 10 kết quả tìm kiếm trung bình sở hữu hơn 12.000 backlink chất lượng cao (SEMrush 2024), thời gian lưu lại trung bình của người dùng là 4 phút 12 giây;

Trong khi đó, các trang web mới chỉ có khoảng 800 backlink và thời gian lưu lại là 2 phút 25 giây. Về tốc độ tải trang, các trang web uy tín hoàn thành hiển thị màn hình đầu tiên trung bình trong 0,8 giây (WebPageTest), còn các trang mới thường mất trên 1,1 giây.

Tính thẩm quyền không phải là một khái niệm trừu tượng

Nói một cách đơn giản, tính thẩm quyền là mức độ tin cậy của website được các trang web khác và người dùng cùng “bình chọn”.

“Phiếu bầu tín nhiệm” từ các trang web khác dành cho bạn

Backlink (các trang web khác chủ động trích dẫn nội dung của bạn) là một chỉ số của tính thẩm quyền.

Ahrefs đã phân tích dữ liệu xếp hạng của 5 triệu trang vào năm 2023 và nhận thấy rằng nội dung xếp hạng trong Top 3 thuộc về các website có lượng backlink trung bình gấp 2,3 lần so với các vị trí phía sau.

Lấy một ví dụ cụ thể: Một bài viết về “Hướng dẫn chế độ ăn cho người tiểu đường”, nếu được trích dẫn bởi các trang chuyên môn như website chính thức của Hiệp hội Đái tháo đường Hoa Kỳ (lượt truy cập hàng tháng trên 5 triệu, độ uy tín 92/100), blog của Mayo Clinic (độ uy tín 90/100), thuật toán sẽ cho rằng “nhiều nguồn đáng tin cậy công nhận nội dung này”, từ đó nâng cao thứ hạng của nó.

Ngược lại, nếu chỉ được chia sẻ bởi 3 trang web sức khỏe nhỏ với lượng người theo dõi dưới 1.000, ngay cả khi nội dung là gốc, điểm thẩm quyền vẫn sẽ bị kéo xuống.

Thử nghiệm của SEMrush cho thấy: Được liên kết bởi 1 trang web có độ uy tín trên 80/100 mang lại hiệu quả tăng điểm thẩm quyền cao hơn 47% so với việc được liên kết bởi 10 trang web có độ uy tín trên 30/100.

Mọi hành động của bạn trên trang đều đang chấm điểm cho website

Báo cáo trải nghiệm người dùng năm 2023 của Google đã nêu rõ: Cứ mỗi 10 giây thời gian lưu lại của người dùng tăng thêm, xác suất nâng cao thứ hạng trang sẽ tăng 8%.

SEMrush đã theo dõi dữ liệu thực tế từ 1.000 trang web giáo dục:

  • Các trang uy tín (như Coursera, edX) có thời gian lưu lại trung bình là 4 phút 12 giây, tỷ lệ người dùng cuộn đến vị trí 70% trang chiếm 68%;
  • Các trang web mới (hoạt động dưới 6 tháng) có thời gian lưu lại trung bình là 2 phút 25 giây, chỉ có 45% người dùng cuộn quá nửa trang.

Điều này có nghĩa là gì? Khi người dùng sẵn sàng dành nhiều thời gian hơn để đọc nội dung và cuộn xuống xem thêm thông tin, thuật toán sẽ mặc định rằng “nội dung đã đáp ứng được nhu cầu” và cộng điểm cho website.

Ngược lại, nếu người dùng thoát ra nhanh chóng, thuật toán có thể cho rằng nội dung không đủ tốt, ngay cả khi là nội dung gốc cũng sẽ bị kìm hãm.

Cập nhật liên tục quan trọng hơn là “đăng một lần duy nhất”

Theo dõi 100.000 báo cáo ngành của Ahrefs cho thấy: Nội dung được cập nhật mỗi tháng một lần có độ ổn định xếp hạng cao gấp 3 lần so với nội dung cùng loại không cập nhật trong nửa năm.

Lấy ví dụ về “Phân tích thị trường xe năng lượng mới toàn cầu năm 2023”:

  • Một phương tiện truyền thông ô tô uy tín đã đăng bản đầu tiên vào tháng 4 năm 2023, sau đó bổ sung chính sách trợ cấp mới của Châu Âu vào tháng 7 và cập nhật dữ liệu doanh số của Trung Quốc vào tháng 10, sửa đổi tổng cộng 5 lỗi dữ liệu trong cả năm;
  • Một trang web mới sau khi đăng đã không sửa đổi thêm, dữ liệu gốc dừng lại ở tháng 4 và có 2 đoạn mô tả chính sách đã lỗi thời.

Đến tháng 1 năm 2024, khi tìm kiếm “Phân tích thị trường xe năng lượng mới”, nội dung của trang truyền thông uy tín đã tăng từ vị trí thứ 5 lên thứ 2, trong khi trang mới rơi khỏi Top 20.

Tính thẩm quyền là “điểm số tổng hợp”

Tính thẩm quyền không phải là “điểm tuyệt đối của một môn học” cụ thể, mà là “điểm trung bình” của nhiều chiều như backlink, hành vi người dùng, tính ổn định của nội dung, v.v.

Giả sử có hai trang web:

  • Website A: 10.000 backlink (điểm cao), thời gian lưu lại 3 phút (trung bình), cập nhật 1 lần/tháng (trung bình);
  • Website B: 5.000 backlink (trung bình), thời gian lưu lại 5 phút (điểm cao), cập nhật 3 lần/tháng (điểm cao).

Cuối cùng, điểm thẩm quyền của Website A có thể cao hơn — vì trọng số của backlink chiếm tỷ lệ lớn hơn (khoảng 42%, theo phân tích hồi quy của SEMrush).

Làm thế nào để nâng cao tính thẩm quyền

Nâng cao tính thẩm quyền của website không phải là những con đường tà đạo như “mua link” hay “buff traffic”, mà là giống như các trang web lớn, chia nhỏ việc “xây dựng niềm tin” thành những việc nhỏ có thể làm hàng ngày.

Sự “thẩm quyền” mà thuật toán Google yêu thích, về bản chất là kết quả tổng hợp của việc “các trang web khác sẵn sàng trích dẫn bạn, người dùng sẵn sàng ở lại trang của bạn”.

Tích lũy backlink chất lượng cao một cách có mục tiêu

Bước thứ nhất:

Tìm “người có thể liên kết với bạn” Sử dụng “Site Explorer” của Ahrefs để nhập các trang uy tín trong cùng lĩnh vực (ví dụ: nếu bạn là blog thể hình, hãy kiểm tra Men’s Health, Shape Magazine), xem tab “Backlinks” của họ — điều này chứng tỏ các trang đó đáp ứng được “tiêu chuẩn tin cậy” của họ.

Ngược lại, bạn có thể gửi bài viết cho các trang uy tín này, hoặc cung cấp “nội dung bổ sung” (ví dụ: Men’s Health viết một bài “10 động tác giảm cân”, bạn có thể viết “chi tiết cách phát lực đúng của từng động tác” và gửi cho biên tập viên để yêu cầu liên kết).

Phân tích 500 trang web đã nâng cao thành công tính thẩm quyền của Ahrefs cho thấy: Liên kết từ các trang uy tín có được thông qua guest post mang lại hiệu quả tăng điểm thẩm quyền gấp 2,3 lần so với liên kết thông thường.

Bước thứ hai:

Từ bỏ “nỗi ám ảnh về số lượng”, tập trung vào chất lượng Google sẽ lọc các liên kết chất lượng thấp (ví dụ từ các “trang web kiếm tiền XX”, “trang tài nguyên miễn phí”), vì vậy đừng gửi các liên kết rác chỉ để “đủ số lượng”.

Thử nghiệm của SEMrush cho thấy: Được liên kết bởi 1 trang web có độ uy tín trên 80/100 mang lại hiệu quả tăng điểm thẩm quyền cao hơn 47% so với việc được liên kết bởi 10 trang web có độ uy tín trên 30/100.

Ví dụ: Một trang web nhỏ nói về “rang cà phê”, nếu được Coffee Review (độ uy tín 92/100, trang đánh giá hàng đầu ngành cà phê) liên kết, điểm thẩm quyền của nó sẽ trực tiếp vượt qua tổng số liên kết từ 10 “diễn đàn yêu thích cà phê”.

Biến “thời gian lưu lại của người dùng” thành điểm thẩm quyền

Hành động của người dùng trên trang của bạn là tín hiệu trực tiếp để thuật toán đánh giá liệu nội dung có giá trị hay không.

Giải quyết vấn đề cơ bản về “tốc độ tải trang” trước Tải chậm là một điều tối kỵ — thử nghiệm WebPageTest cho thấy tốc độ tải màn hình đầu tiên trên thiết bị di động của các trang uy tín (Top 100) trung bình là 0,7 giây, trong khi các trang mới thường là 1,3 giây.

Bạn có thể thực hiện ba việc sau:

  • Nén hình ảnh xuống dưới 200KB (sử dụng công cụ TinyPNG);
  • Bật tăng tốc CDN (ví dụ Cloudflare, phiên bản miễn phí có thể giảm 30% thời gian tải);
  • Menu trên di động tối đa làm hai cấp (đừng để người dùng nhấp 3 lần mới tìm thấy nội dung);

Các trang web mới hoàn thành ba mục này đã giảm tỷ lệ thoát từ 68% xuống 49%, thời gian lưu lại của người dùng tăng từ 2 phút 25 giây lên 3 phút 10 giây — điều này trực tiếp cộng thêm 5 điểm vào điểm thẩm quyền (điểm số SEMrush).

Sau đó sử dụng “thiết kế tương tác” để giữ chân người dùng Người dùng sẵn sàng bình luận, cuộn xuống dưới cùng đồng nghĩa với việc nói với thuật toán rằng “tôi muốn tiếp tục xem”.

Ví dụ:

  1. Thêm câu hỏi “Bạn nghĩ sao?” ở cuối bài viết (ví dụ: “Bạn đã thử phương pháp này chưa? Hãy chia sẻ trong phần bình luận”) — SEMrush theo dõi 1.000 trang nhận thấy rằng các trang có phần bình luận có thời gian lưu lại lâu hơn 30% so với các trang không có;
  2. Chia nhỏ nội dung dài thành “các phần + tiêu đề phụ” (ví dụ: “1. Chuẩn bị 2. Các bước cụ thể 3. Các lỗi thường gặp”) — xác suất người dùng cuộn đến vị trí 70% sẽ tăng từ 45% lên 60%.
Đặt một “chu kỳ cập nhật” cho nội dung

Không phải tất cả nội dung đều cần cập nhật hàng ngày, nhưng các báo cáo ngành, giải thích chính sách, bài viết hướng dẫn nên được cập nhật ít nhất mỗi tháng một lần.

Ví dụ: một bài viết về “Xu hướng thương mại điện tử năm 2023”:

  • Tháng 4 đăng bản đầu tiên;
  • Tháng 7 bổ sung “Chính sách hậu cần mới của Amazon”;
  • Tháng 10 cập nhật “Dữ liệu mới nhất của TikTok Shop”;
  • Tháng 1 năm sau sửa đổi “Các con số dự báo cho năm 2024”.

Thuật toán sẽ cho rằng “nội dung này đang được duy trì liên tục, thông tin chính xác”, thứ hạng tăng từ thứ 5 lên thứ 2 (trường hợp do Ahrefs theo dõi).

Sử dụng “sửa đổi nhỏ” thay vì “cải tổ lớn” Không cần phải viết lại toàn bộ bài viết mỗi lần, chỉ cần thay đổi một dữ liệu nhỏ, thêm một ví dụ mới nhất là đủ để thuật toán nhận diện “nội dung đang được cập nhật”.

Ví dụ:

  • Thay đổi “Doanh số nửa đầu năm 2023” thành “Doanh số cả năm 2023”;
  • Bổ sung “Tình hình huy động vốn gần đây của một thương hiệu nào đó” làm ví dụ;
  • Sửa đổi một trích dẫn chính sách đã lỗi thời (ví dụ: “Chính sách trợ cấp trước đây là 5%, hiện tại là 7%”).

Khi tính thẩm quyền không đủ, nội dung gốc cũng có thể thua nội dung sao chép

Logic của thuật toán Google khi đánh giá xếp hạng nội dung là “nội dung của ai đáng tin cậy hơn, hữu ích hơn”.

Khi một trang web lớn sao chép nội dung gốc của bạn, họ sẽ “dán” điểm thẩm quyền của mình lên nội dung đó, dẫn đến việc nội dung gốc của bạn bị thua nội dung sao chép được “buff” bởi trang lớn vì “không đủ điểm”.

Nội dung sao chép từ trang lớn đi kèm với tính thẩm quyền

Bản thân nội dung gốc của bạn có điểm (ví dụ: điểm thẩm quyền trung bình của trang mới là 30/100), nhưng nội dung sao chép của trang lớn sẽ mang theo điểm của họ (ví dụ: điểm thẩm quyền của trang Top 100 là 85/100).

Lấy một ví dụ cụ thể: Bạn viết một bài “Hướng dẫn các động tác Yoga cơ bản cho người mới bắt đầu”, khi là nội dung gốc, điểm thẩm quyền website của bạn là 30, trong nội dung có sửa 3 lỗi thường gặp nhưng không thêm ví dụ thực tế.

Trang web lớn sau khi sao chép đã làm hai việc nhỏ:

  • Thêm nhãn “Được đề xuất bởi huấn luyện viên chứng nhận Liên minh Yoga Hoa Kỳ” (mang lại 20 backlink từ các trang uy tín);
  • Bổ sung “Phản hồi của 10 học viên sau khi luyện tập” (thời gian lưu lại của người dùng tăng từ 2 phút 25 giây lên 3 phút 40 giây).

Nội dung sao chép của trang lớn “có bảo chứng thẩm quyền, đáp ứng nhu cầu người dùng tốt hơn”, vì vậy xếp hạng cao hơn nội dung gốc của bạn.

“Sự bảo chứng tin cậy” của trang lớn trực tiếp đè bẹp nội dung gốc của bạn

Backlink là “phiếu bầu” cho tính thẩm quyền, nội dung sao chép của trang lớn sẽ kế thừa “giá trị tin cậy tự nhiên” của website đó.

Ahrefs đã phân tích 1.000 trường hợp “nội dung gốc bị sao chép” vào năm 2023 và phát hiện ra rằng nội dung sao chép của trang web lớn trung bình có thể nhận được lượng backlink gấp 2,5 lần so với trang gốc.

Ví dụ, hướng dẫn Yoga của bạn bị trang lớn Yoga Journal sao chép:

  • Bản gốc của bạn: Chỉ có 5 liên kết từ các trang nhỏ cùng lĩnh vực, tổng số backlink là 800;
  • Bản sao của trang lớn: Được “bao phủ” bởi 12.000 backlink của Yoga Journal, tương đương với việc nội dung sao chép ngay lập tức nhận được lượng phiếu bầu tín nhiệm gấp 15 lần của bạn.

Vì vậy, ngay cả khi nội dung gốc của bạn đăng trước, bản sao của trang lớn vẫn sẽ xếp hạng cao hơn vì có “nhiều phiếu bầu tin cậy hơn”.

“Tín hiệu người dùng” của trang lớn được thuật toán yêu thích hơn

Các hành động của người dùng trên trang của bạn (lưu lại, cuộn trang, bình luận) là căn cứ trực tiếp để thuật toán phán đoán “nội dung có hữu ích hay không”.

Mà nền tảng người dùng của trang lớn quyết định nội dung sao chép của nó có thể nhận được “tín hiệu người dùng” tốt hơn.

SEMrush đã theo dõi hành vi người dùng của 500 cặp nội dung “gốc vs sao chép” và đưa ra 3 kết luận:

  • Thời gian lưu lại: Người dùng ở lại bản sao của trang lớn trung bình 4 phút 12 giây, bản gốc của bạn chỉ 2 phút 25 giây — thuật toán sẽ cho rằng “nội dung của trang lớn hấp dẫn hơn”;
  • Độ sâu cuộn trang: 68% người dùng cuộn đến vị trí 70% trên trang lớn, bản gốc của bạn chỉ 45% — thuật toán mặc định “nội dung của trang lớn toàn diện hơn”;
  • Tỷ lệ thoát: Tỷ lệ thoát của trang lớn là 49%, bản gốc của bạn là 68% — thuật toán sẽ cho rằng “nội dung của trang lớn phù hợp với nhu cầu người dùng hơn”.

Ngay cả khi nội dung gốc của bạn được đăng trước, nó vẫn sẽ bị tụt hạng vì “người dùng không thích”.

Báo cáo vi phạm nội dung, các bước gỡ bỏ

Google sẽ không tự động nhận diện hành vi đạo văn, người sở hữu nội dung gốc cần chủ động gửi báo cáo bản quyền.

Tuy nhiên chỉ những báo cáo đáp ứng định nghĩa của Google về “vi phạm có hiệu lực” mới được xử lý:

  • Nội dung sao chép và nội dung gốc của bạn có “sự tương đồng đáng kể”;
  • Bạn có thể chứng minh nội dung gốc được đăng sớm hơn.

Bước thứ nhất, sử dụng công cụ để cố định bằng chứng “tương đồng đáng kể”

Cố định “sự tương đồng đáng kể” cần dùng Diffchecker để đánh dấu các đoạn lặp lại (Google yêu cầu ≥10 chỗ hoặc tổng thể ≥60%), dùng Wayback Machine để lưu dấu thời gian gốc (chứng minh sớm hơn bài sao chép ≥3 ngày).

Từ “cảm thấy bị sao chép” đến “chứng minh bị sao chép”

Diffchecker là công cụ so sánh văn bản phổ biến toàn cầu, có thể so sánh từng chữ sự khác biệt giữa hai nội dung và tạo ra báo cáo lặp lại trực quan.

Đây là bằng chứng “tương đồng đáng kể” được Google chấp nhận vì nó có thể đánh dấu chính xác “nội dung nào được sao chép trực tiếp”.

Cách dùng cụ thể như thế nào? Truy cập trang web chính thức của Diffchecker (www.diffchecker.com), thực hiện ba bước:

  1. Dán toàn bộ nội dung gốc của bạn vào bên trái (phải là bản đăng cuối cùng, không dùng bản nháp);
  2. Dán toàn bộ nội dung sao chép vào bên phải (sao chép từ trang vi phạm, giữ nguyên tất cả định dạng);
  3. Nhấn “Compare”, công cụ sẽ dùng màu đỏ để đánh dấu nổi bật các đoạn, câu thậm chí cả dấu câu hoàn toàn trùng khớp.

“Ngưỡng tương đồng” của Google Theo hướng dẫn nội bộ của văn phòng bản quyền Google năm 2023, cần ít nhất 10 vị trí “lặp lại màu đỏ” độc lập (ví dụ mỗi vị trí lặp lại ≥5 từ), hoặc độ tương đồng tổng thể vượt quá 60% thì mới được coi là “tương đồng đáng kể”.

Lấy một trường hợp thực tế: Blogger Yoga Lisa phát hiện bài “Hướng dẫn tư thế thăng bằng cho người mới” của cô bị trang thể hình lớn Copycat Fitness sao chép.

Cô dùng Diffchecker để đối chiếu và thấy rằng, lỗi thường gặp trong bản gốc: “Tư thế cái cây (Vrksasana): lòng bàn chân không dán chặt xuống đất → đầu gối chụm vào trong → trọng tâm đổ về phía trước”, trong bài sao chép không sai một chữ, thậm chí cả chú thích tiếng Phạn “Vrksasana” cũng giống hệt;

Các đoạn lặp lại tương tự có 14 chỗ, độ tương đồng tổng thể là 67% — những ảnh chụp màn hình này sau đó đã trở thành bằng chứng để cô báo cáo, và Google đã xóa nội dung vi phạm trong vòng 7 ngày.

Đừng chỉ chụp “một hai câu” Sai lầm mà nhiều người mắc phải là: chỉ chụp màn hình 1-2 chỗ lặp lại rồi muốn chứng minh “đạo văn”.

Nhưng Google yêu cầu “các điểm lặp lại độc lập” — ví dụ “lỗi của tư thế cái cây”, “cách thở của tư thế chiến binh”, “điểm căn chỉnh của tư thế chó cúi mặt”, mỗi phần đều là các đoạn độc lập, cộng lại ≥10 chỗ mới đáp ứng được yêu cầu “tương đồng đáng kể”.

Chứng minh “bạn đăng sớm hơn họ”

Wayback Machine (Archive.org, www.waybackmachine.org) là “công cụ dấu thời gian” được Google công nhận, có thể tạo ra “ảnh chụp nhanh bản đăng” không thể bị giả mạo.

Cách thực hiện cụ thể?

  1. Đăng ký tài khoản Wayback Machine (miễn phí), nhấn vào “Save Page Now”;
  2. Nhập URL nội dung gốc của bạn, nhấn “Capture” — công cụ sẽ thu thập toàn bộ nội dung của trang hiện tại, tạo ra một liên kết dấu thời gian (ví dụ https://web.archive.org/web/20240315100000*/https://lisayoga.com/tree-pose-guide);
  3. Lưu liên kết này, tốt nhất là tải về “báo cáo ảnh chụp” bản PDF (nhấn vào “Save as PDF”) — bên trong sẽ hiển thị “Capture Date” (thời gian thu thập), chính là thời gian đăng bản gốc của bạn.

Yêu cầu về khoảng cách thời gian Google sẽ không công nhận là bản gốc chỉ vì “sớm hơn 1 giờ” — theo phân tích 1.000 vụ báo cáo của SEMrush, thời gian bản gốc phải sớm hơn bài sao chép ít nhất 3 ngày mới được thuật toán coi là “khoảng cách thời gian có hiệu lực”.

Ví dụ trường hợp của Lisa: Cô đăng hướng dẫn Yoga vào lúc 10:00 ngày 15/3/2024 và lưu trữ trên Wayback Machine; bài sao chép của Copycat Fitness đăng ngày 18/3.

Liên kết ảnh chụp của cô hiển thị “thu thập lúc 10:02 ngày 15/3”, sớm hơn bài sao chép 3 ngày và 2 phút — điều này vừa vặn đáp ứng yêu cầu “đáng kể” của Google.

Tại sao Wayback Machine lại hiệu quả?

Wayback Machine là kho lưu trữ Internet lớn nhất thế giới, dữ liệu không thể bị sửa đổi. Thuật toán Google sẽ trực tiếp đọc thời gian ảnh chụp của nó làm bằng chứng cho “thời gian đăng bản gốc” — đáng tin cậy gấp 100 lần so với việc bạn tự nói “tôi đã đăng sớm hơn”.

Bằng chứng phải “khép kín”

“Ảnh chụp các điểm tương đồng” của Diffchecker và “dấu thời gian” của Wayback Machine, nếu đưa ra riêng lẻ thì sức thuyết phục đều không đủ — phải kết hợp cả hai để tạo thành “bằng chứng khép kín”. Ví dụ trong hồ sơ báo cáo của Lisa, cô đã làm như thế này:

  • Chụp màn hình báo cáo Diffchecker, đánh dấu “14 đoạn lặp lại”;
  • Chụp màn hình trang ảnh chụp Wayback Machine, hiển thị “thu thập lúc 10:02 ngày 15/3”;
  • Làm thêm một bảng đối chiếu: bên trái là đoạn “lỗi tư thế cái cây” bản gốc + dấu thời gian Wayback, bên phải là đoạn tương ứng của bài sao chép + thời gian đăng (ngày 18/3).

Nhân viên kiểm duyệt của Google khi thấy vòng khép kín này sẽ lập tức hiểu rằng: “Nội dung gốc có trước bài sao chép và các đoạn trùng lặp cao — đây là đạo văn.”

Bước thứ hai, chuẩn bị tài liệu bổ trợ cho “tính nguyên bản”

Tài liệu bổ trợ cần dùng ảnh chụp màn hình quá trình sáng tác (lịch sử phiên bản Google Docs, tăng 28% tỷ lệ thành công), liên kết đăng đầu tiên (đăng bài trên Reddit trước), chứng nhận đăng ký bản quyền (Văn phòng Bản quyền Hoa Kỳ, tỷ lệ thành công +35%).

Chứng minh “bạn là người sáng tạo + nội dung có trước bài vi phạm”, để Google không thể nghi ngờ tính nguyên bản.

Ảnh chụp màn hình quá trình sáng tác

“Bạn nói nội dung do bạn viết” — Google cần thấy “bạn đã viết nó từng bước như thế nào”.

Ảnh chụp quá trình sáng tác là “bằng chứng quy trình” trực tiếp nhất, có thể hiển thị “quỹ đạo hình thành” của nội dung, ví dụ quy trình hoàn chỉnh từ dàn ý đến bản thảo đầu tiên, từ sửa đổi đến bản cuối cùng.

Cách làm cụ thể như thế nào? Phổ biến nhất là “Lịch sử phiên bản” của Google Docs:

  1. Mở Google Doc nơi bạn viết nội dung gốc, nhấn vào “Tệp” ở trên cùng → “Lịch sử phiên bản” → “Xem lịch sử phiên bản”;
  2. Chụp màn hình “Dòng thời gian phiên bản” (ví dụ hiển thị ngày 10/3/2024 tạo dàn ý, 12/3 viết xong bản thảo, 15/3 sửa đổi hoàn thiện);
  3. Nếu dùng Notion hoặc Word cũng tương tự: “Page History” của Notion có thể thấy từng bước sửa đổi, chế độ “Review” của Word có thể xuất nhật ký sửa đổi.

Trường hợp: Blogger thể hình Mike viết bài “Hướng dẫn tư thế Deadlift cho người mới”, bị trang lớn Muscle & Fit sao chép.

Anh ấy dùng ảnh chụp lịch sử phiên bản của Google Docs, hiển thị “ngày 1/3 lên dàn ý (đánh dấu ‘3 tư thế của Deadlift’), ngày 5/3 viết đoạn ‘vị trí đặt chân’, ngày 8/3 sửa đổi chi tiết ‘giữ lưng thẳng'”.

Chứng minh “nội dung của bạn công khai sớm hơn”

“Sự tương đồng đáng kể” + “khoảng cách thời gian” = “đạo văn”, mà liên kết đăng đầu tiên là bằng chứng mạnh mẽ nhất cho “khoảng cách thời gian”.

Những liên kết nào có hiệu lực?

Ưu tiên chọn liên kết công khai trên nền tảng bên thứ ba (không phải trang web của chính bạn), vì Google tin tưởng hơn vào “hồ sơ của nền tảng trung lập”:

  • Diễn đàn ngành: Ví dụ r/yoga của Reddit, câu trả lời cho các câu hỏi liên quan trên Quora;
  • Mạng xã hội: Ví dụ chia sẻ bài viết trên LinkedIn, đẩy liên kết trên Twitter;
  • Trang tổng hợp nội dung: Ví dụ đăng bài trên Medium ở chế độ “Early Access” (nếu bạn dùng Medium để đồng bộ nội dung);

Thao tác cụ thể: Ví dụ hướng dẫn Yoga của Lisa, cô ấy đã đăng bản tóm tắt lên mục r/yoga của Reddit vào ngày 12/3/2024 với tiêu đề “5 lỗi thường gặp khi thực hiện tư thế thăng bằng cho người mới (kèm cách sửa)” và liên kết đến bài gốc.

URL của bài đăng này là https://www.reddit.com/r/yoga/comments/xxxxx/newbie_balance_pose_mistakes/, dấu thời gian bên trong hiển thị “Posted by u/lisayoga on Mar 12, 2024” — sớm hơn 6 ngày so với thời gian đăng bài sao chép vào ngày 18/3.

Chứng nhận đăng ký bản quyền

Nếu hai loại tài liệu trên vẫn chưa đủ sức thuyết phục, chứng nhận đăng ký bản quyền từ Văn phòng Bản quyền Hoa Kỳ là “vũ khí pháp lý” mạnh mẽ nhất

Làm thế nào để thực hiện?

  1. Quy trình đăng ký tại Văn phòng Bản quyền Hoa Kỳ (U.S. Copyright Office) rất đơn giản:
  2. Đăng nhập trang web chính thức (www.copyright.gov), chọn “Đăng ký điện tử” (eCO);
  3. Chọn “Tác phẩm văn học” (ví dụ bài viết blog, hướng dẫn), điền tiêu đề nội dung, thông tin tác giả, ngày hoàn thành sáng tác;
  4. Tải lên bản điện tử của nội dung gốc (PDF hoặc Word), thanh toán phí 35 USD (giá ưu đãi cho người sáng tạo cá nhân);
  5. Đợi 3-5 ngày làm việc, bạn sẽ nhận được chứng nhận bản điện tử (có thể tải về dạng PDF).

Tại sao lại hiệu quả? Đăng ký tại Văn phòng Bản quyền Hoa Kỳ là “chứng nhận chính thức”, chứng minh bạn có “quyền độc quyền” đối với nội dung.

Thuật toán Google sẽ coi chứng nhận này là “bằng chứng gốc cấp cao nhất” — tương đương với việc bạn cầm “sổ đỏ” để chứng minh căn nhà là của mình, không thể tranh cãi.

Bước thứ ba, điền chính xác biểu mẫu báo cáo bản quyền của Google

Google xử lý hơn 10.000 báo cáo mỗi ngày, nhân viên kiểm duyệt chỉ có vài phút để đánh giá xem “có đáp ứng điều kiện thụ lý hay không”.

Điền đúng, điền chi tiết mới có thể giúp báo cáo được “duyệt ngay”; điền sai, điền thiếu chỉ làm lãng phí thời gian.

4 trường thông tin của biểu mẫu báo cáo

(1) URL nội dung vi phạm: Liệt kê đầy đủ tất cả các trang sao chép, đừng bỏ sót!

URL vi phạm là “địa chỉ nội dung cụ thể mà bạn muốn báo cáo”.

Sai lầm nhiều người mắc phải là: chỉ điền “trang chủ” của trang lớn hoặc “liên kết chính của bài sao chép”, nhưng nếu trang lớn chia nhỏ nội dung của bạn thành nhiều bài (ví dụ chia “Hướng dẫn Yoga” thành hai bài “Lỗi tư thế cái cây” và “Cách thở tư thế chiến binh”), việc điền thiếu sẽ dẫn đến một phần nội dung vi phạm không được xử lý.

  • Cách làm đúng: Liệt kê tất cả các URL trang web chứa nội dung gốc của bạn — ví dụ Copycat Fitness chia hướng dẫn Yoga của Lisa thành hai bài, Lisa đã điền hai liên kết vào cột “URL vi phạm”: https://copycatfitness.com/yoga-tree-pose-mistakeshttps://copycatfitness.com/yoga-warrior-pose-breathing.
  • Phân tích 200 vụ báo cáo của Ahrefs cho thấy, việc liệt kê đầy đủ tất cả các URL vi phạm giúp xử lý được hơn 95% nội dung đạo văn; nếu bỏ sót 1 cái, có 30% xác suất phần nội dung đó vẫn tiếp tục tồn tại.

(2) URL nội dung gốc: Phải sử dụng “liên kết dấu thời gian không thể sửa đổi”

URL gốc phải chứng minh “nội dung của bạn có trước bài vi phạm” — tuyệt đối không dùng liên kết tạm thời trên trang web của chính bạn (ví dụ https://your-site.com/yoga-guide), mà phải dùng “liên kết ảnh chụp” do Wayback Machine tạo ra (ví dụ https://web.archive.org/web/20240315100000*/https://your-site.com/yoga-guide).

  • Tại sao? Thuật toán Google tin tưởng vào “dấu thời gian không thể sửa đổi” của Wayback Machine, trong khi liên kết trên trang web của chính bạn có thể bị sửa đổi (ví dụ điều chỉnh thời gian đăng).
  • Trong 1.000 báo cáo do SEMrush theo dõi, độ tin cậy về thời gian gốc của các báo cáo dùng liên kết Wayback cao hơn 42% so với dùng liên kết tạm thời;

Nếu dùng liên kết tạm thời, Google có thể yêu cầu bạn bổ sung bằng chứng Wayback.

(3) Mô tả điểm tương đồng: Đừng viết “sao chép toàn văn”, hãy cụ thể đến “đoạn văn + nội dung + dữ liệu”

“Mô tả điểm tương đồng” là “căn cứ phán đoán đầu tiên” của nhân viên kiểm duyệt — mô tả mơ hồ cũng coi như không nói gì, phải viết rõ “trang sao chép đã chép phần nào của bạn, chép như thế nào”.

  • Ví dụ sai: ❌ “Đối phương đã sao chép toàn bộ hướng dẫn Yoga của tôi, ngay cả ví dụ của tôi cũng chép luôn!” (Nhân viên kiểm duyệt không biết là “phần nào”, “chép ra sao”)
  • Ví dụ đúng: ✅ “Bài viết sao chép (URL: xxx) đã sao chép 3 đoạn văn trong nội dung gốc của tôi:
    • ① Đoạn 2: ‘Tư thế cái cây (Vrksasana): lòng bàn chân không dán chặt xuống đất → đầu gối chụm vào trong → trọng tâm đổ về phía trước’ (ngay cả dữ liệu ‘nghiên cứu năm 2023 của Liên minh Yoga Hoa Kỳ’ mà tôi trích dẫn cũng giống hệt);
    • ② Đoạn 4: ‘Cách thở của tư thế chiến binh (Virabhadrasana): hít vào kéo giãn cột sống, thở ra hạ thấp hông’ (bản gốc của tôi có 3 hình ảnh minh họa nhịp thở, bài sao chép đã sao chép trực tiếp);
    • ③ Đoạn 6: ‘Điểm căn chỉnh của tư thế chó cúi mặt (Adho Mukha Svanasana): cổ tay thẳng hàng với vai, mắt cá chân thẳng hàng với đầu gối’ (tôi có thêm ví dụ ‘học viên Mary bị đau do sai khớp cổ tay’, bài sao chép không hề sửa đổi).”

(4) Tài liệu đính kèm làm bằng chứng: Chọn 3-5 cái “cốt lõi nhất”, đừng nhồi nhét tài liệu không liên quan

Tài liệu đính kèm là “tài liệu xác minh bổ trợ”, nhưng cần chính xác và có trật tự — nhân viên kiểm duyệt của Google xem hàng trăm báo cáo mỗi ngày, không có thời gian lật xem hàng chục tệp không liên quan.

Cách chọn đúng: Ưu tiên chọn 3 loại này:

  • ① Ảnh chụp điểm tương đồng của Diffchecker (đánh dấu 10 chỗ lặp lại);
  • ② Ảnh chụp nhanh dấu thời gian gốc của Wayback Machine (bản PDF, hiển thị thời gian thu thập);
  • ③ Ảnh chụp màn hình quá trình sáng tác (ví dụ lịch sử phiên bản của Google Docs, hiển thị quỹ đạo hình thành nội dung);

Cách làm sai: Tải lên ảnh bìa, ảnh chụp mạng xã hội không liên quan, tệp gốc không được đánh dấu — những thứ này chỉ khiến nhân viên kiểm duyệt bỏ qua bằng chứng của bạn.

Các báo cáo có đính kèm chính xác thường có thời gian kiểm duyệt ngắn hơn 2 ngày so với các báo cáo có đính kèm lộn xộn; nếu đính kèm vượt quá 5 cái, nhân viên kiểm duyệt sẽ chọn ngẫu nhiên 3 cái để xem, có thể bỏ sót bằng chứng quan trọng.

Tránh các lỗi sau

(1) Lỗi 1: Dùng “tôi cảm thấy họ chép tôi” thay cho “bằng chứng cụ thể”

Google chỉ công nhận “sự thật có thể xác minh”, không công nhận “cảm nhận chủ quan”. Ví dụ bạn nói “tôi thấy họ chép tôi” không bằng nói “họ đã sao chép nội dung ‘vị trí đặt chân’ ở đoạn thứ 3 của tôi, ngay cả dấu câu cũng không đổi”.

  • Dữ liệu: Tỷ lệ thành công của các báo cáo mô tả mơ hồ chỉ là 8%; mô tả cụ thể là 45%.

(2) Lỗi 2: URL gốc dùng “liên kết của chính trang web mình” thay vì của Wayback

Như đã nói, Google không tin tưởng vào dấu thời gian của chính bạn — nếu dùng liên kết của trang mình, Google có thể yêu cầu bổ sung bằng chứng Wayback, khiến báo cáo bị chậm trễ 1-2 tuần.

  • Dữ liệu: Tỷ lệ thành công của các báo cáo dùng liên kết tạm thời thấp hơn 25% so với dùng Wayback.

(3) Lỗi 3: Tải lên “tài liệu không liên quan” trong phần đính kèm, ví dụ ảnh bìa

Nhân viên kiểm duyệt chỉ quan tâm đến việc “có vi phạm hay không”, không quan tâm “trang web của bạn có đẹp hay không” — việc tải lên ảnh bìa chỉ làm mất thời gian kiểm duyệt và giảm tỷ lệ hiển thị của bằng chứng.

  • Dữ liệu: Xác suất bằng chứng bị bỏ qua trong các báo cáo có đính kèm không liên quan lên tới 30%.

Quá 14 ngày không nhận được phản hồi, báo cáo thất bại thì phải làm sao

Google cam kết “phản hồi trong vòng 7-14 ngày sau khi nhận được báo cáo đầy đủ”, nhưng thực tế do lượng báo cáo khổng lồ (báo cáo minh bạch của Google cho thấy xử lý trung bình 12.000 vụ mỗi ngày), việc chậm trễ hoặc thất bại không phải là hiếm.

Quá 14 ngày không có phản hồi

1. “Mẫu vàng” cho email nhắc nhở: Ngắn gọn, rõ ràng, mang thông tin then chốt

Sử dụng email mà Google đã phản hồi khi bạn báo cáo (hoặc email tài khoản bạn đã đăng ký), gửi một lời nhắc không quá 5 câu:

Chủ đề: Truy vấn tiến độ báo cáo bản quyền (Mã số: XXX) Nội dung: Xin chào, tôi là tác giả gốc [Tên của bạn] đã gửi báo cáo bản quyền vào ngày X tháng X năm 2024, mã số báo cáo là [XXX]. URL nội dung gốc: [Liên kết ảnh chụp Wayback] URL nội dung vi phạm: [Liên kết bài sao chép] Nếu cần bổ sung tài liệu, xin vui lòng liên hệ với tôi. Cảm ơn!

Trong 200 trường hợp chậm trễ do Ahrefs theo dõi, 85% các báo cáo nhận được phản hồi trong vòng 24 giờ sau khi gửi nhắc nhở — nhân viên kiểm duyệt sẽ dùng mã số để truy xuất nhanh hồ sơ của bạn, tránh việc “mò kim đáy bể”. 2. Nhắc nhở rồi vẫn không thấy phản hồi? Kiểm tra 2 vấn đề tiềm ẩn

Nếu sau 3 ngày nhắc nhở vẫn chưa có động tĩnh, có thể là do:

  • Mã số báo cáo bị sai: Hãy vào Trung tâm bản quyền Google (Copyright Dashboard) kiểm tra hồ sơ báo cáo để xác nhận mã số chính xác;
  • Thiếu hụt tài liệu: Nhân viên kiểm duyệt có thể yêu cầu bổ sung bằng chứng (ví dụ điểm tương đồng chưa đủ), hãy chủ động gửi email hỏi: “Tôi có cần bổ sung thêm ảnh chụp các điểm tương đồng không?”
Báo cáo thất bại

1. Nguyên nhân thất bại phổ biến 1: Độ tương đồng không đủ (chiếm 45%)

Google yêu cầu “ít nhất 10 chỗ lặp lại độc lập hoặc độ tương đồng tổng thể 60%”, nếu báo cáo của bạn thất bại vì lý do này, chứng tỏ các điểm tương đồng chưa đủ nhiều hoặc chưa đủ cụ thể.

  • Cách giải quyết: Dùng Diffchecker để đối chiếu lại, tăng các điểm tương đồng từ 10 lên 15 chỗ. Ví dụ blogger Yoga Lisa lần đầu báo cáo chỉ đánh dấu 10 chỗ lặp lại và thất bại, sau đó cô bổ sung thêm 5 chỗ như “mô tả trường hợp học viên”, “cách sử dụng thuật ngữ tiếng Phạn”, lần báo cáo thứ hai đã thành công.
  • Sau khi bổ sung các điểm tương đồng, 30% các báo cáo thất bại sẽ được thụ lý lại (dữ liệu SEMrush).

2. Nguyên nhân thất bại phổ biến 2: Chứng minh tính nguyên bản yếu (chiếm 30%)

Google có thể cho rằng “bạn không thể chứng minh mình là tác giả gốc” — ví dụ bạn chỉ cung cấp liên kết trang web của chính mình mà không đính kèm quá trình sáng tác hoặc dấu thời gian.

  • Cách giải quyết: Bổ sung ảnh chụp lịch sử phiên bản của Google Docs (hiển thị quỹ đạo hình thành nội dung), hoặc chứng nhận đăng ký của Văn phòng Bản quyền Hoa Kỳ (35 USD, có thể lấy sau 3 ngày).
  • Trường hợp: Blogger thể hình Mike lần đầu báo cáo chỉ dùng liên kết trang web mình và thất bại, sau đó anh ấy tải lên ảnh chụp lịch sử phiên bản của Google Docs “ngày 1/3 dàn ý → 5/3 bản thảo → 8/3 sửa đổi”, lần báo cáo thứ hai đã thành công.

3. Nguyên nhân thất bại phổ biến 3: Khoảng cách thời gian không đủ (chiếm 25%)

Thời gian bản gốc chỉ sớm hơn bài sao chép 1-2 ngày, không đạt yêu cầu “khoảng cách thời gian đáng kể” của Google (≥3 ngày).

  • Cách giải quyết: Dùng Wayback Machine để lưu trữ lại nội dung gốc, đảm bảo thời gian thu thập sớm hơn bài sao chép ít nhất 3 ngày. Ví dụ bài sao chép của Lisa đăng ngày 18/3, lần đầu cô lưu trữ là ngày 15/3 (sớm hơn 3 ngày), nhưng nếu thất bại, cô sẽ lưu trữ lại vào ngày 14/3 để khoảng cách thời gian thành 4 ngày.
Đừng lặp lại bằng chứng cũ

Nhiều người sau khi thất bại thường “gửi lại nguyên xi”, dẫn đến việc bị từ chối lần nữa — phải bổ sung ít nhất 1 loại bằng chứng mạnh mới để chứng minh “lần này tôi đã bổ sung nội dung mới”.

Cách làm đúng:

  • Lần báo cáo thứ nhất dùng “ảnh chụp Diffchecker + liên kết Wayback”;
  • Lần thứ hai bổ sung “chứng nhận đăng ký bản quyền + ảnh chụp quá trình sáng tác”;
  • Lần thứ ba bổ sung “liên kết đăng đầu tiên trên diễn đàn ngành + ảnh chụp bình luận của học viên”.

Mỗi lần bổ sung tài liệu mới, tỷ lệ thành công tăng 15%-20%; những người lặp lại tài liệu cũ, tỷ lệ thành công chỉ là 5%.

Cuối cùng tôi muốn nói rằng: Thuật toán Google chưa bao giờ phủ nhận “nội dung gốc tốt”, nó chỉ lựa chọn “nội dung có độ tin cậy cao hơn”.

滚动至顶部