Google gần đây đã phát hành một bài đăng blog về các chỉnh sửa mà họ cho phép khi nói đến bản dịch tự động (machine translations). Blog đã đưa ra các ví dụ và một số lời khuyên hữu ích cho người dùng. Tuy nhiên, trước đây đã có một số vấn đề về trải nghiệm người dùng khi Google cho phép các chỉnh sửa nhỏ đối với bản dịch tự động.
Tại Google’s October SEO Office Hours, câu hỏi đã được đặt ra về việc liệu có thể chấp nhận việc sử dụng nội dung được dịch tự động đã được con người xét duyệt và có những thay đổi chỉnh sửa nhỏ.
Mục lục
Google SEO-Office Hours Episode
Trong tập Office Hours này, tuân theo một hình thức mới trong đó các câu hỏi được gửi bằng văn bản và Google sau đó sẽ đưa ra câu trả lời.
Lizzi Sassman (@okaylizzi) là một người chuyên viết về công nghệ “quan tâm” đến tài liệu của Google Site Central đã tham gia cùng với John Mueller tại Office Hours lần này.
Theo format mới của chương trình trực tiếp sẽ không cho phép khán giả có bất kỳ câu hỏi tiếp theo nào, vì vậy câu trả lời có xu hướng rất giống với những gì bạn tìm thấy trong tài liệu của Google. Đây có thể là một sự trở ngại nếu bạn đang muốn tìm kiếm sự giải thích rõ ràng về vấn đề hoặc mối quan tâm.
Ví dụ, người đặt câu hỏi lo lắng về nội dung được dịch từ một ngôn ngữ khác bằng máy. Họ thuê người biên tập để xem xét nội dung thường xuyên và nhận thấy nội dung khá hài lòng, có thể chấp nhận được, chỉ cần một chút thay đổi nhỏ.
Người đặt câu hỏi lo lắng về việc liệu “những chỉnh sửa nhỏ” có đủ để làm cho nội dung được Google chấp nhận hay không. Lizzi Sassman đã đưa ra câu trả lời theo sát tài liệu của Google.
Câu hỏi đặt ra một cách rõ ràng là liệu những chỉnh sửa nhỏ có đủ tốt cho Google hay không. Xét cho cùng, Google là một nền tảng không ngừng phát triển và ngay cả những thay đổi nhỏ nhất cũng có thể có tác động lớn. Câu trả lời cho câu hỏi đó là phụ thuộc vào chất lượng của nội dung được dịch. Nếu chất lượng tốt, thì những chỉnh sửa nhỏ có thể là tất cả những gì cần thiết. Tuy nhiên, nếu chất lượng kém, có thể phải thay đổi nhiều hơn.
Google có chấp nhận nội dung được dịch máy chỉnh sửa vừa phải không?
Người dùng đã hỏi:
“Một trang web sử dụng dịch máy để cung cấp các bài đăng bằng các ngôn ngữ khác.
Nội dung được người dịch đánh giá và họ thường hài lòng với chất lượng sau những chỉnh sửa nhỏ.
Điều này có ổn đối với Google không?”
Lizzi Sassman của Google đã trả lời:
“Well, thật tốt khi biết rằng có người tham gia vào quá trình dịch và điều này hoàn toàn khớp với Google miễn là có người thực sự tham gia vào quá trình xét duyệt lại. Đó chính là điểm mấu chốt
Điều bạn cần chú ý là đảm bảo rằng chất lượng bài viết tốt tiếp tục được duy trì và phù hợp với những người đang đọc nội dung.”
Câu trả lời không đề cập cụ thể các chỉnh sửa nhỏ cho bản dịch máy có ổn không, chỉ có điều nếu “human translators” hài lòng với nó, thì Google cũng hài lòng.
Có lẽ nào Google không kiểm tra xem nội dung có được dịch bằng máy hay không, mà dựa vào các dấu hiệu chất lượng nội dung tiêu chuẩn? Chúng tôi không chắc chắn. Office-Hours format mới không cho phép các câu hỏi tiếp theo, vì vậy chúng tôi không thể làm rõ yêu cầu.
Google Spam Policies
Các công cụ dịch văn bản tự động thường được coi là spam, nhưng vẫn có ngoại lệ khi có sự tham gia của con người (Theo tài liệu dành cho nhà phát triển của Google về nội dung spam)
Đây là những gì tài liệu của Google nhắc tới:
“Ví dụ về nội dung tự động tạo spam bao gồm:
Văn bản được dịch bởi một công cụ tự động mà không có người xem xét hoặc quản lý trước khi xuất bản ”
Vì vậy, rõ ràng từ Google’s Published Guidelines nói rằng miễn là có người chỉnh sửa nội dung cho bản dịch máy, thì Google sẽ đồng ý.
Ngoài ra, trong video Google Office-Hours từ tháng 4 năm 2022, John Mueller đã đề cập đến việc nội dung do AI tạo đôi khi có thể bị coi là spam. Ông cho biết nội dung được dịch tự động đôi khi có thể là một vấn đề và nói về các công cụ tạo nội dung AI cũng như so sánh chúng với các công cụ dịch tự động. Ông nói rằng mặc dù nội dung do AI tạo ra vẫn chưa hoàn hảo, nhưng nó đang trở nên tốt hơn và có thể tạo ra nội dung chất lượng cao về nhiều chủ đề khác nhau.

Vào phút 24:55 trong video Office-Hours tháng 4 năm 2022, Mueller tuyên bố:
“Tôi nghĩ, tôi không biết, theo thời gian, có thể đây là một thứ gì đó sẽ phát triển, theo đó nó sẽ trở thành một công cụ hữu dụng cho con người nhiều hơn.
Đại loại như bạn sẽ sử dụng bản dịch máy làm cơ sở để tạo phiên bản được dịch của một trang web.
Nhưng về cơ bản bạn vẫn làm việc thông qua nó một cách thủ công.”
Tại sao bạn nên kiểm tra nội dung được dịch tự động?
Như chúng tôi đã đề cập ở trên, mối quan tâm chính của Google là nội dung mà người dùng tìm thấy khi họ tìm kiếm bằng các trang kết quả tìm kiếm (SERPs) có chất lượng cao và họ sẽ hài lòng với những gì họ tìm thấy.
Tuy nhiên, một điều chưa được thảo luận là nội dung được dịch thường chứa các dấu hiệu mà thuật toán dịch máy có thể xác định được. Google đã dành riêng nhiều năm nghiên cứu để xác định được nội dung cho máy dịch.
Một bài báo nghiên cứu được xuất bản vào năm 2021 cho thấy rằng văn bản được dịch bằng máy có thể phức tạp đối với người đọc. Nghiên cứu có tên “Machine Translated Text Detection Through Text Similarity with Round-Trip Translation”, nghiên cứu đã kiểm tra xem con người xác định văn bản do máy dịch như thế nào khi so sánh với phiên bản gốc.
Trong số 100 văn bản đã được dịch, những người đánh giá chỉ có thể xác định được ngôn ngữ nguồn của hơn một nửa số văn bản.
Các nhà nghiên cứu lưu ý:
“Độ chính xác trung bình là 53,3% (55,0% đối với người bản ngữ và 52,0% đối với người không bản ngữ).”
The Text Similarity With Round-Trip Translation (TSRT) vượt trội hơn và đạt điểm cao hơn so với các công cụ phát hiện bản dịch hiện đại khi bài báo được xuất bản vào năm 2021.
Phương pháp này có thể giúp xác định ngôn ngữ mẹ đẻ của bất kỳ văn bản đã dịch nào. Hơn nữa, nó cũng có thể xác định thuật toán dịch nào đã dịch.
Họ đã báo cáo :
“Kết quả đánh giá cho thấy TSRT vượt trội hơn hẳn các phương pháp khác, với độ chính xác lên đến 90,2%.
Hơn nữa, TSRT cũng có thể xác định bản dịch gốc và ngôn ngữ dịch với độ chính xác lần lượt là 93,3% và 85,6% ”.
Mặc dù không rõ liệu Google có thể phát hiện nội dung đã dịch hay không, nhưng chúng tôi biết rằng có tồn tại công nghệ có thể phát hiện nội dung dịch máy. Công nghệ này có thể xác định thuật toán dịch nào đã dịch.
Trên thực tế là nó vi phạm Webmaster Guidelines và có thể có trải nghiệm người dùng tiêu cực không đủ để thúc đẩy bạn chỉnh sửa nội dung do máy dịch, thì có lẽ khả năng Google đang phân tích chất lượng nội dung để dịch máy có thể là lý do để đưa ra loại nội dung đó của nội dung xem xét kỹ lưỡng hơn.
Nếu thực tế Minor Tweaks To Machine Translations vi phạm Webmaster Guidelines và đem lại trải nghiệm tiêu cực cho người dùng thì có thể không đủ để Google thúc đẩy việc chỉnh sửa nội dung do máy dịch (nghĩa là Google sẽ không ủng hộ dịch máy nữa). Khả năng việc Google đang phân tích chất lượng nội dung dịch máy có thể là lý do để cân nhắc người dùng xem xét lại nội dung đó một cách toàn diện.
Kết luận
Bạn có thể xuất bản nội dung do máy dịch sau khi đã được chỉnh sửa chất lượng hơn. Nếu nhận thấy nội dung do máy dịch không phù hợp với trang web của mình, bạn nên tự mình chỉnh sửa văn bản hoặc nhờ người khác chỉnh sửa để đảm bảo chất lượng.
Dựa theo các nguyên tắc đã xuất bản của Google rằng miễn là yếu tố con người chỉnh sửa nội dung cho bản dịch máy, Google sẽ hài lòng với điều đó. Vì vậy, khi thực hiện các chỉnh sửa này, bạn cần đảm bảo rằng văn bản được chỉnh sửa đọc tự nhiên và dễ hiểu.
Nếu bạn đang đọc bài viết này, chúng tôi hy vọng bạn thích những bài blog mới nhất của chúng tôi! Và nếu bạn có bất kỳ câu hỏi hoặc thắc mắc nào khác về các Chỉnh sửa nhỏ cho bản dịch Máy của Google, vui lòng liên hệ với chúng tôi bất cứ lúc nào tại TopOnSeek.
Nguồn: What does Google say about Minor Tweaks To Machine Translations?