Vì sao dịch chữ go o moringtrong google dịch


Google Translate rất quen thuộc với chúng ta như là một công cụ dịch thuật cực kỳ hữu ích. Mặc dù trong một số trường hợp, nó dịch không chính xác và câu cú có vẻ không hợp lý, dịch không nhuần nhuyễn nhưng dù sao thì nó cũng chỉ là một cỗ máy, một dịch vụ trực tuyến có thể chạy trên những chiếc máy vi tính "cà tàng" nhất. Vậy có khi nào bạn tự hỏi Google Translate (GT) hoạt động ra sao chưa? Nó dịch từng từ một rồi ghép thành một câu hay là có một đội ngũ [TAG]Google[/TAG] ngồi làm việc 24/24 để làm công việc dịch thuật?

Bài viết dưới đây được trích từ trong cuốn sách "Is That A Fish In Your Ear: Translation and the Meaning of Everything" của tác giả David Bellos. Nếu hứng thú bạn có thể tìm mua cuốn sách này để đọc trọn vẹn.

Google đã xây dựng nên GT từ một phần mềm ban đầu được phát triển bởi [TAG]IBM[/TAG] trong những năm 1980 và nó khá khác biệt so với những công cụ dịch thuật lúc bấy giờ. Nó làm việc không dựa trên sự giả định trí óc như những cỗ máy khác, nó cũng không phải là một thuật toán chỉ biết dịch nghĩa từng từ, từng chữ theo cú pháp mà nói chung lại, nếu nhìn sâu vào bên trong cấu trúc của GT thì bạn sẽ thấy, nó không làm những công việc đại loại như dịch nghĩa từng từ đâu. Vậy thì GT làm thế nào mà dịch được "siêu" như vậy?

Câu trả lời là: GT đi lượm lặt những câu nói, những từ ngữ đã được dùng trước đây trên mạng Internet, sau đó tìm tiếp coi có ai dịch nó trước chưa và trả lại kết quả cho người dùng với tốc độ nháy mắt. Ví dụ khi bạn muốn dịch câu "Good morning" sang tiếng Việt, GT sẽ lục lại cơ sở dữ liệu (CSDL) của mình để coi trước đây có ai từng dịch câu "Good morning" này chưa, nếu có thì nó sẽ lấy câu đó ra và trả lời cho bạn, đó chính là "Chào buổi sáng".

Vậy CSDL dịch thuật của GT bao gồm những gì? Đó chính là toàn bộ những văn bản được châu Âu xuất bản từ năm 1957 đến nay trong 24 thứ tiếng, toàn bộ những văn bản, thư từ của Liên Hiệp Quốc cũng như của các cơ quan thuộc Liên Hiệp Quốc đã từng xuất bản bằng 6 ngôn ngữ chính thức, bên cạnh đó là hàng đống tài liệu, ghi chép của những tòa án quốc tế, báo cáo của các công ty và toàn bộ các bài viết, sách vở song ngữ được tải lên mạng bởi các cá nhân, thư viện, người bán sách, tác giả và cả những cơ quan lẫn viện hàn lâm. GT sẽ dựa vào đó để lựa ra những câu, những từ được viết theo dạng song ngữ, rồi dùng các phương pháp thống kê để chọn ra câu dịch hợp lý nhất.

Với phương pháp này, rõ ràng là GT hoạt động được và nó hoạt động khá tốt, đến nỗi có thể làm sửng sốt nhiều người. Vì vậy mà nó cũng tạo ra một ý nghĩ cho rằng thực sự có một cỗ máy dịch thuật hoàn toàn tự động với chất lượng cực kỳ cao. Tuy nhiên, cũng cần biết rằng nếu GT không có bộ CSDL đồ sộ trên thì nó sẽ không thể nào hoạt động được. Và bộ CSDL này là thành quả của hàng triệu giờ lao động của nhiều người khác nhau, những người đã từng dịch trước đó và tải lên mạng để GT gom lại và "tham khảo". Cho đến nay, GT hỗ trợ dịch qua lại 58 ngôn ngữ khác nhau và điều này tương đương với 3.306 kiểu dịch thuật. Nhưng trong số này có một số ngôn ngữ vừa mới được thêm vào gần đây, ví dụ như dịch từ ngôn ngữ Icelandic sang Farsi (Iran), tiếng Yiddish sang tiếng Việt... và rất nhiều bộ ngôn ngữ khác mà trước đây chưa hề có tài liệu nào dịch những ngôn ngữ đó cả. Do vậy mà chất lượng dịch thuật lúc này sẽ rất kém hoặc không còn chính xác nữa, cũng bởi vì CSDL của ngôn ngữ đó không được phong phú như những ngôn ngữ thông dụng khác. Một điều nữa cũng cần được nói đến, đó là nếu đôi khi GT không tìm được tài liệu nào để dịch trực tiếp từ ngôn ngữ A sang ngôn ngữ B thì GT có thể dùng một thêm ngôn ngữ C như là ngôn ngữ trung gian để dịch từ A sang B, điều kiện là trong CSDL của GT, phải có tài liệu được dịch giữa A-C và B-C, lúc đó GT mới dịch từ A-B được. Và tiếng Anh từ ngôn ngữ trung gian chính mà GT đang sử dụng. GT chọn tiếng Anh làm ngôn ngữ trung gian không phải vì họ là công ty của Mỹ, mà vì khi cần dịch từ 2 ngôn ngữ "lạ", người ta cần phải dùng đến một ngôn ngữ khác mà trước đây đã từng được dịch sang 2 thứ tiếng này. Ví dụ, có khá nhiều cuốn sách trinh thám được viết bằng tiếng Anh, sau đó nó được biên dịch thành tiếng Icelandic và Farsi. Chính hành động này đã tạo ra nguồn CSDL dồi dào cho việc dịch qua lại giữa 2 ngôn ngữ này. Nếu không thể dịch trực tiếp giữa Icelandic và Farsi thì GT có thể dựa vào bản dịch giữa tiếng Anh - Icelandic và tiếng Anh - Farsi để dịch một cách gián tiếp từ Icelandic sang Farsi (và ngược lại). Tất nhiên không phải lúc nào GT cũng dịch đúng, đó là lý do tại sao GT cho phép người dùng sữa chữa các bản dịch của mình. Và người dùng cũng cần phải hiểu đôi chút về ngôn ngữ đích để có thể nhận ra khi nào thì GT sai hay dịch không đúng.

Vì sao dịch chữ go o moringtrong google dịch
Vì sao dịch chữ go o moringtrong google dịch
Vì sao dịch chữ go o moringtrong google dịch

Google Translate "mắng" người dùng khi nhập sai câu tiếng Anh để dịch.

Theo đó, khi người dùng sử dụng Google Translate để dịch câu tiếng Anh "What doing you now" sang tiếng Việt, sẽ bất ngờ nhận được kết quả là: "Sai rồi **, phải là 'What are you doing now'". Câu "mắng" đồng thời sửa lỗi này, kèm thêm câu chửi "vỗ mặt" của Google Translate đã khiến nhiều người bất ngờ và nhanh chóng "gây sốt" trong cộng đồng mạng tại Việt Nam.

Câu hỏi đặt ra là vì sao Google Translate lại "mắng" người dùng tại Việt Nam khi họ vô tình điền sai câu tiếng Anh như vậy?

Trên thực tế, Google Translate được tích hợp tính năng cho phép cộng đồng người dùng đề xuất và đóng góp để chỉnh sửa lại những từ hoặc câu dịch không chuẩn xác. Những kết quả dịch nào được nhiều người dùng tham gia đóng góp và đồng tình nhiều nhất sẽ trở thành kết quả dịch mặc định trên Google Translate.

Điều này sẽ giúp cho kết quả dịch trên Google Translate sẽ trở nên chuẩn xác hơn nhờ vào sự đóng góp và sửa lỗi của cộng đồng. Tuy nhiên, chính tính năng "mở" này đã bị nhiều cư dân mạng lợi dụng để sửa lại nội dung dịch thành nghĩa "dở khóc, dở cười" như trên.

Cụ thể, với câu tiếng Anh "What doing you now", do đây là một câu sai cấu trúc ngữ pháp và hầu như không có ai sử dụng Google Translate để dịch câu này, do vậy, một cư dân mạng nào đó đã chủ động sử dụng tính năng đóng góp của cộng đồng để sửa nội dung dịch của câu này thành một câu "mắng" bằng tiếng Việt mà không gặp quá nhiều khó khăn.

Đến thời điểm hiện tại, Google Translate đã sửa lại nội dung câu dịch "What doing you now" thành "Bạn đang làm gì bây giờ".

Trên thực tế, đây không phải là lần đầu tiên dân mạng tại Việt Nam can thiệp và chỉnh sửa các nội dung dịch thuật trên Google Translate. Chẳng hạn như trước đây, khi sử dụng Google Translate để dịch từ "helo" (thay vì "Hello"), người dùng sẽ nhận được kết quả dịch là: "Tiếng Anh cũng ghi ngu, phải là hello"; hay khi dịch câu "Go o morning", người dùng sẽ bị Google Translate "mắng" vì viết sai từ "Good morning"…

Vì sao dịch chữ go o moringtrong google dịch

Người dùng Việt cũng từng bị Google Translate "mắng" khi điền sai chữ "helo".

Hiện tại, nhiều cụm từ khi sử dụng Google Translate để dịch từ tiếng Anh sang tiếng Việt cũng đã bị cư dân mạng can thiệp và chỉnh sửa, chẳng hạn khi dịch cụm từ "Racing Boy" sẽ ra kết quả "Trẻ trâu đú" bằng tiếng Việt, khi dịch từ "Radium" sẽ được kết quả là "ngu Google dịch dở" hoặc với câu "I'm tru" sẽ cho về kết quả "Sai chính tả rồi kìa"… đến nay những kết quả dịch này vẫn được giữ nguyên trên Google Translate mà chưa có sự thay đổi.

Ngoài Google Translate, một dịch vụ khác là Google Maps cũng có tính năng "mở", cho phép sự đóng góp của cộng đồng người dùng để giúp xác định các vị trí trên bản đồ được chính xác hơn. Tuy nhiên, nhiều cư dân mạng tại Việt Nam cũng đã từng nhiều lần lợi dụng tính năng này để thay đổi các địa điểm trên bản đồ Google Maps vì nhiều mục đích khác nhau, nhưng chủ yếu chỉ nhằm mục đích quậy phá và đùa nghịch.

T.Thủy