Nội dung khủng khiếp phải xem khi đào tạo ChatGPT

22/05/2023
Nội dung khủng khiếp phải xem khi đào tạo ChatGPT

Nội dung khủng khiếp mà một công nhân Kenya phải xem khi đào tạo ChatGPT

Bài viết này từ  Big Technology , một bản tin của Alex Kantrowitz.

Richard Mathenge cảm thấy  mình đã đạt được vai trò hoàn hảo khi bắt đầu đào tạo mô hình GPT của OpenAI vào năm 2021. Sau nhiều năm làm việc trong lĩnh vực dịch vụ khách hàng ở Nairobi, Kenya, cuối cùng anh ấy đã tham gia vào một việc gì đó mà anh ấy cảm thấy có ý nghĩa và mang lại tương lai cho anh ấy. Nhưng vị trí để lại cho anh ta vết sẹo. Trong chín giờ mỗi ngày, Mathenge lãnh đạo một nhóm dạy mô hình AI về nội dung tục tĩu. Mục tiêu là đào tạo nó để nó có thể tránh xa những thứ như vậy khỏi người dùng. Hôm nay, nó vẫn bị mắc kẹt với anh ta.

Khi làm việc, Mathenge và nhóm của anh ấy đã xem đi xem lại văn bản tục tĩu và gắn nhãn cho mô hình. Họ có thể phân loại nội dung có nguồn gốc không rõ ràng, thành tài liệu lạm dụng tình dục trẻ em, nội dung khiêu dâm khiêu dâm, bất hợp pháp, phi tình dục hoặc một số tùy chọn khác. Phần lớn những gì họ đọc làm họ kinh hoàng. Mathenge cho biết, một đoạn văn mô tả một người cha quan hệ tình dục với một con vật trước mặt đứa con của mình; những người khác liên quan đến cảnh hiếp dâm trẻ em. Một số quá xúc phạm Mathenge từ chối nói về chúng. “Không thể tưởng tượng nổi,” anh nói với tôi.

Loại công việc mà Mathenge đã thực hiện là rất quan trọng để các bot như ChatGPT và Bard của Google hoạt động và cảm thấy thật kỳ diệu. Nhưng chi phí con người của nỗ lực đã bị bỏ qua rộng rãi. Trong một quy trình có tên là “Học tăng cường từ phản hồi của con người” hay RLHF, các bot trở nên thông minh hơn khi con người gắn nhãn nội dung, dạy chúng cách tối ưu hóa dựa trên phản hồi đó. Các nhà lãnh đạo AI, bao gồm Sam Altman của OpenAI, đã  ca ngợi  hiệu quả kỹ thuật của phương pháp này, nhưng họ hiếm khi nói về chi phí mà một số người phải trả để điều chỉnh các hệ thống AI với các giá trị của chúng ta. Mathenge và các đồng nghiệp của ông đã hoàn thành công việc kinh doanh của thực tế đó.

Mathenge đã nhận được bằng cấp từ Đại học Nazarene Châu Phi của Nairobi vào năm 2018 và nhanh chóng được làm việc trong lĩnh vực công nghệ của thành phố. Vào năm 2021, anh ấy đã nộp đơn xin làm việc với Sama, một dịch vụ chú thích AI đã hoạt động cho các công ty như OpenAI. Sau khi Sama thuê Mathenge, anh ấy bắt tay vào việc dán nhãn hình ảnh LiDAR cho ô tô tự lái. Anh ấy sẽ xem lại các hình ảnh và chọn ra những người, phương tiện khác và đồ vật, giúp người mẫu hiểu rõ hơn những gì họ gặp phải trên đường.

Khi dự án đó kết thúc, Mathenge được chuyển sang làm việc trên các mô hình của OpenAI. Và ở đó, anh gặp phải những văn bản đáng lo ngại. OpenAI nói với tôi rằng họ tin rằng họ đang trả cho các nhà thầu Sama của mình 12,5 đô la mỗi giờ, nhưng Mathenge nói rằng anh ấy và các đồng nghiệp của mình kiếm được khoảng 1 đô la mỗi giờ và đôi khi ít hơn. Dành cả ngày chìm đắm trong những cảnh miêu tả loạn luân, thú tính và những cảnh tục tĩu khác, nhóm bắt đầu rút lui.
 

“Tôi có thể biết khi nào nhóm của tôi làm viêc không tốt, tôi có thể biết khi nào họ không quan tâm đến việc báo cáo công việc,” Mathenge nói với tôi. “Nhóm của tôi chỉ đang gửi tín hiệu rằng họ chưa sẵn sàng tương tác với những từ ngữ như vậy.”

Mophat Okinyi, một nhà phân tích đảm bảo chất lượng trong nhóm của Mathenge, vẫn đang xử lý bụi phóng xạ. Ông nói, việc tiếp xúc nhiều lần với văn bản tục tĩu đã dẫn đến chứng mất ngủ, lo lắng, trầm cảm và hoảng loạn. Vợ của Okinyi thấy anh thay đổi, anh nói; không lâu sau, cô bỏ anh. Okinyi nói: “Dù tôi cảm thấy rất vui khi thấy ChatGPT trở nên nổi tiếng và được nhiều người sử dụng trên toàn cầu, nhưng việc đảm bảo an toàn cho nó đã phá hủy gia đình tôi. Nó đã phá hủy sức khỏe tinh thần của tôi. Khi chúng tôi nói chuyện, tôi vẫn đang phải vật lộn với chấn thương.”

OpenAI biết những công nhân này phải được tư vấn định kỳ, nhưng Okinyi và Mathenge thấy điều đó là không đủ. Mathenge nói: “Tại một số thời điểm, cố vấn đã báo cáo [thực hiện nhiệm vụ], nhưng bạn có thể nói rằng anh ta không chuyên nghiệp. Anh ấy không đủ tiêu chuẩn, tôi rất tiếc phải nói như vậy. Đặt những câu hỏi cơ bản như 'Tên bạn là gì?' và 'Làm thế nào để bạn tìm thấy công việc của bạn?'”

Trong một tuyên bố với tôi, OpenAI cho biết họ rất coi trọng sức khỏe tinh thần của nhân viên và nhà thầu. Người phát ngôn cho biết: “Một trong những lý do chúng tôi mời Sama lần đầu tiên là vì họ cam kết thực hiện tốt các hoạt động tốt. “Hiểu biết trước đây của chúng tôi là các chương trình chăm sóc sức khỏe và tư vấn 1:1 đã được cung cấp, người lao động có thể từ chối bất kỳ công việc nào mà không bị phạt, việc tiếp xúc với nội dung tục tĩu sẽ có giới hạn và thông tin nhạy cảm sẽ được xử lý bởi những người lao động được đào tạo đặc biệt để làm như vậy .”

Người phát ngôn của OpenAI cho biết công ty đã tìm kiếm thêm thông tin từ Sama về điều kiện làm việc của mình vào đầu năm 2022. Sama, người phát ngôn cho biết, sau đó thông báo cho OpenAI rằng họ đang thoát khỏi không gian kiểm duyệt nội dung. Sama đã không trả lời yêu cầu bình luận.

Đối với Mathenge, khái niệm rằng anh ấy sẽ đánh giá sự đánh đổi trước khi tiếp tục công việc này nghe có vẻ xa xỉ. Anh ấy rất vui khi được tuyển dụng khi nền kinh tế Kenya đang chao đảo trong bối cảnh kinh tế bất ổn vì đại dịch. “Đó là trong mùa COVID,” anh nói. “Có được việc làm ở một nước đang phát triển, bản thân nó đã là một điều may mắn.”

Bất chấp tất cả những điều này, Mathenge và các đồng nghiệp của anh ấy cảm thấy tự hào về công việc họ đã làm. Và nó đã thực sự hiệu quả. Hôm nay, ChatGPT từ chối sản xuất những cảnh khiêu dâm mà nhóm đã giúp loại bỏ và đưa ra cảnh báo về các hành vi tình dục có thể là bất hợp pháp. “Đối với tôi, và đối với chúng tôi, chúng tôi rất tự hào,” Mathenge nói. Họ tự hào, nhưng vẫnlàm tổn thương.

Bạn có thể nghe toàn bộ cuộc trò chuyện của Alex Kantrowitz với Richard Mathenge trong tập  Big Technology Podcast tuần này .

Tuân thủ nghị định

Tuân thủ Nghị định số 185/2013/NĐ-CP của Chính phủ và luật quảng cáo số 16/2012/QH13 về kinh doanh bán hàng qua mạng. Chúng tôi không kinh doanh mua bán Quạt Điện trực tiếp qua mạng internet. Website chỉ là kênh thông tin giới thiệu cửa hàng, giới thiệu sản phẩm và cho mức giá tham khảo trên thị trường. Quý khách có nhu cầu mua hàng hay cần hỗ trợ xin vui lòng liên hệ số điện thoại 0908 586 616 hoặc đến cửa hàng của chúng tôi để được tư vấn trực tiếp. Chân thành cảm ơn !

0975.745.118
zalo