Contents
Trong tháng 11 năm 2022, ChatGPT đã ra mắt và nhanh chóng trở thành một trong những công cụ viết tin cậy nhất trên internet. Với giao diện đơn giản, người dùng chỉ cần mô tả nội dung cần viết và ChatGPT sẽ tạo ra nó trong vài giây. Tuy nhiên, trong bối cảnh nội dung được tạo bởi AI thường bị nhầm lẫn với nội dung do con người viết và được sử dụng để tạo lợi thế không công bằng, việc nhận diện nội dung do AI tạo ra trở nên rất quan trọng. Nhưng ChatGPT lại không thể nhận diện chính xác nội dung do AI tạo ra, kể cả sản phẩm của chính mình. Vậy tại sao lại như vậy?
Sự Khác Biệt Giữa Văn Bản Do AI Tạo Và Văn Bản Do Con Người Viết
Điều kiện tiên quyết để ChatGPT có thể nhận diện văn bản của chính mình hoặc bất kỳ văn bản nào do AI tạo ra là phải có sự khác biệt giữa văn bản do AI tạo và văn bản do con người viết. Vậy, có sự khác biệt đáng kể nào giữa văn bản do con người viết và nội dung do AI tạo ra không? Nếu có, chắc chắn một công cụ như ChatGPT nên có khả năng nhận biết được điều đó.
Chúng tôi đã viết một câu chuyện ngắn mà không sử dụng bất kỳ công cụ AI nào và sau đó hỏi ChatGPT liệu câu chuyện này có phải là nội dung do AI tạo ra không. ChatGPT tự tin xác nhận rằng đó là văn bản do AI tạo ra.
Sau đó, chúng tôi yêu cầu ChatGPT tạo ra một câu chuyện, và trong cùng một luồng chat, chúng tôi sao chép và dán đoạn văn bản được tạo ra và hỏi ChatGPT liệu đoạn văn bản này có phải do AI tạo ra không. Phản hồi của ChatGPT là một câu “Không” tự tin.
ChatGPT sai lầm khi nhận diện văn bản do AI tạo ra
ChatGPT đã thất bại trong việc nhận diện văn bản do con người viết hoặc do AI tạo ra trong cả hai trường hợp. Vậy tại sao ChatGPT lại không thể phát hiện văn bản của chính mình? Điều này có nghĩa là không có sự khác biệt giữa văn bản do AI tạo và văn bản do con người viết?
Thực ra, có sự khác biệt. Chúng ta có thể viết cả một cuốn sách về sự khác biệt giữa hai loại văn bản này, nhưng điều đó không quan trọng lắm. Vậy nếu có sự khác biệt, tại sao ChatGPT hoặc bất kỳ công cụ AI nào khác lại không thể nhận diện những khác biệt này và xác định chính xác nội dung do AI tạo ra khác với nội dung do con người viết? Câu trả lời nằm ở cách ChatGPT hoạt động và cách nó tạo ra văn bản.
Cách ChatGPT Tạo Ra Văn Bản
Trí tuệ nhân tạo và con người bắt tay nhau
Khi bạn yêu cầu ChatGPT tạo ra văn bản, nó sẽ cố gắng bắt chước quá trình viết của con người. Đầu tiên, mô hình đằng sau ChatGPT – Generative Pre-trained Transformer (GPT) – đã được huấn luyện trên một lượng lớn văn bản của con người. Từ email, bài viết về sức khỏe, bài viết về công nghệ, bài luận trung học và bất kỳ văn bản nào bạn có thể tìm thấy trên mạng đều đã được cung cấp cho mô hình trong quá trình huấn luyện. Vì vậy, ChatGPT hiểu cách mỗi loại văn bản này nên được viết.
Nếu bạn yêu cầu ChatGPT viết một email gửi sếp của bạn, nó biết email loại này nên trông như thế nào vì nó đã được huấn luyện trên những email tương tự – có thể là hàng ngàn email. Tương tự, nếu bạn yêu cầu nó viết một bài luận trung học, nó cũng biết bài luận trung học nên nghe như thế nào. ChatGPT sẽ cố gắng viết bất cứ điều gì bạn muốn nó viết theo cách mà con người sẽ làm.
Tuy nhiên, có một điểm cần lưu ý. Không giống như cách con người viết, ChatGPT không thực sự hiểu những gì nó đang viết theo cách mà con người hiểu. Thay vào đó, chatbot này cố gắng dự đoán từ nào sẽ hợp lý nhất tiếp theo trong câu cho đến khi hoàn thành bài viết.
ChatGPT Viết Bằng Cách Dự Đoán
Giả sử bạn yêu cầu ChatGPT viết một câu chuyện về một thành phố hư cấu có tên là Volkra. Có khả năng rất cao là chatbot sẽ bắt đầu câu chuyện bằng từ “Ngày xửa ngày xưa”. Điều này là do chatbot không tự suy nghĩ mà cố gắng dự đoán những gì con người sẽ viết dựa trên những gì nó đã học từ hàng ngàn câu chuyện được cung cấp trong quá trình huấn luyện.
Vì vậy, tin rằng con người có khả năng bắt đầu câu chuyện bằng từ “Ngày xửa ngày xưa”, ChatGPT sẽ cố gắng dự đoán từ tiếp theo hợp lý nhất, đó là “một” rồi đến “thời”. Vì vậy, bạn sẽ có “Ngày xửa ngày xưa một thời…” rồi đến từ tiếp theo và từ tiếp theo cho đến khi câu chuyện hoàn thành. ChatGPT cơ bản là viết bằng cách dự đoán từ nào sẽ tự nhiên nhất (hoặc ít nhất là có xác suất cao nhất) xuất hiện tiếp theo trong câu và chèn nó vào.
Vì vậy, khi một công cụ AI cố gắng phát hiện liệu một đoạn văn bản có phải do AI tạo ra hay không, một trong những tiêu chí mà nó cố gắng đánh giá là tính dự đoán của văn bản vì các công cụ AI viết bằng cách dự đoán. Thước đo tính dự đoán này được gọi là độ phức tạp trong ngôn ngữ AI. Khi được trình bày với một đoạn văn bản, ngoài các tiêu chí khác, một công cụ AI như ChatGPT sẽ cố gắng phân tích văn bản để đo lường mức độ dự đoán của chuỗi từ hoặc câu trong văn bản. Mức độ dự đoán cao hoặc độ phức tạp thấp thường có nghĩa là văn bản có khả năng do AI tạo ra. Mức độ dự đoán thấp hoặc độ phức tạp cao thường có nghĩa là văn bản có khả năng do con người viết.
Những tiêu chí này, cùng với các yếu tố khác như mức độ sáng tạo của văn bản, đáng tiếc là không đủ để xác định chắc chắn liệu một đoạn văn bản có phải do một công cụ AI viết hay không. Điều này là do con người có thể viết với sự biến đổi lớn hơn, như trong ví dụ văn bản mà chúng tôi đã sử dụng để minh họa ở đầu bài viết này.
Các chatbot AI như ChatGPT được thiết kế để bắt chước ngôn ngữ tự nhiên của con người nhiều nhất có thể. Vì vậy, mặc dù văn bản do AI tạo ra có thể có các mẫu nhận diện được, nhưng những mẫu đó không rõ ràng ngay cả với một công cụ mạnh mẽ như ChatGPT. Đây là lý do tại sao ChatGPT không thể nhận diện văn bản của chính mình, cũng như lý do tại sao các công cụ phát hiện văn bản do AI tạo ra không hoạt động.
-
ChatGPT có thể nhận diện văn bản do AI tạo ra không?
- Hiện tại, ChatGPT không thể nhận diện chính xác văn bản do AI tạo ra, kể cả sản phẩm của chính mình.
-
Sự khác biệt giữa văn bản do AI tạo và văn bản do con người viết là gì?
- Văn bản do AI tạo thường có tính dự đoán cao hơn, trong khi văn bản do con người viết có thể có sự biến đổi và sáng tạo lớn hơn.
-
ChatGPT hoạt động như thế nào để tạo ra văn bản?
- ChatGPT sử dụng mô hình Generative Pre-trained Transformer (GPT) đã được huấn luyện trên một lượng lớn văn bản của con người để dự đoán và tạo ra văn bản.
-
Tại sao ChatGPT không thể nhận diện văn bản của chính mình?
- Vì ChatGPT viết bằng cách dự đoán và không có mẫu rõ ràng, dễ nhận biết trong văn bản do AI tạo ra.
-
Có cách nào để nhận diện văn bản do AI tạo ra trong tương lai không?
- Có khả năng sẽ có các dấu watermark kỹ thuật số được giới thiệu để giúp nhận diện văn bản do AI tạo ra trong tương lai.
-
Các công cụ phát hiện văn bản do AI tạo ra có hiệu quả không?
- Hiện tại, các công cụ này không hiệu quả vì không có mẫu rõ ràng trong văn bản do AI tạo ra.
-
ChatGPT có thể bắt chước ngôn ngữ tự nhiên của con người không?
- Có, ChatGPT được thiết kế để bắt chước ngôn ngữ tự nhiên của con người nhiều nhất có thể.
Tạp Chí Mobile – Nguồn tin công nghệ đáng tin cậy.
Tech – Khám phá thêm nhiều bài viết công nghệ hấp dẫn.
ChatGPT Có Thể Nhận Diện Văn Bản Của Chính Mình Trong Tương Lai Không?
Hiện tại, các công cụ như ChatGPT không thể phát hiện liệu một đoạn văn bản có được viết bởi chính mình hay bất kỳ công cụ AI nào khác vì không có mẫu rõ ràng, dễ nhận biết trong nội dung do AI tạo ra. Tuy nhiên, có khả năng điều này sẽ sớm thay đổi. Với nỗ lực của các công ty như ChatGPT để giới thiệu các dấu watermark kỹ thuật số vào nội dung do ChatGPT tạo ra, sẽ có một mẫu dễ nhận biết hơn trong văn bản do chatbot tạo ra.