Contents
- Công Cụ AI Tạo Nội Dung Sử Dụng Tác Phẩm Của Nghệ Sĩ Như Thế Nào?
- Tại Sao Nhiều Nghệ Sĩ Lại Bức Xúc?
- Bạn Có Thể Ngăn Công Cụ AI Truy Cập Tác Phẩm Của Bạn Không?
- Chính Sách Bảo Mật Của Google Có Thể Có Nghĩa Là Nó Sử Dụng Tất Cả Nội Dung Trực Tuyến Để Huấn Luyện Các Thuật Toán AI Của Mình
- Mạng Xã Hội Có Thể Sử Dụng Bất Kỳ Nội Dung Nào Bạn Xuất Bản Trên Nền Tảng Của Họ
- Các Dịch Vụ Như Adobe Có Thể Truy Cập và Sử Dụng Tác Phẩm Của Bạn Để Huấn Luyện Các Thuật Toán Của Họ
- Các Công Ty Công Nghệ Có Quyền Truy Cập Gần Như Không Giới Hạn Vào Dữ Liệu Của Bạn… Hiện Tại
- Cuối Cùng, Sẽ Cần Các Vụ Kiện Và Quy Định Để Bảo Vệ Nghệ Sĩ Khỏi AI
Trong thời đại công nghệ phát triển mạnh mẽ, các công cụ AI tạo nội dung như Midjourney và Stable Diffusion đang tạo ra những hình ảnh ngày càng thuyết phục. Tuy nhiên, chúng dựa vào cơ sở dữ liệu khổng lồ của các tác phẩm sáng tạo để tạo ra nội dung của mình. Vậy làm thế nào để bảo vệ tác phẩm của bạn khỏi các công cụ AI này? Câu trả lời là: rất phức tạp.
Công Cụ AI Tạo Nội Dung Sử Dụng Tác Phẩm Của Nghệ Sĩ Như Thế Nào?
Các công cụ AI tạo nội dung sử dụng các mô hình học máy được huấn luyện để thực hiện các hành động dựa trên các tập dữ liệu lớn. Ví dụ, với một công cụ tạo hình ảnh AI như Midjourney, các tập dữ liệu được sử dụng để huấn luyện bao gồm hàng tỷ cặp hình ảnh và văn bản, từ tác phẩm của các nghệ sĩ huyền thoại như Picasso đến các nghệ sĩ chuyên nghiệp và nghiệp dư.
Các công cụ tạo hình ảnh AI sử dụng các cặp phương tiện-văn bản này để tạo ra nội dung hình ảnh dựa trên các lệnh văn bản của người dùng. Cơ bản, chúng sử dụng tác phẩm của các nghệ sĩ hiện có và khớp các mẫu với các cặp văn bản (bài đăng xã hội, chú thích, văn bản thay thế, v.v.) để người dùng có thể tạo ra hình ảnh mới từ các lệnh như “bầu trời đêm sao theo phong cách của Vincent van Gogh” hoặc “cảnh neo-noir của một thám tử uống whiskey ở Downtown LA những năm 1950”.
Tại Sao Nhiều Nghệ Sĩ Lại Bức Xúc?
Khiếu nại lớn nhất từ các nghệ sĩ là các công cụ AI tạo nội dung sử dụng tác phẩm của họ mà không có sự cho phép. Họ không chỉ sử dụng tác phẩm của họ để huấn luyện các thuật toán.
Các lời quảng cáo về công cụ AI tạo nội dung gợi ý rằng chúng tạo ra nội dung độc đáo, nhưng thực tế không phải vậy. Điều chúng thực sự làm là kết hợp dữ liệu từ nhiều tác phẩm nghệ thuật và ghép lại để tạo ra thứ gì đó phù hợp với lệnh của người dùng.
Thuật ngữ “tạo AI” thực ra là gây hiểu lầm. “Sao chép AI” sẽ chính xác hơn, và mánh khóe của các công cụ này là chúng sao chép một lượng lớn tác phẩm nghệ thuật và trộn chúng lại với nhau.
Hình ảnh minh họa về quá trình tạo hình ảnh của Midjourney trên Discord
Các công cụ AI tạo nội dung được thiết kế để thay thế các nghệ sĩ – và chúng đang làm điều đó bằng cách sử dụng tác phẩm nghệ thuật của họ. Và, như thể điều đó chưa đủ tệ, hầu hết các công cụ AI đều làm điều này mà không hỏi ý kiến, không đưa ra bất kỳ khoản bồi thường nào, hoặc thậm chí không ghi công cho các nhà sáng tạo ban đầu.
Bạn Có Thể Ngăn Công Cụ AI Truy Cập Tác Phẩm Của Bạn Không?
Thật không may, cách duy nhất để ngăn các công cụ AI truy cập bất kỳ nội dung nào của bạn là không xuất bản gì trên mạng. Điều này có vẻ cực đoan, nhưng đó là thực tế. Chắc chắn, bạn có thể sử dụng tệp robots.txt trên trang web của mình để ngăn các công cụ AI quét trang web của bạn, hoặc bảo vệ hình ảnh của bạn khỏi các công cụ AI bằng cách từ chối tham gia vào các tập dữ liệu huấn luyện, nhưng các phương pháp này có nhiều hạn chế.
Trước hết, các lệnh trong tệp robots.txt chỉ mang tính khuyến nghị, có nghĩa là các trang web không có nghĩa vụ pháp lý phải tuân thủ. Thứ hai, bạn sẽ phải chặn một công ty như Google khỏi việc thu thập dữ liệu trang web của bạn, điều này gần như là tự sát về mặt SEO. Và cuối cùng, tệp robots.txt chỉ cho phép bạn (hạn chế) kiểm soát quyền truy cập vào trang web của bạn, nó không làm gì để bảo vệ nội dung bạn xuất bản ở nơi khác: mạng xã hội, dịch vụ đám mây, v.v.
Thật không may cho các nghệ sĩ, tình hình sẽ trở nên tồi tệ hơn trước khi nó được cải thiện.
Chính Sách Bảo Mật Của Google Có Thể Có Nghĩa Là Nó Sử Dụng Tất Cả Nội Dung Trực Tuyến Để Huấn Luyện Các Thuật Toán AI Của Mình
Vào tháng 7 năm 2023, Google đã cập nhật chính sách bảo mật của mình để nói rằng nó sẽ sử dụng nội dung trực tuyến để huấn luyện các hệ thống AI của mình, bao gồm Brad, Google Translate và các hệ thống khác. Google sử dụng cụm từ “nguồn công khai”. Đây là trích dẫn đã gây ra một số lo ngại sau khi cập nhật:
“Ví dụ, chúng tôi có thể thu thập thông tin có sẵn công khai trên mạng hoặc từ các nguồn công khai khác để giúp huấn luyện các mô hình AI của Google và xây dựng các sản phẩm và tính năng, như Google Translate, Bard và khả năng AI trên đám mây.” – Chính Sách Bảo Mật Của Google
Nói cách khác, Google đang nói rằng bất cứ điều gì bạn xuất bản trực tuyến đều có thể bị lấy đi. Ít nhất, Google làm cho việc so sánh các cập nhật chính sách bảo mật của mình trở nên dễ dàng bằng cách làm nổi bật những thay đổi gần đây nhất:
Như bạn có thể thấy, sự thay đổi trong từ ngữ khá tinh vi, nhưng hàm ý thì rất lớn. Trước đây, chức năng chính của các mô hình ngôn ngữ của Google là giải thích các truy vấn tìm kiếm và dịch văn bản sang các ngôn ngữ khác.
Bây giờ, công ty cho biết nó có thể sử dụng tất cả các nguồn công khai để huấn luyện toàn bộ bộ các mô hình AI của mình. Điều này bao gồm hệ thống AI tạo nội dung của nó, Bard, và mở rộng vượt ra ngoài các mô hình ngôn ngữ để bao gồm tất cả các công cụ/tính năng AI của Google – ví dụ rõ ràng nhất là tạo hình ảnh.
Mạng Xã Hội Có Thể Sử Dụng Bất Kỳ Nội Dung Nào Bạn Xuất Bản Trên Nền Tảng Của Họ
Meta cũng có quyền truy cập không giới hạn vào mọi thứ được xuất bản trên Facebook, Instagram và Threads. Đây là thực hành tiêu chuẩn cho các nền tảng xã hội nếu bạn đọc các Điều khoản và Điều kiện. Ngay khi bạn tải lên bất cứ thứ gì lên mạng xã hội, họ có quyền sử dụng và tái sử dụng nó theo bất kỳ cách nào họ muốn.
Nhiều người dùng mạng xã hội đã phát hiện ra các công ty sử dụng hình ảnh của họ trong quảng cáo mà không có sự cho phép, bao gồm cả các nghệ sĩ. Thật không may, nếu công ty đó lại là mạng xã hội mà bạn đã tải lên hình ảnh, công ty mẹ của mạng xã hội đó, hoặc một thương hiệu khác thuộc sở hữu của cùng một công ty mẹ, bạn sẽ không có cách nào.
Đối với hầu hết mọi người, khả năng một nền tảng như Instagram sử dụng một trong những hình ảnh của họ cho một chiến dịch quảng cáo là rất thấp. Tuy nhiên, Meta gần như chắc chắn đang sử dụng hình ảnh, video và bài đăng của bạn để huấn luyện các thuật toán AI của mình.
Các Dịch Vụ Như Adobe Có Thể Truy Cập và Sử Dụng Tác Phẩm Của Bạn Để Huấn Luyện Các Thuật Toán Của Họ
Vào tháng 1 năm 2023, Adobe đã gặp phải một số phản ứng dữ dội vì một bản cập nhật cho các Điều khoản và Điều kiện của mình. Ngôn ngữ dường như gợi ý rằng Adobe có thể sử dụng hình ảnh được tải lên các dịch vụ đám mây của mình bởi các nhiếp ảnh gia để huấn luyện các thuật toán AI của mình.
Cụ thể, từ ngữ như sau:
“Adobe có thể phân tích nội dung của bạn bằng cách sử dụng các kỹ thuật như học máy (ví dụ: để nhận diện mẫu) để phát triển và cải thiện các sản phẩm và dịch vụ của chúng tôi.”
Điều làm cho vấn đề trở nên tồi tệ hơn, Adobe tự động đăng ký người dùng vào hệ thống phân tích nội dung này, có nghĩa là họ phải tự tắt nó trong cài đặt tài khoản của mình. Dễ hiểu, các nghệ sĩ không phản ứng quá tốt và Adobe đã làm cho tình hình trở nên tồi tệ hơn bằng cách không phản hồi lại các chỉ trích ban đầu.
Vài tuần sau, Adobe tuyên bố rằng không có dữ liệu khách hàng nào được sử dụng để huấn luyện các công cụ AI tạo nội dung của mình. Công ty gọi sự cố này là một lời cảnh tỉnh và cam kết sẽ làm rõ bất kỳ sự nhầm lẫn nào bằng cách làm rõ ràng hơn ngôn ngữ của chính sách của mình.
Dù sao đi nữa, sự thật vẫn là nếu Adobe muốn sử dụng dữ liệu khách hàng để huấn luyện các hệ thống AI của mình, không ai có thể làm gì về điều đó – ngoài việc tẩy chay. Đồng thời, Adobe đang lấy dữ liệu cho các công cụ như Generative Fill từ đâu đó, vì vậy họ đang sử dụng tác phẩm của các nghệ sĩ, theo một cách nào đó.
Các Công Ty Công Nghệ Có Quyền Truy Cập Gần Như Không Giới Hạn Vào Dữ Liệu Của Bạn… Hiện Tại
Hiện tại, các gã khổng lồ công nghệ như Google và Meta có quyền truy cập gần như không giới hạn vào dữ liệu của các nghệ sĩ. Sự giám sát về cách họ xử lý dữ liệu người dùng gần như cũ bằng tuổi của internet, nhưng các quy định về quyền riêng tư vẫn đang phải bắt kịp.
Phải đến năm 2018, Liên minh châu Âu mới triển khai hướng dẫn bảo mật GDPR của mình và chúng đã làm rất ít để bảo vệ dữ liệu người dùng.
AI tạo nội dung là một mỏ vàng mới hoàn toàn với hầu như không có quy định nào để hạn chế hành động của các công ty công nghệ trong lĩnh vực này. Hiện tại, các công ty như Google và OpenAI có thể làm gần như bất cứ điều gì họ muốn với dữ liệu của chúng ta, và điều này sẽ không thay đổi trong thời gian ngắn.
1. Các công cụ AI tạo nội dung sử dụng tác phẩm của nghệ sĩ như thế nào?
Các công cụ AI tạo nội dung sử dụng các mô hình học máy được huấn luyện trên các tập dữ liệu lớn, bao gồm hàng tỷ cặp hình ảnh và văn bản, để tạo ra nội dung mới dựa trên các lệnh của người dùng.
2. Tại sao nhiều nghệ sĩ lại bức xúc về việc sử dụng tác phẩm của họ bởi các công cụ AI?
Nghệ sĩ bức xúc vì các công cụ AI sử dụng tác phẩm của họ mà không có sự cho phép, không đưa ra bất kỳ khoản bồi thường nào và không ghi công cho các nhà sáng tạo ban đầu.
3. Có cách nào để ngăn các công cụ AI truy cập tác phẩm của bạn không?
Cách duy nhất để ngăn các công cụ AI truy cập tác phẩm của bạn là không xuất bản gì trên mạng. Các phương pháp khác như sử dụng tệp robots.txt hoặc từ chối tham gia vào các tập dữ liệu huấn luyện có nhiều hạn chế.
4. Chính sách bảo mật của Google có ảnh hưởng gì đến việc sử dụng nội dung trực tuyến để huấn luyện AI không?
Google đã cập nhật chính sách bảo mật của mình để cho phép sử dụng nội dung công khai trực tuyến để huấn luyện các mô hình AI của mình, bao gồm cả các hệ thống như Google Translate và Bard.
5. Các mạng xã hội có quyền sử dụng nội dung mà người dùng xuất bản trên nền tảng của họ không?
Các mạng xã hội như Meta có quyền sử dụng bất kỳ nội dung nào được xuất bản trên nền tảng của họ theo các Điều khoản và Điều kiện của họ.
6. Adobe có sử dụng tác phẩm của người dùng để huấn luyện các thuật toán AI của mình không?
Adobe đã từng bị chỉ trích vì ngôn ngữ trong Điều khoản và Điều kiện của mình cho phép sử dụng hình ảnh của người dùng để huấn luyện các thuật toán AI, nhưng sau đó đã làm rõ rằng không sử dụng dữ liệu khách hàng cho mục đích này.
7. Các công ty công nghệ có quyền truy cập vào dữ liệu của người dùng như thế nào?
Các công ty công nghệ như Google và Meta có quyền truy cập gần như không giới hạn vào dữ liệu của người dùng, và hiện tại hầu như không có quy định nào để hạn chế điều này.
Cuối Cùng, Sẽ Cần Các Vụ Kiện Và Quy Định Để Bảo Vệ Nghệ Sĩ Khỏi AI
Cho đến khi AI tạo nội dung và quyền truy cập của nó vào dữ liệu người dùng được quy định, các nghệ sĩ gần như không có cách nào để ngăn chặn công nghệ này. Kịch bản có khả năng nhất sẽ là thay đổi luật bản quyền hoặc, có thể, các biện pháp bảo vệ dữ liệu mới liên quan đến quyền sở hữu sáng tạo. Trong bất kỳ trường hợp nào, sẽ mất một thời gian dài để thấy bất kỳ quy định mới nào được giới thiệu và sau đó được thực thi.
Tin vui cho các nghệ sĩ là các vụ kiện chống lại AI tạo nội dung đang tăng nhanh và điều này có thể đẩy nhanh phản ứng pháp lý. Tin xấu là một số công ty công nghệ liên quan có quỹ pháp lý để kéo dài các vụ kiện này qua các con đường pháp lý tốn thời gian nhất.
Trong thời gian chờ đợi, các câu hỏi đạo đức về việc tạo nghệ thuật bằng AI sẽ vẫn còn đó.