Contents
- Công Cụ AI Tạo Nội Dung Sử Dụng Tác Phẩm Của Nghệ Sĩ Như Thế Nào?
- Tại Sao Nhiều Nghệ Sĩ Lại Phản Đối?
- Bạn Có Thể Ngăn Các Công Cụ AI Tạo Nội Dung Truy Cập Tác Phẩm Của Bạn Không?
- Chính Sách Bảo Mật Của Google Có Thể Có Nghĩa Là Nó Sử Dụng Tất Cả Nội Dung Trực Tuyến Để Huấn Luyện Các Thuật Toán AI Của Mình
- Mạng Xã Hội Có Thể Sử Dụng Bất Kỳ Nội Dung Nào Bạn Xuất Bản Trên Nền Tảng Của Họ
- Các Dịch Vụ Như Adobe Có Thể Truy Cập Và Sử Dụng Tác Phẩm Của Bạn Để Huấn Luyện Các Thuật Toán Của Họ
- Các Công Ty Công Nghệ Có Quyền Truy Cập Gần Như Không Giới Hạn Vào Dữ Liệu Của Bạn… Hiện Tại
- Cuối Cùng, Sẽ Cần Các Vụ Kiện Và Quy Định Để Bảo Vệ Các Nghệ Sĩ Khỏi AI
Trong thời đại công nghệ hiện nay, các công cụ AI tạo nội dung như Midjourney và Stable Diffusion đang ngày càng tạo ra những hình ảnh thuyết phục hơn. Tuy nhiên, chúng dựa vào các cơ sở dữ liệu khổng lồ từ tác phẩm của các nghệ sĩ để tạo ra nội dung của mình. Vậy liệu có cách nào để bảo vệ tác phẩm của bạn khỏi các công cụ AI này không? Câu trả lời là: rất phức tạp.
Công Cụ AI Tạo Nội Dung Sử Dụng Tác Phẩm Của Nghệ Sĩ Như Thế Nào?
Các công cụ AI tạo nội dung sử dụng các mô hình học máy được huấn luyện để thực hiện các hành động dựa trên các tập dữ liệu lớn. Chẳng hạn, với một công cụ tạo ảnh AI như Midjourney, các tập dữ liệu được sử dụng để huấn luyện bao gồm hàng tỷ cặp ảnh và văn bản – từ tác phẩm của các nghệ sĩ lừng danh như Picasso đến các nghệ sĩ chuyên nghiệp và nghiệp dư.
Các công cụ tạo ảnh AI sử dụng các cặp phương tiện-văn bản này để tạo ra nội dung hình ảnh dựa trên các lời nhắc từ người dùng. Cơ bản, chúng sử dụng tác phẩm của các nghệ sĩ hiện có và khớp các mẫu với các cặp văn bản (bài đăng trên mạng xã hội, chú thích, văn bản thay thế, v.v.) để người dùng có thể tạo ra các hình ảnh mới từ các lời nhắc như “bầu trời đêm sao trong phong cách của Vincent van Gogh” hoặc “cảnh neo-noir của một thám tử uống whiskey ở Downtown LA những năm 1950”.
Tại Sao Nhiều Nghệ Sĩ Lại Phản Đối?
Khiếu nại lớn nhất từ các nghệ sĩ là các công cụ AI tạo nội dung sử dụng tác phẩm của họ mà không có sự cho phép. Họ không chỉ sử dụng tác phẩm của họ để huấn luyện các thuật toán.
Các tuyên bố tiếp thị về công cụ AI tạo nội dung cho rằng các công cụ này tạo ra nội dung độc đáo, nhưng thực tế không phải vậy. Điều chúng thực sự làm là kết hợp dữ liệu từ nhiều tác phẩm nghệ thuật và ghép chúng lại để tạo ra điều gì đó phù hợp với lời nhắc của người dùng.
Thuật ngữ “tạo AI” thực sự gây hiểu lầm. “Sao chép AI” sẽ chính xác hơn, và mánh khóe của các công cụ này là chúng sao chép một lượng lớn tác phẩm nghệ thuật và trộn chúng lại.
Ảnh chụp màn hình các thế hệ hình ảnh AI của Midjourney trên Discord
Các công cụ AI tạo nội dung được thiết kế để thay thế các nghệ sĩ – và chúng đang làm điều đó bằng cách sử dụng tác phẩm nghệ thuật của họ. Và, như thể điều đó chưa đủ tệ, hầu hết các công cụ AI đều làm điều này mà không hỏi ý kiến, không đưa ra bất kỳ khoản bồi thường nào, hoặc thậm chí không ghi công cho người sáng tạo ban đầu.
Bạn Có Thể Ngăn Các Công Cụ AI Tạo Nội Dung Truy Cập Tác Phẩm Của Bạn Không?
Thật không may, cách duy nhất để ngăn các công cụ AI truy cập bất kỳ nội dung nào của bạn là không xuất bản gì trên mạng. Nghe có vẻ cực đoan, nhưng đó là thực tế. Chắc chắn, bạn có thể sử dụng tệp robots.txt trên trang web của mình để ngăn các công cụ AI quét trang web của bạn, hoặc bảo vệ hình ảnh của bạn khỏi AI bằng cách chọn không tham gia vào các tập dữ liệu huấn luyện, nhưng các phương pháp này có nhiều hạn chế.
Thứ nhất, các lệnh trong tệp robots.txt chỉ mang tính khuyến nghị, có nghĩa là các trang web không có nghĩa vụ pháp lý phải tuân thủ. Thứ hai, bạn sẽ phải chặn một công ty như Google không được thu thập dữ liệu từ trang web của bạn, điều này cơ bản là tự sát về mặt SEO. Và cuối cùng, tệp robots.txt chỉ cho phép bạn (hạn chế) kiểm soát quyền truy cập vào trang web của mình, nó không làm gì để bảo vệ nội dung bạn xuất bản ở nơi khác: mạng xã hội, dịch vụ đám mây, v.v.
Thật không may cho các nghệ sĩ, tình hình sẽ trở nên tồi tệ hơn trước khi nó tốt hơn.
Chính Sách Bảo Mật Của Google Có Thể Có Nghĩa Là Nó Sử Dụng Tất Cả Nội Dung Trực Tuyến Để Huấn Luyện Các Thuật Toán AI Của Mình
Vào tháng 7 năm 2023, Google đã cập nhật chính sách bảo mật của mình để cho biết nó sẽ sử dụng nội dung trực tuyến để huấn luyện các hệ thống AI của mình, bao gồm Brad, Google Dịch và các dịch vụ khác. Google sử dụng cụm từ “nguồn công khai”. Đây là trích dẫn đã gây ra một số lo ngại sau khi cập nhật:
“Ví dụ, chúng tôi có thể thu thập thông tin có sẵn công khai trực tuyến hoặc từ các nguồn công khai khác để giúp huấn luyện các mô hình AI của Google và xây dựng sản phẩm và tính năng, như Google Dịch, Bard và khả năng AI của Cloud.” – Chính Sách Bảo Mật của Google
Nói cách khác, Google hiện đang tuyên bố rằng bất cứ điều gì bạn xuất bản trực tuyến đều có thể bị sử dụng. Ít nhất, Google làm cho việc so sánh các cập nhật về chính sách bảo mật của mình trở nên dễ dàng bằng cách làm nổi bật những thay đổi gần đây nhất:
Như bạn có thể thấy, sự thay đổi trong từ ngữ khá tinh vi, nhưng hàm ý lại rất lớn. Trước đây, các chức năng chính của mô hình ngôn ngữ của Google là giải thích các truy vấn tìm kiếm và dịch văn bản sang các ngôn ngữ khác.
Bây giờ, công ty cho biết nó có thể sử dụng tất cả các nguồn công khai để huấn luyện toàn bộ bộ các mô hình AI của mình. Điều này bao gồm hệ thống AI tạo nội dung của Google, Bard, và mở rộng ra ngoài các mô hình ngôn ngữ để bao gồm tất cả các công cụ/tính năng AI của Google – ví dụ rõ ràng nhất là tạo ảnh.
Mạng Xã Hội Có Thể Sử Dụng Bất Kỳ Nội Dung Nào Bạn Xuất Bản Trên Nền Tảng Của Họ
Meta cũng có quyền truy cập không giới hạn vào mọi thứ được xuất bản trên Facebook, Instagram và Threads. Đây là thực tiễn tiêu chuẩn cho các nền tảng xã hội nếu bạn đọc các điều khoản và điều kiện. Ngay khi bạn tải lên bất cứ thứ gì lên mạng xã hội, họ có quyền sử dụng và tái sử dụng nó theo bất kỳ cách nào họ muốn.
Nhiều người dùng mạng xã hội đã phát hiện ra các công ty sử dụng hình ảnh của họ trong quảng cáo mà không có sự cho phép, bao gồm cả các nghệ sĩ. Thật không may, nếu công ty đó là mạng xã hội mà bạn đã tải lên hình ảnh, công ty mẹ của mạng đó, hoặc một thương hiệu khác do cùng một công ty mẹ sở hữu, bạn sẽ không có cơ hội.
Đối với hầu hết mọi người, cơ hội một nền tảng như Instagram sử dụng một trong những hình ảnh của họ cho một chiến dịch quảng cáo là rất thấp. Tuy nhiên, Meta gần như chắc chắn đang sử dụng hình ảnh, video và bài đăng của bạn để huấn luyện các thuật toán AI của mình.
Các Dịch Vụ Như Adobe Có Thể Truy Cập Và Sử Dụng Tác Phẩm Của Bạn Để Huấn Luyện Các Thuật Toán Của Họ
Vào tháng 1 năm 2023, Adobe đã gặp phải sự phản đối vì một bản cập nhật cho các điều khoản và điều kiện của mình. Ngôn ngữ dường như cho thấy Adobe có thể sử dụng hình ảnh được tải lên các dịch vụ đám mây của mình bởi các nhiếp ảnh gia để huấn luyện các thuật toán AI của mình.
Cụ thể, ngôn ngữ được sử dụng như sau:
“Adobe có thể phân tích nội dung của bạn bằng các kỹ thuật như học máy (ví dụ: để nhận diện mẫu) để phát triển và cải thiện các sản phẩm và dịch vụ của chúng tôi.”
Điều làm cho vấn đề tồi tệ hơn, Adobe đã tự động đăng ký người dùng vào hệ thống phân tích nội dung này, có nghĩa là họ phải tự tay tắt nó trong cài đặt tài khoản của mình. Hiểu được, các nghệ sĩ không phản ứng quá tích cực và Adobe đã làm cho tình hình trở nên căng thẳng hơn bằng cách không phản hồi ngay lập tức trước những lời chỉ trích.
Vài tuần sau, Adobe tuyên bố rằng không có dữ liệu khách hàng nào được sử dụng để huấn luyện các công cụ AI tạo nội dung của mình. Công ty gọi sự việc này là một bài học và cam kết sẽ làm rõ bất kỳ sự nhầm lẫn nào bằng cách làm rõ ràng hơn ngôn ngữ của chính sách của mình.
Dù sao đi nữa, sự thật vẫn là nếu Adobe muốn sử dụng dữ liệu khách hàng để huấn luyện các hệ thống AI của mình, không ai có thể làm gì về điều đó – ngoại trừ tẩy chay. Đồng thời, Adobe đang lấy dữ liệu cho các công cụ như Generative Fill từ đâu đó, vì vậy nó đang sử dụng tác phẩm của các nghệ sĩ, theo một cách nào đó.
Các Công Ty Công Nghệ Có Quyền Truy Cập Gần Như Không Giới Hạn Vào Dữ Liệu Của Bạn… Hiện Tại
Hiện tại, các gã khổng lồ công nghệ như Google và Meta có quyền truy cập gần như không giới hạn vào dữ liệu của các nghệ sĩ. Sự giám sát về cách họ xử lý dữ liệu người dùng gần như cũ bằng tuổi của internet, nhưng các quy định về quyền riêng tư vẫn đang phải bắt kịp.
Phải đến năm 2018, Liên minh Châu Âu mới thực hiện hướng dẫn bảo mật GDPR và chúng đã không làm gì nhiều để bảo vệ dữ liệu người dùng.
AI tạo nội dung là một mảnh đất mới hoàn toàn với hầu như không có quy định nào để hạn chế hành động của các công ty công nghệ trong lĩnh vực này. Hiện tại, các công ty như Google và OpenAI có thể làm gần như bất cứ điều gì họ muốn với dữ liệu của chúng ta, và điều này sẽ không thay đổi sớm.
-
Các công cụ AI tạo nội dung sử dụng tác phẩm của nghệ sĩ như thế nào?
- Các công cụ AI tạo nội dung sử dụng các tập dữ liệu lớn, bao gồm hình ảnh và văn bản, để huấn luyện các mô hình học máy. Những mô hình này sau đó được sử dụng để tạo ra nội dung mới dựa trên các lời nhắc từ người dùng.
-
Tại sao nhiều nghệ sĩ lại phản đối việc sử dụng tác phẩm của họ bởi các công cụ AI?
- Nghệ sĩ phản đối vì các công cụ AI sử dụng tác phẩm của họ mà không có sự cho phép, không bồi thường và không ghi công, đồng thời có khả năng thay thế công việc của họ.
-
Có cách nào để ngăn các công cụ AI truy cập tác phẩm của tôi không?
- Cách duy nhất để ngăn các công cụ AI truy cập tác phẩm của bạn là không xuất bản gì trên mạng. Các biện pháp khác như sử dụng tệp robots.txt hoặc chọn không tham gia vào các tập dữ liệu huấn luyện có hạn chế.
-
Chính sách bảo mật của Google có ảnh hưởng như thế nào đến việc sử dụng nội dung trực tuyến?
- Google đã cập nhật chính sách bảo mật của mình để bao gồm việc sử dụng nội dung công khai trực tuyến để huấn luyện các mô hình AI của mình, bao gồm Google Dịch và Bard.
-
Mạng xã hội có quyền sử dụng nội dung của tôi như thế nào?
- Các mạng xã hội như Facebook, Instagram và Threads có quyền sử dụng bất kỳ nội dung nào bạn xuất bản trên nền tảng của họ theo các điều khoản và điều kiện của họ.
-
Adobe có sử dụng tác phẩm của tôi để huấn luyện các thuật toán AI của họ không?
- Adobe đã từng gây tranh cãi về việc sử dụng hình ảnh tải lên các dịch vụ đám mây của mình để huấn luyện các thuật toán AI, nhưng sau đó họ đã làm rõ rằng không có dữ liệu khách hàng nào được sử dụng cho mục đích này.
-
Có thể làm gì để bảo vệ quyền sở hữu sáng tạo của tôi khỏi các công cụ AI?
- Hiện tại, các nghệ sĩ có thể hy vọng vào các vụ kiện và quy định mới để bảo vệ quyền sở hữu sáng tạo của họ. Tuy nhiên, điều này sẽ mất thời gian và sự kiên nhẫn.
Cuối Cùng, Sẽ Cần Các Vụ Kiện Và Quy Định Để Bảo Vệ Các Nghệ Sĩ Khỏi AI
Cho đến khi AI tạo nội dung và quyền truy cập của nó vào dữ liệu người dùng được quy định, các nghệ sĩ gần như không có cách nào để ngăn chặn công nghệ này. Kịch bản có khả năng nhất sẽ là thay đổi luật bản quyền hoặc, có thể, các biện pháp bảo vệ dữ liệu mới liên quan đến quyền sở hữu sáng tạo. Trong bất kỳ trường hợp nào, sẽ mất một thời gian dài để thấy bất kỳ quy định mới nào được giới thiệu và sau đó được thực thi.
Tin vui cho các nghệ sĩ là các vụ kiện chống lại AI tạo nội dung đang tích lũy nhanh chóng và điều này có thể đẩy nhanh phản ứng pháp lý. Tin xấu là một số công ty công nghệ liên quan có quỹ pháp lý để kéo dài các vụ kiện này qua các con đường pháp lý tốn thời gian nhất.
Trong thời gian chờ đợi, các câu hỏi đạo đức về việc tạo nghệ thuật bằng AI sẽ vẫn còn đó.