Trong thời gian gần đây, các công cụ tạo ảnh bằng AI như OpenAI, Imagen, Adobe Firefly, DALL-E-3 và nhiều hơn nữa đã mang lại nhiều niềm vui và cả sự ám ảnh cho người dùng. Với sự phát triển của công nghệ, chúng ta có nhiều lựa chọn hơn để tinh chỉnh kết quả. Mới đây, Google Labs đã ra mắt Whisk, một công cụ cho phép bạn tải lên ảnh làm hướng dẫn thay vì sử dụng các đoạn văn bản.
Whisk Của Google Labs Tạo Ảnh Từ Ảnh Khác
Nếu bạn đang sinh sống tại Mỹ, bạn sẽ có cơ hội trải nghiệm Whisk từ Google Labs, một “thí nghiệm về AI tạo ảnh”, theo blog của Google. Với Whisk, thay vì chỉ dựa vào các đoạn văn bản mô tả, bạn có thể thêm ảnh làm tài liệu tham khảo. Nền tảng này sẽ yêu cầu bạn cung cấp ba đặc điểm chính: chủ thể, cảnh và phong cách. Sau đó, công cụ sẽ trộn lẫn, hay “whisk” các yếu tố này lại với nhau và tạo ra hình ảnh hoàn hảo cho bạn.
Whisk sử dụng Imagen 3, mô hình tạo ảnh mới nhất của Google.
Google không loại bỏ hoàn toàn các đoạn văn bản với Whisk. Bạn vẫn có thể viết các đoạn văn bản cho từng hạng mục hoặc thêm một ghi chú chung. Bạn cũng có thể tinh chỉnh hình ảnh sau khi xem lần thử đầu tiên của Whisk. Ví dụ, nếu bạn tạo ra một thiệp lễ hội theo phong cách cổ điển với hình ảnh một chú mèo nằm trên tuyết, sau khi xem kết quả, bạn có thể thêm các bông tuyết làm điểm nhấn cuối cùng.
Mỗi lần bạn thêm hoặc tạo một hình ảnh trong bất kỳ hạng mục nào của Whisk, nền tảng sẽ tạo ra một mô tả văn bản chi tiết về nó. Do đó, nếu bạn muốn thêm hoặc chỉnh sửa một hình ảnh hiện có, bạn chỉ cần tùy chỉnh văn bản.
Hội thoại văn bản trên nền tảng tạo ảnh Whisk cho phép bạn chỉnh sửa đoạn văn bản tự động
Cuối cùng, nếu bạn cảm thấy thiếu cảm hứng, bạn có thể ngẫu nhiên hóa các thành phần hình ảnh bằng cách chọn biểu tượng xúc xắc. Đối với các thế hệ phức tạp hơn, bạn cũng có thể thêm nhiều hơn một chủ thể, cảnh hoặc tham chiếu phong cách.
Khi bạn hài lòng với tác phẩm của mình, bạn có thể lưu trữ nó trên nền tảng hoặc tải xuống để sử dụng cục bộ.
Đáng Để Thử Whisk?
Với tất cả các tùy chọn tạo ảnh AI tiên tiến hiện có để nâng cao ảnh của bạn hoặc tạo ra “nghệ thuật gốc”, công cụ mới của Google có thể chỉ là một trò đùa. Tuy nhiên, cách mà Whisk sử dụng các tham chiếu hình ảnh trong việc tạo ảnh là độc đáo, và tôi có thể thấy nó có giá trị trong các tình huống sáng tạo và chuyên nghiệp.
Giả sử bạn đang làm việc trên một bản thuyết trình và cần các hình ảnh tương tự như một tham chiếu mà bạn đã có. Thay vì cố gắng mô tả lại tham chiếu đó bằng lời, bạn chỉ cần tải lên tệp, cùng với một mô tả văn bản ngắn gọn về cách bạn muốn hình ảnh mới của mình khác biệt.
Để phân biệt Whisk với các phần mềm tạo ảnh AI khác, Google đã khẳng định rằng nền tảng này được thiết kế để khám phá, không phải để hoàn thiện. Trong khi các sản phẩm khác có thể phù hợp hơn cho các chỉnh sửa tinh chỉnh, Whisk phù hợp nhất cho việc brainstorming:
“Chúng tôi đã xây dựng nó cho việc khám phá hình ảnh nhanh chóng, không phải cho các chỉnh sửa hoàn hảo về pixel. Điều này là về việc khám phá ý tưởng theo những cách mới và sáng tạo, cho phép bạn làm việc qua hàng chục lựa chọn và tải xuống những cái bạn yêu thích.”
Hãy thành thật: đôi khi, việc tìm ra từ ngữ thật khó. Tin tôi đi, tôi luôn tìm kiếm những cọng rơm vô hình để tìm ra mô tả phù hợp. Đối với tôi, điều này mang lại cho Whisk tiềm năng nghiêm túc, cho tất cả những lần mà chỉ cần nói “Tôi muốn một hình ảnh trông giống như cái này” sẽ dễ dàng hơn.
-
Whisk có thể sử dụng ở đâu?
Whisk hiện tại chỉ có sẵn cho người dùng tại Mỹ. -
Whisk có thể thay thế hoàn toàn các đoạn văn bản không?
Không, Whisk vẫn cho phép bạn sử dụng các đoạn văn bản để tinh chỉnh hình ảnh. -
Làm thế nào để tôi có thể tinh chỉnh hình ảnh sau khi tạo bằng Whisk?
Bạn có thể chỉnh sửa mô tả văn bản tự động được tạo bởi Whisk để thay đổi hình ảnh. -
Whisk có phù hợp cho các chỉnh sửa chi tiết không?
Không, Whisk được thiết kế cho việc khám phá hình ảnh nhanh chóng, không phải cho các chỉnh sửa chi tiết. -
Tôi có thể lưu hoặc tải xuống hình ảnh từ Whisk không?
Có, bạn có thể lưu hình ảnh trên nền tảng hoặc tải xuống để sử dụng cục bộ. -
Whisk có thể giúp tôi trong công việc như thế nào?
Whisk rất hữu ích cho việc tạo ra các hình ảnh tương tự như một tham chiếu hiện có, đặc biệt hữu ích trong các bản thuyết trình hoặc dự án sáng tạo. -
Tôi có thể thêm nhiều hơn một tham chiếu vào Whisk không?
Có, bạn có thể thêm nhiều hơn một chủ thể, cảnh hoặc tham chiếu phong cách để tạo ra các hình ảnh phức tạp hơn.
Kết Luận
Whisk của Google Labs mang đến một cách tiếp cận mới mẻ và sáng tạo trong việc tạo ảnh bằng AI, sử dụng hình ảnh làm tham chiếu thay vì chỉ dựa vào văn bản. Điều này không chỉ giúp người dùng dễ dàng hơn trong việc truyền đạt ý tưởng mà còn mở ra nhiều cơ hội sáng tạo trong các lĩnh vực khác nhau. Nếu bạn đang tìm kiếm một công cụ để khám phá và thử nghiệm các ý tưởng hình ảnh, Whisk chắc chắn đáng để thử.
Hãy tiếp tục khám phá thêm các hướng dẫn khác trên Tạp Chí Mobile để tối ưu hóa trải nghiệm sử dụng công nghệ của bạn.