Trong thời đại công nghệ hiện nay, các mô hình tạo hình ảnh từ văn bản dựa trên AI đang trở nên phổ biến và dễ tiếp cận hơn bao giờ hết. Tuy nhiên, nếu bạn muốn kiểm soát quá trình tạo hình ảnh một cách chi tiết hơn, các trình tạo hình ảnh AI mã nguồn mở sẽ là lựa chọn tốt nhất. Trong bài viết này, chúng tôi sẽ giới thiệu đến bạn 5 trình tạo hình ảnh AI mã nguồn mở tốt nhất mà bạn có thể thử ngay lập tức.
1. Craiyon
Craiyon là một trong những trình tạo hình ảnh AI mã nguồn mở dễ tiếp cận nhất. Dựa trên DALL-E Mini, bạn có thể sao chép kho lưu trữ GitHub và cài đặt mô hình trên máy tính của mình, nhưng Craiyon đã chuyển hướng sang sử dụng trang web chính thức.
Trang web chính thức của Craiyon cung cấp mô hình mới nhất miễn phí mà không cần cài đặt. Hiện tại, Craiyon không có ứng dụng trên Android hay iOS. Về chức năng, bạn sẽ thấy các tùy chọn thông thường mà bạn mong đợi từ một trình tạo hình ảnh AI. Khi nhập câu lệnh và nhận hình ảnh, bạn có thể sử dụng tính năng nâng cấp độ phân giải để có bản sao độ phân giải cao hơn. Có ba phong cách để lựa chọn: Nghệ thuật, Ảnh và Vẽ. Bạn cũng có thể chọn tùy chọn “Không” nếu muốn mô hình tự quyết định.
Craiyon trang chủ
Ngoài ra, “Chế độ Chuyên gia” cho phép bạn thêm các từ ngữ tiêu cực, giúp mô hình tránh các yếu tố cụ thể. Tính năng dự đoán câu lệnh sử dụng ChatGPT để giúp người dùng viết các câu lệnh chi tiết nhất có thể. Cuối cùng, tính năng loại bỏ nền bằng AI giúp bạn tiết kiệm thời gian và công sức khi cắt bỏ nền khỏi hình ảnh.
Hình ảnh được tạo bởi Craiyon
Craiyon miễn phí sử dụng, nhưng người dùng miễn phí bị giới hạn ở chín hình ảnh miễn phí mỗi phút. Bạn có thể đăng ký các gói Supporter hoặc Professional (lần lượt là 5 và 20 đô la mỗi tháng, tính theo năm) để loại bỏ quảng cáo, watermark, tăng tốc độ tạo hình ảnh và giữ hình ảnh đã tạo riêng tư. Gói đăng ký tùy chỉnh cũng cho phép mô hình tùy chỉnh, tích hợp, hỗ trợ chuyên dụng và máy chủ riêng.
2. Stable Diffusion 1.5
Stable Diffusion là một trong những mô hình tạo hình ảnh từ văn bản mã nguồn mở phổ biến nhất. Nó cũng hỗ trợ cho các mô hình khác, bao gồm ba trình tạo hình ảnh được đề cập dưới đây. Được phát hành vào năm 2022, Stable Diffusion đã có nhiều phiên bản kể từ đó.
Giao diện web của Stable Diffusion
Mô hình này dễ cài đặt ngay cả với người mới bắt đầu và hoạt động tốt nếu bạn có GPU chuyên dụng với ít nhất 4GB bộ nhớ. Bạn cũng có thể truy cập Stable Diffusion trực tuyến và chúng tôi đã hướng dẫn bạn cách chạy Stable Diffusion trên máy Mac.
Có nhiều điểm kiểm tra (xem như các phiên bản) khác nhau để sử dụng với Stable Diffusion. Mặc dù chúng tôi đã thử nghiệm phiên bản 1.5, phiên bản 2.1 cũng đang trong quá trình phát triển và chính xác hơn.
Hình ảnh được tạo bởi DreamShaper
Chạy mô hình cũng khá dễ dàng. Chúng tôi đã thử nghiệm với giao diện web AUTOMATIC1111 Stable Diffusion và tất cả các điều khiển và tham số hoạt động tốt. Mô hình cũng khá an toàn với nội dung nhạy cảm nhờ vào cơ sở dữ liệu LAION-5B mà nó được đào tạo (mặc dù không hoàn hảo). Thời gian tạo hình ảnh sẽ thay đổi tùy thuộc vào phần cứng của bạn, nhưng bạn có thể mong đợi hình ảnh chi tiết và chân thực ngay cả với các câu lệnh cơ bản.
3. DreamShaper
DreamShaper là một mô hình tạo hình ảnh dựa trên Stable Diffusion. Nó được thiết kế như một giải pháp thay thế mã nguồn mở cho MidJourney và tập trung vào tính chân thực của hình ảnh được tạo ra, mặc dù nó cũng có thể xử lý các phong cách anime và hội họa với một số điều chỉnh.
Mô hình này mạnh mẽ hơn Stable Diffusion, cho phép người dùng có nhiều tự do hơn trong kết quả cuối cùng, từ cải thiện ánh sáng đến các hạn chế NSFW lỏng lẻo hơn. Chạy mô hình cũng dễ dàng, với phiên bản đã được đào tạo sẵn có thể tải xuống trực tuyến để truy cập cục bộ và nhiều trang web, bao gồm Sinkin.ai, RandomSeed và Mage.space (yêu cầu đăng ký cơ bản) cho phép bạn chạy mô hình với tăng tốc GPU.
So sánh DreamShaper và Stable Diffusion
Như bạn có thể đoán, hình ảnh được tạo bởi DreamShaper có xu hướng trông chân thực hơn so với Stable Diffusion. Ngay cả khi bạn chạy cùng một câu lệnh trên cả hai mô hình, mô hình DreamShaper có khả năng trở nên chân thực, chi tiết và ánh sáng tốt hơn.
Điều này đặc biệt đúng với chân dung hoặc nhân vật, điều mà tôi thấy Stable Diffusion thiếu so với cùng một câu lệnh. Nếu hình ảnh của bạn trở nên quá chân thực, đây là bốn cách để nhận diện hình ảnh được tạo bởi AI.
Bạn không cần một PC khủng để chạy mô hình này. GTX 1650Ti của tôi với 4GB VRAM đã chạy mô hình hoàn hảo. Thời gian tạo hình ảnh có hơi lâu hơn, nhưng điều đó không ảnh hưởng đến kết quả thực tế. Tuy nhiên, bạn có thể cần GPU với nhiều VRAM hơn để chạy DreamShaper XL, dựa trên mô hình Stable Diffusion XL.
4. InvokeAI
InvokeAI là một mô hình tạo hình ảnh dựa trên AI khác dựa trên Stable Diffusion, với phiên bản XL dựa trên Stable Diffusion XL. Nó cũng có giao diện người dùng web và dòng lệnh riêng, nghĩa là bạn không cần phải vượt qua nhiều bước như với giao diện web của Stable Diffusion.
Giao diện người dùng của InvokeAI với hình ảnh
Mô hình này tập trung vào việc cho phép người dùng tạo hình ảnh dựa trên tài sản trí tuệ của họ với các quy trình làm việc tùy chỉnh. InvokeAI là một trong những mô hình tạo hình ảnh AI mã nguồn mở tốt nhất để đào tạo các mô hình tùy chỉnh và làm việc với tài sản trí tuệ.
Hình ảnh được tạo bởi InvokeAI
Tài liệu chính thức liệt kê hai phương pháp cài đặt: cài đặt qua trình cài đặt của InvokeAI hoặc sử dụng PyPI nếu bạn thoải mái với dòng lệnh và Python và cần kiểm soát nhiều hơn các gói được cài đặt cùng với mô hình.
Tuy nhiên, sự kiểm soát bổ sung này cũng mang lại một số hạn chế, đáng chú ý nhất là yêu cầu phần cứng nghiêm ngặt hơn. InvokeAI khuyến nghị một GPU chuyên dụng với ít nhất 4GB bộ nhớ, với 6-8GB được khuyến nghị cho phiên bản XL. Yêu cầu VRAM áp dụng cho cả GPU AMD và Nvidia. Bạn cũng cần ít nhất 12GB RAM và 12GB dung lượng đĩa trống cho mô hình, các phụ thuộc và Python.
Mặc dù tài liệu không khuyến nghị sử dụng GPU Nvidia GTX 10 Series và 16 Series do thiếu bộ nhớ video, trình cài đặt được cung cấp đã chạy tốt. Trải nghiệm của bạn có thể khác nhau, nhưng nếu bạn đang sử dụng GPU cấp thấp hơn, hãy mong đợi phải đợi lâu hơn để thấy câu lệnh của bạn biến thành hình ảnh. Cuối cùng, nếu bạn đang sử dụng Windows, bạn chỉ có thể sử dụng GPU Nvidia, vì hiện tại không hỗ trợ GPU AMD.
Về phần tạo hình ảnh, mô hình có xu hướng nghiêng về phong cách nghệ thuật hơn là chân thực. Tất nhiên, bạn có thể đào tạo mô hình trên tập dữ liệu của mình và có nó tạo ra hình ảnh gần hơn với những gì bạn muốn, ngay cả khi điều đó liên quan đến hình ảnh chân thực, đặc biệt nếu bạn đang làm việc trong thiết kế sản phẩm, kiến trúc hoặc không gian bán lẻ. Tuy nhiên, điều quan trọng cần lưu ý là InvokeAI chủ yếu là một công cụ tạo hình ảnh, nghĩa là bạn có thể phải sử dụng các mô hình của riêng mình để có kết quả tốt nhất (dễ dàng tìm thấy qua trình quản lý mô hình được cung cấp trong giao diện web) vì mô hình mặc định khá giống với Stable Diffusion.
5. Openjourney
Openjourney là một mô hình tạo hình ảnh AI mã nguồn mở miễn phí dựa trên Stable Diffusion. Nếu bạn tự hỏi tại sao mô hình này được gọi là Openjourney, đó là vì nó được đào tạo trên hình ảnh của Midjourney và có thể bắt chước phong cách của nó trong các hình ảnh được tạo ra.
PromptHero, công ty đứng sau Openjourney, cho phép bạn thử nghiệm mô hình cùng với các mô hình khác, bao gồm Stable Diffusion (phiên bản 1.5 và 2), DreamShaper và Realistic Vision. Khi đăng ký, bạn sẽ nhận được 25 tín dụng miễn phí (một tín dụng cho mỗi hình ảnh được tạo), sau đó bạn phải đăng ký gói Pro, chi phí 9 đô la mỗi tháng và cung cấp 300 tín dụng mỗi tháng cùng với các tính năng độc quyền khác.
So sánh Openjourney và Stable Diffusion
Tuy nhiên, nếu bạn muốn chạy nó cục bộ và miễn phí, bạn có thể tải xuống tệp mô hình từ HuggingFace và chạy nó bằng giao diện web của Stable Diffusion. Openjourney cũng là mô hình tạo hình ảnh AI được tải xuống nhiều thứ hai trên HuggingFace, ngay sau Stable Diffusion.
Openjourney không liệt kê bất kỳ yêu cầu phần cứng cụ thể nào để chạy mô hình cục bộ trên trang web của mình, nhưng bạn có thể mong đợi yêu cầu phần cứng tương tự như Stable Diffusion. Điều này có nghĩa là một GPU chuyên dụng với 4GB VRAM, 16GB RAM và khoảng 12 đến 15GB dung lượng trống trên máy tính của bạn để lưu mô hình và các phụ thuộc của nó.
Hình ảnh được tạo bởi Openjourney
Hình ảnh được tạo bởi Openjourney có xu hướng cân bằng giữa chân thực và nghệ thuật trừ khi được chỉ định khác. Nếu bạn đang tìm kiếm một mô hình toàn diện và thích cảm giác của Midjourney mà không phải trả phí đăng ký, Openjourney là một trong những lựa chọn tốt nhất.
1. Tôi có thể sử dụng các trình tạo hình ảnh AI mã nguồn mở này mà không cần kiến thức về lập trình không?
Có, nhiều mô hình như Craiyon và Stable Diffusion cung cấp các giao diện người dùng dễ sử dụng, giúp bạn có thể tạo hình ảnh mà không cần kiến thức lập trình.
2. Các trình tạo hình ảnh AI này có miễn phí hoàn toàn không?
Một số mô hình như Craiyon và Stable Diffusion có phiên bản miễn phí, nhưng có thể có các giới hạn về số lượng hình ảnh bạn có thể tạo. Các gói đăng ký trả phí có thể cung cấp thêm tính năng và không giới hạn.
3. Tôi cần phần cứng gì để chạy các mô hình này trên máy tính cá nhân?
Thông thường, bạn sẽ cần một GPU chuyên dụng với ít nhất 4GB VRAM, 16GB RAM và dung lượng đĩa trống để lưu mô hình và các phụ thuộc của nó.
4. Tôi có thể sử dụng hình ảnh được tạo bởi các mô hình này cho mục đích thương mại không?
Điều này phụ thuộc vào điều khoản sử dụng của từng mô hình. Một số mô hình cho phép sử dụng thương mại, trong khi những mô hình khác có thể có hạn chế. Hãy kiểm tra kỹ trước khi sử dụng.
5. Làm thế nào để tôi có thể cải thiện chất lượng hình ảnh được tạo bởi AI?
Bạn có thể cải thiện chất lượng bằng cách sử dụng các câu lệnh chi tiết hơn, đào tạo mô hình trên tập dữ liệu của riêng bạn hoặc sử dụng các tính năng nâng cao như “Chế độ Chuyên gia” của Craiyon.
6. Có mô hình nào tốt nhất cho việc tạo hình ảnh chân thực không?
DreamShaper được biết đến với khả năng tạo ra hình ảnh chân thực và chi tiết, đặc biệt là trong các chân dung và nhân vật.
7. Tôi có thể tìm thấy các mô hình này ở đâu để tải xuống và sử dụng?
Bạn có thể tìm thấy các mô hình này trên các trang web như GitHub, HuggingFace, và các trang web chính thức của từng mô hình.
Kết luận
Các trình tạo hình ảnh AI mã nguồn mở cung cấp cho bạn sự linh hoạt và kiểm soát mà các dịch vụ trực tuyến thường không có. Từ Craiyon dễ sử dụng đến Stable Diffusion mạnh mẽ, DreamShaper chân thực, InvokeAI tùy chỉnh và Openjourney đa năng, bạn có nhiều lựa chọn để khám phá. Hãy thử ngay để tạo ra những hình ảnh độc đáo và phù hợp với nhu cầu của bạn.
Hãy ghé thăm Tạp Chí Mobile để khám phá thêm nhiều bài viết công nghệ thú vị và cập nhật những xu hướng mới nhất trong lĩnh vực Tech tại chuyên mục Tech.