Contents
Trong thế giới công nghệ, sự phát triển của trí tuệ nhân tạo (AI) đã mang lại những công cụ mới mẻ và sáng tạo, đặc biệt là trong lĩnh vực tạo giọng nói. ElevenLabs, với công cụ AI tạo giọng nói của mình, đang dẫn đầu trong lĩnh vực này. Bài viết này sẽ giới thiệu chi tiết về ElevenLabs, cách sử dụng công cụ AI tạo giọng nói của họ, và những ứng dụng thực tế có thể khai thác từ công nghệ này.
ElevenLabs Là Gì?
ElevenLabs là một công ty nghiên cứu công nghệ giọng nói được thành lập bởi một cựu kỹ sư học máy của Google và một cựu chiến lược gia triển khai của Palantir. Mục tiêu cuối cùng của họ là tạo ra một công cụ có khả năng “chuyển đổi ngay lập tức âm thanh nói giữa các ngôn ngữ.” ElevenLabs Voice AI là một mô hình chuyển văn bản thành giọng nói có thể tạo ra giọng nói con người nghe rất chân thực. Trang web của họ nêu rõ: “Sứ mệnh của chúng tôi là biến việc hỗ trợ âm thanh đa ngôn ngữ theo yêu cầu thành hiện thực trên các lĩnh vực giáo dục, phát trực tuyến, sách nói, trò chơi, phim ảnh và thậm chí là cuộc trò chuyện trực tiếp.”
Các công cụ như Google Translate và các lựa chọn thay thế của nó là một chuyện, nhưng bạn có thể tưởng tượng một công cụ có thể dịch ngay lập tức những gì bạn đang nghe không? Việc sao chép giọng nói của người nói để bạn nghe được lời nói như họ sẽ nói là một bước quan trọng hướng tới mục tiêu đó.
AI Tạo Giọng Nói Là Gì?
AI tạo giọng nói cho phép bạn lấy một giọng nói và làm cho nó nói bất cứ điều gì bạn muốn nghe. Bạn chỉ cần chọn một giọng nói, cung cấp đoạn hội thoại, và công cụ sẽ làm phần còn lại. Bạn có thể nghĩ rằng “Microsoft Sam đã làm điều đó từ những năm 1990” và bạn hoàn toàn đúng. Nhưng Microsoft Sam và các công cụ tương tự nghe như robot. Trong khi đó, công cụ của ElevenLabs nghe gần giống với con người hơn.
ElevenLabs cung cấp ba lựa chọn AI giọng nói: giọng nói “đã chuẩn bị sẵn” hoàn toàn miễn phí, trình tạo giọng nói AI (cho phép bạn chọn giới tính, độ tuổi và giọng nói) và giọng nói “sao chép” chỉ có với thuê bao mà bạn có thể tải lên.
Dưới đây là một ví dụ:
Việc sử dụng AI cho mục đích sáng tạo đi kèm với một số trách nhiệm đạo đức và việc tạo ra giọng nói với công cụ AI giọng nói của ElevenLabs cũng không ngoại lệ.
Tóm lại, đừng sử dụng giọng nói của ai đó mà không có sự cho phép của họ. Mặc dù điều này không phải là bất hợp pháp, nhưng họ có thể cảm thấy không hài lòng về việc này.
Trước khi tiếp tục, hãy nhớ rằng vào thời điểm viết bài này, công cụ AI giọng nói của ElevenLabs vẫn đang trong giai đoạn beta. Điều này có nghĩa là nó chưa phải là sản phẩm hoàn chỉnh.
Tạo Đoạn Hội Thoại AI Cơ Bản
Cách đơn giản nhất để bắt đầu là sử dụng công cụ AI giọng nói miễn phí của ElevenLabs.
Để sử dụng công cụ này, hãy truy cập beta.elevenlabs.io và tạo một tài khoản (bạn có thể sử dụng email của mình, tài khoản Google hoặc Facebook).
Tiếp theo:
- Nhấp vào Tổng hợp Giọng Nói
- Chọn một trong những giọng nói đã chuẩn bị sẵn trong Cài Đặt (có giọng nam và nữ)
- Mở rộng Cài Đặt Giọng Nói để thiết lập Ổn Định và Rõ Ràng + Tăng Cường Tương Đồng (ổn định cao sẽ đơn điệu, rõ ràng cao sẽ gần với giọng nói mong muốn) các thanh trượt
- Chọn Eleven Monolingual (tiếng Anh tiêu chuẩn)
- Nhập văn bản bạn muốn chuyển đổi thành giọng nói
- Nhấp vào Tạo
Tạo giọng nói AI tổng hợp
- Khi quá trình hoàn tất, nó sẽ tự động phát; nếu không, nhấp vào Phát
Bạn cũng có thể Tải Xuống mẫu đã tạo.
Cách Tạo Giọng Nói AI Với ElevenLabs
Nếu bạn thích tạo một giọng nói mới, bạn có thể sử dụng nút Thêm Giọng Nói để truy cập màn hình VoiceLab. Để tạo một giọng nói mới dựa trên các bộ sẵn có của ElevenLabs:
- Nhấp vào Thêm Giọng Nói > Thiết Kế Giọng Nói
- Thiết lập các trường Giới Tính, Độ Tuổi và Giọng Nói
- Điều chỉnh thanh trượt Cường Độ Giọng Nói khi cần
- Nhập văn bản bạn muốn chuyển đổi
- Nhấp vào Tạo
Tạo giọng nữ trong ElevenLabs
- Khi hoàn tất, hãy nghe thử
Trong quá trình thử nghiệm, tôi nhận thấy rằng cả giọng nữ/trẻ/Úc và giọng nam/già/Úc đều mang âm hưởng “Mỹ.” Đây là vấn đề có thể sẽ được giải quyết khi công nghệ phát triển.
Tạo Giọng Nói Riêng Của Bạn Trong AI
Mặc dù các tùy chọn đã chuẩn bị sẵn và có thể cấu hình là thú vị, nhưng yếu tố thực sự hấp dẫn của công nghệ ElevenLabs là công cụ Sao Chép Giọng Nói Tức Thì.
Không giống như các tùy chọn khác, Sao Chép Giọng Nói Tức Thì yêu cầu một thuê bao. Có nhiều lựa chọn, rẻ nhất là 5 đô la một tháng. Vào thời điểm viết bài này, điều này đi kèm với giảm giá 80% cho tháng đầu tiên, chỉ còn 1 đô la.
Các lựa chọn khác có giá 22, 99 và 330 đô la một tháng, với khả năng tạo ra tối đa 40 giờ âm thanh mỗi tháng.
Để sử dụng công cụ sao chép giọng nói của ElevenLabs, bạn sẽ cần cả đoạn hội thoại và một mẫu giọng nói của bạn. Bất cứ điều gì cũng được, miễn là nó rõ ràng và ở định dạng MP3. Mẫu càng dài càng tốt, tối đa 5 phút.
Từ màn hình VoiceLab:
- Nhấp vào Thêm Giọng Nói > Sao Chép Giọng Nói Tức Thì
- Trong cửa sổ kết quả, đặt tên
- Nhấp hoặc kéo một tệp phù hợp để tải lên mẫu (có thể thêm tối đa 25 mẫu để cải thiện độ chính xác)
- Nhấp vào Nhãn và chỉ định một khóa + giá trị (ví dụ: Giọng Nói/Anh)–làm điều này tối đa 5 lần
Sao chép giọng nói của bạn với ElevenLabs
- Nhập một mô tả ngắn gọn về giọng nói
- Kiểm tra hộp kiểm xác nhận sự đồng ý sau đó Thêm Giọng Nói
Khi giọng nói đã được thêm, bạn có thể điều chỉnh nó trong màn hình Tổng Hợp Giọng Nói như trên.
Bạn Có Thể Làm Gì Với Giọng Nói AI?
Giọng nói AI với các giọng nói đã chuẩn bị sẵn và sao chép có rất nhiều khả năng. Như đã đề cập, mục tiêu cuối cùng của ElevenLabs là dịch thuật trực tiếp, nhưng họ cũng đã lưu ý nhiều ứng dụng khác.
Sách nói được đề cập (có thể được đọc bởi một ngôi sao điện ảnh đã qua đời từ lâu) cùng với trò chơi điện tử (sử dụng giọng nói AI sẽ tiết kiệm chi phí cho các diễn viên lồng tiếng). Nhưng nó còn có nhiều ứng dụng khác, từ âm nhạc đến châm biếm, tự giúp đỡ, và có lẽ còn nhiều hơn nữa.
Bạn thậm chí có thể tạo một podcast sử dụng giọng nói AI, mặc dù kết quả có thể nghe hơi nhàm chán.
Giới thiệu cho một tập của podcast Really Useful Podcast của chúng tôi được sản xuất bằng ElevenLabs:
Mặc dù kết quả không hoàn toàn như mong đợi, nhưng đủ tốt để sử dụng, và công nghệ chỉ có thể ngày càng tốt hơn.
Trong khi đó, ElevenLabs đang lên kế hoạch cho một tính năng “cuộc trò chuyện giọng nói” được tạo ra sẽ được giới thiệu vào một ngày sau này.
-
ElevenLabs có miễn phí không?
ElevenLabs cung cấp một tầng miễn phí với các giọng nói đã chuẩn bị sẵn, nhưng để sử dụng các tính năng nâng cao như sao chép giọng nói, bạn cần đăng ký thuê bao. -
Công cụ AI giọng nói của ElevenLabs có thể dùng để làm gì?
Công cụ này có thể được sử dụng cho nhiều mục đích như sách nói, trò chơi điện tử, podcast, và thậm chí là dịch thuật trực tiếp. -
Có thể tạo giọng nói của riêng mình với ElevenLabs không?
Có, bạn có thể sử dụng công cụ Sao Chép Giọng Nói Tức Thì của ElevenLabs để tạo ra một giọng nói dựa trên mẫu giọng nói của bạn. -
Sử dụng giọng nói AI có đạo đức không?
Việc sử dụng giọng nói AI mà không có sự đồng ý của người sở hữu giọng nói đó có thể gây ra những vấn đề đạo đức. Luôn luôn nên xin phép trước khi sử dụng giọng nói của người khác. -
ElevenLabs có kế hoạch phát triển nào trong tương lai không?
ElevenLabs đang lên kế hoạch cho một tính năng “cuộc trò chuyện giọng nói” được tạo ra sẽ được giới thiệu trong tương lai. -
Công cụ AI giọng nói của ElevenLabs có dễ sử dụng không?
Có, công cụ này được thiết kế để dễ sử dụng và cung cấp hướng dẫn rõ ràng cho người dùng. -
Tôi có thể tải xuống giọng nói đã tạo từ ElevenLabs không?
Có, bạn có thể tải xuống các mẫu giọng nói đã tạo sau khi hoàn tất quá trình tạo.
Sử Dụng Giọng Nói Của Bạn Theo Cách Mới Với AI Giọng Nói Của ElevenLabs
Trí tuệ nhân tạo đã mang lại cho chúng ta những công cụ mới đáng kinh ngạc trong vài năm qua. Chat-GPT có thể được sử dụng để tạo văn bản, trả lời câu hỏi, phác thảo báo cáo, và nhiều hơn nữa. Midjourney là một công cụ đáng kinh ngạc có khả năng tạo ra nghệ thuật dựa trên các gợi ý.
Bây giờ, công cụ AI giọng nói từ ElevenLabs giúp việc thao túng giọng nói trở nên dễ dàng. Nó giống như một sự mô phỏng, nhưng với một bản sao của giọng nói gốc.
Mặc dù có những tranh cãi về đạo đức liên quan đến việc sử dụng giọng nói mà không có sự đồng ý, nhưng đây là một công cụ mạnh mẽ với một số khả năng thú vị. Điều tuyệt vời nhất là nó rất dễ sử dụng và mang lại kết quả ấn tượng.