Contents
Kdenlive, trình chỉnh sửa video mã nguồn mở, đã tích hợp công nghệ trí tuệ nhân tạo vào phiên bản mới nhất năm 2023 với sự bổ sung của động cơ chuyển đổi giọng nói thành văn bản Whisper của OpenAI. Phiên bản 23.04 của Kdenlive mang đến nhiều tính năng mới hấp dẫn, khiến người dùng càng thêm phấn khích.
Kdenlive đã thông báo về một số tính năng mới được mong đợi trong phiên bản phần mềm mới nhất. Đây là một năm đầy sự kiện đối với các nhà phát triển, với phiên bản 23.04 là bản phát hành lớn đầu tiên kể từ chiến dịch gây quỹ thành công của họ vào đầu năm 2022.
Họ đã đặt ra một số mục tiêu tự định hướng đầy tham vọng cho phiên bản này, bao gồm dòng thời gian lồng nhau, cải thiện chuyển đổi giọng nói thành văn bản, dịch tự động sang tiếng Anh và như thường lệ, một loạt các bản sửa lỗi và cải thiện mã.
Tải xuống: Kdenlive 23.04 cho Windows, Mac và Linux (Miễn phí)
Những Tính Năng Mới Để Thử Trong Kdenlive 23.04
Phiên bản này có rất nhiều điều để người dùng mong đợi. Đáng chú ý nhất là việc công bố dòng thời gian lồng nhau và việc bổ sung động cơ giọng nói Whisper của OpenAI.
Dòng Thời Gian Lồng Nhau
Dòng thời gian lồng nhau không phải là điều mới mẻ, các nhà biên tập đã sử dụng dòng thời gian lồng nhau trong Premiere Pro từ lâu. Bây giờ, với phiên bản 23.04, người dùng Kdenlive cũng có thể tối ưu hóa công việc của mình một cách tương tự.
Về cơ bản, dòng thời gian lồng nhau cho phép nhà biên tập làm việc trên dự án của mình theo từng phần nhỏ (gọi là chuỗi) thay vì một dòng thời gian dài và thường không gọn gàng. Trước khi có dòng thời gian lồng nhau, một nhà biên tập có thể chỉnh sửa một chuỗi cụ thể, hoàn thiện nó bằng cách kết xuất ra, và sau đó nhập lại chuỗi đã hoàn thành vào dự án của họ.
Nhưng điều đó có cái giá của nó. Việc hoàn thiện chuỗi đúng như tên gọi của nó. Khi chuỗi đó đã được kết xuất và nhập lại, nó không thể chỉnh sửa được nữa.
Ví dụ về dòng thời gian lồng nhau trong Kdenlive
Dòng thời gian lồng nhau khắc phục điều đó. Việc hoàn thiện và sau đó nhập lại từng chuỗi riêng lẻ không còn cần thiết. Các dòng thời gian riêng biệt có thể được tạo cho từng chuỗi, với một dòng thời gian chính bao gồm những chuỗi đó thay vì các đoạn phim riêng lẻ.
Các chuỗi riêng lẻ không chỉ vẫn có thể chỉnh sửa trong dòng thời gian lồng nhau của chúng, mà bất kỳ thay đổi nào được thực hiện đối với chúng sẽ tự động phản ánh trong toàn bộ dự án chính.
Động Cơ Giọng Nói Thành Văn Bản Whisper của OpenAI
Whisper là công cụ chuyển đổi giọng nói thành văn bản được tạo bởi OpenAI, đội ngũ đứng sau ChatGPT. Miễn phí và được cung cấp bởi học sâu và mạng nơ-ron, dự án này hứa hẹn một hệ thống xử lý ngôn ngữ tự nhiên hơn và do đó chính xác hơn để sử dụng trong các ứng dụng chuyển đổi giọng nói thành văn bản. Các nhà phát triển của Kdenlive đã bổ sung nó vào phiên bản 23.04 để hỗ trợ tính năng phụ đề tự động.
Mặc dù Kdenlive đã có một động cơ phụ đề hiện có, VOSK, việc bổ sung giao thức chuyển đổi giọng nói thành văn bản Whisper hứa hẹn sẽ cải thiện đáng kể. Một trong những điểm bán hàng chính của Whisper không chỉ là độ chính xác tăng lên mà còn là khả năng dịch âm thanh sang tiếng Anh ngay lập tức.
Nếu một nhà biên tập có một cảnh chứa ngôn ngữ nước ngoài cần phụ đề, lý thuyết là Whisper có thể làm điều đó mà không bị gián đoạn.
Các nhà phát triển đã nỗ lực để làm cho Whisper dễ cấu hình bằng cách chỉ cần tải xuống các tệp cần thiết qua màn hình cấu hình. Và càng đơn giản hóa việc sử dụng bằng cách tạo một đường phụ đề trong dự án của bạn và sau đó chọn đũa thần và làm theo các hướng dẫn.
Phụ đề tự động bằng Whisper trong Kdenlive
Hiệu Ứng Đếm Giờ
Hiệu ứng Đếm Giờ nhận được ít sự chú ý nhất trong thông báo về phiên bản 23.04. Đây là một tính năng hữu ích trông có vẻ đơn giản, nhưng thực tế lại là một quy trình thủ công phức tạp cho đến bây giờ.
Giống như hầu hết các NLE, Kdenlive cũng bao gồm khả năng xem mã thời gian của dự án, nhưng không thể tùy chỉnh và chỉ đồng bộ với toàn bộ dự án. Việc tạo một đếm giờ tự động tăng hoặc giảm và đồng bộ với một đoạn phim hoặc một đường riêng lẻ là một quy trình phức tạp với nhiều bước khác nhau.
Với bản cập nhật mới này, Đếm Giờ có thể được thêm vào như bất kỳ hiệu ứng nào khác bằng cách kéo và thả, và có thể được chỉnh sửa nhanh chóng và dễ dàng thông qua Ngăn Hiệu Ứng/Thành Phần bên cạnh nó.
Các tham số có thể điều chỉnh bao gồm phông chữ, kích thước, màu sắc, vị trí và bất kỳ điều gì khác mà người dùng mong đợi.
-
Kdenlive 23.04 có những tính năng mới nào?
- Phiên bản 23.04 của Kdenlive bao gồm các tính năng như dòng thời gian lồng nhau, động cơ giọng nói thành văn bản Whisper của OpenAI, và hiệu ứng Đếm Giờ.
-
Dòng thời gian lồng nhau là gì?
- Dòng thời gian lồng nhau cho phép nhà biên tập làm việc trên dự án theo từng phần nhỏ (chuỗi) và giữ cho các chuỗi này có thể chỉnh sửa ngay cả sau khi đã được thêm vào dòng thời gian chính.
-
Whisper của OpenAI là gì?
- Whisper là một công cụ chuyển đổi giọng nói thành văn bản miễn phí được phát triển bởi OpenAI, giúp cải thiện độ chính xác và hỗ trợ dịch tự động sang tiếng Anh.
-
Làm thế nào để cấu hình Whisper trong Kdenlive?
- Bạn có thể cấu hình Whisper bằng cách tải xuống các tệp cần thiết qua màn hình cấu hình và sau đó tạo một đường phụ đề trong dự án của bạn, chọn đũa thần và làm theo hướng dẫn.
-
Hiệu ứng Đếm Giờ trong Kdenlive 23.04 hoạt động như thế nào?
- Hiệu ứng Đếm Giờ có thể được thêm vào bằng cách kéo và thả, và có thể được tùy chỉnh về phông chữ, kích thước, màu sắc, vị trí và các tham số khác.
-
Kdenlive có hỗ trợ GPU không?
- Các nhà phát triển đang làm việc để cải thiện hỗ trợ GPU trong các bản phát hành tiếp theo.
-
Tôi có thể tải Kdenlive 23.04 ở đâu?
- Bạn có thể tải xuống Kdenlive 23.04 cho Windows, Mac và Linux từ trang web chính thức của Kdenlive.
Tham khảo thêm tại Tạp Chí Mobile và xem thêm các hướng dẫn khác tại Hướng Dẫn.
Kế Hoạch Tiếp Theo Là Gì?
Ngoài các tính năng mới, Kdenlive 23.04 còn bao gồm các bản sửa lỗi và cải thiện thông thường cho bản phát hành năm 2023. Những điều này bao gồm cải thiện hiệu suất của các đoạn phim trong dòng thời gian, nhập tốt hơn các đoạn phim có dung lượng lớn, xử lý phụ đề tốt hơn và một loạt các chuyển tiếp mới cho các nhà biên tập thử nghiệm.
Các nhà phát triển đã lưu ý trong thông báo của họ rằng đối với bản phát hành tiếp theo, họ dự định làm việc trên quy trình làm việc với các hiệu ứng trong khi hướng tới việc cải thiện hỗ trợ GPU.