Trang chủ Trí tuệ nhân tạo (AI) Công nghệ nhân bản giọng nói AI của Microsoft quá tốt nhưng...

Công nghệ nhân bản giọng nói AI của Microsoft quá tốt nhưng có một nhược điểm

Team nghiên cứu của Microsoft đã tiết lộ VALL-E 2, một hệ thống AI mới để tổng hợp giọng nói có khả năng tạo ra giọng nói “hiệu suất ở cấp độ con người” chỉ với vài giây âm thanh không thể phân biệt được với nguồn.

“VALL-E 2 là tiến bộ mới nhất trong mô hình ngôn ngữ codec thần kinh đánh dấu một cột mốc quan trọng trong quá trình tổng hợp chuyển văn bản thành giọng nói (TTS) không cần mẫu đào tạo, lần đầu tiên đạt được sự ngang bằng với con người”, bài nghiên cứu cho biết.

Hệ thống được xây dựng dựa trên phiên bản tiền nhiệm VALL-E giới thiệu vào đầu năm 2023. Các mô hình ngôn ngữ codec thần kinh biểu diễn giọng nói dưới dạng các chuỗi code.

Team cho biết điều khiến VALL-E 2 khác biệt so với các kỹ thuật nhân bản giọng nói khác là phương pháp “Lấy mẫu nhận biết lặp lại” và chuyển đổi thích ứng giữa các kỹ thuật lấy mẫu. Các chiến lược này cải thiện tính nhất quán và giải quyết vấn đề phổ biến nhất theo cách nói sáng tạo truyền thống.

Các nhà nghiên cứu viết:

“VALL-E 2 tổng hợp giọng nói chất lượng cao một cách nhất quán, ngay cả đối với những câu khó hiểu do độ phức tạp hoặc cụm từ lặp đi lặp lại”, đồng thời chỉ ra rằng công nghệ này có thể giúp tạo ra giọng nói cho những người mất khả năng nói.

Tuy nhiên, công cụ này quá ấn tượng đến mức sẽ không thể cung cấp cho công chúng.

“Hiện tại, chúng tôi không có kế hoạch kết hợp VALL-E 2 vào sản phẩm hoặc mở rộng khả năng tiếp cận công chúng”, Microsoft cho biết trong tuyên bố đầy đạo đức của mình, đồng thời lưu ý rằng các công cụ như vậy mang lại rủi ro như bắt chước giọng nói mà không có sự đồng ý và sử dụng giọng nói AI thuyết phục trong lừa đảo và các hoạt động tội phạm khác.

Team nghiên cứu nhấn mạnh cần có một phương pháp tiêu chuẩn để đánh dấu kỹ thuật số các thế hệ AI, nhận thấy rằng việc phát hiện nội dung do AI tạo ra với độ chính xác cao vẫn là một thách thức.

“Nếu mô hình được khái quát hóa cho những người không nhìn thấy trong thế giới thực, thì nó phải bao gồm một giao thức để đảm bảo người nói chấp thuận việc sử dụng giọng nói của họ và một mô hình phát hiện giọng nói tổng hợp”.

Điều đó nói lên rằng, kết quả của VALL-E 2 rất chính xác so với các công cụ khác. Trong một loạt thử nghiệm do team nghiên cứu thực hiện, VALL-E 2 vượt trội hơn các tiêu chuẩn của con người về độ mạnh mẽ, tự nhiên và độ giống nhau của giọng nói được tạo ra.

Microsoft

Nguồn: Microsoft

VALL-E-2 có thể đạt được những kết quả này chỉ với 3 giây âm thanh. Tuy nhiên, team nghiên cứu lưu ý rằng “sử dụng mẫu giọng nói dài 10 giây thậm chí còn mang lại chất lượng tốt hơn”.

Microsoft không phải là công ty AI duy nhất trình diễn các mô hình AI tiên tiến mà không tung ra thị trường. Voicebox của Meta và Voice Engine của OpenAI là hai công cụ sao chép giọng nói ấn tượng nhưng cũng gặp phải những hạn chế tương tự.

Người phát ngôn của Meta AI nói vào năm ngoái:

“Có nhiều trường hợp sử dụng thú vị đối với các mô hình giọng nói tổng quát, nhưng vì nguy cơ sử dụng sai mục đích, chúng tôi không cung cấp công khai mô hình hoặc code Voicebox vào thời điểm này”.

Ngoài ra, OpenAI giải thích rằng trước tiên họ đang cố gắng giải quyết vấn đề bảo mật trước khi tung ra mô hình giọng nói tổng hợp.

OpenAI giải thích trong một bài đăng trên blog chính thức:

“Theo cách tiếp cận của chúng tôi đối với an toàn AI và các cam kết tự nguyện của chúng tôi, chúng tôi đang chọn xem trước nhưng không phát hành rộng rãi công nghệ trên vào thời điểm này”.

Lời kêu gọi hướng dẫn đạo đức đang lan rộng khắp cộng đồng AI, đặc biệt là khi các cơ quan quản lý bắt đầu nêu lên mối lo ngại về tác động của AI tạo sinh trong cuộc sống hàng ngày của chúng ta.

Tham gia Telegram của Tạp Chí Bitcoin: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin  

Đình Đình

Theo Decrypt

MỚI CẬP NHẬT

Tâm lý xã hội về Bitcoin chạm đáy trong năm, báo hiệu giá sắp...

Tâm lý xã hội về Bitcoin đã chạm mức thấp nhất vào năm 2024, báo hiệu khả năng giá sắp phục hồi trên ngưỡng...
stablecoin

SpaceX của Elon Musk sử dụng stablecoin để phòng ngừa rủi ro ngoại hối

Theo nhà đầu tư mạo hiểm Chamath Palihapitiya đến từ Silicon Valley cho biết trong podcast All-In vào thứ 6, SpaceX đang sử dụng...

UAE hiện nắm giữ 40 ​​tỷ đô la Bitcoin

Các Tiểu vương quốc Ả Rập Thống nhất (UAE) hiện sở hữu 40 tỷ đô la Bitcoin sau nhiều năm đầu tư để xây...

4 sự kiện kinh tế quan trọng có thể định hình giá trị của...

Khi năm 2024 đang dần khép lại, cộng đồng đam mê Bitcoin không khỏi xôn xao suy đoán về tương lai của đồng tiền...
Wall Street Pepe presale xuất sắc huy động vượt 33,5 triệu USD

Dogecoin và Pepe phục hồi mạnh mẽ, Wall Street Pepe presale xuất sắc huy...

Sau cú sụt giảm mạnh khiến toàn bộ thị trường điêu đứng, Bitcoin đã ngay lập tức phục hồi ấn tượng, tăng 3,9% và...

Tin vắn Crypto 22/12: Bitcoin đã sẵn sàng bước vào giai đoạn tăng giá...

Từ nhận định Bitcoin đã sẵn sàng bước vào giai đoạn parabol của chu kỳ thị trường hiện tại đến Spacecoin XYZ đã phóng...
doge-giam-gia

Dogecoin lao dốc 30% từ đỉnh, đối mặt nguy cơ tụt dưới mốc $0,20

Giá Dogecoin (DOGE) giảm hơn 30% so với mức cao nhất năm là $0,48 vào đầu tháng này. Sự sụt giảm được liên kết...

Nhiều Bitcoin “ngủ đông” đang dần hồi sinh và được chuyển đến ví mới

Trong suốt bốn ngày qua, giá Bitcoin liên tục thoái lui khỏi mức đỉnh kỷ lục 108.000 USD, chứng kiến giá trị giảm hơn...

Doanh số NFT tăng 32% trong tuần đạt 304 triệu đô la

Tuần trước, doanh số bán NFT dựa trên Ethereum đã ghi nhận mức tăng mạnh, đẩy tổng khối lượng giao dịch NFT kỹ thuật...

Altcoin tăng 20.000% và 9 token khác đang dẫn đầu về hoạt động cá...

Dữ liệu mới nhất từ công ty nghiên cứu thị trường Santiment đã chỉ ra một altcoin đang ghi nhận mức tăng trưởng ấn...
XRP

Cá voi XRP mua dip, ảnh hưởng thế nào đến giá?

Giá Ripple (XRP) giảm gần đây đã thu hút sự chú ý của các nhà đầu tư lớn, với dữ liệu on-chain cho thấy...
Bitcoin

Bitcoin sụp đổ có thể là bước đệm cho sự phục hồi lịch sử...

Giá Bitcoin gần đây đã đạt mức cao nhất mọi thời đại là 108.364 đô la trước khi lao dốc xuống còn 92.118 đô...

Cựu CEO Binance.US Brian Brooks gia nhập hội đồng quản trị MicroStrategy

MicroStrategy, công ty phần mềm nổi bật của bò Bitcoin Michael Saylor, vừa thông báo việc bổ nhiệm cựu CEO của Binance.US, Brian Brooks,...
hype-tang-gia

Hyperliquid (HYPE) lập kỷ lục mới, điều gì thúc đẩy sự tăng trưởng đột...

Hyperliquid đã đạt được một cột mốc quan trọng với khối lượng giao dịch đạt 11,5 tỷ USD và khối lượng thanh lý lên...

Nhà sáng lập Hex, Richard Heart, bị Interpol và Europol truy nã vì trốn...

Tổ chức cảnh sát quốc tế Interpol đã phát hành "Thông báo Đỏ" đến các quốc gia thành viên theo yêu cầu của Phần...
mua-altcoin

Cơ hội mùa altcoin giảm, nhưng 3 chỉ số chỉ ra tiềm năng hồi...

Ngày 4 tháng 12, chỉ số mùa altcoin đã đạt mức 88, gợi ý rằng các tiền điện tử ngoài Bitcoin có thể sẽ...