Trang chủ >> Trí tuệ nhân tạo (AI) >> Công nghệ nhân bản giọng nói AI của Microsoft quá tốt nhưng có một nhược...

Công nghệ nhân bản giọng nói AI của Microsoft quá tốt nhưng có một nhược điểm

Updated: 04/07/2024 at 13:00

Team nghiên cứu của Microsoft đã tiết lộ VALL-E 2, một hệ thống AI mới để tổng hợp giọng nói có khả năng tạo ra giọng nói “hiệu suất ở cấp độ con người” chỉ với vài giây âm thanh không thể phân biệt được với nguồn.

“VALL-E 2 là tiến bộ mới nhất trong mô hình ngôn ngữ codec thần kinh đánh dấu một cột mốc quan trọng trong quá trình tổng hợp chuyển văn bản thành giọng nói (TTS) không cần mẫu đào tạo, lần đầu tiên đạt được sự ngang bằng với con người”, bài nghiên cứu cho biết.

Hệ thống được xây dựng dựa trên phiên bản tiền nhiệm VALL-E giới thiệu vào đầu năm 2023. Các mô hình ngôn ngữ codec thần kinh biểu diễn giọng nói dưới dạng các chuỗi code.

Team cho biết điều khiến VALL-E 2 khác biệt so với các kỹ thuật nhân bản giọng nói khác là phương pháp “Lấy mẫu nhận biết lặp lại” và chuyển đổi thích ứng giữa các kỹ thuật lấy mẫu. Các chiến lược này cải thiện tính nhất quán và giải quyết vấn đề phổ biến nhất theo cách nói sáng tạo truyền thống.

Các nhà nghiên cứu viết:

“VALL-E 2 tổng hợp giọng nói chất lượng cao một cách nhất quán, ngay cả đối với những câu khó hiểu do độ phức tạp hoặc cụm từ lặp đi lặp lại”, đồng thời chỉ ra rằng công nghệ này có thể giúp tạo ra giọng nói cho những người mất khả năng nói.

Tuy nhiên, công cụ này quá ấn tượng đến mức sẽ không thể cung cấp cho công chúng.

“Hiện tại, chúng tôi không có kế hoạch kết hợp VALL-E 2 vào sản phẩm hoặc mở rộng khả năng tiếp cận công chúng”, Microsoft cho biết trong tuyên bố đầy đạo đức của mình, đồng thời lưu ý rằng các công cụ như vậy mang lại rủi ro như bắt chước giọng nói mà không có sự đồng ý và sử dụng giọng nói AI thuyết phục trong lừa đảo và các hoạt động tội phạm khác.

Team nghiên cứu nhấn mạnh cần có một phương pháp tiêu chuẩn để đánh dấu kỹ thuật số các thế hệ AI, nhận thấy rằng việc phát hiện nội dung do AI tạo ra với độ chính xác cao vẫn là một thách thức.

“Nếu mô hình được khái quát hóa cho những người không nhìn thấy trong thế giới thực, thì nó phải bao gồm một giao thức để đảm bảo người nói chấp thuận việc sử dụng giọng nói của họ và một mô hình phát hiện giọng nói tổng hợp”.

Điều đó nói lên rằng, kết quả của VALL-E 2 rất chính xác so với các công cụ khác. Trong một loạt thử nghiệm do team nghiên cứu thực hiện, VALL-E 2 vượt trội hơn các tiêu chuẩn của con người về độ mạnh mẽ, tự nhiên và độ giống nhau của giọng nói được tạo ra.

Nguồn: Microsoft

VALL-E-2 có thể đạt được những kết quả này chỉ với 3 giây âm thanh. Tuy nhiên, team nghiên cứu lưu ý rằng “sử dụng mẫu giọng nói dài 10 giây thậm chí còn mang lại chất lượng tốt hơn”.

Microsoft không phải là công ty AI duy nhất trình diễn các mô hình AI tiên tiến mà không tung ra thị trường. Voicebox của Meta và Voice Engine của OpenAI là hai công cụ sao chép giọng nói ấn tượng nhưng cũng gặp phải những hạn chế tương tự.

Người phát ngôn của Meta AI nói vào năm ngoái:

“Có nhiều trường hợp sử dụng thú vị đối với các mô hình giọng nói tổng quát, nhưng vì nguy cơ sử dụng sai mục đích, chúng tôi không cung cấp công khai mô hình hoặc code Voicebox vào thời điểm này”.

Ngoài ra, OpenAI giải thích rằng trước tiên họ đang cố gắng giải quyết vấn đề bảo mật trước khi tung ra mô hình giọng nói tổng hợp.

OpenAI giải thích trong một bài đăng trên blog chính thức:

“Theo cách tiếp cận của chúng tôi đối với an toàn AI và các cam kết tự nguyện của chúng tôi, chúng tôi đang chọn xem trước nhưng không phát hành rộng rãi công nghệ trên vào thời điểm này”.

Lời kêu gọi hướng dẫn đạo đức đang lan rộng khắp cộng đồng AI, đặc biệt là khi các cơ quan quản lý bắt đầu nêu lên mối lo ngại về tác động của AI tạo sinh trong cuộc sống hàng ngày của chúng ta.

Tham gia Telegram của Tạp Chí Bitcoin: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Đình Đình

Theo Decrypt

Được đề cập trong bài viết

Bình luận

BÀI TRƯỚC

DWF Labs ra mắt quỹ 20 triệu đô la cho các dự án Web3 tại các khu vực nói tiếng Trung

BÀI SAU

BloFin cảnh báo giá Bitcoin phải đối mặt với kháng cự 63.000 đô la trong bối cảnh thanh khoản thấp

Từ GPU đến token – Sự lạc quan của Nvidia có thể ảnh hưởng đến lĩnh vực tiền điện tử AI như thế nào

31/08/2025
13:00

Chip AI “Made in China” mới của DeepSeek có thể làm sụp đổ thị trường tiền điện tử Hoa Kỳ

23/08/2025
14:00

Meta dốc hàng tỷ USD vào AI: Tầm nhìn táo bạo hay canh bạc liều lĩnh?

31/07/2025
15:00

Token AI giảm 10% khi Thượng viện Hoa Kỳ bác bỏ lệnh đóng băng quy định AI của liên bang

02/07/2025
15:30

Đây là lý do Token nội dung có thể là xu hướng AI lớn nhất tiếp theo

27/06/2025
06:00

Xung đột Israel–Iran sẽ kết thúc ra sao? Đây là dự đoán từ các mô hình AI

14/06/2025
14:30

AI củng cố vai trò trong Web3, thách thức DeFi và gaming: DappRadar

07/06/2025
06:30

Lĩnh vực tiền điện tử AI tăng trưởng gấp 4 lần trong 2 năm, gần đạt 20 tỷ USD vốn hóa thị trường

29/05/2025
16:00

CEO DNA Fund: AI phi tập trung có tiềm năng tăng trưởng ‘lớn hơn Bitcoin’

27/05/2025
12:56

Cathie Wood dự báo AI và Bitcoin sẽ dẫn dắt giai đoạn tăng trưởng kinh tế mới của Mỹ

10/05/2025
13:00

Liệu AI Coin đang bước vào thị trường tăng giá tháng 5 hay phe gấu vẫn nắm quyền kiểm soát?

09/05/2025
11:00

CEO Aptos Labs: AI Agents và tài sản on-chain có thể định hình lại nền kinh tế toàn cầu

04/05/2025
06:00

Bitcoin ETF giao ngay hút mạnh vốn khi thị trường crypto vượt mốc $4 nghìn tỷ

12/09/2025
22:15

Bitcoin sắp đạt $160.000: Tín hiệu golden cross MACD quay trở lại trong tháng 10

11/09/2025
20:30

ONDO tăng lên mức cao nhất 3 tuần – Những yếu tố nào hỗ trợ?

11/09/2025
16:30

3 lý do Solana có thể sớm hạ nhiệt sau đợt tăng giá mạnh mẽ này

11/09/2025
10:00

ETH có thể rơi về 3.500 đô la? Lý do phe gấu ngày càng chiếm ưu thế

10/09/2025
22:05

Cardano (ADA) vượt mốc $0,95 sau breakout mô hình cờ hiệu?

10/09/2025
15:30

Vì sao mô hình này gợi ý khả năng BONK tăng 72%?

10/09/2025
11:00

Vì sao token AI đang dẫn dắt thị trường crypto trong tháng 9?

09/09/2025
21:15

Phe bò đọ sức với phe gấu TRX – Mức 0,37 đô la có thể quyết định xu hướng

09/09/2025
17:30

Top 3 altcoin đáng chú ý trong tuần thứ hai của tháng 9/2025

09/09/2025
16:30

TOP 3 coin “Made in USA” đáng chú ý trong tuần thứ hai của tháng 9

09/09/2025
11:00

Điều kiện để giá ETH bật tăng mạnh

08/09/2025
21:20

Mới cập nhật

Liệu HYPE có giữ vững đà tăng sau khi lập đỉnh mới?

Tin tức Altcoin
49 phút trước

Hyperliquid (HYPE) đã tăng 7,55% lên mức cao nhất mọi thời đại (ATH) mới là 57,38 đô la trước khi điều chỉnh nhẹ về 56,44 đô la tại thời điểm viết bài. Trong cùng giai đoạn, vốn hóa thị trường của HYPE đạt ATH mới 19,13 tỷ đô la, trong... ...

Tương quan giữa vàng và Bitcoin bị phá vỡ khi mùa altcoin tăng tốc

Tin tức Bitcoin (BTC)
1 giờ trước

Vàng vừa đạt mức cao nhất mọi thời đại (ATH) mới khoảng 3.675 đô la. Trong nhiều năm, đà tăng của vàng thường được xem là tín hiệu sức mạnh cho Bitcoin. Các trader tin rằng Bitcoin thường đi theo vàng với độ trễ khoảng 200 ngày. Tuy nhiên, mô... ...

Pi Coin bật tăng trở lại, nhưng Valour PI ETP vẫn chật vật

Tin tức Altcoin
2 giờ trước

Valour Pi (PI), một sản phẩm ETP được xây dựng để theo dõi tiền điện tử gốc của Pi Network, đang chật vật tìm động lực tăng trưởng khi thị trường hầu như không có nhiều hoạt động. Bất chấp việc ETP thiếu lực hút, Pi Coin lại bắt đầu... ...

Giá RAY và JUP được định vị để bứt phá mạnh mẽ

Phân tích kỹ thuật
2 giờ trước

Trong phiên giao dịch ngày thứ Sáu, các giao thức Tài chính phi tập trung (DeFi) như Raydium (RAY) và Jupiter (JUP) nổi bật trong nhóm dẫn dắt thị trường tiền điện tử, hưởng lợi từ đà bứt phá mạnh mẽ của Solana (SOL). Phân tích kỹ thuật cho thấy... ...

Bitcoin lấy lại 115.000 đô la: Đây là các mốc giá tiếp theo cần chú ý

Tin tức Bitcoin (BTC)
3 giờ trước

Bitcoin (BTC) đã ghi nhận đà phục hồi đáng chú ý trong ngày thứ Sáu, khi giá tăng 1% trong 24 giờ qua, vượt ngưỡng 115.000 USD. Dữ liệu on-chain từ Glassnode cho thấy nhiều chỉ báo kỹ thuật đang củng cố triển vọng lạc quan, phản ánh rằng thị... ...

2 chuyên gia đầu ngành đưa ra cảnh báo bong bóng crypto: 99% token có thể giảm mạnh

Tạp chí
3 giờ trước

Trong bối cảnh thị trường crypto liên tiếp lập kỷ lục mới, những tiếng nói cảnh báo về một bong bóng tiềm ẩn ngày càng trở nên mạnh mẽ. Các nhân vật có ảnh hưởng hàng đầu trong ngành – từ Arjun Sethi của Kraken, Barry Silbert của Digital Currency... ...

Tron (TRX) tiếp tục đà phục hồi, bất chấp doanh thu sụt giảm khi nhu cầu bán lẻ bùng nổ

Phân tích kỹ thuật
4 giờ trước

Tron (TRX) tiếp tục duy trì nhịp tăng, ghi nhận thêm gần 1% trong phiên thứ Sáu, sau khi đã bứt phá 2,36% ở phiên giao dịch trước đó nhờ lực cầu bán lẻ dâng cao. Các tín hiệu từ phân tích kỹ thuật và dữ liệu phái sinh đều... ...

4 dấu hiệu cho thấy mùa altcoin sắp “cập bến” trong tháng 9

Tin tức Altcoin
4 giờ trước

Vốn hóa thị trường altcoin hiện chỉ còn cách mức đỉnh lịch sử vỏn vẹn vài phần trăm. Nhiều nhà phân tích tin rằng trong tháng 9, thị trường có thể đạt đến một mức cao hơn nữa. Có nhiều yếu tố cho thấy mùa altcoin đã bước vào giai... ...

Dogecoin tăng gần 20%: Cá mập âm thầm gom hàng, ETF sắp ra mắt tại Mỹ?

Tin tức Memecoin
5 giờ trước

Dogecoin tiếp tục duy trì đà phục hồi trong tuần này khi làn sóng tích lũy từ các tổ chức và kỳ vọng về một quỹ DOGE ETF tại Mỹ đã thúc đẩy sự hứng khởi của nhà đầu tư. Xu hướng mua vào quy mô lớn từ CleanCore Solutions... ...

Ethereum lập kỷ lục 12 triệu lượt gọi hợp đồng thông minh, nhắm mốc 5.200 USD

Tin tức Ethereum (ETH)
6 giờ trước

Theo báo cáo tuần thứ hai tháng 9 của CryptoQuant, đà tăng gần đây của Ethereum – từ khoảng 1.400 USD hồi tháng 4 lên sát 5.000 USD – diễn ra song song với việc các quỹ gia tăng phân bổ, cá voi tích lũy mạnh, lượng nạp lên sàn giảm,... ...

Xem thêm bài viết

Được đề cập trong bài viết

Chọn chế độ hiển thị:

Coin phổ biến

Công nghệ nhân bản giọng nói AI của Microsoft quá tốt nhưng có một nhược điểm

Chọn chế độ hiển thị: