Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Updated: 18/10/2024 at 11:26

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Bình luận
Mới cập nhật

Giá Aptos (APT) đã ghi nhận cú bật mạnh mẽ trong tuần đầu tháng 8, đánh dấu sự trở lại sau giai đoạn điều chỉnh sâu trước đó. Vấn đề được giới đầu tư quan tâm lúc này là liệu APT có thể duy trì động lực để thoát khỏi... ...

Giao thức Pendle vừa ra mắt nền tảng giao dịch lợi suất mới mang tên Boros, cho phép nhà giao dịch đặt vị thế long hoặc short đối với lãi suất funding. Từ khi triển khai, Boros đã nhanh chóng thu hút lượng tiền gửi và hoạt động giao dịch... ...

Trong tuần qua, giá Solana (SOL) đã bứt phá mạnh mẽ, tăng 10% nhờ làn sóng lạc quan lan tỏa khắp thị trường tiền điện tử. Sự trở lại của niềm tin đã trở thành động lực thúc đẩy SOL tiếp tục leo dốc, và với đà tăng đang được... ...

Ethereum (ETH) đang thu hút sự chú ý của các nhà đầu tư khi vượt mốc 4.000 USD lần đầu tiên kể từ cuối năm 2024, với những dự đoán giá cực kỳ lạc quan đang gia tăng. Phân tích mới từ trader nổi tiếng Merlijn cho thấy ETH/USD đang... ...

Theo bảng giá của Tạp Chí Bitcoin, Bitcoin giảm nhẹ 0,11% trong 24 giờ qua xuống 116.700 USD, nhưng vẫn tăng 25% từ đầu năm đến nay, chỉ xếp sau mức tăng 29,3% của vàng trong nhóm các loại tài sản lớn, theo thống kê từ chiến lược gia tài... ...

Bitcoin (BTC) đã trải qua giai đoạn tích lũy trong vài tuần qua, và các nhà phân tích cho rằng đây là thời điểm lý tưởng để tiếp tục gia tăng nắm giữ tài sản tiền điện tử này. Một báo cáo từ công ty phân tích thị trường CryptoQuant... ...

Đợt tăng giá của Ethereum (ETH) vượt mốc 4.000 đô la đã kích hoạt làn sóng thanh lý vị thế Short đáng kể, phản ánh nhu cầu ngày càng mạnh mẽ đối với altcoin hàng đầu. Dữ liệu on-chain cho thấy sự quan tâm và tích lũy đang hồi phục,... ...

Sau tuần trước với hiệu suất ảm đạm trên toàn thị trường crypto, hoạt động giao dịch sôi động đã trở lại trong tuần này. Đà phục hồi mới được phản ánh qua mức tăng 6% vốn hóa thị trường crypto toàn cầu trong 7 ngày qua. Các nhà đầu... ...

Bitcoin được giao dịch lần cuối ở mức 120.000 đô la vào ngày 23/7, khiến các trader đặt câu hỏi liệu mức cao nhất mọi thời đại (ATH) mới có còn khả thi trong năm nay hay không? Sự bất ổn kinh tế toàn cầu và tính bền vững của... ...

Khi thị trường crypto toàn cầu dần phục hồi sau một giai đoạn điều chỉnh kéo dài, tâm lý lạc quan đang quay trở lại với các nhà đầu tư. Nhiều chuyên gia phân tích nhận định rằng một mùa altcoin — thời điểm các đồng tiền điện tử ngoài... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode