Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Updated: 18/10/2024 at 11:26

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Bình luận
Mới cập nhật

Bản nâng cấp mạng mới nhất của Ethereum mang tên Pectra không chỉ mang đến những cải tiến mạnh mẽ về khả năng mở rộng và tính năng tài khoản thông minh, mà còn đánh dấu một bước tiến quan trọng trong quá trình phát triển của hệ sinh thái.... ...

Giới công nghệ ở Silicon Valley từ lâu đã xem Jack Dorsey là “Steve Jobs tiếp theo” bởi vì khả năng công nghệ của anh được đánh giá ngang hàng. X (trước đây là Twitter) đã làm thay đổi thế giới và công ty thanh toán Block của Dorsey (trước... ...

Bitcoin và Ethereum (ETH) đã nghiền nát các cược giảm giá, khiến gần 1 tỷ đô la bị thanh lý vào ngày 8/5, với 80% đến từ các vị thế Short. Đây là một ví dụ điển hình của Short Squeeze và hậu quả thì không mấy dễ chịu. Nhưng... ...

Bitcoin tiếp tục ghi dấu ấn với xu hướng tăng ấn tượng cho đến phiên đóng cửa tuần vào ngày 11 tháng 5, trong bối cảnh các nhà phân tích kỹ thuật đang tập trung vào những ngưỡng hỗ trợ then chốt nhằm bảo vệ đà tăng hiện tại. Trong... ...

Trong vài ngày qua, Ethereum phục hồi mạnh mẽ, tăng từ dưới 2.000 lên gần 2.700 đô la. Dù một phần mức tăng này có thể đến từ động lực chung của thị trường, ETH dường như đang chuẩn bị tiếp tục đà tăng hướng tới mốc 3.000 đô la... ...

Cardano – một trong những nền tảng blockchain hàng đầu thế giới – đang bước vào một chương phát triển hoàn toàn mới, đánh dấu bước chuyển mình quan trọng từ một hệ thống thận trọng, chặt chẽ sang một mô hình phát triển mở, linh hoạt và năng động... ...

Trong một phân tích kỹ thuật gần đây, Raoul Pal – CEO Global Macro – đã chia sẻ quan điểm lạc quan bất ngờ về Dogecoin, một meme coin vốn nổi tiếng với bản chất hài hước và cộng đồng sôi động. Theo Pal, Dogecoin đang thể hiện một mô... ...

Thị trường altcoin đang manh nha những tín hiệu breakout, báo hiệu một đợt tăng trưởng tiềm năng trong vài tháng tới. Một số nhà phân tích cho rằng altcoin có thể bước vào giai đoạn bùng nổ, với mức tăng giá hàng ngày ấn tượng. Nhà bình luận nổi... ...

Một chuyên gia phân tích tiền điện tử — người từng dự báo chính xác đợt điều chỉnh giá Bitcoin trước kỳ halving năm ngoái — hiện nhận định rằng thị trường đang bước vào giai đoạn cuối của chu kỳ tăng giá hiện tại. Chia sẻ với hơn 546.700... ...

Hedera (HBAR) đang thu hút sự chú ý trở lại trên thị trường khi altcoin này thể hiện đà phục hồi ấn tượng sau thời gian dài giao dịch trầm lắng. Trong sáu tuần qua, HBAR liên tục ghi nhận các phiên tăng giá đều đặn, đánh dấu mức cao... ...

Xem thêm bài viết
Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode