Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Updated: 18/10/2024 at 11:26

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Bình luận
Mới cập nhật

Ethereum (ETH) duy trì giao dịch quanh mốc 4.300 USD vào thứ Hai, sau khi thị trường chứng kiến gần 8 tỷ USD dòng vốn đổ vào. Đáng chú ý, có tới 4 tỷ USD được xoay vòng từ các cá voi Bitcoin, cùng 3,95 tỷ USD rót vào các... ...

Tháng 8 đã chứng kiến làn sóng bán tháo trên toàn thị trường crypto, sau đợt tăng trưởng trong tháng 7 đưa nhiều tài sản lên mức đỉnh giá mới. Tuy nhiên, trong khi tâm lý nhà đầu tư nhỏ lẻ hạ nhiệt, những holder lớn lại coi đợt giảm... ...

Trong vòng 24 giờ qua, Ethena (ENA) đã ghi nhận mức giảm 7,75%, xóa gần một nửa mức tăng 15% mà đồng coin này đạt được trong 30 ngày trước đó. Đáng chú ý, các “Smart Money” – những nhà đầu tư thông minh – lại âm thầm gia tăng... ...

Trong vài tháng gần đây, Shiba Inu (SHIB) gần như không có biến động đáng kể. Trong 3 tháng qua, memecoin này chỉ tăng vỏn vẹn 0,09%, gần như đi ngang trong khi nhiều dự án crypto vốn hóa lớn khác lại bật tăng. Vào thời điểm hiện tại, SHIB... ...

Ethereum Foundation thông báo mạng thử nghiệm Holešky đang bước vào giai đoạn cuối cùng và sẽ chính thức ngừng hoạt động hai tuần sau khi bản nâng cấp Fusaka hoàn tất. Theo Foundation, sự hỗ trợ từ các nhóm phát triển client, nhóm thử nghiệm và nhà cung cấp... ...

Một thực thể liên quan đến gia đình Tổng thống Mỹ Donald Trump hiện đang nắm giữ lượng token quản trị trị giá khoảng 5 tỷ USD của World Liberty Financial (WLFI) sau đợt mở khóa lớn vào ngày thứ Hai. Theo thông tin trên website của World Liberty Financial,... ...

Bitcoin đã giao dịch trong biên độ hẹp 2,3% kể từ khi giảm mạnh từ 112.500 đô la vào thứ Sáu. Sự thiếu động lực này phần nào có thể được lý giải bởi việc các thị trường được quản lý đóng cửa để nghỉ lễ Ngày Lao động tại... ...

Nền tảng phân tích tâm lý thị trường tiền điện tử Santiment vừa công bố một báo cáo cho thấy các đề cập “buy the dip” trên mạng xã hội đang tăng mạnh, báo hiệu khả năng tiếp tục giảm giá. Santiment nhận định, một đáy thực sự chỉ xuất... ...

XRP đã tiếp tục mở rộng mức lỗ từ đợt bán tháo mạnh mẽ diễn ra vào tuần trước. Giá đã giảm 2,9% trong 24 giờ qua, hiện đang giao dịch ở mức 2,75 USD. Tâm lý thận trọng trong thị trường tiền điện tử rộng lớn hơn cùng với... ...

Tính đến tháng 8 năm 2025, dữ liệu on-chain cho thấy top 10 holder kiểm soát khoảng 83,9 triệu ETH, tương đương với khoảng 70% tổng cung lưu hành. Điều này đã dấy lên câu hỏi trong cộng đồng: Ai thực sự nắm giữ phần lớn ETH? Câu trả lời... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode