Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Updated: 18/10/2024 at 11:26

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Bình luận
Mới cập nhật

Giá Bitcoin hiện giao dịch thấp hơn 5,9% so với mức cao nhất mọi thời đại 111.970 đô la, trong bối cảnh các trader cảnh báo về nguy cơ xảy ra “đợt điều chỉnh sâu hơn” trong tháng 6, với mốc 100.000 đô la trở thành ngưỡng hỗ trợ tâm... ...

Cộng đồng Pi Network hiện đang đối mặt với một tình huống đầy căng thẳng khi người dùng báo cáo về một yêu cầu di chuyển mới đột ngột xuất hiện trong ứng dụng của họ. Điều này đã dẫn đến sự tức giận và bối rối trong cộng đồng,... ...

Các memecoin đang đối mặt với những tín hiệu trái chiều giống như phần còn lại của thị trường, trong khi chờ đợi một chất xúc tác tăng giá rõ ràng. Tuy nhiên, Dogwifhat (WIF) lại cho thấy không phải memecoin nào cũng cần động lực lớn để bứt phá —... ...

Ethereum (ETH) là nền tảng blockchain nổi tiếng với khả năng xây dựng hợp đồng thông minh và ứng dụng phi tập trung (DApps). Để tiếp tục cải thiện trải nghiệm người dùng và bảo mật, Ethereum đã giới thiệu bản nâng cấp mới nhất mang tên Pectra, với một... ...

Theo các chuyên gia phân tích, Bitcoin đang đối mặt với khả năng xảy ra một đợt bán tháo và xả hàng lớn trước khi có thể tiếp tục đà tăng giá mạnh mẽ. Một trong những nhân vật đáng chú ý trong cộng đồng phân tích thị trường, nhà... ...

Kể từ đầu tháng 4, sự phục hồi của thị trường tài sản kỹ thuật số đã đi kèm với một sự chuyển dịch đáng kể về hoạt động giao dịch, khi giờ giao dịch châu Á mở rộng thị phần trong khối lượng giao dịch giao ngay Bitcoin (BTC),... ...

Dogecoin (DOGE) đã duy trì sự ổn định dưới mức 0,2 đô la kể từ thứ Bảy, thiết lập một phạm vi giao dịch ngắn hạn với mức hỗ trợ tại 0,186 đô la. Đồng tiền này đã chạm đáy trong đợt giảm giá tuần trước và phá vỡ mức... ...

Tín hiệu fractal vàng cổ vũ đà tăng giá ETH Một mô hình fractal kéo dài nhiều năm từ vàng đang tạo ra luận điểm vững chắc cho khả năng ETH tăng vọt lên mức 6.000 đô la trong những tháng tới. Phân tích song song biểu đồ giá giữa... ...

Bitcoin (BTC) đã chứng kiến sự trở lại của biến động mạnh mẽ sau khi đạt mức cao kỷ lục mới. Giá BTC tăng từ khoảng $74.500 vào tháng 4 lên gần $111.900 trong tháng 5, đánh dấu một đợt tăng giá theo hình parabol. Tuy nhiên, đà tăng này... ...

Cổ phiếu của Classover Holdings Inc., công ty công nghệ giáo dục niêm yết trên sàn Nasdaq, đã tăng mạnh 39,85% trong phiên giao dịch ngày thứ Hai sau khi công ty thông báo kế hoạch huy động tối đa 500 triệu USD để xây dựng ngân quỹ doanh nghiệp... ...

Xem thêm bài viết
Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode