Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Updated: 18/10/2024 at 11:26

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Bình luận
Mới cập nhật

TRON (TRX) đã hai lần đóng phiên giao dịch hàng ngày trên mức 0,274 đô la trong mười ngày qua. Cả hai lần, giá đều đã điều chỉnh trở lại mức hỗ trợ 0,266 đô la. Phe bò và phe gấu đang tranh giành quyền kiểm soát vùng đỉnh phạm... ...

Ba ngày trước, Uniswap (UNI) đã nỗ lực bứt phá khỏi kênh giá song song, ghi nhận mức đỉnh cục bộ ấn tượng tại 7,6 đô la. Tuy nhiên, đà tăng nhanh chóng bị chặn lại bởi áp lực bán mạnh mẽ. Đợt điều chỉnh sau đó đẩy giá xuống... ...

Bitcoin đã tìm cách bảo toàn mức ATH trong năm 2024 vào ngày 1 tháng 6 sau khi nến hàng tháng đóng cửa mang lại mức tăng 11%. Bitcoin phát tín hiệu điều chỉnh Dữ liệu từ Tạp chí Bitcoin và TradingView cho thấy BTC/USD đang cố gắng lấy lại... ...

Khi làn sóng biến động quay trở lại thị trường và các token vốn hóa lớn bắt đầu hụt hơi, Cardano (ADA) và TRON ((TRX) đang lặng lẽ chiếm lĩnh vị thế như những ứng viên tiềm năng cho đợt bứt phá tiếp theo. Chỉ số SOPR của TRON hiện... ...

Thị trường crypto đã chính thức khép lại tuần cuối cùng của nửa đầu năm với những biến động dữ dội. Mặc cho tâm lý nhà đầu tư vẫn bị đè nặng bởi các yếu tố FUD vĩ mô, làn sóng điều chỉnh rộng trên thị trường dường như chưa... ...

Đợt tăng giá của Ethereum vào tháng 5 đã khơi dậy lại sự quan tâm của các nhà đầu tư đối với các quỹ ETH ETF. Trong 31 ngày, dòng vốn đổ vào các sản phẩm đầu tư này đã vượt quá 550 triệu USD, đánh dấu dòng tiền ròng... ...

Giá Bitcoin (BTC) tiếp tục bị kìm chân dưới ngưỡng $105.000 suốt cuối tuần qua, cho thấy lực bán vẫn đang chiếm thế thượng phong trên thị trường. Trong một báo cáo mới nhất, CryptoQuant nhận định rằng “một số chỉ báo về nhu cầu đối với Bitcoin có thể... ...

Theo truyền thông địa phương, các công tố viên Pháp đã truy tố 25 nghi phạm, trong độ tuổi từ 16 đến 23, liên quan đến loạt vụ tấn công bạo lực nhắm vào những người giàu có trong lĩnh vực tiền điện tử. Cuộc điều tra tập trung vào... ...

Khi giá Bitcoin đang trong giai đoạn tích lũy sau mức đỉnh lịch sử (ATH), sức mạnh tính toán của mạng lưới đã vươn tới một cột mốc chưa từng có: chạm đỉnh 943 exahash mỗi giây (EH/s). Theo dữ liệu trung bình động đơn giản (SMA) 7 ngày, hashrate... ...

Chiến lược gia tiền điện tử Justin Bennett tin rằng đợt thoái lui hiện tại của Bitcoin đang thiết lập cho một động thái đạt mức cao nhất mọi thời đại (ATH) mới. Justin Bennett nói với 115.000 người theo dõi của mình trên nền tảng truyền thông xã hội... ...

Xem thêm bài viết
Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode