Trang chủ Trí tuệ nhân tạo (AI) Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI...

Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

MỚI CẬP NHẬT

Aave

Khối lượng cho vay của Aave tăng gấp 3 lần so với đầu năm,...

Giao thức DeFi hàng đầu Aave đã đạt cột mốc đáng chú ý 10 tỷ đô la trong các khoản vay đang hoạt động,...
eth-stablecoin-thanh-khoan

Ethereum thống trị thanh khoản của stablecoin với thị phần hơn 52%

Mặc dù các blockchain như TRON và Solana đang tạo ra sự chú ý với các đợt phát hành stablecoin mới, nhưng Ethereum vẫn...

Tin vắn Crypto 21/11: Bitcoin có thể không chứng kiến ​​sự điều chỉnh cho...

Từ nhận định Bitcoin có thể không chứng kiến ​​sự điều chỉnh cho đến khi vượt mốc $100.000 đến BitGo ra mắt công ty...

Giá SUI giảm 11% khi blockchain Sui ngừng hoạt động hơn một giờ

Vào ngày 21 tháng 11, blockchain layer 1 Sui, được thiết kế nhằm triển khai các hợp đồng thông minh một cách nhanh chóng,...

Vốn hóa thị trường của Bitcoin tiến gần 2 nghìn tỷ USD, nhắm tới...

Vốn hóa thị trường của Bitcoin đã tăng vọt, với tài sản này đạt mức cao nhất mọi thời đại mới trong ngày hôm...

Bybit ra mắt 3 Launchpool mới là MORPHO, THRUST và MAJOR cho người dùng...

Sàn giao dịch Bybit đã công bố sự ra mắt 3 dự án Morpho (MORPHO), Thruster (THRUST) và Major (MAJOR) từ 17:00 ngày 21 tháng...

DOGE hay SHIB: ChatGPT Tiết Lộ Meme Coin Tốt Nhất Cho 2025!

Ngày càng nhiều nhà đầu tư crypto chuyển sang sử dụng ChatGPT để tìm ý tưởng giao dịch và định hướng chiến lược. Và...

Binance chứng kiến dòng ra mạnh mẽ buộc phải sử dụng quỹ dự trữ...

Những thông tin lan truyền trong cộng đồng gần đây chỉ ra rằng Binance đang đối mặt với làn sóng rút tiền quy mô...
hack-upbit-trieu-tien

Hàn Quốc xác nhận Triều Tiên đứng sau vụ hack Upbit trị giá 50...

Ngày 21/11, Cơ quan điều tra quốc gia Hàn Quốc đã xác nhận rằng vụ tấn công làm thất thoát 342.000 đồng Ether (ETH)...

SEC phân phối 4,6 triệu đô la cho các nhà đầu tư chịu thiệt...

Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC) đã chuyển 4,6 triệu đô la tiền bồi thường cho các nhà đầu tư...
MoonPay phá vỡ kỷ lục tháng 11 năm 2023 về giao dịch Solana trong một ngày

MoonPay phá vỡ kỷ lục giao dịch Solana trong một ngày

Vào ngày 19 tháng 11, cổng thanh toán tiền điện tử MoonPay thông báo rằng số lượng giao dịch Solana (SOL) của họ trong...

Pepe Unchained Gây Sốt: Thu Về Hơn 3,5 Triệu Đô La Trong Tuần Qua,...

 Tháng 11 tiếp tục mang đến những bất ngờ thú vị cho những nhà đầu tư biết nắm bắt cơ hội trong thị trường...
eth-btc-giam

Bitcoin vượt $97.000, đẩy ETH/BTC xuống mức thấp nhất kể từ tháng 3 năm...

Tỷ lệ ETH/BTC đã giảm 1,54% trong 24 giờ qua và hiện đang giao dịch ở mức 0,032. Kể từ đầu năm 2024, chỉ...

Nhật Bản sẽ nới lỏng thuế tiền điện tử theo gói kích thích mới

Nhật Bản đang thúc đẩy một gói kích thích kinh tế mang tính đột phá, bao gồm các cải cách đáng kể về quy...

Giá trị công ty xAI của Elon Musk hiện đạt 50 tỷ USD sau...

Nhà phát triển Grok, xAI, vừa huy động thành công 5 tỷ USD trong vòng gọi vốn mới, nâng giá trị công ty lên...

[QC] Không Có Trần Cho Những Meme Coin SOL Tốt Nhất? Nhà Đầu Tư...

Lĩnh vực meme coin trên Solana rải đầy những câu chuyện về người nghèo trở thành giàu có đối với những nhà đầu...