Trang chủ Trí tuệ nhân tạo (AI) Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI...

Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

MỚI CẬP NHẬT

Giá hash Bitcoin tăng vọt lên mức cao nhất trong hai tháng, thúc đẩy...

Theo dữ liệu từ Hashrate Index, giá hash của Bitcoin đã đạt mức cao nhất trong hai tháng, vượt qua 50 đô la lần...

Memecoin đã giúp doanh thu của Tron đạt mức cao mới trong quý 3:...

Nền tảng memecoin SunPump của Tron đã giúp doanh thu quý III của blockchain này đạt mức kỷ lục 151,2 triệu đô la, tăng...

Hai nhà xây dựng đã sản xuất 88% block Ethereum vào tháng 10 làm...

Hai nhà xây dựng block Ethereum đã tạo ra phần lớn số block trong hai tuần đầu tháng 10, dẫn đến những lo ngại...

Síp tạm dừng nhận đơn đăng ký tiền điện tử để chuẩn bị cho...

Liên minh Châu Âu sẽ chuyển từ hệ thống luật quốc gia về các nhà cung cấp dịch vụ tài sản tiền điện tử...

Gia đình Trump nhận 75% doanh thu ròng của World Liberty Financial mà không...

Dự án tiền điện tử của Donald Trump, World Liberty Financial (WLF), vừa công bố một tài liệu dài 13 trang vào thứ Năm,...

Trang web Ambient Finance bị hack, nhóm cảnh báo người dùng chờ sửa lỗi

Giao diện đầu cuối của Ambient Finance, một giao thức giao dịch phi tập trung, đã bị xâm phạm vào ngày 17 tháng 10....

Khối lượng Polymarket vượt 2 tỷ đô la với Trump dẫn đầu các cược...

Nền tảng dự đoán phi tập trung Polymarket đã chính thức vượt mốc 2 tỷ đô la tổng khối lượng giao dịch cho cuộc...

SEC chính thức nộp Biểu mẫu C kháng cáo phán quyết Ripple

Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC) đã chính thức nộp Biểu mẫu C nhằm kháng cáo phán quyết trong vụ...

Giá Coin hôm nay 18/10: Bitcoin chỉ còn cách ATH chưa tới 9%, altcoin...

Giá Bitcoin gần đây đã tăng mạnh, đạt mức cao nhất trong gần ba tháng, chỉ cách mức cao nhất mọi thời đại (ATH)...

Kẻ hack tài khoản X của SEC để phát tán tin phê duyệt Bitcoin...

Cục Điều tra Liên bang Hoa Kỳ (FBI) vừa bắt giữ Eric Council Jr., 25 tuổi, đến từ Athens, Alabama, người bị cáo buộc...

Montenegro sẽ hoàn tất việc dẫn độ Do Kwon vào cuối tuần

Bộ trưởng Tư pháp Montenegro, Bojan Božović, đã xác nhận rằng quyết định dẫn độ Do Kwon, đồng sáng lập Terraform Labs, đã được...

Giá WLD giảm 5% khi Worldcoin đổi tên thành “World”, ra mắt Layer 2...

Công ty xác minh danh tính dựa trên công nghệ blockchain, trước đây mang tên Worldcoin, đã chính thức đổi tên thành "World". Nhà...

Shiba Inu khẳng định vị thế trong thị trường Memecoin, Cutoshi hướng tới tăng...

 Shiba Inu (SHIB) tiếp tục khẳng định vị thế của mình như một trong những đồng tiền điện tử meme hấp dẫn nhất trên...

USDT của Tether đạt 330 triệu ví và tài khoản onchain tính đến Q3

Tether, công ty đứng sau stablecoin USDT, đã thông báo rằng khoảng 330 triệu ví và tài khoản onchain đã nhận được tài sản...
tiền điện tử

Chainalysis: Tiền điện tử phát triển mạnh ở Ukraine bị chiến tranh tàn phá...

Chainalysis tiết lộ Đông Âu đang ghi nhận ​​hoạt động DeFi gia tăng, chủ yếu do Ukraine và Nga thống trị. Ukraine và Nga xếp...
token hoa RWA

Lĩnh vực token hóa RWA có thể tăng trưởng gấp 50 lần vào năm...

Lĩnh vực token hóa tài sản trong thế giới thực (RWA) đã có một năm đột phá vào 2024, mở đường cho sự phát...