Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Updated: 18/10/2024 at 11:26

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Bình luận
Mới cập nhật

Theo CEO của Xapo Bank, Seamus Rocca, chu kỳ thị trường Bitcoin bốn năm, trong đó diễn ra quá trình hình thành các mức cao nhất mọi thời đại tiếp theo là những điều chỉnh sâu, vẫn chưa bị đánh bại, bất chấp niềm tin rộng rãi rằng nó đã... ...

Sau 18 tháng sụt giảm mạnh về quy mô tài sản stablecoin trên toàn cầu, việc ứng dụng stablecoin đang tăng tốc trở lại. Galaxy Ventures cho rằng có ba động lực dài hạn chính dẫn đến sự phục hồi này: Stablecoin được sử dụng như công cụ tiết kiệm... ...

Tính đến thời điểm hiện tại trong năm 2025, Hoa Kỳ đã thu được tổng cộng 113 tỷ USD từ thuế quan, đánh dấu mức tăng 86% so với năm trước. Chỉ riêng trong tháng 6, chính phủ đã thu khoảng 27 tỷ USD, dẫn đến một thặng dư ngân... ...

Nền tảng phát hành memecoin Pump.fun đã huy động thành công 500 triệu USD trong một đợt ICO vào thứ Bảy, chỉ trong vòng khoảng 12 phút đã bán hết số lượng token. Token PUMP có tổng cung tối đa là 1 nghìn tỷ, trong đó 33% được phân bổ... ...

Bitcoin, đồng tiền kỹ thuật số đầu tiên và cũng là “vàng kỹ thuật số” nổi bật nhất trong thế giới crypto, luôn được biết đến với đặc điểm giới hạn cứng (hardcap) 21 triệu đồng, điều này tạo ra sự hấp dẫn đặc biệt. Tuy nhiên, vào năm 2025,... ...

Bitcoin đã chính thức vượt qua mức 118.000 USD, đánh dấu một cột mốc cao nhất mọi thời đại mới và gây chấn động giới đầu tư tiền điện tử toàn cầu. Sự bứt phá này không chỉ là dấu hiệu của sự phục hồi mạnh mẽ mà còn mở... ...

Nhà đồng sáng lập và cựu CEO của Binance, Changpeng Zhao (CZ), đã mạnh mẽ bác bỏ các báo cáo gần đây từ Bloomberg, trong đó cho rằng ông có mối liên hệ với một đồng stablecoin mang tên USD1, do World Liberty Financial (WLF) phát hành — một công... ...

Dù truyền thông thường nhấn mạnh đến “phi đô la hóa” (de-dollarization), thực tế thì nhu cầu sử dụng đồng đô la Mỹ trên toàn cầu đang tăng mạnh chưa từng thấy. Hơn 4 tỷ người và hàng triệu doanh nghiệp đang tìm cách tiếp cận USD thông qua stablecoin... ...

[Bài viết Quảng Cáo] Khi thị trường tài chính kỹ thuật số tiếp tục phát triển và định hình lại cuộc sống hàng ngày, mọi người trên toàn thế giới đang có cơ hội tự đưa ra quyết định đầu tư — bao gồm việc tham gia vào các nền... ...

Vào thời điểm viết bài, Bitcoin đang giao dịch ở mức 118.158 USD, sau khi đạt mức cao nhất mọi thời đại mới là 118.856 USD vào hôm qua. Cột mốc này một lần nữa khẳng định sự lạc quan trong cộng đồng đầu tư, khi tâm lý tích cực... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode