Trang chủ Trí tuệ nhân tạo (AI) Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI...

Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

MỚI CẬP NHẬT

MicroStrategy-bong-bong-bitcoin

MicroStrategy có tạo nên bong bóng Bitcoin không?

Chiến lược mua Bitcoin (BTC) của MicroStrategy đã thu hút sự chú ý từ các nhà đầu tư, nhưng liệu nó có khả thi...

Quai Network ra mắt testnet cuối cùng với phần thưởng 10 triệu token QUAI

Quai Network đã chính thức ra mắt testnet cuối cùng, đánh dấu bước tiến quan trọng trong quá trình phát triển của nền tảng....

Solana vượt $260 để đạt mức giá cao nhất mọi thời đại mới sau...

Sau ba năm dài, Solana đã chính thức vượt qua mức giá cao nhất mọi thời đại, thiết lập cột mốc mới trên 260 USD...

CEO Galaxy Digital cho rằng việc Bitcoin đạt $100.000 chỉ là “mới bắt đầu”

Mike Novogratz, CEO của Galaxy Digital, tin rằng mức giá $100.000 của Bitcoin chỉ mới là "bắt đầu" đối với vua tiền điện tử...
rektcoin-aidrop-chay-hang

Rekt Coin ra mắt cùng airdrop sau khi Rekt Drink cháy hàng

Rekt Brands vừa thông báo rằng token của họ, REKT, sẽ chính thức ra mắt vào lúc 17 giờ chiều thứ Sáu (giờ Việt...

Dự đoán giá Cardano (ADA) cho tháng 11 năm 2024

Bên cạnh mức tăng ấn tượng gần 50% trong tuần qua để quay lại Top 10 đồng coin lớn nhất thị trường, Cardano (ADA) đang...

Hội đồng cố vấn tiền điện tử do Trump đề xuất có thể thành...

Hội đồng Cố vấn Tiền điện tử do Tổng thống đắc cử Donald Trump đề xuất có thể thành lập một quỹ dự trữ...

Giá Coin hôm nay 22/11: Bitcoin lập đỉnh mới trên $99.000, altcoin và phố...

Bitcoin tiếp tục lập đỉnh mới tại $99.014 sau khi tăng vọt hơn 4% trong ngày hôm qua. Chứng khoán Mỹ Hợp đồng futures trên thị...

FTX kỳ vọng kế hoạch tái cấu trúc sẽ có hiệu lực vào tháng...

Sàn giao dịch FTX, sau khi nộp đơn xin phá sản vào năm 2022, hôm nay thông báo rằng kế hoạch tái cấu trúc...

SEC đang tham gia với các đơn vị đăng ký ETF Solana

Triển vọng cho các quỹ ETF Solana giao ngay đang có những bước tiến đáng kể, khi Ủy ban Chứng khoán và Giao dịch...
MicroStrategy hoàn tất việc huy động 3 tỷ đô la để mua thêm Bitcoin khi MSTR giảm 25%

MicroStrategy hoàn tất việc huy động 3 tỷ đô la để mua thêm Bitcoin

MicroStrategy (MSTR) hoàn tất đợt phát hành trái phiếu chuyển đổi 3 tỷ USD với lãi suất 0%, đáo hạn vào tháng 12/2029, dự...

Tài sản ròng của các quỹ Bitcoin ETF tại Hoa Kỳ chính thức vượt...

Các quỹ Bitcoin ETF của Hoa Kỳ đã phá vỡ 100 tỷ đô la tài sản ròng lần đầu tiên vào ngày 21 tháng...

47 tỷ USD BTC có thể chảy vào Bitcoin L2 vào năm 2030 –...

Bộ phận nghiên cứu của Galaxy Digital ước tính rằng khoảng 47 tỷ USD thanh khoản Bitcoin có thể được chuyển vào mạng lưới...

Chỉ số memecoin tăng vọt khi các đợt niêm yết mới tiếp tục thúc...

Lĩnh vực memecoin dẫn đầu đà tăng trưởng thị trường trong tuần qua giữa xu hướng tăng giá rộng rãi. Chỉ số GMMEME, tăng 3,94%,...

Chủ tịch SEC Gary Gensler chính thức thông báo sẽ từ chức

Chủ tịch Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC) Gary Gensler, nổi tiếng với lập trường cứng rắn về quy định...
hack

Hoa Kỳ buộc tội 5 thủ phạm trong âm mưu hack 11 triệu đô...

Các công tố viên Hoa Kỳ vừa buộc tội 5 người thuộc một nhóm tội phạm đã tham gia hack hàng chục doanh nghiệp...