Trang chủ Trí tuệ nhân tạo (AI) Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI...

Nvidia ra mắt mô hình AI mới, đánh bại GPT-4o của OpenAI trong các bài kiểm tra chuẩn

Nvidia đã gây bất ngờ khi ra mắt một mô hình trí tuệ nhân tạo (AI) mới vào ngày 15 tháng 10, được cho là vượt trội hơn các hệ thống AI hiện đại như GPT-4o và Claude-3.

Theo bài đăng trên X từ tài khoản Nvidia AI Developer, mô hình mới có tên Llama-3.1-Nemotron-70B-Instruct, được giới thiệu là “mô hình hàng đầu” trên Chatbot Arena của lmarena.AI.

Llama-3.1-Nemotron-70B-Instruct thực chất là phiên bản cải tiến của mô hình mã nguồn mở Llama-3.1-70B-Instruct từ Meta, với phần “Nemotron” trong tên phản ánh những đóng góp của Nvidia vào mô hình này. Tập hợp các mô hình AI Llama, như được gọi bởi Meta, đã tạo ra nền tảng nguồn mở cho các nhà phát triển.

Trong trường hợp của Nemotron, Nvidia đã thực hiện một thách thức lớn, phát triển một hệ thống được thiết kế để “hữu ích” hơn các mô hình nổi bật như ChatGPT của OpenAI và Claude-3 của Anthropic. Nvidia đã sử dụng các tập dữ liệu được tuyển chọn kỹ lưỡng, các phương pháp tinh chỉnh tiên tiến và phần cứng AI hiện đại để biến đổi mô hình gốc của Meta thành một sản phẩm có khả năng “hữu ích” nhất hiện nay.

Khi đánh giá mô hình AI, không có phương pháp khách quan nào để xác định cái nào là “tốt nhất”. Khác với các phép đo vật lý rõ ràng, hiệu suất của mô hình AI thường được đánh giá qua thử nghiệm so sánh. Các nhà phát triển và nhà nghiên cứu phải đánh giá hiệu quả của mô hình thông qua các thử thách tương tự nhau.

Đánh giá chuẩn AI thường bao gồm việc đưa ra các truy vấn hoặc nhiệm vụ tương tự cho các mô hình khác nhau và so sánh tính hữu ích của kết quả. Vì sự chủ quan trong việc xác định điều gì được coi là hữu ích, người giám sát thường được sử dụng để đánh giá hiệu suất qua các đánh giá mù*.

Trong trường hợp của Nemotron, Nvidia tuyên bố rằng mô hình mới này có thể vượt qua các đối thủ như GPT-4o và Claude-3. Mặc dù Llama-3.1-Nemotron-70B-Instruct chưa được liệt kê trong bảng xếp hạng cụ thể nào, nếu tuyên bố rằng nó đạt 85 điểm trong bài kiểm tra “Khó” trên Chatbot Arena là chính xác, thì nó sẽ đứng đầu trong lĩnh vực này.

Điều đáng chú ý là Llama-3.1-70B là một mô hình AI nguồn mở tầm trung từ Meta, trong khi phiên bản lớn hơn, Llama-3.1-405B, có số lượng tham số gấp nhiều lần. Đồng thời, GPT-4o được phát triển với hơn 1 nghìn tỷ tham số.

*Đánh giá mù là một phương pháp đánh giá trong đó người tham gia không biết thông tin cụ thể về các đối tượng hoặc mẫu mà họ đang đánh giá. Điều này giúp giảm thiểu thiên kiến và đảm bảo rằng các đánh giá được thực hiện một cách khách quan hơn.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Itadori

Theo Cointelegraph

MỚI CẬP NHẬT

Shock: Trader 23 tuổi tự sát trên sóng livestream để tạo meme coin

Một trader có biệt danh MistaFuccYou đã tự sát trực tiếp trên nền tảng X (trước đây là Twitter) vào tối thứ Sáu sau...
btc-nhu-cau-giam

Bitcoin sẽ biến động thế nào khi nhu cầu giảm xuống dưới ngưỡng quan...

Trong các phiên giao dịch gần đây, giá Bitcoin đã tăng lên trên $98.000, củng cố kỳ vọng về một xu hướng tăng tiếp...
Liệu 100 đô la trong FXGuys ($FXG), SUI hoặc PEPE có thể biến thành 10.000 đô la không

[QC] Liệu 100 đô la trong FXGuys ($FXG), SUI hoặc PEPE có thể biến...

Thị trường tiền điện tử nổi tiếng với việc biến những khoản đầu tư nhỏ thành khoản lợi nhuận khổng lồ. Nhưng liệu việc...

Bybit đối mặt làn sóng rút tiền 4 tỷ USD, CEO Ben Zhou thảo...

Sau vụ hack lớn nhất trong lịch sử ngành công nghiệp crypto vào ngày 21/2, Bybit đã chứng kiến hơn 4 tỷ USD bị...

Giá ARKM tăng 11% sau khi Arkham thông báo giao dịch tại 17 bang...

Arkham Intelligence, công ty phân tích dữ liệu và sàn giao dịch tiền điện tử, thông báo vào thứ Bảy rằng họ sẽ chính...
Blockchain

Những đột phá lớn tiếp theo của blockchain

Cứ mỗi bốn năm, vài tháng sau sự kiện halving của Bitcoin, hệ sinh thái blockchain lại thu hút sự chú ý đặc biệt...
Bybit trao thưởng 10% cho bất kỳ ai hỗ trợ khôi phục tiền từ vụ hack 1,4 tỷ đô la

Bybit trao thưởng 10% cho bất kỳ ai hỗ trợ khôi phục tiền từ...

Sau vụ tấn công sàn giao dịch nghiêm trọng nhất trong lịch sử tiền điện tử, sàn giao dịch Bybit có trụ sở tại...

mETH Protocol thu hồi 43 triệu USD cmETH từ vụ hack Bybit, không phải...

Giao thức tái ký quỹ thanh khoản của Mantle, mETH Protocol, thông báo vào thứ Bảy rằng họ đã thu hồi thành công 15.000...

Người đàn ông Ấn Độ bị bắt vì mua và phân phối ma túy...

Mới đây, một công dân Ấn Độ đã bị Cục Phòng chống Ma túy tại Gurugram, Haryana bắt giữ vì sử dụng tiền điện...
memecoin coin

Tài khoản X của lãnh đạo Myanmar bị hack để quảng bá coin giả

Các hacker có lẽ đã chiếm quyền điều khiển tài khoản X chính thức của nhà lãnh đạo quân sự Myanmar vào ngày thứ...
eth

Hacker Bybit trở thành holder ETH lớn thứ 14 thế giới

Hacker của Bybit, được cho là thực thể từ Triều Tiên, hiện đang là một trong những holder ETH lớn nhất thế giới. Điều...

Berachain (BERA) giảm 15% sau đợt tăng mạnh

Berachain (BERA) giảm gần 15% trong 24 giờ qua, với vốn hóa thị trường hiện tại là 770 triệu đô la, mặc dù giá...

Cuộc cạnh tranh giữa hai mạng blockchain Solana và Ethereum ngày càng hấp dẫn

Cuộc cạnh tranh giữa hai mạng blockchain Solana và Ethereum chưa bao giờ hấp dẫn đến vậy. Trong khi Solana, một nền tảng mới...

Mantle (MNT) giảm 12% sau khi vụ hack Bybit làm lung lay niềm tin...

Mantle (MNT) giảm gần 12% sau vụ hack Bybit, trong đó khoảng 174 triệu đô la cmETH – một coin trên Mantle cung cấp...

Chuyên gia trong ngành ca ngợi cách xử lý khủng hoảng của Bybit giữa...

Vào ngày 21 tháng 2, Bybit – một trong những sàn giao dịch hàng đầu thế giới – đã phải đối mặt với một...

Giá ADA sẽ sớm đạt 1 đô la? Nhà phân tích phát hiện tín...

Gần đây, nhà phân tích nổi tiếng Ali Martinez đã phân tích diễn biến giá của Cardano (ADA) và chỉ ra những dấu hiệu...