Trang chủ Trí tuệ nhân tạo (AI) Mô hình AI Gemini mới của Google đánh bại GPT-4o và Claude-3

Mô hình AI Gemini mới của Google đánh bại GPT-4o và Claude-3

Có một công cụ mới đứng đầu trong thế giới đánh giá trí tuệ nhân tạo (AI), đó là Gemini 1.5 Pro. 

ChatGPT-4o của OpenAI cuối cùng đã mất vị thế vô địch vào ngày 1 tháng 8 khi Google âm thầm ra mắt bản phát hành thử nghiệm của mô hình mới nhất.

Tuy nhiên, nó đã nhanh chóng thu hút sự chú ý của cộng đồng AI trên khắp các phương tiện truyền thông xã hội khi các báo cáo bắt đầu xuất hiện rằng nó đang vượt qua các đối thủ về điểm chuẩn.

Tiêu chuẩn trí tuệ nhân tạo

ChatGPT của OpenAI đã trở thành tiêu chuẩn cho AI tạo sinh kể từ khi ra mắt GPT-3. Mô hình mới nhất của nó, GPT-4o, và đối thủ cạnh tranh gần nhất của nó, Claude-3 của Anthropic, đã thống trị hầu hết các mô hình khác trong hầu hết các điểm chuẩn phổ biến trong khoảng một năm trở lại đây với rất ít sự cạnh tranh.

Nguồn: Large Model Systems Organization.

Một trong những tiêu chuẩn đánh giá phổ biến nhất được gọi là LMSYS Chatbot Arena. Nó kiểm tra các mô hình trên nhiều nhiệm vụ khác nhau và chỉ định điểm năng lực chung. GPT-4o nhận được điểm 1.286 trong khi Claude-3 đạt được điểm đáng nể là 1.271.

Phiên bản trước của Gemini 1.5 Pro đạt 1.261 điểm. Nhưng phiên bản thử nghiệm (Gemini 1.5 Pro 0801) phát hành vào ngày 1 tháng 8 đạt tới 1.300 điểm.

Điều này cho thấy nhìn chung nó có khả năng hơn so với các đối thủ cạnh tranh, nhưng điểm chuẩn không nhất thiết phản ánh chính xác những gì mô hình AI có thể và không thể làm.

Sự phấn khích của cộng đồng

Chúng ta dường như đang bước vào kỷ nguyên mà thị trường chatbot AI đã đủ trưởng thành để cung cấp nhiều lựa chọn. Cuối cùng, người dùng cuối sẽ quyết định mô hình AI nào phù hợp nhất với họ.

Đã có một làn sóng phấn khích về phiên bản mới nhất của Gemini khi người dùng trên mạng xã hội ca ngợi nó là “cực kỳ tốt”. Một Redditor thậm chí còn viết rằng nó “đã hoàn toàn vượt trội hơn GPT-4o”.

Hiện tại vẫn chưa rõ liệu phiên bản thử nghiệm của Gemini 1.5 Pro có trở thành phiên bản mặc định trong tương lai hay không. Mặc dù phiên bản này vẫn có sẵn tại thời điểm viết bài, nhưng việc phiên bản này đang trong giai đoạn phát hành hoặc thử nghiệm sớm cho thấy có khả năng bị hủy bỏ hoặc thay đổi vì lý do an toàn hoặc tinh chỉnh.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter: https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin 

Itadori

Theo Cointelegraph

MỚI CẬP NHẬT

X đình chỉ tài khoản cho phép người dùng tạo memecoin chỉ bằng một...

Nền tảng truyền thông xã hội X của Elon Musk đã đình chỉ một tài khoản cho phép người dùng tạo memecoin chỉ bằng...

Cổ phiếu Coinbase tăng 3% khi giao dịch tiền điện tử trong quý 2...

Cổ phiếu Coinbase tăng 3,2% sau giờ làm việc sau khi công ty công bố kết quả kinh doanh quý 2 mới nhất -...
ESMA canh bao

EU cảnh báo về rủi ro tiền điện tử nước ngoài theo quy định...

Vào ngày 31 tháng 7, Cơ quan Giám sát Thị trường và Chứng khoán Châu Âu (ESMA) - cơ quan quản lý chịu trách...

[QC] Poodlana Huy Động $3,6 Triệu Chỉ Trong 14 Ngày: Xu Hướng Tiền Điện...

Với $3,6 triệu được huy động trong thời gian ngắn, Poodlana - đồng tiền điện tử lấy cảm hứng từ thời trang -...

Hiệu suất các cặp Bitcoin và tiền pháp định thể hiện những thách thức...

Phân tích các cặp giao dịch Bitcoin và tiền pháp định trên các sàn giao dịch tập trung thường cho thấy sự chênh lệch...
hack

Giao thức DeFi đã xóa một dòng code quan trọng dẫn đến vụ hack...

Giao thức DeFi Convergence đã xác nhận bị hack thông qua exploit (tấn công khai thác) hợp đồng thông minh vào ngày 1/8. Cụ thể,...

Galaxy Digital lỗ ròng 177 triệu USD trong quý 2 giữa tình hình thị...

Galaxy Digital báo cáo lỗ ròng 177 triệu USD trong quý 2, so với lãi ròng 1,6 triệu USD cùng kỳ năm ngoái. Trong khi...

Công ty khai thác Bitcoin Marathon Digital báo lỗ 200 triệu USD trong quý...

Công ty khai thác Bitcoin, Marathon Digital Holdings, đã báo cáo một khoản lỗ đáng kể trong quý hai năm nay, với lý do...

Bitlayer giới thiệu Track Pack, tối ưu hóa tiềm năng phát triển cho các...

Bitlayer, giải pháp Layer 2 đầu tiên của Bitcoin dựa trên BitVM, đã công bố ra mắt Bitlayer Track Pack, một bộ công cụ...
5-depin-coin-tang

Đây là 5 DePin coin có thể tăng vọt vào tháng 8

Các token hỗ trợ Mạng cơ sở hạ tầng vật lý phi tập trung (DePIN) đang nổi lên như những tài sản đáng chú...

25,78% nguồn cung token W của Wormhole sẽ được lưu hành sau lần mở...

Wormhole, một nền tảng cầu nối crosschain phổ biến, đã thông báo rằng họ sẽ phát hành thêm 6% token W vào ngày 3...

Người giữ Bitcoin dài hạn chốt lời thông minh hơn, biết tận dụng các...

Lợi nhuận thực tế của Bitcoin do người giữ dài hạn (LTH) và người giữ ngắn hạn (STH) cho thấy sự biến động đáng...

Block của Jack Dorsey chứng kiến doanh thu từ Bitcoin tăng 9% lên 2,6...

Tập đoàn thanh toán Block Inc. của Jack Dorsey đã công bố kết quả thu nhập trong quý 2 năm 2024, ghi nhận mức...
Tòa án Hàn Quốc đóng băng 176 triệu đô la của Do Kwon

Do Kwon sẽ bị dẫn độ về Hàn Quốc sau khi tòa phúc thẩm...

Đồng sáng lập Terraform Labs, Do Kwon, cuối cùng sẽ bị dẫn độ về Hàn Quốc sau quá trình pháp lý kéo dài hơn...

DWF Labs ra mắt stablecoin tổng hợp giữa sự tăng trưởng bùng nổ của...

DWF Labs, một công ty giao dịch crypto và tạo lập thị trường nổi tiếng, đang chuẩn bị tham gia vào lĩnh vực stablecoin...

Báo cáo thu nhập quý 2 của MicroStrategy cho thấy kho dự trữ Bitcoin...

Công ty phần mềm Mỹ MicroStrategy đã công bố báo cáo thu nhập quý 2 vào thứ năm, ghi nhận khoản lỗ ròng là 102,6 triệu...