Trang chủ Trí tuệ nhân tạo (AI) Mô hình AI Gemini mới của Google đánh bại GPT-4o và Claude-3

Mô hình AI Gemini mới của Google đánh bại GPT-4o và Claude-3

Có một công cụ mới đứng đầu trong thế giới đánh giá trí tuệ nhân tạo (AI), đó là Gemini 1.5 Pro. 

ChatGPT-4o của OpenAI cuối cùng đã mất vị thế vô địch vào ngày 1 tháng 8 khi Google âm thầm ra mắt bản phát hành thử nghiệm của mô hình mới nhất.

Tuy nhiên, nó đã nhanh chóng thu hút sự chú ý của cộng đồng AI trên khắp các phương tiện truyền thông xã hội khi các báo cáo bắt đầu xuất hiện rằng nó đang vượt qua các đối thủ về điểm chuẩn.

Tiêu chuẩn trí tuệ nhân tạo

ChatGPT của OpenAI đã trở thành tiêu chuẩn cho AI tạo sinh kể từ khi ra mắt GPT-3. Mô hình mới nhất của nó, GPT-4o, và đối thủ cạnh tranh gần nhất của nó, Claude-3 của Anthropic, đã thống trị hầu hết các mô hình khác trong hầu hết các điểm chuẩn phổ biến trong khoảng một năm trở lại đây với rất ít sự cạnh tranh.

Nguồn: Large Model Systems Organization.

Một trong những tiêu chuẩn đánh giá phổ biến nhất được gọi là LMSYS Chatbot Arena. Nó kiểm tra các mô hình trên nhiều nhiệm vụ khác nhau và chỉ định điểm năng lực chung. GPT-4o nhận được điểm 1.286 trong khi Claude-3 đạt được điểm đáng nể là 1.271.

Phiên bản trước của Gemini 1.5 Pro đạt 1.261 điểm. Nhưng phiên bản thử nghiệm (Gemini 1.5 Pro 0801) phát hành vào ngày 1 tháng 8 đạt tới 1.300 điểm.

Điều này cho thấy nhìn chung nó có khả năng hơn so với các đối thủ cạnh tranh, nhưng điểm chuẩn không nhất thiết phản ánh chính xác những gì mô hình AI có thể và không thể làm.

Sự phấn khích của cộng đồng

Chúng ta dường như đang bước vào kỷ nguyên mà thị trường chatbot AI đã đủ trưởng thành để cung cấp nhiều lựa chọn. Cuối cùng, người dùng cuối sẽ quyết định mô hình AI nào phù hợp nhất với họ.

Đã có một làn sóng phấn khích về phiên bản mới nhất của Gemini khi người dùng trên mạng xã hội ca ngợi nó là “cực kỳ tốt”. Một Redditor thậm chí còn viết rằng nó “đã hoàn toàn vượt trội hơn GPT-4o”.

Hiện tại vẫn chưa rõ liệu phiên bản thử nghiệm của Gemini 1.5 Pro có trở thành phiên bản mặc định trong tương lai hay không. Mặc dù phiên bản này vẫn có sẵn tại thời điểm viết bài, nhưng việc phiên bản này đang trong giai đoạn phát hành hoặc thử nghiệm sớm cho thấy có khả năng bị hủy bỏ hoặc thay đổi vì lý do an toàn hoặc tinh chỉnh.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter: https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin 

Itadori

Theo Cointelegraph

MỚI CẬP NHẬT

Pi

Người dùng Pi Network chuyển sang bán tài khoản trong bối cảnh thời gian...

Một xu hướng ngày càng phổ biến trong cộng đồng người dùng Pi Network (Pioneer) là nhiều người quyết định bán toàn bộ tài...

Mùa altcoin đã chết khi Bitcoin ETF tạo nên cơn sóng mới?

Trong suốt nhiều năm qua, thị trường crypto đã duy trì một chu kỳ luân chuyển vốn có thể dự đoán được, trong đó...

StarkWare thành lập quỹ dự trữ BTC chiến lược, hướng tới mục tiêu thống...

StarkWare, công ty đứng sau công nghệ STARK proof giúp phát triển Starknet, vừa công bố việc thành lập "Quỹ dự trữ Bitcoin chiến...

TOP 3 altcoin thu hút được sự chú ý trong ngày hôm nay

Thị trường tiền điện tử tiếp tục chìm trong sắc đỏ, với tổng vốn hóa bốc hơi 57 tỷ USD trong ngày hôm nay...

Dự trữ stablecoin đạt kỷ lục nhưng altcoin vẫn gặp khó khăn – Tại...

Dự trữ stablecoin trên các sàn giao dịch thường được coi là chỉ báo quan trọng về sức mua của nhà đầu tư. Khi...

Ethereum đã chạm đáy chưa?

Token gốc của Ethereum vừa ghi nhận mức đóng cửa tuần thấp nhất kể từ tháng 11 năm 2023, cho thấy sự khó khăn của...

DeFi TVL giảm 49,6 tỷ đô la, xóa bỏ mức tăng kể từ cuộc...

Tổng giá trị bị khóa (TVL) trong các giao thức DeFi đã chứng kiến sự suy giảm mạnh mẽ kể từ khi Donald Trump...
pi

Dự báo giá Pi Coin ngày 11/3: Sẽ giảm 20%?

Thị trường crypto đang đối mặt với một giai đoạn khó khăn khác và các altcoin chịu tác động mạnh mẽ. Bitcoin cho thấy...

Tài khoản X của đồng sáng lập Meteora bị hack, đăng bài chỉ trích...

Vào ngày 11 tháng 3, tài khoản X của Ben Chow, một trong những nhà đồng sáng lập Meteora, đã bị xâm phạm và...

World Liberty Financial gần như đã bán hết token WLFI, nhưng danh mục đầu...

World Liberty Financial (WLFI), dự án DeFi được gia đình Trump hậu thuẫn, đang tiến gần đến việc hoàn thành giai đoạn cuối của...

Nhận thưởng nạp tiền 20% và vô vàn chương trình ưu đãi khác khi...

Trong thế giới giao dịch tiền điện tử sôi động, các chương trình thưởng và ưu đãi đóng vai trò quan trọng trong việc...
Doanh thu của Solana giảm 93%

Doanh thu của Solana giảm 93% so với mức cao nhất vào tháng 1...

Doanh thu và tổng giá trị bị khóa (TVL) trên mạng Solana đã ghi nhận sự sụt giảm nghiêm trọng trong hai tháng qua,...

Tin vắn Crypto 11/03: Bitcoin vẫn có thể giảm xuống dưới $80.000 một lần...

Từ nhận định Bitcoin vẫn có thể giảm xuống dưới $80.000 một lần nữa đến El Salvador ký thỏa thuận quản lý với Paraguay...

Binance tổ chức Bubblemaps TGE trên PancakeSwap, làm dấy lên đồn đoán về việc...

Binance vừa chính thức thông báo về việc tổ chức sự kiện tạo token (TGE) của Bubblemaps (BMT) trên PancakeSwap. Sự kiện này không chỉ...

Blockchain Base đối mặt với phản ứng dữ dội về việc quảng bá GrokCoin

Một cuộc tranh cãi gay gắt đã bùng nổ trong cộng đồng blockchain Base sau khi tài khoản X chính thức của layer 2...

Đạo luật GENIUS: Khung mới nhằm mục đích thúc đẩy Hoa Kỳ trở thành...

Thượng nghị sĩ Bill Hagerty, cùng với các đồng tài trợ Thượng nghị sĩ Tim Scott, Cynthia Lummis và Kirsten Gillibrand, đã trình bày...