Trang chủ Trí tuệ nhân tạo (AI) Mô hình AI Gemini mới của Google đánh bại GPT-4o và Claude-3

Mô hình AI Gemini mới của Google đánh bại GPT-4o và Claude-3

Có một công cụ mới đứng đầu trong thế giới đánh giá trí tuệ nhân tạo (AI), đó là Gemini 1.5 Pro. 

ChatGPT-4o của OpenAI cuối cùng đã mất vị thế vô địch vào ngày 1 tháng 8 khi Google âm thầm ra mắt bản phát hành thử nghiệm của mô hình mới nhất.

Tuy nhiên, nó đã nhanh chóng thu hút sự chú ý của cộng đồng AI trên khắp các phương tiện truyền thông xã hội khi các báo cáo bắt đầu xuất hiện rằng nó đang vượt qua các đối thủ về điểm chuẩn.

Tiêu chuẩn trí tuệ nhân tạo

ChatGPT của OpenAI đã trở thành tiêu chuẩn cho AI tạo sinh kể từ khi ra mắt GPT-3. Mô hình mới nhất của nó, GPT-4o, và đối thủ cạnh tranh gần nhất của nó, Claude-3 của Anthropic, đã thống trị hầu hết các mô hình khác trong hầu hết các điểm chuẩn phổ biến trong khoảng một năm trở lại đây với rất ít sự cạnh tranh.

Nguồn: Large Model Systems Organization.

Một trong những tiêu chuẩn đánh giá phổ biến nhất được gọi là LMSYS Chatbot Arena. Nó kiểm tra các mô hình trên nhiều nhiệm vụ khác nhau và chỉ định điểm năng lực chung. GPT-4o nhận được điểm 1.286 trong khi Claude-3 đạt được điểm đáng nể là 1.271.

Phiên bản trước của Gemini 1.5 Pro đạt 1.261 điểm. Nhưng phiên bản thử nghiệm (Gemini 1.5 Pro 0801) phát hành vào ngày 1 tháng 8 đạt tới 1.300 điểm.

Điều này cho thấy nhìn chung nó có khả năng hơn so với các đối thủ cạnh tranh, nhưng điểm chuẩn không nhất thiết phản ánh chính xác những gì mô hình AI có thể và không thể làm.

Sự phấn khích của cộng đồng

Chúng ta dường như đang bước vào kỷ nguyên mà thị trường chatbot AI đã đủ trưởng thành để cung cấp nhiều lựa chọn. Cuối cùng, người dùng cuối sẽ quyết định mô hình AI nào phù hợp nhất với họ.

Đã có một làn sóng phấn khích về phiên bản mới nhất của Gemini khi người dùng trên mạng xã hội ca ngợi nó là “cực kỳ tốt”. Một Redditor thậm chí còn viết rằng nó “đã hoàn toàn vượt trội hơn GPT-4o”.

Hiện tại vẫn chưa rõ liệu phiên bản thử nghiệm của Gemini 1.5 Pro có trở thành phiên bản mặc định trong tương lai hay không. Mặc dù phiên bản này vẫn có sẵn tại thời điểm viết bài, nhưng việc phiên bản này đang trong giai đoạn phát hành hoặc thử nghiệm sớm cho thấy có khả năng bị hủy bỏ hoặc thay đổi vì lý do an toàn hoặc tinh chỉnh.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter: https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin 

Itadori

Theo Cointelegraph

MỚI CẬP NHẬT

Tòa án liên bang yêu cầu nhà sáng lập My Big Coin bồi thường 7,6 triệu đô la cho các nạn nhân

Tòa án liên bang yêu cầu nhà sáng lập My Big Coin bồi thường...

Một tòa án liên bang đã ra phán quyết buộc Randall Crater, cư trú tại Heathrow, Florida, phải bồi thường hơn 7,6 triệu USD...

Câu chuyện ‘ultra sound money’ của Ethereum đang mờ dần nhưng các số liệu...

Câu chuyện về 'ultra sound money' của Ethereum đã dần mất đi sự hấp dẫn trong thời gian gần đây. Sự gia tăng không...

Chủ tịch Fed tuyên bố không vội giảm lãi suất, ủng hộ quản lý...

Chủ tịch Cục Dự trữ Liên bang (Fed) Jerome Powell đã có những tuyên bố quan trọng trong phiên điều trần trước Ủy ban...

Chỉ số này cho thấy thợ đào Bitcoin đang đầu hàng: CryptoQuant

Các thợ đào Bitcoin hiện đang trải qua một giai đoạn cực kỳ khó khăn. Với giá trị của Bitcoin tiếp tục duy trì...
Nhà lập pháp Ukraine mong đợi đất nước sẽ hợp pháp hóa tiền điện tử vào mùa hè năm 2025

Nhà lập pháp Ukraine mong đợi đất nước sẽ hợp pháp hóa tiền điện...

Ukraine đang tiến gần hơn đến việc hợp pháp hóa tiền điện tử, với kế hoạch chính thức triển khai vào mùa hè năm...
ftt-tang

FTX Token (FTT) cho thấy sức mạnh dù thị trường tiền điện tử bốc...

FTX Token (FTT) đã trở thành tiền điện tử có hiệu suất tốt nhất trong ngày, bất chấp sự sụt giảm chung của thị...

Dự luật dự trữ Bitcoin chiến lược của Oklahoma đã được ủy ban tiểu...

Dennis Porter, đồng sáng lập Satoshi Action Fund, đã thông báo về việc Ủy ban Tiểu bang Oklahoma đã chính thức thông qua dự...
Nhiều memecoin có khả năng nằm ngoài phạm vi quyền hạn của SEC

Hester Peirce: Nhiều memecoin có khả năng nằm ngoài phạm vi quyền hạn của...

Ủy viên Hester Peirce cho rằng nhiều memecoin trên thị trường hiện nay có thể không nằm trong phạm vi quản lý của Ủy...

[QC] Đồng tiền 10.000x? Đối thủ Solana ra mắt Web3 Mobile trong đợt presale

 Coldware (COLD) đang gây chú ý trong không gian blockchain như một giao thức Layer-1 thế hệ mới tích hợp công nghệ Web3...

[QC] Dự đoán giá Coldware 2025: Liệu COLD có chạm mốc 5 USD trước...

Coldware (COLD) đang nổi lên như một trong những dự án blockchain tiềm năng nhất năm 2025, kết hợp độc đáo giữa tài...
Litecoin có thể thấy ETF được chấp thuận trước XRP, có thể phải cạnh tranh với Token thanh toán mới này

[QC] Litecoin có thể thấy ETF được chấp thuận trước XRP, có thể phải...

Giá tiền điện tử thay đổi nhanh chóng trong những ngày này. Một số token đang phải đối mặt với thời kỳ khó khăn...

Memecoin và AI giảm 50%, trong khi chỉ số Mỹ và DeFi ổn định

Theo các chỉ số GMCI, nhiều lĩnh vực trong thị trường crypto đã hoàn toàn mất đi mức tăng đạt được sau cuộc bầu...
Lạm phát giảm có thể kích hoạt một đợt tăng giá mới cho Bitcoin

Lạm phát giảm có thể kích hoạt một đợt tăng giá mới cho Bitcoin:...

Các nhà đầu tư trên thị trường tiền điện tử dự đoán không có sự thay đổi đáng kể trong Chỉ số Giá Tiêu...

Coinbase đạt doanh thu 2 tỷ USD, tăng 109% so với quý 4

Theo báo cáo ngày 11/2 của nhà nghiên cứu tài sản số Coin Metrics, Coinbase được dự đoán sẽ ghi nhận doanh thu khoảng...

Nhà lưu ký tiền điện tử BitGo cân nhắc IPO vào năm 2025

Công ty lưu ký tiền điện tử BitGo đang xem xét thực hiện đợt phát hành cổ phiếu lần đầu ra công chúng (IPO)...
Chúng tôi không thấy những tác động kinh tế vĩ mô đáng kể từ việc bán tháo tiền điện tử

Chủ tịch Fed Jerome Powell khẳng định sẽ không phát hành đồng đô la...

Chủ tịch Cục Dự trữ Liên bang (Fed), Jerome Powell, tuyên bố trước Thượng viện Mỹ rằng cơ quan này sẽ không phát hành...