Trang chủ Trí tuệ nhân tạo (AI) Mô hình AI Gemini mới của Google đánh bại GPT-4o và Claude-3

Mô hình AI Gemini mới của Google đánh bại GPT-4o và Claude-3

Có một công cụ mới đứng đầu trong thế giới đánh giá trí tuệ nhân tạo (AI), đó là Gemini 1.5 Pro. 

ChatGPT-4o của OpenAI cuối cùng đã mất vị thế vô địch vào ngày 1 tháng 8 khi Google âm thầm ra mắt bản phát hành thử nghiệm của mô hình mới nhất.

Tuy nhiên, nó đã nhanh chóng thu hút sự chú ý của cộng đồng AI trên khắp các phương tiện truyền thông xã hội khi các báo cáo bắt đầu xuất hiện rằng nó đang vượt qua các đối thủ về điểm chuẩn.

Tiêu chuẩn trí tuệ nhân tạo

ChatGPT của OpenAI đã trở thành tiêu chuẩn cho AI tạo sinh kể từ khi ra mắt GPT-3. Mô hình mới nhất của nó, GPT-4o, và đối thủ cạnh tranh gần nhất của nó, Claude-3 của Anthropic, đã thống trị hầu hết các mô hình khác trong hầu hết các điểm chuẩn phổ biến trong khoảng một năm trở lại đây với rất ít sự cạnh tranh.

Nguồn: Large Model Systems Organization.

Một trong những tiêu chuẩn đánh giá phổ biến nhất được gọi là LMSYS Chatbot Arena. Nó kiểm tra các mô hình trên nhiều nhiệm vụ khác nhau và chỉ định điểm năng lực chung. GPT-4o nhận được điểm 1.286 trong khi Claude-3 đạt được điểm đáng nể là 1.271.

Phiên bản trước của Gemini 1.5 Pro đạt 1.261 điểm. Nhưng phiên bản thử nghiệm (Gemini 1.5 Pro 0801) phát hành vào ngày 1 tháng 8 đạt tới 1.300 điểm.

Điều này cho thấy nhìn chung nó có khả năng hơn so với các đối thủ cạnh tranh, nhưng điểm chuẩn không nhất thiết phản ánh chính xác những gì mô hình AI có thể và không thể làm.

Sự phấn khích của cộng đồng

Chúng ta dường như đang bước vào kỷ nguyên mà thị trường chatbot AI đã đủ trưởng thành để cung cấp nhiều lựa chọn. Cuối cùng, người dùng cuối sẽ quyết định mô hình AI nào phù hợp nhất với họ.

Đã có một làn sóng phấn khích về phiên bản mới nhất của Gemini khi người dùng trên mạng xã hội ca ngợi nó là “cực kỳ tốt”. Một Redditor thậm chí còn viết rằng nó “đã hoàn toàn vượt trội hơn GPT-4o”.

Hiện tại vẫn chưa rõ liệu phiên bản thử nghiệm của Gemini 1.5 Pro có trở thành phiên bản mặc định trong tương lai hay không. Mặc dù phiên bản này vẫn có sẵn tại thời điểm viết bài, nhưng việc phiên bản này đang trong giai đoạn phát hành hoặc thử nghiệm sớm cho thấy có khả năng bị hủy bỏ hoặc thay đổi vì lý do an toàn hoặc tinh chỉnh.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter: https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin 

Itadori

Theo Cointelegraph

MỚI CẬP NHẬT

XRP Ledger cắt giảm yêu cầu dự trữ 90% – Ripple cảnh báo lừa...

Dữ liệu blockchain cho thấy XRP Ledger đã giảm yêu cầu dự trữ cơ sở từ 10 XRP (25,6 đô la theo giá hiện...

Bitcoin giảm xuống còn 70.000 USD tại Hàn Quốc khi Tổng thống tuyên bố...

Giá Bitcoin đã giảm từ 96.000 USD xuống còn 93.700 USD hôm nay sau khi Tổng thống Hàn Quốc Yoon Suk Yeol tuyên bố...
tron trx

TRX đạt mức cao kỷ lục 20 tỷ đô la, báo hiệu “mùa altcoin”...

Tron (TRX) vừa vượt qua mức vốn hóa thị trường kỷ lục 20 tỷ đô la, đánh dấu một tín hiệu tích cực cho...

Tại sao giá Cardano (ADA) tăng hôm nay?

Cardano (ADA) tiếp tục xu hướng tăng vào ngày 3/12, thêm 16% trong 24 giờ qua và giao dịch ở mức 1,26 đô la....
Presale của Pepe Unchained vượt 65 triệu USD

Presale của Pepe Unchained vượt 65 triệu USD. Liệu nó có thể bùng nổ...

Pepe Unchained (PEPU) đang tiếp tục khẳng định vị thế là một trong những đồng meme coin microcap nóng nhất trên thị trường hiện...

Pantera Capital huy động 20 triệu USD để đầu tư vào TON

Các nhà đầu tư tiền điện tử dường như không thể nào ngừng yêu thích The Open Network (TON), blockchain liên kết chặt chẽ với...

Hoa Kỳ bán Bitcoin là một “sai lầm chiến lược nghiêm trọng”, các chuyên...

Các giám đốc điều hành và chuyên gia trong ngành công nghiệp crypto nhanh chóng chỉ ra sự thiếu sáng suốt trong quyết định...
Orderly Network giúp người dùng Solana giao dịch không giới hạn

[QC] Orderly Network giúp người dùng Solana giao dịch không giới hạn trong hệ...

New York, ngày 2 tháng 12 năm 2024, Chainwire Orderly Network ra mắt sổ lệnh (orderbook) omnichain cho hợp đồng vĩnh viễn trên mạng chính...

Tin vắn Crypto 03/12: Holder dài hạn đang gây ảnh hưởng đến giá của...

Từ nhận định hành động của holder dài hạn đang gây ảnh hưởng tới giá Bitcoin đến Chủ tịch SEC mới có thể được...
Ví Jump Trading Firm bỏ ra tới 500.000 đô la đầu tư vào meme coin mèo mới Catslap

Ví Jump Trading Firm bỏ ra tới 500.000 đô la đầu tư vào meme...

Meme coin mèo thế hệ mới Catslap ($SLAP) đang trở thành tâm điểm chú ý của cộng đồng các nhà đầu tư tiền điện...

Ngày Donald Trump nhậm chức có thể đánh dấu mức cao của tiền điện...

Dựa trên dữ liệu lịch sử về hiệu suất thị trường trong các năm bầu cử tổng thống Mỹ, động lực tăng trưởng của...

Campuchia chặn 16 trang web sàn giao dịch crypto, bao gồm Binance và Coinbase

Chính phủ Campuchia vừa ban hành lệnh chặn quyền truy cập vào 16 trang web sàn giao dịch tiền mã hóa lớn, bao gồm...
sol-giam

Solana (SOl) gặp áp lực khi đánh mất đà tăng trưởng 40%

Solana (SOL) đã chứng kiến sự suy giảm đáng kể về tâm lý thị trường sau khi không giữ vững được mức tăng giá...
aave

Aave sánh ngang với các ngân hàng truyền thống khi tiền gửi ròng đạt...

Tiền gửi ròng của giao thức DeFi Aave đã đạt kỷ lục mới tính đến thứ 2, vươn lên mạnh mẽ và vượt qua...

Chainlink (LINK) tăng 37% lên mức cao nhất trong 2 năm nhờ đối tác...

Chainlink (LINK) tăng vọt hơn 37%, đạt mức cao nhất trong gần hai năm, vượt ngưỡng 26 USD vào cuối phiên giao dịch ngày...

Giao dịch crypto tại Hàn Quốc đạt 18 tỷ USD, vượt thị trường chứng...

Khối lượng giao dịch bán lẻ crypto tại Hàn Quốc bùng nổ, đạt 18 tỷ USD trong 24 giờ qua, vượt qua toàn bộ...