Mô hình AI Gemini mới của Google đánh bại GPT-4o và Claude-3

Updated: 02/08/2024 at 16:09

Có một công cụ mới đứng đầu trong thế giới đánh giá trí tuệ nhân tạo (AI), đó là Gemini 1.5 Pro. 

ChatGPT-4o của OpenAI cuối cùng đã mất vị thế vô địch vào ngày 1 tháng 8 khi Google âm thầm ra mắt bản phát hành thử nghiệm của mô hình mới nhất.

Tuy nhiên, nó đã nhanh chóng thu hút sự chú ý của cộng đồng AI trên khắp các phương tiện truyền thông xã hội khi các báo cáo bắt đầu xuất hiện rằng nó đang vượt qua các đối thủ về điểm chuẩn.

Tiêu chuẩn trí tuệ nhân tạo

ChatGPT của OpenAI đã trở thành tiêu chuẩn cho AI tạo sinh kể từ khi ra mắt GPT-3. Mô hình mới nhất của nó, GPT-4o, và đối thủ cạnh tranh gần nhất của nó, Claude-3 của Anthropic, đã thống trị hầu hết các mô hình khác trong hầu hết các điểm chuẩn phổ biến trong khoảng một năm trở lại đây với rất ít sự cạnh tranh.

Nguồn: Large Model Systems Organization.

Một trong những tiêu chuẩn đánh giá phổ biến nhất được gọi là LMSYS Chatbot Arena. Nó kiểm tra các mô hình trên nhiều nhiệm vụ khác nhau và chỉ định điểm năng lực chung. GPT-4o nhận được điểm 1.286 trong khi Claude-3 đạt được điểm đáng nể là 1.271.

Phiên bản trước của Gemini 1.5 Pro đạt 1.261 điểm. Nhưng phiên bản thử nghiệm (Gemini 1.5 Pro 0801) phát hành vào ngày 1 tháng 8 đạt tới 1.300 điểm.

Điều này cho thấy nhìn chung nó có khả năng hơn so với các đối thủ cạnh tranh, nhưng điểm chuẩn không nhất thiết phản ánh chính xác những gì mô hình AI có thể và không thể làm.

Sự phấn khích của cộng đồng

Chúng ta dường như đang bước vào kỷ nguyên mà thị trường chatbot AI đã đủ trưởng thành để cung cấp nhiều lựa chọn. Cuối cùng, người dùng cuối sẽ quyết định mô hình AI nào phù hợp nhất với họ.

Đã có một làn sóng phấn khích về phiên bản mới nhất của Gemini khi người dùng trên mạng xã hội ca ngợi nó là “cực kỳ tốt”. Một Redditor thậm chí còn viết rằng nó “đã hoàn toàn vượt trội hơn GPT-4o”.

Hiện tại vẫn chưa rõ liệu phiên bản thử nghiệm của Gemini 1.5 Pro có trở thành phiên bản mặc định trong tương lai hay không. Mặc dù phiên bản này vẫn có sẵn tại thời điểm viết bài, nhưng việc phiên bản này đang trong giai đoạn phát hành hoặc thử nghiệm sớm cho thấy có khả năng bị hủy bỏ hoặc thay đổi vì lý do an toàn hoặc tinh chỉnh.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter: https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin 

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Bình luận
Mới cập nhật

Ethereum (ETH) đang nỗ lực bứt phá qua ngưỡng kháng cự quan trọng sau cú phục hồi ấn tượng từ vùng đáy hồi tuần trước. Theo một số nhà phân tích, tiền điện tử này có thể đang tái hiện lại kịch bản bứt phá quen thuộc trong quá khứ... ...

Token ENA của Ethena tăng hơn 5% trong 24 giờ và 70% trong 3 tháng qua, được hỗ trợ bởi tín hiệu kỹ thuật tích cực và câu chuyện mới thu hút sự chú ý từ thị trường. Việc ra mắt stablecoin USDtb, với 90% tài sản được bảo chứng... ...

Bất chấp sự bất ổn của thị trường, Pudgy Penguins (PENGU) đang thu hút sự chú ý nhờ hiệu suất mạnh mẽ và ấn tượng. Tại thời điểm viết bài, memecoin này đã tăng 13%, dẫn đầu thị trường crypto và mở ra khả năng cho một đợt tăng giá... ...

SBI Holdings, một tập đoàn dịch vụ tài chính hàng đầu của Nhật Bản, đã chính thức bác bỏ các thông tin từ truyền thông cho rằng công ty đã nộp đơn xin thành lập quỹ hoán đổi danh mục (ETF) liên quan đến tiền điện tử. Vào thứ Tư,... ...

Việc các tổ chức tài chính truyền thống tham gia vào tài chính phi tập trung (DeFi) và token hóa tài sản vẫn còn rất hạn chế, bất chấp nhiều năm phát triển hạ tầng và những tiến triển gần đây về mặt pháp lý – theo báo cáo mới... ...

HBAR một lần nữa suy yếu và rơi xuống dưới ngưỡng Value Area High (VAH) tại $0,264 — mức được xác lập thông qua chỉ báo Fixed Range Volume Profile, dựa trên hành động giá từ đầu năm đến nay. Trong một phân tích trước đó, Tạp chí Bitcoin từng... ...

Trong một bài đăng trên X, đồng sáng lập Ethereum – Vitalik Buterin – nhấn mạnh rằng việc giảm thời gian rút tài sản từ Layer 2 (L2) về Layer 1 (L1) còn quan trọng hơn cả việc đạt được “phân quyền giai đoạn 2” của L2. Ông cho rằng đây là... ...

Solana (SOL) đang tích lũy động lực tăng giá sau khi bật lên từ vùng hợp lưu quan trọng – nơi giao thoa giữa đường hỗ trợ xu hướng tăng và vùng Fibonacci thoái lui vàng (mức 0,618–0,7). Cấu trúc kỹ thuật hiện tại cho thấy SOL có thể đang... ...

Theo báo cáo từ DappRadar ngày 7/8, thị trường NFT đã chứng kiến sự phục hồi mạnh mẽ trong tháng 7, vượt qua cả DeFi về mức độ hoạt động của người dùng. Sự chuyển dịch này đánh dấu một cột mốc quan trọng, cho thấy NFT có thể đang... ...

Theo nhận định của một nhà phân tích, Ethereum (ETH) tiếp tục giữ vững đà tăng, cho thấy altcoin có thể đang chuẩn bị cho một đợt bứt phá mạnh tới 500% ngay từ tháng 10. Tuy nhiên, không phải tất cả trader đều tin rằng xu hướng tăng hiện... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode