Mô hình AI Gemini mới của Google đánh bại GPT-4o và Claude-3

Updated: 02/08/2024 at 16:09

Có một công cụ mới đứng đầu trong thế giới đánh giá trí tuệ nhân tạo (AI), đó là Gemini 1.5 Pro. 

ChatGPT-4o của OpenAI cuối cùng đã mất vị thế vô địch vào ngày 1 tháng 8 khi Google âm thầm ra mắt bản phát hành thử nghiệm của mô hình mới nhất.

Tuy nhiên, nó đã nhanh chóng thu hút sự chú ý của cộng đồng AI trên khắp các phương tiện truyền thông xã hội khi các báo cáo bắt đầu xuất hiện rằng nó đang vượt qua các đối thủ về điểm chuẩn.

Tiêu chuẩn trí tuệ nhân tạo

ChatGPT của OpenAI đã trở thành tiêu chuẩn cho AI tạo sinh kể từ khi ra mắt GPT-3. Mô hình mới nhất của nó, GPT-4o, và đối thủ cạnh tranh gần nhất của nó, Claude-3 của Anthropic, đã thống trị hầu hết các mô hình khác trong hầu hết các điểm chuẩn phổ biến trong khoảng một năm trở lại đây với rất ít sự cạnh tranh.

Nguồn: Large Model Systems Organization.

Một trong những tiêu chuẩn đánh giá phổ biến nhất được gọi là LMSYS Chatbot Arena. Nó kiểm tra các mô hình trên nhiều nhiệm vụ khác nhau và chỉ định điểm năng lực chung. GPT-4o nhận được điểm 1.286 trong khi Claude-3 đạt được điểm đáng nể là 1.271.

Phiên bản trước của Gemini 1.5 Pro đạt 1.261 điểm. Nhưng phiên bản thử nghiệm (Gemini 1.5 Pro 0801) phát hành vào ngày 1 tháng 8 đạt tới 1.300 điểm.

Điều này cho thấy nhìn chung nó có khả năng hơn so với các đối thủ cạnh tranh, nhưng điểm chuẩn không nhất thiết phản ánh chính xác những gì mô hình AI có thể và không thể làm.

Sự phấn khích của cộng đồng

Chúng ta dường như đang bước vào kỷ nguyên mà thị trường chatbot AI đã đủ trưởng thành để cung cấp nhiều lựa chọn. Cuối cùng, người dùng cuối sẽ quyết định mô hình AI nào phù hợp nhất với họ.

Đã có một làn sóng phấn khích về phiên bản mới nhất của Gemini khi người dùng trên mạng xã hội ca ngợi nó là “cực kỳ tốt”. Một Redditor thậm chí còn viết rằng nó “đã hoàn toàn vượt trội hơn GPT-4o”.

Hiện tại vẫn chưa rõ liệu phiên bản thử nghiệm của Gemini 1.5 Pro có trở thành phiên bản mặc định trong tương lai hay không. Mặc dù phiên bản này vẫn có sẵn tại thời điểm viết bài, nhưng việc phiên bản này đang trong giai đoạn phát hành hoặc thử nghiệm sớm cho thấy có khả năng bị hủy bỏ hoặc thay đổi vì lý do an toàn hoặc tinh chỉnh.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter: https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin 

Itadori

Theo Cointelegraph

Được đề cập trong bài viết
Bình luận
Mới cập nhật

Trong tháng 8, BNB nổi bật như một trong số ít các tiền điện tử vốn hóa lớn vẫn giữ vững phong độ bất chấp các đợt điều chỉnh của thị trường. Binance Coin vừa lập đỉnh lịch sử mới ở 899 USD, nâng lợi nhuận ba tháng lên gần... ...

Solana đã chính thức khởi động giai đoạn bỏ phiếu cho bản nâng cấp Alpenglow, một cải cách đồng thuận được kỳ vọng sẽ mang đến sự thay đổi lớn nhất trong lịch sử mạng lưới. Đề xuất, được biết đến với tên gọi chính thức SIMD-0326, hiện đang mở... ...

Ether tiếp tục phát đi những tín hiệu kỹ thuật tích cực, với nhà phân tích tiền điện tử Jelle nhấn mạnh đến “mô hình loa kèn – megaphone pattern” trên biểu đồ tuần, nhắm đến mục tiêu 10.000 đô la. Mô hình loa kèn, hay còn gọi là mô... ...

Gần đây, nhiều tin đồn đã xuất hiện xoay quanh khả năng một mùa altcoin sắp diễn ra. Hiệu suất của Ethereum đã ghi nhận mức tăng trưởng vượt bậc. Trung Quốc vừa công bố một gói kích thích kinh tế, trong khi Cục Dự trữ Liên bang Hoa Kỳ... ...

Giá Solana (SOL) hiện đang tăng lên khoảng 207 đô la tại thời điểm viết bài, đánh dấu mức tăng 8,5% trong 24 giờ qua. Mặc dù xu hướng ba tháng vẫn duy trì đà tăng, nhưng đợt tăng giá gần đây có thể sớm gặp phải ngưỡng kháng cự.... ...

Đề xuất của Tron (TRX) về việc cắt giảm một nửa phí giao dịch đã nhận được sự ủng hộ tích cực trước thời hạn bỏ phiếu vào ngày 29/8. Tính đến thời điểm viết bài, đã có 20 siêu đại diện bỏ phiếu ủng hộ đề xuất, trong khi... ...

Tối thứ Năm, Bitcoin (BTC) đã trở lại trên ngưỡng 112.000 USD, sau khi tìm thấy điểm tựa quan trọng vào đầu tuần. Đà phục hồi này phần nào được tiếp thêm động lực nhờ sự quan tâm xoay quanh Hội nghị Bitcoin Asia tại Hồng Kông. Tuy vậy, giới... ...

Giá XRP đã giảm 22% xuống còn 2,72 đô la từ mức đỉnh nhiều năm 3,66 đô la đạt được vào ngày 18/7, trước khi phục hồi về quanh mức 3 đô la hiện tại. Liệu altcoin phổ biến này đã thực sự chạm đỉnh hay vẫn còn một đợt... ...

Các quỹ Ether ETF đang thu hút sự quan tâm mạnh mẽ tại Mỹ, với lượng tiền đầu tư cao gấp hơn 10 lần so với các quỹ Bitcoin ETF trong năm ngày giao dịch vừa qua. Kể từ ngày 21 tháng 8, các quỹ ETF Ether đã ghi nhận... ...

Theo báo cáo mới nhất, tiến độ mã nguồn mở của Pi Network đã đạt 90%. Dự án đang được đẩy mạnh để phát hành mã nguồn công khai – bước đi mà cộng đồng kỳ vọng sẽ diễn ra vào tháng 9 năm 2025. Mốc tiến triển này làm... ...

Xem thêm bài viết

Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode