OpenAI ra mắt sớm o3-Mini để đáp trả DeepSeek AI – So sánh chi tiết

Updated: 01/02/2025 at 23:15

Vào thứ 6 vừa qua, OpenAI đã nhanh chóng củng cố vị thế của mình trên thị trường bằng việc ra mắt o3-mini, một phản ứng mạnh mẽ đối với mô hình R1 của startup Trung Quốc DeepSeek. Mô hình này đã gây chấn động ngành công nghiệp AI nhờ vào hiệu suất vượt trội và chi phí tính toán chỉ bằng một phần nhỏ so với các đối thủ.

OpenAI cho biết trong một bài đăng trên blog chính thức:

“Chúng tôi giới thiệu OpenAI o3-mini, mô hình mới nhất và tiết kiệm chi phí nhất trong dòng sản phẩm của chúng tôi, hiện đã có sẵn trên cả ChatGPT và API kể từ thứ 6. Được ra mắt lần đầu vào tháng 12/2024, o3-mini là một mô hình mạnh mẽ và nhanh chóng, mở rộng khả năng của các mô hình nhỏ mà vẫn duy trì chi phí thấp và độ trễ hạn chế, tiếp nối thành công của OpenAI o1-mini”.

Đặc biệt, OpenAI cung cấp khả năng lập luận miễn phí cho người dùng lần đầu tiên và tăng gấp ba lần giới hạn tin nhắn hàng ngày cho khách hàng trả phí, từ 50 lên 150 tin nhắn, nhằm khuyến khích việc sử dụng mô hình mới này.

Không giống như dòng GPT-4o và các mô hình GPT truyền thống, nhóm mô hình AI “o” của OpenAI chủ yếu tập trung vào tác vụ lập luận. Các mô hình này ít sáng tạo hơn, nhưng lại sở hữu khả năng suy luận mạnh mẽ, có thể giải quyết vấn đề phức tạp, sửa chữa phân tích sai và tạo ra code có cấu trúc rõ ràng hơn.

Ở cấp độ cao nhất, OpenAI phân chia các mô hình AI của mình thành hai nhóm chính: Generative Pre-trained Transformers (GPT – Mô hình biến đổi tạo sinh được huấn luyện trước) và “Omni” (o).

– GPT giống như nghệ sĩ trong gia đình: “não phải”, thiên về sáng tạo và giao tiếp, hoàn hảo cho việc nhập vai, trò chuyện, viết sáng tạo, tóm tắt, giải thích, động não và thảo luận các ý tưởng mới.

– Omni là mọt sách của gia đình: Dù không phải là chuyên gia kể chuyện, nhưng Omni xuất sắc trong việc lập trình, giải các phương trình toán học, phân tích vấn đề phức tạp, lập kế hoạch chi tiết cho quá trình lập luận và so sánh các nghiên cứu khoa học một cách tỉ mỉ.

OpenAI o3-mini mới được phát hành với ba phiên bản: thấp, trung bình và cao. Mỗi phiên bản này cung cấp mức độ “suy luận” khác nhau, giúp người dùng nhận được câu trả lời chính xác hơn, nhưng đồng thời cũng tốn kém hơn (vì các nhà phát triển phải trả tiền cho mỗi token sử dụng).

Phiên bản o3-mini thấp tập trung vào hiệu quả và tiết kiệm chi phí, mặc dù có phần thua kém OpenAI o1-mini về kiến thức chung và khả năng suy luận đa ngôn ngữ. Tuy nhiên, o3-mini thấp lại tỏ ra vượt trội trong các nhiệm vụ khác, như code hoặc các tác vụ thực tế. Trong khi đó, các phiên bản o3-mini trung bình và o3-mini cao đều có hiệu suất vượt trội so với OpenAI o1-mini ở mọi tiêu chí đánh giá.

Nguồn: OpenAI

Bước đột phá của DeepSeek đã tạo ra một cú sốc lớn khi mô hình của họ vượt trội so với các sản phẩm hàng đầu của OpenAI, nhưng lại chỉ sử dụng một phần nhỏ sức mạnh tính toán. Kết quả là một đợt bán tháo công nghệ lớn, khiến gần 1 nghìn tỷ đô la bị xóa sổ khỏi thị trường chứng khoán Hoa Kỳ. Riêng Nvidia đã mất 600 tỷ đô la giá trị thị trường, khi các nhà đầu tư bắt đầu nghi ngờ về nhu cầu tương lai đối với các chip AI đắt đỏ của công ty.

Sự chênh lệch hiệu quả này bắt nguồn từ cách tiếp cận sáng tạo của DeepSeek đối với kiến trúc mô hình. Trong khi các công ty Hoa Kỳ chủ yếu tập trung vào việc gia tăng sức mạnh tính toán, team DeepSeek lại tìm ra cách tối ưu hóa quy trình xử lý thông tin của các mô hình AI, giúp chúng hoạt động hiệu quả hơn.

Áp lực cạnh tranh càng trở nên gay gắt hơn khi Alibaba — gã khổng lồ công nghệ Trung Quốc — ra mắt Qwen2.5 Max, một mô hình thậm chí còn mạnh mẽ hơn so với mô hình của DeepSeek, mở đường cho một làn sóng đổi mới AI mạnh mẽ từ Trung Quốc.

Trước tình hình đó, OpenAI đã tung ra o3-mini, với mục tiêu thu hẹp khoảng cách. Mô hình này nhanh hơn 24% so với phiên bản tiền nhiệm và có thể ngang bằng hoặc đánh bại các mô hình cũ về các chỉ số hiệu suất quan trọng, đồng thời giảm chi phí vận hành.

Về giá cả, OpenAI o3-mini có mức giá cạnh tranh hơn. Cụ thể, chi phí là 0,55 đô la cho một triệu token đầu vào và 4,4 đô la cho một triệu token đầu ra, mặc dù vẫn cao hơn so với mức giá R1 của DeepSeek (0,14 đô la và 2,19 đô la cho cùng một khối lượng). Tuy nhiên, mức giá này đã thu hẹp đáng kể khoảng cách giữa OpenAI và DeepSeek, đồng thời giảm mạnh so với mức chi phí vận hành của OpenAI o1.

Nguồn: OpenAI

Đây có thể chính là yếu tố then chốt quyết định thành công. OpenAI o3-mini là một mô hình có nguồn đóng, không giống như DeepSeek R1 miễn phí. Tuy nhiên, đối với những người sẵn sàng chi trả để sử dụng trên các máy chủ lưu trữ, sức hấp dẫn của o3-mini sẽ tăng lên tùy vào mục đích sử dụng và yêu cầu công việc.

Phiên bản o3-mini trung bình đạt 79,6 điểm trong bài kiểm tra chuẩn AIME về các bài toán, gần sát với DeepSeek R1 đạt 79,8 điểm, chỉ kém o3-mini cao (87,3 điểm) – mô hình mạnh nhất trong dòng sản phẩm của OpenAI.

Nhìn chung, kết quả trong các chuẩn khác cũng tương tự. Ví dụ, trong chuẩn GPQA đánh giá trình độ thành thạo ở các lĩnh vực khoa học khác nhau, DeepSeek R1 đạt 71,5 điểm, trong khi o3-mini thấp đạt 70,6 điểm và o3-mini cao đạt 79,7 điểm. Về mặt Codeforces — một chuẩn đánh giá khả năng lập trình, R1 đứng ở vị trí bách phân vị thứ 96,3, trong khi o3-mini thấp ở mức thứ 93 và o3-mini cao ở mức thứ 97.

Mặc dù có sự khác biệt nhất định, nhưng khi xét đến các tiêu chuẩn đánh giá, những chênh lệch này có thể không quá đáng kể, tùy thuộc vào mô hình được chọn để thực hiện nhiệm vụ cụ thể.

Thử nghiệm OpenAI o3-mini so với DeepSeek R1

Mô hình đã được thử nghiệm với một vài nhiệm vụ để xem nó hoạt động như thế nào so với DeepSeek R1.

Nhiệm vụ đầu tiên là game gián điệp để kiểm tra mức độ trong suy luận nhiều bước. Thử nghiệm chọn cùng một mẫu từ tập dữ liệu BIG-bench trên Github mà đã được sử dụng để đánh giá DeepSeek R1. Truy cập tại đây để xem toàn bộ câu chuyện, liên quan đến chuyến đi của trường học đến một địa điểm xa xôi, đầy tuyết, nơi học sinh và giáo viên phải đối mặt với một loạt vụ mất tích kỳ lạ, mô hình phải tìm ra kẻ theo dõi là ai.

OpenAI o3-mini hoạt động không tốt và đưa ra kết luận sai trong câu chuyện. Theo câu trả lời mà bài kiểm tra cung cấp, tên của kẻ theo dõi là Leo. DeepSeek R1 đã trả lời đúng, trong khi OpenAI o3-mini trả lời sai, nói rằng tên của kẻ theo dõi là Eric.

Mô hình này khá tốt trong các nhiệm vụ liên quan đến ngôn ngữ logic, không liên quan đến toán học. Ví dụ, thử nghiệm yêu cầu mô hình viết 5 câu kết thúc bằng một từ cụ thể và nó có khả năng hiểu nhiệm vụ, đánh giá kết quả trước khi đưa ra câu trả lời cuối cùng. Nó đã suy nghĩ về câu trả lời trong 4 giây, sửa một câu trả lời sai và đưa ra một câu trả lời hoàn toàn chính xác.

openai

Mô hình cũng rất giỏi toán, chứng minh khả năng giải quyết các vấn đề được coi là cực kỳ khó khăn trong một số tiêu chuẩn. Cùng một vấn đề phức tạp mà DeepSeek R1 mất 275 giây để giải quyết đã được OpenAI o3-mini hoàn thành chỉ trong 33 giây.

openai

openai

Như vậy, có thể thấy đây là một nỗ lực khá ấn tượng từ OpenAI. Tiếp theo, DeepSeek sẽ có đòn phản công như thế nào? Hãy cùng chúng tôi theo dõi!

Disclaimer: Bài viết chỉ có mục đích thông tin, không phải lời khuyên đầu tư. Nhà đầu tư nên tìm hiểu kỹ trước khi ra quyết định. Chúng tôi không chịu trách nhiệm về các quyết định đầu tư của bạn. 

Tham gia Telegram: https://t.me/tapchibitcoinvn

Twitter (X): https://twitter.com/tapchibtc_io

Tiktok: https://www.tiktok.com/@tapchibitcoin

Đình Đình

Được đề cập trong bài viết
Bình luận
Mới cập nhật

Solana (SOL) tăng 5% lên $160 đô la vào hôm thứ Hai sau tin tức về quỹ ETF đầu tiên của mình sẽ được giao dịch vào ngày thứ Tư. Tuy nhiên, đà tăng trưởng không kéo dài được lâu khi altcoin này đã xóa sạch mọi mức tăng trong... ...

Hai chuyên gia hàng đầu về quỹ ETF của Bloomberg, Eric Balchunas và James Seyffart, vừa đưa ra dự báo đầy lạc quan: có đến 95% khả năng Ủy ban Giao dịch và Chứng khoán Hoa Kỳ (SEC) sẽ bật đèn xanh cho các quỹ ETF dành cho XRP, Solana... ...

Sheridan, Sheridan, ngày 2 tháng 7 năm 2025, Chainwire R0AR, một nền tảng tài chính phi tập trung (DeFi), đã công bố niêm yết token gốc của mình, $1R0R, trên sàn giao dịch tiền điện tử MEXC. Cột mốc này đánh dấu một bước tiến quan trọng trong việc giúp... ...

Công ty quản lý tài sản Grayscale vừa nhận được sự chấp thuận từ Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC) để chuyển đổi quỹ Digital Large-Cap Fund thành quỹ giao dịch hoán đổi (ETF). Quỹ này bao gồm năm loại tiền điện tử có vốn hóa... ...

Vào thứ Sáu vừa qua, Pi Network đã công bố hai tính năng quan trọng, nhưng thông tin này dường như không đủ sức hút để kích thích thị trường. Mặc dù diễn biến giá có xu hướng tích cực trước sự kiện, nhưng nó đã chuyển sang xu hướng... ...

Các Thượng nghị sĩ Đảng Cộng hòa tại Thượng viện Mỹ đã suýt soát thông qua một dự luật ngân sách theo quy trình hòa giải ngân sách (budget reconciliation) – vốn là ưu tiên hàng đầu của Tổng thống Donald Trump – bất chấp sự phản đối mạnh mẽ... ...

Bitcoin đã giảm xuống còn 105.820 USD, sau khi không thể vượt qua ngưỡng 109.000 USD. Các nhà phân tích của Bitfinex nhận định trong một báo cáo thị trường rằng Bitcoin có thể đã hình thành một đỉnh cục bộ hoặc đang bước vào giai đoạn tích lũy. Hãy... ...

Giá Bitcoin (BTC) đang chịu áp lực giảm trong thời gian gần đây, chủ yếu đến từ các yếu tố kinh tế vĩ mô. Tuy nhiên, nhờ dòng vốn ổn định từ các quỹ ETF, đồng tiền điện tử hàng đầu vẫn cho thấy sự kiên cường và duy trì... ...

Khi tháng 7 bắt đầu, thị trường tiền điện tử tiếp tục đối mặt với làn sóng áp lực ngày càng gia tăng, bắt nguồn từ căng thẳng địa chính trị leo thang giữa Israel và Iran, cùng sự đảo chiều trong tâm lý nhà đầu tư. Việc Mỹ gia... ...

Litecoin (LTC) đã lấy lại đà tăng sau khi đóng trên ngưỡng 85 đô la. Hiện tại, giá đang dao động quanh 85,33 đô la. Đóng nến hàng ngày trên đường xu hướng kháng cự quan trọng này đã thắp lên hy vọng trong giới phân tích, với các dự... ...

Xem thêm bài viết
Chọn chế độ hiển thị:
Bình thường Bảo vệ mắt Dark Mode