Trang chủ Trí tuệ nhân tạo (AI) OpenAI ra mắt sớm o3-Mini để đáp trả DeepSeek AI – So...

OpenAI ra mắt sớm o3-Mini để đáp trả DeepSeek AI – So sánh chi tiết

Vào thứ 6 vừa qua, OpenAI đã nhanh chóng củng cố vị thế của mình trên thị trường bằng việc ra mắt o3-mini, một phản ứng mạnh mẽ đối với mô hình R1 của startup Trung Quốc DeepSeek. Mô hình này đã gây chấn động ngành công nghiệp AI nhờ vào hiệu suất vượt trội và chi phí tính toán chỉ bằng một phần nhỏ so với các đối thủ.

OpenAI cho biết trong một bài đăng trên blog chính thức:

“Chúng tôi giới thiệu OpenAI o3-mini, mô hình mới nhất và tiết kiệm chi phí nhất trong dòng sản phẩm của chúng tôi, hiện đã có sẵn trên cả ChatGPT và API kể từ thứ 6. Được ra mắt lần đầu vào tháng 12/2024, o3-mini là một mô hình mạnh mẽ và nhanh chóng, mở rộng khả năng của các mô hình nhỏ mà vẫn duy trì chi phí thấp và độ trễ hạn chế, tiếp nối thành công của OpenAI o1-mini”.

Đặc biệt, OpenAI cung cấp khả năng lập luận miễn phí cho người dùng lần đầu tiên và tăng gấp ba lần giới hạn tin nhắn hàng ngày cho khách hàng trả phí, từ 50 lên 150 tin nhắn, nhằm khuyến khích việc sử dụng mô hình mới này.

Không giống như dòng GPT-4o và các mô hình GPT truyền thống, nhóm mô hình AI “o” của OpenAI chủ yếu tập trung vào tác vụ lập luận. Các mô hình này ít sáng tạo hơn, nhưng lại sở hữu khả năng suy luận mạnh mẽ, có thể giải quyết vấn đề phức tạp, sửa chữa phân tích sai và tạo ra code có cấu trúc rõ ràng hơn.

Ở cấp độ cao nhất, OpenAI phân chia các mô hình AI của mình thành hai nhóm chính: Generative Pre-trained Transformers (GPT – Mô hình biến đổi tạo sinh được huấn luyện trước) và “Omni” (o).

– GPT giống như nghệ sĩ trong gia đình: “não phải”, thiên về sáng tạo và giao tiếp, hoàn hảo cho việc nhập vai, trò chuyện, viết sáng tạo, tóm tắt, giải thích, động não và thảo luận các ý tưởng mới.

– Omni là mọt sách của gia đình: Dù không phải là chuyên gia kể chuyện, nhưng Omni xuất sắc trong việc lập trình, giải các phương trình toán học, phân tích vấn đề phức tạp, lập kế hoạch chi tiết cho quá trình lập luận và so sánh các nghiên cứu khoa học một cách tỉ mỉ.

OpenAI o3-mini mới được phát hành với ba phiên bản: thấp, trung bình và cao. Mỗi phiên bản này cung cấp mức độ “suy luận” khác nhau, giúp người dùng nhận được câu trả lời chính xác hơn, nhưng đồng thời cũng tốn kém hơn (vì các nhà phát triển phải trả tiền cho mỗi token sử dụng).

Phiên bản o3-mini thấp tập trung vào hiệu quả và tiết kiệm chi phí, mặc dù có phần thua kém OpenAI o1-mini về kiến thức chung và khả năng suy luận đa ngôn ngữ. Tuy nhiên, o3-mini thấp lại tỏ ra vượt trội trong các nhiệm vụ khác, như code hoặc các tác vụ thực tế. Trong khi đó, các phiên bản o3-mini trung bình và o3-mini cao đều có hiệu suất vượt trội so với OpenAI o1-mini ở mọi tiêu chí đánh giá.

Nguồn: OpenAI

Bước đột phá của DeepSeek đã tạo ra một cú sốc lớn khi mô hình của họ vượt trội so với các sản phẩm hàng đầu của OpenAI, nhưng lại chỉ sử dụng một phần nhỏ sức mạnh tính toán. Kết quả là một đợt bán tháo công nghệ lớn, khiến gần 1 nghìn tỷ đô la bị xóa sổ khỏi thị trường chứng khoán Hoa Kỳ. Riêng Nvidia đã mất 600 tỷ đô la giá trị thị trường, khi các nhà đầu tư bắt đầu nghi ngờ về nhu cầu tương lai đối với các chip AI đắt đỏ của công ty.

Sự chênh lệch hiệu quả này bắt nguồn từ cách tiếp cận sáng tạo của DeepSeek đối với kiến trúc mô hình. Trong khi các công ty Hoa Kỳ chủ yếu tập trung vào việc gia tăng sức mạnh tính toán, team DeepSeek lại tìm ra cách tối ưu hóa quy trình xử lý thông tin của các mô hình AI, giúp chúng hoạt động hiệu quả hơn.

Áp lực cạnh tranh càng trở nên gay gắt hơn khi Alibaba — gã khổng lồ công nghệ Trung Quốc — ra mắt Qwen2.5 Max, một mô hình thậm chí còn mạnh mẽ hơn so với mô hình của DeepSeek, mở đường cho một làn sóng đổi mới AI mạnh mẽ từ Trung Quốc.

Trước tình hình đó, OpenAI đã tung ra o3-mini, với mục tiêu thu hẹp khoảng cách. Mô hình này nhanh hơn 24% so với phiên bản tiền nhiệm và có thể ngang bằng hoặc đánh bại các mô hình cũ về các chỉ số hiệu suất quan trọng, đồng thời giảm chi phí vận hành.

Về giá cả, OpenAI o3-mini có mức giá cạnh tranh hơn. Cụ thể, chi phí là 0,55 đô la cho một triệu token đầu vào và 4,4 đô la cho một triệu token đầu ra, mặc dù vẫn cao hơn so với mức giá R1 của DeepSeek (0,14 đô la và 2,19 đô la cho cùng một khối lượng). Tuy nhiên, mức giá này đã thu hẹp đáng kể khoảng cách giữa OpenAI và DeepSeek, đồng thời giảm mạnh so với mức chi phí vận hành của OpenAI o1.

Nguồn: OpenAI

Đây có thể chính là yếu tố then chốt quyết định thành công. OpenAI o3-mini là một mô hình có nguồn đóng, không giống như DeepSeek R1 miễn phí. Tuy nhiên, đối với những người sẵn sàng chi trả để sử dụng trên các máy chủ lưu trữ, sức hấp dẫn của o3-mini sẽ tăng lên tùy vào mục đích sử dụng và yêu cầu công việc.

Phiên bản o3-mini trung bình đạt 79,6 điểm trong bài kiểm tra chuẩn AIME về các bài toán, gần sát với DeepSeek R1 đạt 79,8 điểm, chỉ kém o3-mini cao (87,3 điểm) – mô hình mạnh nhất trong dòng sản phẩm của OpenAI.

Nhìn chung, kết quả trong các chuẩn khác cũng tương tự. Ví dụ, trong chuẩn GPQA đánh giá trình độ thành thạo ở các lĩnh vực khoa học khác nhau, DeepSeek R1 đạt 71,5 điểm, trong khi o3-mini thấp đạt 70,6 điểm và o3-mini cao đạt 79,7 điểm. Về mặt Codeforces — một chuẩn đánh giá khả năng lập trình, R1 đứng ở vị trí bách phân vị thứ 96,3, trong khi o3-mini thấp ở mức thứ 93 và o3-mini cao ở mức thứ 97.

Mặc dù có sự khác biệt nhất định, nhưng khi xét đến các tiêu chuẩn đánh giá, những chênh lệch này có thể không quá đáng kể, tùy thuộc vào mô hình được chọn để thực hiện nhiệm vụ cụ thể.

Thử nghiệm OpenAI o3-mini so với DeepSeek R1

Mô hình đã được thử nghiệm với một vài nhiệm vụ để xem nó hoạt động như thế nào so với DeepSeek R1.

Nhiệm vụ đầu tiên là game gián điệp để kiểm tra mức độ trong suy luận nhiều bước. Thử nghiệm chọn cùng một mẫu từ tập dữ liệu BIG-bench trên Github mà đã được sử dụng để đánh giá DeepSeek R1. Truy cập tại đây để xem toàn bộ câu chuyện, liên quan đến chuyến đi của trường học đến một địa điểm xa xôi, đầy tuyết, nơi học sinh và giáo viên phải đối mặt với một loạt vụ mất tích kỳ lạ, mô hình phải tìm ra kẻ theo dõi là ai.

OpenAI o3-mini hoạt động không tốt và đưa ra kết luận sai trong câu chuyện. Theo câu trả lời mà bài kiểm tra cung cấp, tên của kẻ theo dõi là Leo. DeepSeek R1 đã trả lời đúng, trong khi OpenAI o3-mini trả lời sai, nói rằng tên của kẻ theo dõi là Eric.

Mô hình này khá tốt trong các nhiệm vụ liên quan đến ngôn ngữ logic, không liên quan đến toán học. Ví dụ, thử nghiệm yêu cầu mô hình viết 5 câu kết thúc bằng một từ cụ thể và nó có khả năng hiểu nhiệm vụ, đánh giá kết quả trước khi đưa ra câu trả lời cuối cùng. Nó đã suy nghĩ về câu trả lời trong 4 giây, sửa một câu trả lời sai và đưa ra một câu trả lời hoàn toàn chính xác.

openai

Mô hình cũng rất giỏi toán, chứng minh khả năng giải quyết các vấn đề được coi là cực kỳ khó khăn trong một số tiêu chuẩn. Cùng một vấn đề phức tạp mà DeepSeek R1 mất 275 giây để giải quyết đã được OpenAI o3-mini hoàn thành chỉ trong 33 giây.

openai

openai

Như vậy, có thể thấy đây là một nỗ lực khá ấn tượng từ OpenAI. Tiếp theo, DeepSeek sẽ có đòn phản công như thế nào? Hãy cùng chúng tôi theo dõi!

Disclaimer: Bài viết chỉ có mục đích thông tin, không phải lời khuyên đầu tư. Nhà đầu tư nên tìm hiểu kỹ trước khi ra quyết định. Chúng tôi không chịu trách nhiệm về các quyết định đầu tư của bạn. 

Tham gia Telegram: https://t.me/tapchibitcoinvn

Twitter (X): https://twitter.com/tapchibtc_io

Tiktok: https://www.tiktok.com/@tapchibitcoin

Đình Đình

MỚI CẬP NHẬT

altcoin

Altcoin sắp có đợt tăng giá lớn cuối cùng, nhưng chỉ một số ít...

Theo một nhà phân tích, các altcoin có thể chỉ có một đợt tăng giá cuối cùng trong chu kỳ này, nhưng chỉ những...

Dự đoán giá SUI: Bứt phá trên $2,52 có kích hoạt đảo chiều xu...

SUI đang hình thành mô hình vai đầu vai ngược - một tín hiệu đảo chiều tăng điển hình thường xuất hiện sau các...

Saylor cho biết tính thanh khoản cao của Bitcoin biến nó thành tài sản...

Michael Saylor, đồng sáng lập Strategy, cho biết trong một tuyên bố gần đây trên X rằng biến động giá gần đây của Bitcoin...

Hồ sơ kỳ lạ vừa được đưa vào hồ sơ vụ kiện giữa SEC...

Một bên không phải là bên liên quan đã nộp một lá thư khẩn cấp vào ngày 2 tháng 4 cho Thẩm phán liên...

XRP giữ mức hỗ trợ $2 khi biểu đồ cho thấy mức tăng 73%

XRP ổn định gần mức hỗ trợ $2 sau đợt bán tháo trên toàn thị trường khiến altcoin này và một số loại tiền...

DappRadar: TVL DeFi giảm 27% trong khi AI, ứng dụng xã hội tăng đột...

Nền kinh tế bất ổn và một vụ hack sàn giao dịch nghiêm trọng đã làm giảm tổng giá trị bị khóa trong các...

SEC họp với BlackRock và Crypto Council để thảo luận quy định về ETF...

Lực lượng đặc nhiệm về tiền điện tử của Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC) đã tổ chức các cuộc...

Lợi suất trái phiếu kho bạc kỳ hạn 10 năm giảm xuống 4% khi...

Vào ngày 3 tháng 4, lợi suất trái phiếu chính phủ dài hạn của Hoa Kỳ đã giảm xuống mức thấp nhất trong sáu...
XRP

Ripple mở khóa 1 tỷ đô la XRP khi đà giảm giá đang hình...

XRP đang chịu áp lực, giảm gần 0,32% trong 24 giờ qua và dao động ngay trên mốc 2 đô la khi đà giảm...
eth-giam-gia

Ethereum (ETH) có bị bán tháo khi Shorter tăng cược lên 330 triệu đô...

Ethereum (ETH) và các loại tiền điện tử khác đã giảm mạnh sau khi Tổng thống Hoa Kỳ Donald Trump công bố chính sách...

Babylon Foundation công bố airdrop và phát hành token BABY

Babylon Foundation, tổ chức hỗ trợ giao thức staking Bitcoin của Babylon, vừa công bố chi tiết về sự kiện phát hành token BABY,...
sol-giam

Solana (SOL) mất 10% khi phe gấu siết chặt kiểm soát – Điều gì...

Solana (SOL) đang chịu áp lực bán mạnh khi giá lao dốc hơn 10% trong 24 giờ qua, phản ánh đà giảm ngày càng...
Binance đối mặt với làn sóng chỉ trích lớn khi nhiều người dùng kêu gọi tẩy chay

Binance đối mặt với làn sóng chỉ trích lớn khi nhiều người dùng kêu...

Những tranh cãi xoay quanh việc niêm yết token, mất peg của stablecoin FDUSD cùng các cáo buộc về hành vi thiếu đạo đức...
Ethereum

Có thể mong đợi gì từ ETH vào tháng 4?

Ethereum (ETH) đã trải qua một tháng đầy thử thách vào tháng 3, thể hiện rõ qua một loạt các xu hướng giảm giá...
btc-lao-doc

Bitcoin thách thức mức $80.000, hình thành ‘death cross’ khi chứng khoán Mỹ tái...

Bitcoin chạm mức thấp nhất trong tháng khi thị trường chịu áp lực từ dữ liệu thất nghiệp tại Mỹ. Bitcoin mất đà đầu tháng...
pi

Pi Network tạo mức thấp nhất mọi thời đại mới, giá tiếp tục dưới...

Pi Network (PI) sụt giảm đáng kể gần đây, khiến nhiều holder phải chịu lỗ. Cho đến nay, giá vẫn chưa thể thoát khỏi xu...