Trang chủ Trí tuệ nhân tạo (AI) OpenAI ra mắt sớm o3-Mini để đáp trả DeepSeek AI – So...

OpenAI ra mắt sớm o3-Mini để đáp trả DeepSeek AI – So sánh chi tiết

Vào thứ 6 vừa qua, OpenAI đã nhanh chóng củng cố vị thế của mình trên thị trường bằng việc ra mắt o3-mini, một phản ứng mạnh mẽ đối với mô hình R1 của startup Trung Quốc DeepSeek. Mô hình này đã gây chấn động ngành công nghiệp AI nhờ vào hiệu suất vượt trội và chi phí tính toán chỉ bằng một phần nhỏ so với các đối thủ.

OpenAI cho biết trong một bài đăng trên blog chính thức:

“Chúng tôi giới thiệu OpenAI o3-mini, mô hình mới nhất và tiết kiệm chi phí nhất trong dòng sản phẩm của chúng tôi, hiện đã có sẵn trên cả ChatGPT và API kể từ thứ 6. Được ra mắt lần đầu vào tháng 12/2024, o3-mini là một mô hình mạnh mẽ và nhanh chóng, mở rộng khả năng của các mô hình nhỏ mà vẫn duy trì chi phí thấp và độ trễ hạn chế, tiếp nối thành công của OpenAI o1-mini”.

Đặc biệt, OpenAI cung cấp khả năng lập luận miễn phí cho người dùng lần đầu tiên và tăng gấp ba lần giới hạn tin nhắn hàng ngày cho khách hàng trả phí, từ 50 lên 150 tin nhắn, nhằm khuyến khích việc sử dụng mô hình mới này.

Không giống như dòng GPT-4o và các mô hình GPT truyền thống, nhóm mô hình AI “o” của OpenAI chủ yếu tập trung vào tác vụ lập luận. Các mô hình này ít sáng tạo hơn, nhưng lại sở hữu khả năng suy luận mạnh mẽ, có thể giải quyết vấn đề phức tạp, sửa chữa phân tích sai và tạo ra code có cấu trúc rõ ràng hơn.

Ở cấp độ cao nhất, OpenAI phân chia các mô hình AI của mình thành hai nhóm chính: Generative Pre-trained Transformers (GPT – Mô hình biến đổi tạo sinh được huấn luyện trước) và “Omni” (o).

– GPT giống như nghệ sĩ trong gia đình: “não phải”, thiên về sáng tạo và giao tiếp, hoàn hảo cho việc nhập vai, trò chuyện, viết sáng tạo, tóm tắt, giải thích, động não và thảo luận các ý tưởng mới.

– Omni là mọt sách của gia đình: Dù không phải là chuyên gia kể chuyện, nhưng Omni xuất sắc trong việc lập trình, giải các phương trình toán học, phân tích vấn đề phức tạp, lập kế hoạch chi tiết cho quá trình lập luận và so sánh các nghiên cứu khoa học một cách tỉ mỉ.

OpenAI o3-mini mới được phát hành với ba phiên bản: thấp, trung bình và cao. Mỗi phiên bản này cung cấp mức độ “suy luận” khác nhau, giúp người dùng nhận được câu trả lời chính xác hơn, nhưng đồng thời cũng tốn kém hơn (vì các nhà phát triển phải trả tiền cho mỗi token sử dụng).

Phiên bản o3-mini thấp tập trung vào hiệu quả và tiết kiệm chi phí, mặc dù có phần thua kém OpenAI o1-mini về kiến thức chung và khả năng suy luận đa ngôn ngữ. Tuy nhiên, o3-mini thấp lại tỏ ra vượt trội trong các nhiệm vụ khác, như code hoặc các tác vụ thực tế. Trong khi đó, các phiên bản o3-mini trung bình và o3-mini cao đều có hiệu suất vượt trội so với OpenAI o1-mini ở mọi tiêu chí đánh giá.

Nguồn: OpenAI

Bước đột phá của DeepSeek đã tạo ra một cú sốc lớn khi mô hình của họ vượt trội so với các sản phẩm hàng đầu của OpenAI, nhưng lại chỉ sử dụng một phần nhỏ sức mạnh tính toán. Kết quả là một đợt bán tháo công nghệ lớn, khiến gần 1 nghìn tỷ đô la bị xóa sổ khỏi thị trường chứng khoán Hoa Kỳ. Riêng Nvidia đã mất 600 tỷ đô la giá trị thị trường, khi các nhà đầu tư bắt đầu nghi ngờ về nhu cầu tương lai đối với các chip AI đắt đỏ của công ty.

Sự chênh lệch hiệu quả này bắt nguồn từ cách tiếp cận sáng tạo của DeepSeek đối với kiến trúc mô hình. Trong khi các công ty Hoa Kỳ chủ yếu tập trung vào việc gia tăng sức mạnh tính toán, team DeepSeek lại tìm ra cách tối ưu hóa quy trình xử lý thông tin của các mô hình AI, giúp chúng hoạt động hiệu quả hơn.

Áp lực cạnh tranh càng trở nên gay gắt hơn khi Alibaba — gã khổng lồ công nghệ Trung Quốc — ra mắt Qwen2.5 Max, một mô hình thậm chí còn mạnh mẽ hơn so với mô hình của DeepSeek, mở đường cho một làn sóng đổi mới AI mạnh mẽ từ Trung Quốc.

Trước tình hình đó, OpenAI đã tung ra o3-mini, với mục tiêu thu hẹp khoảng cách. Mô hình này nhanh hơn 24% so với phiên bản tiền nhiệm và có thể ngang bằng hoặc đánh bại các mô hình cũ về các chỉ số hiệu suất quan trọng, đồng thời giảm chi phí vận hành.

Về giá cả, OpenAI o3-mini có mức giá cạnh tranh hơn. Cụ thể, chi phí là 0,55 đô la cho một triệu token đầu vào và 4,4 đô la cho một triệu token đầu ra, mặc dù vẫn cao hơn so với mức giá R1 của DeepSeek (0,14 đô la và 2,19 đô la cho cùng một khối lượng). Tuy nhiên, mức giá này đã thu hẹp đáng kể khoảng cách giữa OpenAI và DeepSeek, đồng thời giảm mạnh so với mức chi phí vận hành của OpenAI o1.

Nguồn: OpenAI

Đây có thể chính là yếu tố then chốt quyết định thành công. OpenAI o3-mini là một mô hình có nguồn đóng, không giống như DeepSeek R1 miễn phí. Tuy nhiên, đối với những người sẵn sàng chi trả để sử dụng trên các máy chủ lưu trữ, sức hấp dẫn của o3-mini sẽ tăng lên tùy vào mục đích sử dụng và yêu cầu công việc.

Phiên bản o3-mini trung bình đạt 79,6 điểm trong bài kiểm tra chuẩn AIME về các bài toán, gần sát với DeepSeek R1 đạt 79,8 điểm, chỉ kém o3-mini cao (87,3 điểm) – mô hình mạnh nhất trong dòng sản phẩm của OpenAI.

Nhìn chung, kết quả trong các chuẩn khác cũng tương tự. Ví dụ, trong chuẩn GPQA đánh giá trình độ thành thạo ở các lĩnh vực khoa học khác nhau, DeepSeek R1 đạt 71,5 điểm, trong khi o3-mini thấp đạt 70,6 điểm và o3-mini cao đạt 79,7 điểm. Về mặt Codeforces — một chuẩn đánh giá khả năng lập trình, R1 đứng ở vị trí bách phân vị thứ 96,3, trong khi o3-mini thấp ở mức thứ 93 và o3-mini cao ở mức thứ 97.

Mặc dù có sự khác biệt nhất định, nhưng khi xét đến các tiêu chuẩn đánh giá, những chênh lệch này có thể không quá đáng kể, tùy thuộc vào mô hình được chọn để thực hiện nhiệm vụ cụ thể.

Thử nghiệm OpenAI o3-mini so với DeepSeek R1

Mô hình đã được thử nghiệm với một vài nhiệm vụ để xem nó hoạt động như thế nào so với DeepSeek R1.

Nhiệm vụ đầu tiên là game gián điệp để kiểm tra mức độ trong suy luận nhiều bước. Thử nghiệm chọn cùng một mẫu từ tập dữ liệu BIG-bench trên Github mà đã được sử dụng để đánh giá DeepSeek R1. Truy cập tại đây để xem toàn bộ câu chuyện, liên quan đến chuyến đi của trường học đến một địa điểm xa xôi, đầy tuyết, nơi học sinh và giáo viên phải đối mặt với một loạt vụ mất tích kỳ lạ, mô hình phải tìm ra kẻ theo dõi là ai.

OpenAI o3-mini hoạt động không tốt và đưa ra kết luận sai trong câu chuyện. Theo câu trả lời mà bài kiểm tra cung cấp, tên của kẻ theo dõi là Leo. DeepSeek R1 đã trả lời đúng, trong khi OpenAI o3-mini trả lời sai, nói rằng tên của kẻ theo dõi là Eric.

Mô hình này khá tốt trong các nhiệm vụ liên quan đến ngôn ngữ logic, không liên quan đến toán học. Ví dụ, thử nghiệm yêu cầu mô hình viết 5 câu kết thúc bằng một từ cụ thể và nó có khả năng hiểu nhiệm vụ, đánh giá kết quả trước khi đưa ra câu trả lời cuối cùng. Nó đã suy nghĩ về câu trả lời trong 4 giây, sửa một câu trả lời sai và đưa ra một câu trả lời hoàn toàn chính xác.

openai

Mô hình cũng rất giỏi toán, chứng minh khả năng giải quyết các vấn đề được coi là cực kỳ khó khăn trong một số tiêu chuẩn. Cùng một vấn đề phức tạp mà DeepSeek R1 mất 275 giây để giải quyết đã được OpenAI o3-mini hoàn thành chỉ trong 33 giây.

openai

openai

Như vậy, có thể thấy đây là một nỗ lực khá ấn tượng từ OpenAI. Tiếp theo, DeepSeek sẽ có đòn phản công như thế nào? Hãy cùng chúng tôi theo dõi!

Disclaimer: Bài viết chỉ có mục đích thông tin, không phải lời khuyên đầu tư. Nhà đầu tư nên tìm hiểu kỹ trước khi ra quyết định. Chúng tôi không chịu trách nhiệm về các quyết định đầu tư của bạn. 

Tham gia Telegram: https://t.me/tapchibitcoinvn

Twitter (X): https://twitter.com/tapchibtc_io

Tiktok: https://www.tiktok.com/@tapchibitcoin

Đình Đình

MỚI CẬP NHẬT

Cardano (ADA) hạ nhiệt sau cú hích từ Trump, đánh mất mốc $1

Cardano (ADA) đã bứt phá mạnh mẽ vào cuối tuần, tăng 60% và vượt mốc $1 vào Chủ Nhật. Đà tăng ấn tượng này...

Các nhà phân tích Bitcoin thiết lập con đường phục hồi lên tới 150.000...

Các nhà phân tích Bitcoin đã vạch ra con đường phục hồi tiềm năng lên đến 150.000 đô la sau cú giảm sâu hiện...
altcoin

Tại sao những altcoin này lại là xu hướng hôm nay?

Thị trường crypto đã xóa sạch mức tăng cuối tuần và tiếp tục xu hướng giảm, với Bitcoin và các altcoin lớn đang điều...

Israel công bố thiết kế CBDC sơ bộ cho shekel kỹ thuật số

Ngân hàng Israel đã công bố một đề xuất thiết kế sơ bộ cho shekel kỹ thuật số (DS), tiền kỹ thuật số tiềm...
dogecoin

Nhà sáng lập Cardano đưa ra lời đề nghị đặc biệt với Elon Musk...

Một ý tưởng bất ngờ vừa xuất hiện trong thế giới crypto. Nhà sáng lập Cardano (ADA), Charles Hoskinson, đã đưa ra đề xuất...

3 altcoin đã chạm mức thấp nhất mọi thời đại hôm nay

Thị trường crypto đã cho thấy tín hiệu tăng trưởng vào cuối tuần qua, tuy nhiên đà tăng này đã bị đứt gãy trong...

Thỏa thuận của IMF cấm khu vực công ở El Salvador ‘tích lũy Bitcoin’

Quỹ Tiền tệ Quốc tế (IMF) đang tìm cách hạn chế việc El Salvador mua Bitcoin như một phần của thỏa thuận tài trợ...

3 altcoin có thể gây ra đợt thanh lý lớn trong tuần đầu tiên...

Tuần đầu tiên của tháng 3 đã chứng kiến sự biến động mạnh mẽ trên thị trường. Những thông tin bất ngờ từ Tổng...
ftx

Ví FTX và Alameda unstake 431 triệu đô la SOL

Các ví thuộc về sàn giao dịch FTX đã phá sản và công ty giao dịch Alameda Research vừa unstake hơn 3 triệu token...

THORChain tạo ra 5 triệu đô la phí, 5,4 tỷ đô la khối lượng...

THORChain đã ghi nhận tổng doanh thu vượt mốc 5 triệu đô la sau khi khối lượng swap tài sản trên giao thức đạt...

Các đồng coin sẽ bùng nổ mạnh mẽ nhờ Quỹ Dự trữ Tiền điện...

Ông Donald Trump vừa khiến cộng đồng Web3 dậy sóng khi tuyên bố tiến hành thành lập một “Quỹ Dự trữ Tiền điện tử...

Các nhà phân tích dự đoán giá ETH sẽ giảm xuống còn 1.200 đô...

Thị trường crypto đang trải qua một giai đoạn khắc nghiệt, với tổng giá trị vốn hóa thị trường đã giảm hơn 12%, tương...

Tin vắn Crypto 04/03: Bitcoin có thể vẫn tiếp tục dao động trong phạm...

Từ nhận định Bitcoin có thể vẫn dao động trong phạm vi từ $80.000 đến $100.000 trước khi breakout mạnh mẽ đến SEC chính...

Bitcoin không còn được coi là nơi trú ẩn an toàn?

Phân tích gần đây cảnh báo rằng Bitcoin đang phải đối mặt với những yếu tố giảm giá liên tục, khi các trader tìm...

Liệu những Altcoin này có phải là mục tiêu tiếp theo trong quỹ dự...

Thông báo mới nhất của Tổng thống Hoa Kỳ - Donald Trump về việc thêm một số loại tiền điện tử được chọn vào...
Giá PI Coin giảm mạnh 24%

Đánh giá khả năng Pi Network lập đỉnh mới trong thời gian tới

Pi Network (PI) đã trải qua một đợt suy giảm mạnh, hiện giao dịch thấp hơn đáng kể so với mức cao nhất mọi...