Trang chủ Trí tuệ nhân tạo (AI) OpenAI ra mắt sớm o3-Mini để đáp trả DeepSeek AI – So...

OpenAI ra mắt sớm o3-Mini để đáp trả DeepSeek AI – So sánh chi tiết

Vào thứ 6 vừa qua, OpenAI đã nhanh chóng củng cố vị thế của mình trên thị trường bằng việc ra mắt o3-mini, một phản ứng mạnh mẽ đối với mô hình R1 của startup Trung Quốc DeepSeek. Mô hình này đã gây chấn động ngành công nghiệp AI nhờ vào hiệu suất vượt trội và chi phí tính toán chỉ bằng một phần nhỏ so với các đối thủ.

OpenAI cho biết trong một bài đăng trên blog chính thức:

“Chúng tôi giới thiệu OpenAI o3-mini, mô hình mới nhất và tiết kiệm chi phí nhất trong dòng sản phẩm của chúng tôi, hiện đã có sẵn trên cả ChatGPT và API kể từ thứ 6. Được ra mắt lần đầu vào tháng 12/2024, o3-mini là một mô hình mạnh mẽ và nhanh chóng, mở rộng khả năng của các mô hình nhỏ mà vẫn duy trì chi phí thấp và độ trễ hạn chế, tiếp nối thành công của OpenAI o1-mini”.

Đặc biệt, OpenAI cung cấp khả năng lập luận miễn phí cho người dùng lần đầu tiên và tăng gấp ba lần giới hạn tin nhắn hàng ngày cho khách hàng trả phí, từ 50 lên 150 tin nhắn, nhằm khuyến khích việc sử dụng mô hình mới này.

Không giống như dòng GPT-4o và các mô hình GPT truyền thống, nhóm mô hình AI “o” của OpenAI chủ yếu tập trung vào tác vụ lập luận. Các mô hình này ít sáng tạo hơn, nhưng lại sở hữu khả năng suy luận mạnh mẽ, có thể giải quyết vấn đề phức tạp, sửa chữa phân tích sai và tạo ra code có cấu trúc rõ ràng hơn.

Ở cấp độ cao nhất, OpenAI phân chia các mô hình AI của mình thành hai nhóm chính: Generative Pre-trained Transformers (GPT – Mô hình biến đổi tạo sinh được huấn luyện trước) và “Omni” (o).

– GPT giống như nghệ sĩ trong gia đình: “não phải”, thiên về sáng tạo và giao tiếp, hoàn hảo cho việc nhập vai, trò chuyện, viết sáng tạo, tóm tắt, giải thích, động não và thảo luận các ý tưởng mới.

– Omni là mọt sách của gia đình: Dù không phải là chuyên gia kể chuyện, nhưng Omni xuất sắc trong việc lập trình, giải các phương trình toán học, phân tích vấn đề phức tạp, lập kế hoạch chi tiết cho quá trình lập luận và so sánh các nghiên cứu khoa học một cách tỉ mỉ.

OpenAI o3-mini mới được phát hành với ba phiên bản: thấp, trung bình và cao. Mỗi phiên bản này cung cấp mức độ “suy luận” khác nhau, giúp người dùng nhận được câu trả lời chính xác hơn, nhưng đồng thời cũng tốn kém hơn (vì các nhà phát triển phải trả tiền cho mỗi token sử dụng).

Phiên bản o3-mini thấp tập trung vào hiệu quả và tiết kiệm chi phí, mặc dù có phần thua kém OpenAI o1-mini về kiến thức chung và khả năng suy luận đa ngôn ngữ. Tuy nhiên, o3-mini thấp lại tỏ ra vượt trội trong các nhiệm vụ khác, như code hoặc các tác vụ thực tế. Trong khi đó, các phiên bản o3-mini trung bình và o3-mini cao đều có hiệu suất vượt trội so với OpenAI o1-mini ở mọi tiêu chí đánh giá.

Nguồn: OpenAI

Bước đột phá của DeepSeek đã tạo ra một cú sốc lớn khi mô hình của họ vượt trội so với các sản phẩm hàng đầu của OpenAI, nhưng lại chỉ sử dụng một phần nhỏ sức mạnh tính toán. Kết quả là một đợt bán tháo công nghệ lớn, khiến gần 1 nghìn tỷ đô la bị xóa sổ khỏi thị trường chứng khoán Hoa Kỳ. Riêng Nvidia đã mất 600 tỷ đô la giá trị thị trường, khi các nhà đầu tư bắt đầu nghi ngờ về nhu cầu tương lai đối với các chip AI đắt đỏ của công ty.

Sự chênh lệch hiệu quả này bắt nguồn từ cách tiếp cận sáng tạo của DeepSeek đối với kiến trúc mô hình. Trong khi các công ty Hoa Kỳ chủ yếu tập trung vào việc gia tăng sức mạnh tính toán, team DeepSeek lại tìm ra cách tối ưu hóa quy trình xử lý thông tin của các mô hình AI, giúp chúng hoạt động hiệu quả hơn.

Áp lực cạnh tranh càng trở nên gay gắt hơn khi Alibaba — gã khổng lồ công nghệ Trung Quốc — ra mắt Qwen2.5 Max, một mô hình thậm chí còn mạnh mẽ hơn so với mô hình của DeepSeek, mở đường cho một làn sóng đổi mới AI mạnh mẽ từ Trung Quốc.

Trước tình hình đó, OpenAI đã tung ra o3-mini, với mục tiêu thu hẹp khoảng cách. Mô hình này nhanh hơn 24% so với phiên bản tiền nhiệm và có thể ngang bằng hoặc đánh bại các mô hình cũ về các chỉ số hiệu suất quan trọng, đồng thời giảm chi phí vận hành.

Về giá cả, OpenAI o3-mini có mức giá cạnh tranh hơn. Cụ thể, chi phí là 0,55 đô la cho một triệu token đầu vào và 4,4 đô la cho một triệu token đầu ra, mặc dù vẫn cao hơn so với mức giá R1 của DeepSeek (0,14 đô la và 2,19 đô la cho cùng một khối lượng). Tuy nhiên, mức giá này đã thu hẹp đáng kể khoảng cách giữa OpenAI và DeepSeek, đồng thời giảm mạnh so với mức chi phí vận hành của OpenAI o1.

Nguồn: OpenAI

Đây có thể chính là yếu tố then chốt quyết định thành công. OpenAI o3-mini là một mô hình có nguồn đóng, không giống như DeepSeek R1 miễn phí. Tuy nhiên, đối với những người sẵn sàng chi trả để sử dụng trên các máy chủ lưu trữ, sức hấp dẫn của o3-mini sẽ tăng lên tùy vào mục đích sử dụng và yêu cầu công việc.

Phiên bản o3-mini trung bình đạt 79,6 điểm trong bài kiểm tra chuẩn AIME về các bài toán, gần sát với DeepSeek R1 đạt 79,8 điểm, chỉ kém o3-mini cao (87,3 điểm) – mô hình mạnh nhất trong dòng sản phẩm của OpenAI.

Nhìn chung, kết quả trong các chuẩn khác cũng tương tự. Ví dụ, trong chuẩn GPQA đánh giá trình độ thành thạo ở các lĩnh vực khoa học khác nhau, DeepSeek R1 đạt 71,5 điểm, trong khi o3-mini thấp đạt 70,6 điểm và o3-mini cao đạt 79,7 điểm. Về mặt Codeforces — một chuẩn đánh giá khả năng lập trình, R1 đứng ở vị trí bách phân vị thứ 96,3, trong khi o3-mini thấp ở mức thứ 93 và o3-mini cao ở mức thứ 97.

Mặc dù có sự khác biệt nhất định, nhưng khi xét đến các tiêu chuẩn đánh giá, những chênh lệch này có thể không quá đáng kể, tùy thuộc vào mô hình được chọn để thực hiện nhiệm vụ cụ thể.

Thử nghiệm OpenAI o3-mini so với DeepSeek R1

Mô hình đã được thử nghiệm với một vài nhiệm vụ để xem nó hoạt động như thế nào so với DeepSeek R1.

Nhiệm vụ đầu tiên là game gián điệp để kiểm tra mức độ trong suy luận nhiều bước. Thử nghiệm chọn cùng một mẫu từ tập dữ liệu BIG-bench trên Github mà đã được sử dụng để đánh giá DeepSeek R1. Truy cập tại đây để xem toàn bộ câu chuyện, liên quan đến chuyến đi của trường học đến một địa điểm xa xôi, đầy tuyết, nơi học sinh và giáo viên phải đối mặt với một loạt vụ mất tích kỳ lạ, mô hình phải tìm ra kẻ theo dõi là ai.

OpenAI o3-mini hoạt động không tốt và đưa ra kết luận sai trong câu chuyện. Theo câu trả lời mà bài kiểm tra cung cấp, tên của kẻ theo dõi là Leo. DeepSeek R1 đã trả lời đúng, trong khi OpenAI o3-mini trả lời sai, nói rằng tên của kẻ theo dõi là Eric.

Mô hình này khá tốt trong các nhiệm vụ liên quan đến ngôn ngữ logic, không liên quan đến toán học. Ví dụ, thử nghiệm yêu cầu mô hình viết 5 câu kết thúc bằng một từ cụ thể và nó có khả năng hiểu nhiệm vụ, đánh giá kết quả trước khi đưa ra câu trả lời cuối cùng. Nó đã suy nghĩ về câu trả lời trong 4 giây, sửa một câu trả lời sai và đưa ra một câu trả lời hoàn toàn chính xác.

openai

Mô hình cũng rất giỏi toán, chứng minh khả năng giải quyết các vấn đề được coi là cực kỳ khó khăn trong một số tiêu chuẩn. Cùng một vấn đề phức tạp mà DeepSeek R1 mất 275 giây để giải quyết đã được OpenAI o3-mini hoàn thành chỉ trong 33 giây.

openai

openai

Như vậy, có thể thấy đây là một nỗ lực khá ấn tượng từ OpenAI. Tiếp theo, DeepSeek sẽ có đòn phản công như thế nào? Hãy cùng chúng tôi theo dõi!

Disclaimer: Bài viết chỉ có mục đích thông tin, không phải lời khuyên đầu tư. Nhà đầu tư nên tìm hiểu kỹ trước khi ra quyết định. Chúng tôi không chịu trách nhiệm về các quyết định đầu tư của bạn. 

Tham gia Telegram: https://t.me/tapchibitcoinvn

Twitter (X): https://twitter.com/tapchibtc_io

Tiktok: https://www.tiktok.com/@tapchibitcoin

Đình Đình

MỚI CẬP NHẬT

Đội ngũ MuskIt công bố Musk Tower: Trung tâm đổi mới sáng tạo và...

59Musk Tower, dự án được mong đợi từ lâu với Viện Musk tại trung tâm, sẽ trở thành một trung tâm đổi mới trong...
litecoin

LTC giảm 6% khi đối mặt với mức hỗ trợ quan trọng trên 120...

Litecoin (LTC) giảm 6% trong 24 giờ qua, đưa vốn hóa thị trường xuống còn 9,23 tỷ đô la. Mặc dù suy giảm, các...
eth

ETH cần được tăng cường hoạt động và chấp nhận để lấy lại 4.000...

Theo các nhà phân tích, Ethereum (ETH) cần tăng cường hoạt động trên blockchain, phát triển các ứng dụng mới và thúc đẩy hợp...

Châu Âu cần Bitcoin (BTC): Changpeng Zhao khẳng định

Changpeng Zhao, cựu CEO của Binance, một trong những tên tuổi nổi bật trong lĩnh vực tiền điện tử, đang mạnh mẽ khẳng định...
stablecoin

Kraken hủy niêm yết USDT và 4 stablecoin khác tại Châu Âu

Sàn giao dịch Kraken đang thực hiện các bước để tuân thủ quy định về tiền điện tử của Liên minh châu Âu khi...
bitcoin

Vitalik Buterin nắm giữ chưa tới 10% tài sản bằng Bitcoin

Vitalik Buterin, nhà sáng lập Ethereum, không chỉ được biết đến với việc xây dựng nền tảng blockchain mạnh mẽ thứ hai thế giới...

Tin vắn Crypto 01/02: Bitcoin nhắm mục tiêu vùng $120.000 trong thời gian tới...

Từ nhận định Bitcoin nhắm mục tiêu vùng $120.000 trong thời gian tới đến Coinbase chính thức công bố việc mua lại Spindl, sau...

CEO Binance tiết lộ cách tránh các mô hình Ponzi và Kim tự tháp

Trong bối cảnh thị trường crypto ngày càng phát triển và thu hút sự quan tâm của đông đảo nhà đầu tư, các mô...
Bitcoin

Robert Kiyosaki: “Bitcoin có thể sụp đổ – nhưng đó là cơ hội để...

Nhà đầu tư và doanh nhân nổi tiếng Robert Kiyosaki, tác giả của cuốn sách bán chạy Cha Giàu, Cha Nghèo, vừa đưa ra...
bitcoin

Phe gấu đang gặp khó khăn – Bitcoin được dự báo đạt ATH mới...

Theo một nhà phân tích, phe gấu Bitcoin có thể thấy khó khăn hơn trong việc duy trì niềm tin vào kịch bản giảm...

Stablecoin vượt mặt Visa và Mastercard với khối lượng giao dịch 27,6 nghìn tỷ...

Theo báo cáo từ sàn giao dịch tiền điện tử CEX.IO, khối lượng giao dịch của stablecoin đã đạt 27,6 nghìn tỷ USD vào...

Chủ tịch Fed Chicago chia sẻ quan điểm về quỹ dự trữ Bitcoin

Austan Goolsbee, Chủ tịch Ngân hàng Dự trữ Liên bang Chicago, gần đây đã đưa ra một tuyên bố quan trọng về các hạn...

Doanh thu của Kraken tăng 128% lên 1,5 tỷ USD trong năm 2024 sau...

Kraken đã ghi nhận mức doanh thu gấp đôi trong năm 2024, đạt 1,5 tỷ USD, tăng 128% so với năm trước, theo dữ...

Sky Protocol thu hút sự chú ý khi nguồn cung USDS tăng mạnh

Kể từ ngày 17 tháng 9 năm 2024, nguồn cung của USDS, stablecoin gốc của Sky Protocol (trước đây là Maker), đã tăng mạnh...

Gã khổng lồ tài chính Nhật Bản vừa thể hiện “sự ủng hộ to...

SoftBank Group vừa công bố khoản đầu tư trị giá 50 triệu đô la vào Cipher Mining, công ty khai thác Bitcoin quy mô...

SUI, APT, ARB và SAND mở khóa token trị giá 3,9 tỷ USD trong...

Thị trường crypto sẽ chứng kiến sự mở khóa token trị giá hơn 3,9 tỷ USD trong tháng 2, với sự dẫn đầu của...