Trang chủ Trí tuệ nhân tạo (AI) OpenAI ra mắt mô hình 01 mới, vượt trội hơn ChatGPT-4o với...

OpenAI ra mắt mô hình 01 mới, vượt trội hơn ChatGPT-4o với khả năng suy luận cấp tiến sĩ

OpenAI vừa ra mắt dòng mô hình mới và chính thức triển khai trên gói ChatGPT Plus dành cho người dùng trả phí vào thứ Năm, khẳng định rằng các mô hình này mang lại những cải tiến vượt trội về hiệu suất và khả năng suy luận.

“Chúng tôi giới thiệu OpenAI o1, một mô hình ngôn ngữ lớn được huấn luyện thông qua học tăng cường để xử lý các suy luận phức tạp,” OpenAI tuyên bố trong bài viết trên blog chính thức. “Mô hình o1 suy nghĩ trước khi trả lời.” Các nhà quan sát trong ngành AI đã dự đoán rằng OpenAI sẽ ra mắt mô hình có tên mã “strawberry” trong vài tuần qua, mặc dù các chi tiết cụ thể về sự khác biệt giữa các mô hình vẫn chưa được công khai.

OpenAI mô tả dòng mô hình mới này như một bước đột phá lớn, đến mức họ đã phá vỡ quy ước đặt tên thông thường và thay thế các phiên bản ChatGPT-3, ChatGPT-3.5 và ChatGPT-4o bằng OpenAI o1.

“Với các nhiệm vụ suy luận phức tạp, đây là một bước tiến đáng kể và thể hiện một cấp độ mới về khả năng của AI,” OpenAI nhấn mạnh. “Vì lý do này, chúng tôi đã đặt lại bộ đếm về số một và đặt tên cho dòng mô hình này là OpenAI o1.”

Điểm nổi bật của dòng mô hình mới này là khả năng “suy nghĩ thấu đáo” trước khi hành động, đồng thời sử dụng phương pháp “chuỗi suy nghĩ” để đạt hiệu quả tối ưu trong các nhiệm vụ phức tạp.

Đáng chú ý, ngay cả mô hình nhỏ nhất trong dòng này cũng đã vượt qua GPT-4o ở nhiều khía cạnh quan trọng, theo các tiêu chuẩn đánh giá AI mà OpenAI chia sẻ – đặc biệt trong những bài kiểm tra có độ phức tạp ở cấp độ tiến sĩ.

Các mô hình mới tập trung vào khả năng “suy luận có cân nhắc,” trong đó hệ thống dành thêm thời gian xử lý các câu trả lời một cách kỹ lưỡng. Quy trình này nhằm mang lại các phản hồi sâu sắc và mạch lạc hơn, đặc biệt là trong các tác vụ yêu cầu suy luận phức tạp.

OpenAI cũng công bố kết quả thử nghiệm nội bộ cho thấy sự cải thiện đáng kể so với GPT-4o ở các nhiệm vụ như lập trình, tính toán và phân tích dữ liệu. Tuy nhiên, công ty thừa nhận rằng mô hình o1 không cho thấy sự cải thiện rõ rệt ở các tác vụ sáng tạo, như viết nội dung sáng tạo. (Các thử nghiệm chủ quan cũng cho thấy các sản phẩm của OpenAI vẫn xếp sau Claude AI của Anthropic trong lĩnh vực này.) Dẫu vậy, kết quả của mô hình mới vẫn được các chuyên gia đánh giá cao.

Các khả năng của dòng mô hình mới này sử dụng quy trình AI “chuỗi suy nghĩ” trong quá trình suy luận. Nói một cách đơn giản, mô hình này sẽ tiếp cận từng bước của vấn đề và xử lý từng giai đoạn trước khi đưa ra kết quả cuối cùng mà người dùng sẽ thấy.

“Dòng o1 được huấn luyện bằng học tăng cường quy mô lớn để suy luận thông qua chuỗi suy nghĩ,” OpenAI giải thích trong tài liệu về dòng o1. “Việc đào tạo mô hình để sử dụng chuỗi suy nghĩ trước khi trả lời có thể mở ra nhiều lợi ích đáng kể, nhưng cũng tiềm ẩn những rủi ro phát sinh từ trí thông minh ngày càng gia tăng.”

Tuyên bố này mở ra cuộc tranh luận giữa các chuyên gia kỹ thuật về tính đột phá của kiến trúc mô hình mới. OpenAI chưa làm rõ liệu quy trình này có khác biệt thực sự so với việc tạo nội dung dựa trên token, hay là sự kết hợp giữa hai phương pháp này.

Trước đó, mô hình AI mã nguồn mở có tên Reflection đã thử nghiệm một cách tiếp cận tương tự, tập trung vào suy luận, nhưng bị chỉ trích vì thiếu minh bạch. Mô hình đó sử dụng các thẻ để phân tách các bước suy luận, mà theo các nhà phát triển, giúp cải thiện đầu ra so với các mô hình truyền thống.

Việc tích hợp nhiều quy tắc hơn vào chuỗi suy nghĩ không chỉ giúp mô hình chính xác hơn mà còn khó bị phá vỡ bởi các kỹ thuật đánh lừa hệ thống, vì mô hình có thêm thời gian và các bước để phát hiện ra những kết quả tiềm ẩn rủi ro.

Cộng đồng “jailbreaking” vẫn tiếp tục hoạt động mạnh mẽ khi tìm cách vượt qua các biện pháp bảo mật của AI, và những vụ thành công đầu tiên của OpenAI o1 đã được báo cáo chỉ vài phút sau khi mô hình ra mắt.

Vẫn còn chưa rõ liệu phương pháp suy luận có cân nhắc này có thể được mở rộng hiệu quả cho các ứng dụng yêu cầu phản hồi tức thì hay không. Trong khi đó, OpenAI cho biết họ sẽ tiếp tục mở rộng các tính năng của mô hình, bao gồm chức năng tìm kiếm trên web và cải thiện tương tác đa phương tiện.

Mô hình này sẽ được điều chỉnh theo thời gian để đáp ứng các tiêu chuẩn tối thiểu của OpenAI về an toàn, ngăn chặn phá vỡ bảo mật và tính tự động.

Mặc dù mô hình đã bắt đầu triển khai hôm nay, có khả năng nó sẽ được phát hành theo từng giai đoạn, vì một số người dùng cho biết họ vẫn chưa thể truy cập mô hình này để thử nghiệm.

Phiên bản nhỏ nhất sẽ sớm được cung cấp miễn phí, và truy cập API sẽ rẻ hơn 80% so với phiên bản OpenAI o1-preview, theo thông báo của công ty. Tuy nhiên, hiện tại chỉ có hạn mức 30 tin nhắn mỗi tuần cho o1-preview và 50 tin nhắn cho o1-mini, vì vậy hãy lựa chọn câu hỏi một cách cẩn thận.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter: https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Hoà Thân

Decrypt

MỚI CẬP NHẬT

CHILLGUY

Memecoin TikTok CHILLGUY tăng vọt 101% bất chấp lời đe dọa pháp lý của...

Thị trường crypto rơi vào hỗn loạn sau khi Phillip Banks, người tạo ra meme “Chill Guy” nổi tiếng, tuyên bố kế hoạch phát...

Giá Bitcoin tiến gần $100.000, OI CME lần đầu tiên vượt 215.000 BTC

Bitcoin (BTC) lần đầu tiên tiến gần đến mức vốn hóa thị trường 2 nghìn tỷ USD sau khi giá tăng thêm $30.000 kể...
Aave

Khối lượng cho vay của Aave tăng gấp 3 lần so với đầu năm,...

Giao thức DeFi hàng đầu Aave đã đạt cột mốc đáng chú ý 10 tỷ đô la trong các khoản vay đang hoạt động,...
eth-stablecoin-thanh-khoan

Ethereum thống trị thanh khoản của stablecoin với thị phần hơn 52%

Mặc dù các blockchain như TRON và Solana đang tạo ra sự chú ý với các đợt phát hành stablecoin mới, nhưng Ethereum vẫn...

Tin vắn Crypto 21/11: Bitcoin có thể không chứng kiến ​​sự điều chỉnh cho...

Từ nhận định Bitcoin có thể không chứng kiến ​​sự điều chỉnh cho đến khi vượt mốc $100.000 đến BitGo ra mắt công ty...

Giá SUI giảm 11% khi blockchain Sui ngừng hoạt động hơn một giờ

Vào ngày 21 tháng 11, blockchain layer 1 Sui, được thiết kế nhằm triển khai các hợp đồng thông minh một cách nhanh chóng,...

Vốn hóa thị trường của Bitcoin tiến gần 2 nghìn tỷ USD, nhắm tới...

Vốn hóa thị trường của Bitcoin đã tăng vọt, với tài sản này đạt mức cao nhất mọi thời đại mới trong ngày hôm...

Bybit ra mắt 3 Launchpool mới là MORPHO, THRUST và MAJOR cho người dùng...

Sàn giao dịch Bybit đã công bố sự ra mắt 3 dự án Morpho (MORPHO), Thruster (THRUST) và Major (MAJOR) từ 17:00 ngày 21 tháng...

DOGE hay SHIB: ChatGPT Tiết Lộ Meme Coin Tốt Nhất Cho 2025!

Ngày càng nhiều nhà đầu tư crypto chuyển sang sử dụng ChatGPT để tìm ý tưởng giao dịch và định hướng chiến lược. Và...

Binance chứng kiến dòng ra mạnh mẽ buộc phải sử dụng quỹ dự trữ...

Những thông tin lan truyền trong cộng đồng gần đây chỉ ra rằng Binance đang đối mặt với làn sóng rút tiền quy mô...
hack-upbit-trieu-tien

Hàn Quốc xác nhận Triều Tiên đứng sau vụ hack Upbit trị giá 50...

Ngày 21/11, Cơ quan điều tra quốc gia Hàn Quốc đã xác nhận rằng vụ tấn công làm thất thoát 342.000 đồng Ether (ETH)...

SEC phân phối 4,6 triệu đô la cho các nhà đầu tư chịu thiệt...

Ủy ban Chứng khoán và Giao dịch Hoa Kỳ (SEC) đã chuyển 4,6 triệu đô la tiền bồi thường cho các nhà đầu tư...
MoonPay phá vỡ kỷ lục tháng 11 năm 2023 về giao dịch Solana trong một ngày

MoonPay phá vỡ kỷ lục giao dịch Solana trong một ngày

Vào ngày 19 tháng 11, cổng thanh toán tiền điện tử MoonPay thông báo rằng số lượng giao dịch Solana (SOL) của họ trong...

Pepe Unchained Gây Sốt: Thu Về Hơn 3,5 Triệu Đô La Trong Tuần Qua,...

 Tháng 11 tiếp tục mang đến những bất ngờ thú vị cho những nhà đầu tư biết nắm bắt cơ hội trong thị trường...
eth-btc-giam

Bitcoin vượt $97.000, đẩy ETH/BTC xuống mức thấp nhất kể từ tháng 3 năm...

Tỷ lệ ETH/BTC đã giảm 1,54% trong 24 giờ qua và hiện đang giao dịch ở mức 0,032. Kể từ đầu năm 2024, chỉ...

Nhật Bản sẽ nới lỏng thuế tiền điện tử theo gói kích thích mới

Nhật Bản đang thúc đẩy một gói kích thích kinh tế mang tính đột phá, bao gồm các cải cách đáng kể về quy...