Trang chủ >> Trí tuệ nhân tạo (AI) >> Mô hình AI thế hệ tiếp theo của OpenAI gặp giới hạn hiệu suất

Mô hình AI thế hệ tiếp theo của OpenAI gặp giới hạn hiệu suất

Updated: 13/11/2024 at 6:00

Mô hình trí tuệ nhân tạo mới của OpenAI mang lại những cải tiến hiệu suất nhỏ hơn so với các phiên bản trước đó, theo các nguồn tin từ The Information.

Kết quả thử nghiệm cho thấy Orion đạt hiệu suất ngang với GPT-4 sau khi hoàn thành chỉ 20% quá trình đào tạo. Tuy nhiên, sự cải thiện từ GPT-4 lên GPT-5 hiện tại dường như nhỏ hơn so với sự nhảy vọt từ GPT-3 lên GPT-4.

“Một số nhà nghiên cứu tại công ty cho rằng Orion không thực sự vượt trội hơn người tiền nhiệm trong việc xử lý một số nhiệm vụ cụ thể,” các nhân viên OpenAI cho biết. “Orion hoạt động tốt hơn ở các nhiệm vụ ngôn ngữ nhưng có thể không vượt qua các mô hình trước đó trong các nhiệm vụ như lập trình.”

Mặc dù việc Orion đạt được mức độ GPT-4 chỉ sau 20% thời gian đào tạo có vẻ ấn tượng, cần lưu ý rằng các giai đoạn đầu của quá trình đào tạo AI thường mang lại những cải tiến lớn nhất, trong khi các giai đoạn sau thường chỉ mang lại những tiến bộ nhỏ hơn.

Những hạn chế này xuất hiện trong bối cảnh OpenAI vừa nhận được khoản tài trợ 6,6 tỷ USD, với những kỳ vọng lớn từ các nhà đầu tư và đối mặt với các ràng buộc kỹ thuật thách thức các phương pháp mở rộng truyền thống trong phát triển AI. Nếu các phiên bản đầu tiên không đáp ứng được kỳ vọng, các nỗ lực gây quỹ sắp tới của công ty có thể không nhận được sự nhiệt tình như trước đây – điều này có thể gây khó khăn cho một công ty tiềm năng có lợi nhuận như mong muốn của Sam Altman đối với OpenAI.

Kết quả không như mong đợi cho thấy một thách thức cơ bản đối với toàn bộ ngành AI: sự suy giảm nguồn dữ liệu đào tạo chất lượng cao và nhu cầu duy trì tính cạnh tranh trong lĩnh vực AI sáng tạo.

Nghiên cứu công bố vào tháng 6 dự đoán rằng các công ty AI sẽ cạn kiệt dữ liệu văn bản do con người tạo ra công khai từ năm 2026 đến năm 2032, đánh dấu một điểm uốn quan trọng cho các phương pháp phát triển truyền thống.

“Các phát hiện của chúng tôi chỉ ra rằng các xu hướng phát triển LLM hiện tại không thể duy trì thông qua việc mở rộng dữ liệu thông thường,” nghiên cứu cho biết, nhấn mạnh nhu cầu về các phương pháp tiếp cận thay thế để cải thiện mô hình, bao gồm tạo dữ liệu tổng hợp, học chuyển tiếp từ các miền dữ liệu phong phú và sử dụng dữ liệu không công khai.

Chiến lược lịch sử của việc đào tạo các mô hình ngôn ngữ trên văn bản có sẵn công khai từ các trang web, sách và các nguồn khác đã đạt đến điểm giảm dần lợi nhuận, với các nhà phát triển đã “khai thác hầu hết những gì có thể từ loại dữ liệu đó,” theo The Information.

Cách OpenAI đối phó với vấn đề này: Mô hình lý luận vs. Mô hình ngôn ngữ

Để đối phó với những thách thức này, OpenAI đang tái cấu trúc cơ bản cách tiếp cận phát triển AI của mình.

“Để đáp lại thách thức gần đây đối với các quy luật mở rộng dựa trên đào tạo do sự cải thiện chậm lại của GPT, ngành công nghiệp dường như đang chuyển nỗ lực sang cải thiện các mô hình sau khi đào tạo ban đầu, có khả năng tạo ra một loại quy luật mở rộng khác,” The Information báo cáo.

Để đạt được trạng thái cải thiện liên tục này, OpenAI đang tách việc phát triển mô hình thành hai hướng riêng biệt:

Dòng O (có thể là mật danh Strawberry), tập trung vào khả năng lý luận, đại diện cho một hướng mới trong kiến trúc mô hình. Các mô hình này hoạt động với cường độ tính toán cao hơn đáng kể và được thiết kế đặc biệt cho các nhiệm vụ giải quyết vấn đề phức tạp.

Nhu cầu tính toán rất lớn, với ước tính ban đầu cho rằng chi phí hoạt động gấp sáu lần so với các mô hình hiện tại. Tuy nhiên, khả năng lý luận nâng cao có thể biện minh cho chi phí tăng cao đối với các ứng dụng cụ thể yêu cầu xử lý phân tích nâng cao.

Mô hình này, nếu nó giống như Strawberry, cũng có nhiệm vụ tạo ra đủ dữ liệu tổng hợp để liên tục nâng cao chất lượng của LLM của OpenAI.

Song song, các Mô hình Orion hoặc dòng GPT (xem xét việc OpenAI đã đăng ký nhãn hiệu GPT-5) tiếp tục phát triển, tập trung vào xử lý ngôn ngữ và các nhiệm vụ giao tiếp chung. Các mô hình này duy trì yêu cầu tính toán hiệu quả hơn trong khi tận dụng cơ sở kiến thức rộng lớn hơn để thực hiện các nhiệm vụ viết và lập luận.

CPO Kevin Weil của OpenAI cũng đã xác nhận điều này trong một AMA và cho biết ông mong đợi sẽ hội tụ cả hai phát triển này tại một thời điểm nào đó trong tương lai.

“Nó không phải là một trong hai, mà là cả hai,” ông trả lời khi được hỏi liệu OpenAI sẽ tập trung vào việc mở rộng LLM với nhiều dữ liệu hơn hay sử dụng cách tiếp cận khác, tập trung vào các mô hình nhỏ hơn nhưng nhanh hơn, “các mô hình cơ bản tốt hơn cộng với nhiều quy mô thời gian suy luận / tính toán Strawberry hơn.”

Giải pháp tạm thời hay giải pháp cuối cùng?

Cách tiếp cận của OpenAI trong việc giải quyết vấn đề khan hiếm dữ liệu thông qua tạo dữ liệu tổng hợp mang đến những thách thức phức tạp cho ngành công nghiệp. Các nhà nghiên cứu của công ty đang phát triển các mô hình tinh vi để tạo dữ liệu đào tạo, nhưng giải pháp này đưa ra những phức tạp mới trong việc duy trì chất lượng và độ tin cậy của mô hình.

Như đã báo cáo trước đó, các nhà nghiên cứu nhận thấy rằng đào tạo mô hình trên dữ liệu tổng hợp là một con dao hai lưỡi. Mặc dù nó cung cấp một giải pháp tiềm năng cho vấn đề khan hiếm dữ liệu, nhưng nó cũng đưa ra những rủi ro mới về suy thoái mô hình và các mối quan tâm về độ tin cậy với suy thoái đã được chứng minh sau một vài lần lặp đào tạo.

Nói cách khác, khi các mô hình được đào tạo trên nội dung do AI tạo ra, chúng có thể bắt đầu khuếch đại các sai sót tinh vi trong đầu ra của mình. Những vòng lặp phản hồi này có thể duy trì và phóng đại các thành kiến hiện có, tạo ra hiệu ứng tích lũy ngày càng khó phát hiện và sửa chữa.

Nhóm Nền tảng của OpenAI đang phát triển các cơ chế lọc mới để duy trì chất lượng dữ liệu, thực hiện các kỹ thuật xác thực khác nhau để phân biệt giữa nội dung chất lượng cao và nội dung tổng hợp có thể có vấn đề. Nhóm cũng đang khám phá các phương pháp đào tạo kết hợp chiến lược kết hợp nội dung do con người và AI tạo ra để tối đa hóa lợi ích của cả hai nguồn trong khi giảm thiểu các nhược điểm tương ứng của chúng.

Tối ưu hóa sau đào tạo cũng đã trở nên quan trọng. Các nhà nghiên cứu đang phát triển các phương pháp mới để nâng cao hiệu suất mô hình sau giai đoạn đào tạo ban đầu, có thể cung cấp một cách để cải thiện khả năng mà không chỉ dựa vào việc mở rộng tập dữ liệu đào tạo.

Nói vậy, GPT-5 vẫn là một mô hình đang trong giai đoạn phôi thai với công việc phát triển đáng kể ở phía trước. Sam Altman, CEO của OpenAI, đã chỉ ra rằng nó sẽ không sẵn sàng triển khai trong năm nay hoặc năm tới. Thời gian dài này có thể chứng tỏ là một lợi thế, cho phép các nhà nghiên cứu giải quyết các hạn chế hiện tại và có khả năng phát hiện các phương pháp mới để cải thiện mô hình, nâng cao đáng kể GPT-5 trước khi ra mắt.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Twitter (X): https://twitter.com/tapchibtc_io

Tiktok: https://www.tiktok.com/@tapchibitcoin

Thạch Sanh

Theo Decrypt

Thẻ đính kèm:
OpenAI

Được đề cập trong bài viết

Sam Altman

Đồng sáng lập kiêm CEO của OpenAI và Worldcoin

Họ tên đầy đủ: Samuel Harris Altman Năm sinh: 1985 Quốc tịch: Hoa Kỳ Chức danh: CEO của OpenAI, đồng sáng lập World (trước đây là Worldcoin), cựu Chủ tịch Y Combinator Tài sản ước tính: khoảng 10 tỷ USD Khởi nghiệp từ sớm Sam Altman sinh ra và lớn… …

Tìm hiểu thêm

OpenAI

Công ty phát triển ChatGPT

Tên đầy đủ: OpenAI, Inc. Năm thành lập: 2015 Trụ sở chính: San Francisco, California, Hoa Kỳ Mô hình hoạt động: Tổ chức nghiên cứu kết hợp lợi nhuận có giới hạn (capped-profit hybrid model) Người đồng sáng lập: Sam Altman, Elon Musk, Greg Brockman, Ilya Sutskever, John Schulman, Wojciech… …

Tìm hiểu thêm

Bình luận

BÀI TRƯỚC

Bullrun Bitcoin có thể kéo dài trong 200 ngày nữa trước khi suy thoái kinh tế có thể xảy ra ở Hoa Kỳ

BÀI SAU

Arthur Hayes: Tương lai nợ nần của nước Mỹ có thể đưa Bitcoin lên 1 triệu đô la

Từ GPU đến token – Sự lạc quan của Nvidia có thể ảnh hưởng đến lĩnh vực tiền điện tử AI như thế nào

31/08/2025
13:00

Chip AI “Made in China” mới của DeepSeek có thể làm sụp đổ thị trường tiền điện tử Hoa Kỳ

23/08/2025
14:00

Meta dốc hàng tỷ USD vào AI: Tầm nhìn táo bạo hay canh bạc liều lĩnh?

31/07/2025
15:00

Token AI giảm 10% khi Thượng viện Hoa Kỳ bác bỏ lệnh đóng băng quy định AI của liên bang

02/07/2025
15:30

Đây là lý do Token nội dung có thể là xu hướng AI lớn nhất tiếp theo

27/06/2025
06:00

Xung đột Israel–Iran sẽ kết thúc ra sao? Đây là dự đoán từ các mô hình AI

14/06/2025
14:30

AI củng cố vai trò trong Web3, thách thức DeFi và gaming: DappRadar

07/06/2025
06:30

Lĩnh vực tiền điện tử AI tăng trưởng gấp 4 lần trong 2 năm, gần đạt 20 tỷ USD vốn hóa thị trường

29/05/2025
16:00

CEO DNA Fund: AI phi tập trung có tiềm năng tăng trưởng ‘lớn hơn Bitcoin’

27/05/2025
12:56

Cathie Wood dự báo AI và Bitcoin sẽ dẫn dắt giai đoạn tăng trưởng kinh tế mới của Mỹ

10/05/2025
13:00

Liệu AI Coin đang bước vào thị trường tăng giá tháng 5 hay phe gấu vẫn nắm quyền kiểm soát?

09/05/2025
11:00

CEO Aptos Labs: AI Agents và tài sản on-chain có thể định hình lại nền kinh tế toàn cầu

04/05/2025
06:00

Các ông lớn ngân hàng dự báo Fed sẽ cắt giảm lãi suất ít nhất hai lần trong năm 2025

06/09/2025
08:00

ETF Bitcoin và Ethereum mất gần 400 triệu USD nhưng tổ chức vẫn duy trì quan tâm

06/09/2025
07:00

Doanh nghiệp ồ ạt nắm giữ Bitcoin giữa làn sóng tăng giá 2025 – River

05/09/2025
10:00

SEC đề xuất vùng an toàn và cải cách broker-dealer cho crypto

05/09/2025
09:00

Chuyên gia Bloomberg: ETF altcoin khó tạo ra “alt season” truyền thống

05/09/2025
06:30

Chủ tịch ECB kêu gọi xử lý rủi ro từ stablecoin ngoài EU

04/09/2025
16:00

Fed sẽ tổ chức hội nghị tháng 10, tập trung vào stablecoin và DeFi

04/09/2025
15:00

XRP Army góp phần quyết định vào chiến thắng của Ripple trước SEC

04/09/2025
10:58

Arbitrum tung gói khuyến khích DeFi trị giá 40 triệu USD

04/09/2025
10:54

American Bitcoin của Trump bị ngừng 5 lần vì biến động

04/09/2025
09:30

Citi: Stablecoin và chứng khoán mã hóa sẽ chiếm 10% giao dịch toàn cầu trong 5 năm

03/09/2025
16:00

Tìm kiếm “memecoin” trên Google tăng trở lại nhưng vẫn dưới đỉnh tháng 1

03/09/2025
09:30

Mới cập nhật

Liệu XRP có giữ được hỗ trợ quan trọng khi OI giảm mạnh

Phân tích kỹ thuật
13 phút trước

Ripple (XRP) đang đối mặt với áp lực bán mạnh khi bước vào cuối tuần, hiện dao động quanh ngưỡng 2,82 USD trong phiên giao dịch thứ Bảy. Nỗ lực phục hồi trong ngày nhanh chóng hụt hơi trước rào cản 2,90 USD, khiến giá rơi trở lại vùng hỗ... ...

ETH duy trì đà tăng, bất chấp những lo ngại vĩ mô từ kinh tế Mỹ

Tin tức Ethereum (ETH)
43 phút trước

Ether (ETH) lao dốc 5,2% trong phiên thứ Sáu sau khi giới đầu tư tiêu hóa báo cáo việc làm Mỹ kém kỳ vọng. Đợt bán tháo này diễn ra song song với sự đảo chiều trên thị trường chứng khoán, cuốn phăng 90 triệu USD vị thế Long ETH.... ...

Phân tích kỹ thuật ngày 6 tháng 9: BTC, ETH, XRP, BNB, SOL, DOGE, ADA, LINK, HYPE, SUI

Phân tích kỹ thuật
2 giờ trước

Vào thứ Năm, áp lực bán đã kéo giá Bitcoin (BTC) xuống dưới mốc 110.000 USD, nhưng ngay lập tức, phe bò đã tận dụng nhịp giảm này để mua vào, đưa giá bật lên trên 113.000 USD vào thứ Sáu. Khi giá tăng, phe gấu lại xuất hiện với... ...

LINK khan hiếm, cầu tăng vọt: Chainlink Reserve có biến giấc mơ ‘vàng kỹ thuật số’ thành hiện thực?

Tin tức Altcoin
3 giờ trước

Bạn có tin rằng chỉ một thông báo cũng đủ để xoay chuyển toàn bộ cục diện thị trường tiền điện tử? Điều đó vừa xảy ra — và không đến từ một meme coin hay cơn sốt ngắn hạn, mà từ Chainlink, nền tảng hạ tầng thầm lặng nhưng... ...

Đây là 20 mạng lưới tiền điện tử phổ biến nhất hiện nay

Tin tức Altcoin
3 giờ trước

Hoạt động trên blockchain đang trở nên sôi động hơn bao giờ hết. Dữ liệu mới nhất cho thấy các mạng layer 1 tiếp tục khẳng định vị thế dẫn đầu, layer 2 đang tăng tốc vươn lên, trong khi những nền tảng DeFi ghi nhận đà tăng trưởng bùng... ...

Token sàn DEX này có thể tăng mạnh trong thời gian tới

Phân tích kỹ thuật
11 giờ trước

Aerodrome Finance (AERO) ghi nhận mức tăng hơn 4% trong phiên giao dịch hôm thứ Sáu, bật mạnh từ đường trung bình động hàm mũ (EMA) 50 ngày. Các chỉ số kỹ thuật cùng dữ liệu phái sinh tiếp tục duy trì triển vọng tích cực, mở ra khả năng... ...

Justin Sun kêu gọi WLFI mở khóa token bị đóng băng “phi lý”

Tin tức Memecoin
11 giờ trước

Nhà sáng lập Tron – Justin Sun đang kêu gọi World Liberty Financial (WLFI), một dự án crypto có liên quan đến gia đình Trump, mở khóa số token đã phân bổ cho anh. Ví của Sun đã bị đưa vào danh sách đen hôm thứ 5, sau khi dữ... ...

Solana hướng tới mức cao hơn khi TVL DeFi bùng nổ 1,8 tỷ USD trong 30 ngày

Phân tích kỹ thuật
12 giờ trước

Solana (SOL) đang phát đi những tín hiệu tăng giá nhẹ, giao dịch vững trên mức 205 USD vào thứ Sáu, phản ánh tâm lý thị trường “chấp nhận rủi ro” sau khi các dữ liệu kinh tế trọng yếu của Mỹ, bao gồm Tỷ lệ Thất nghiệp và Báo... ...

Bitcoin tăng trở lại nhờ dòng tiền tổ chức và kỳ vọng chính sách Fed: Liệu đà tăng có duy trì?

Phân tích kỹ thuật
12 giờ trước

Bitcoin (BTC) tiếp tục duy trì đà phục hồi, tiến sát mốc 112.000 USD trong phiên giao dịch ngày thứ Sáu, tăng gần 4% kể từ đầu tuần sau khi sụt giảm 4,62% ở tuần trước. Sự trở lại này diễn ra trong bối cảnh dòng tiền từ doanh nghiệp... ...

Drama crypto: Litecoin khiêu khích, XRP “phản dame” bằng vốn hóa gấp 20 lần

Tin tức Litecoin (LTC)
12 giờ trước

Trong khi thị trường tiền điện tử vẫn đang quay cuồng với biến động giá, một cuộc “khẩu chiến” bất ngờ lại bùng nổ giữa hai cái tên quen thuộc: XRP của Ripple và Litecoin. Mọi chuyện bắt đầu khi tài khoản X chính thức của Litecoin đăng tải lời... ...

Xem thêm bài viết

Được đề cập trong bài viết