Vào tháng 11, công ty start-up OpenAI của Mỹ đã ra mắt dự án chatbot AI ChatGPT dựa trên mô hình ngôn ngữ lớn GPT-3 và GPT-3.5. Nó đã trở thành một cú hit ngay lập tức nhờ khả năng hoàn thành các tác vụ phức tạp như viết code. Bot thậm chí đã vượt qua kỳ thi MBA tại Wharton và một số doanh nghiệp đã sớm tích hợp công cụ này. OpenAI hiện đã phát hành phiên bản nâng cấp của mô hình ngôn ngữ có tên GPT-4. Đây là những thông tin nên chúng ta biết về mô hình mới.
Generative Pre-training Transformer (GPT) là một mô hình ngôn ngữ dựa vào deep learning để tạo ra các phản hồi giống con người đối với lời nhắc của người dùng. Như MetaNews đã đưa tin, Giám đốc công nghệ Microsoft Đức Andreas Braun lần đầu tiên tiết lộ ý tưởng về một phiên bản cải tiến của công nghệ GPT tại một hội nghị gần đây ở Châu Âu. Và bây giờ nó đã xuất hiện.
GPT-4 là gì?
GPT-4 là phiên bản mới và tiên tiến nhất của các mô hình ngôn ngữ lớn của OpenAI, làm nền tảng cho ChatGPT và một số ứng dụng khác. Đúng như tên gọi, đây là mẫu thứ tư trong loạt mẫu GPT. OpenAI đã phát hành mô hình vào ngày 14 tháng 3.
Báo cáo kỹ thuật GPT-4 không chỉ định kích thước mô hình, với lý do “bối cảnh cạnh tranh và ý nghĩa an toàn của các mô hình quy mô lớn”. Tuy nhiên, vào tháng 1, The Verge đã báo cáo rằng GPT-4 sẽ tăng đáng kể số lượng tham số lên 100 nghìn tỷ. Giám đốc điều hành OpenAI Sam Altman đã mô tả các báo cáo là “hoàn toàn nhảm nhí”.
AI sáng tạo yêu cầu một lượng dữ liệu khổng lồ để đào tạo. Trong trường hợp của GPT, số lượng tham số đào tạo được sử dụng để phát triển mô hình ngôn ngữ đã tăng từ khoảng 120 triệu vào năm 2018 lên gần 180 tỷ vào năm 2020, theo một báo cáo mới từ công ty dữ liệu TrendForce.
Theo OpenAI, GPT-4 sử dụng hệ thống đa phương thức để xử lý nhiều loại đầu vào khác nhau, bao gồm video, âm thanh, hình ảnh và văn bản. Nó có khả năng tạo video từ văn bản, nhưng đó vẫn là một ý tưởng đang được tiến hành. GPT-4 có thể thực hiện nhiều tác vụ cùng một lúc.
Bot đã được đào tạo bằng cách sử dụng phản hồi thực tế từ con người, làm cho nó trở nên giống con người hơn và rõ ràng là tiên tiến hơn so với các mô hình trước đó. Để so sánh, GPT-3.5 xử lý đầu vào văn bản thuần túy và tạo đầu ra mã và văn bản ngôn ngữ tự nhiên.
Làm thế nào để mô hình mới so sánh với ChatGPT-3.5?
Trong một bài đăng trên blog, OpenAI giải thích rằng “GPT-4 đáng tin cậy hơn, sáng tạo hơn và có thể xử lý nhiều hướng dẫn sắc thái hơn nhiều so với GPT-3.5.” Nó có thể đọc, chỉnh sửa, phân tích hoặc tạo tối đa 25.000 từ văn bản, một cải tiến lớn so với các phiên bản trước đây của cùng công nghệ.
Công ty tuyên bố GPT-4 “có thể giải các bài toán khó với độ chính xác cao hơn, nhờ vào kiến thức chung rộng hơn và khả năng giải quyết vấn đề của nó”. GPT-4 có thể giúp người dùng trong các tác vụ đòi hỏi sự sáng tạo, chẳng hạn như sáng tác bài hát hoặc tìm hiểu phong cách của người dùng.
GPT-4 cũng có thể lấy hình ảnh làm đầu vào và tạo chú thích, phân loại và phân tích. Ví dụ: một người dùng đăng bức ảnh có trứng, sữa, bơ và bột mì và hỏi: “Tôi có thể làm món gì với những nguyên liệu này?”
Chatbot đã trả lời bằng một danh sách các tùy chọn bao gồm bánh kếp hoặc bánh quế, bánh crepe, bánh mì nướng kiểu Pháp, trứng tráng hoặc khoai tây chiên, bánh trứng, sữa trứng hoặc bánh pudding, bánh ngọt hoặc bánh nướng nhỏ, bánh nướng xốp hoặc bánh mì và bánh quy hoặc bánh quy. “Đây chỉ là một vài ví dụ, nhưng khả năng là vô tận!”, thông báo cho biết.
GPT-4 “cao cấp hơn nhiều”
Jim Fan, nhà khoa học AI từ Đại học Stanford, đã viết trên Twitter rằng “khả năng suy luận của GPT-4 tiên tiến hơn nhiều” so với GPT-3.5. Ông cho biết mô hình hiện có thể phân tích và chú thích hình ảnh, cũng như tóm tắt các văn bản phức tạp.
GPT-4 đã xuất sắc vượt qua kỳ thi thanh tra và nhiều lần vượt trội so với ChatGPT trong cùng một nhiệm vụ. Nó chính xác hơn, tự hào xếp thứ hạng 99% và được nêu danh là “có tầm nhìn trong kỳ thi Olympic Sinh học” hơn so với những người tiền nhiệm của nó, cụ thể là ChatGPT.
Nhà khoa học này cũng cho biết vào tuần trước rằng GPT-4 có thể có khả năng thực hiện nhiều tác vụ hơn so với những tác vụ mà Microsoft đã chia sẻ, bao gồm cả việc thực hiện bài kiểm tra IQ trực quan. Ông dự đoán mô hình ngôn ngữ đa phương thức sẽ là một “thế lực không thể ngăn cản”.
GPT-4 bị lỗi tăng cường “an toàn” cho người dùng
Sam Altman cho biết trên Twitter rằng GPT-4 “là mô hình phù hợp và có khả năng nhất của chúng tôi”. Nhưng Giám đốc điều hành OpenAI cảnh báo rằng mặc dù GPT-4 “có vẻ ấn tượng hơn khi sử dụng lần đầu nhưng mô hình vẫn còn thiếu sót, vẫn còn hạn chế”.
Các giới hạn của GPT-4 bao gồm thành kiến xã hội, ảo giác và lời nhắc chống đối. Altman cho biết công ty đang làm việc để giải quyết tất cả những vấn đề này.
it is more creative than previous models, it hallucinates significantly less, and it is less biased. it can pass a bar exam and score a 5 on several AP exams. there is a version with a 32k token context.
— Sam Altman (@sama) March 14, 2023
OpenAI cho biết họ “đã dành sáu tháng để làm cho GPT-4 an toàn và phù hợp hơn.” Mô hình mới có khả năng phản hồi các yêu cầu về nội dung như không được phép thấp hơn 82% và có khả năng tạo ra phản hồi thực tế cao hơn 40% so với GPT-3.5, công ty cho biết. Điều này làm cho GPT-4 trở thành một công cụ hữu ích hơn so với các bot AI khác trên thị trường.
“Chúng tôi đã kết hợp nhiều phản hồi của con người hơn, bao gồm cả phản hồi do người dùng ChatGPT gửi, để cải thiện hành vi của GPT-4. Chúng tôi đã áp dụng các bài học từ việc sử dụng thực tế các mô hình trước đây của mình vào hệ thống giám sát và nghiên cứu an toàn của GPT-4,” thông báo nói thêm.
Đại diện Hoa Kỳ Don Beyer và Ted Lieu đã xác nhận với New York Times rằng Altman đã đến thăm Quốc hội vào đầu năm nay để trình diễn GPT-4 và “các biện pháp kiểm soát bảo mật” cải tiến của nó so với các mô hình AI khác.
Bạn có thể sử dụng nó ở đâu?
Jim Fan, nhà khoa học của Stanford, đã do dự về việc liệu công nghệ này đã được phát hành cho công chúng chưa. Nhưng trang web OpenAI cho biết GPT-4 sẽ được cung cấp cho các nhà phát triển thông qua API. Nó đã có sẵn cho công chúng thông qua ChatGPT Plus, một dịch vụ đăng ký với giá 20 USD/tháng từ OpenAI.
Người dùng API phải tham gia danh sách chờ. Giao diện lập trình ứng dụng (API) là một loại giao diện phần mềm cho phép hai hoặc nhiều chương trình máy tính giao tiếp với nhau, theo từ điển trực tuyến biết tất cả Wikipedia.
GPT-4 cũng đã được một số tổ chức tích hợp vào các sản phẩm, bao gồm Morgan Stanley, Stripe, Duolingo, Chính phủ Iceland và Khan Academy.
Andreas Braun của Microsoft không cho biết khi nào các tính năng mới của GPT-4 sẽ được thêm vào Bing Chat do AI hỗ trợ của công ty khi ông tiết lộ tin tức ở Đức. Nhưng các quan chức khác nói với TechCrunch rằng các phiên bản Bing sử dụng GPT trên thực tế đã sử dụng GPT-4 trước khi phát hành chính thức.
Tham gia Telegram của Tạp Chí Bitcoin: https://t.me/tapchibitcoinvn
Theo dõi Twitter: https://twitter.com/tapchibtc_io
Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin
- CryptoGPT (GPT) là gì? ZK blockchain layer-2 phát triển AI có gì nổi bật?
- Phân biệt token chứng khoán và chứng khoán được token hóa
Xoài
Theo Metanews