Trang chủ Trí tuệ nhân tạo (AI) Alibaba ra mắt AI Qwen2 thách thức Meta và OpenAI

Alibaba ra mắt AI Qwen2 thách thức Meta và OpenAI

Alibaba, gã khổng lồ thương mại điện tử Trung Quốc, là một người chơi lớn trong lĩnh vực AI của Trung Quốc. Hôm nay, họ đã công bố ra mắt mô hình AI mới nhất của mình, Qwen2 – và theo một số biện pháp so sánh, nó là lựa chọn nguồn mở tốt nhất hiện nay.

Được phát triển bởi Alibaba Cloud, Qwen2 là thế hệ tiếp theo của dòng mô hình Tongyi Qianwen (Qwen) của công ty, bao gồm mô hình ngôn ngữ lớn Tongyi Qianwen LLM (còn được gọi là Qwen), mô hình AI hình ảnh Qwen-VL và Qwen-Audio.

Qwen được tiền huấn luyện trên dữ liệu đa ngôn ngữ bao phủ nhiều ngành công nghiệp và lĩnh vực khác nhau, với Qwen-72B là mô hình mạnh nhất trong dòng. Nó được huấn luyện trên 3 nghìn tỷ token dữ liệu. So với đó, biến thể mạnh nhất của Llama-2 của Meta dựa trên 2 nghìn tỷ token. Tuy nhiên, Llama-3 đang trong quá trình xử lý 15 nghìn tỷ token.

Theo một bài đăng blog gần đây của đội ngũ Qwen, Qwen2 có thể xử lý 128 nghìn token ngữ cảnh – tương đương với GPT-4o từ OpenAI. Qwen2 cũng đã vượt trội hơn LLama3 của Meta trong hầu hết các chỉ số tổng hợp quan trọng, đội ngũ này khẳng định, làm cho nó trở thành mô hình nguồn mở tốt nhất hiện có.

Tuy nhiên, đáng chú ý là Elo Arena độc lập xếp hạng Qwen2-72B-Instruct cao hơn một chút so với GPT-4-0314 nhưng dưới LLama3 70B và GPT-4-0125-preview, làm cho nó trở thành mô hình LLM nguồn mở được ưa chuộng thứ hai trong số các người thử nghiệm cho đến nay.

Qwen2 hoạt động tốt hơn Llama3, Mixtral và Qwen1.5 trong các tiêu chuẩn tổng hợp | Hình ảnh: Alibaba Cloud

Qwen2 có sẵn trong năm kích thước khác nhau, từ 0,5 tỷ đến 72 tỷ tham số, và phiên bản phát hành này mang lại những cải tiến đáng kể trong các lĩnh vực chuyên môn khác nhau. Ngoài ra, các mô hình đã được huấn luyện với dữ liệu bằng 27 ngôn ngữ nhiều hơn so với phiên bản trước, bao gồm tiếng Đức, tiếng Pháp, tiếng Tây Ban Nha, tiếng Ý và tiếng Nga, ngoài tiếng Anh và tiếng Trung.

“So với các mô hình ngôn ngữ nguồn mở tiên tiến nhất, bao gồm Qwen1.5 đã phát hành trước đó, Qwen2 nhìn chung đã vượt qua hầu hết các mô hình nguồn mở và thể hiện tính cạnh tranh với các mô hình độc quyền trên một loạt các chỉ số nhắm đến hiểu ngôn ngữ, sinh ngôn ngữ, khả năng đa ngôn ngữ, lập trình, toán học và lý luận,” đội ngũ Qwen tuyên bố trên trang chính thức của mô hình trên HuggingFace.

Các mô hình Qwen2 cũng cho thấy khả năng ấn tượng trong việc hiểu các ngữ cảnh dài. Qwen2-72B-Instruct có thể xử lý các nhiệm vụ trích xuất thông tin ở bất kỳ đâu trong ngữ cảnh khổng lồ của nó mà không gặp lỗi, và nó đã vượt qua bài kiểm tra “Needle in a Haystack” gần như hoàn hảo. Điều này quan trọng, vì truyền thống, hiệu suất của mô hình bắt đầu suy giảm khi chúng ta tương tác với nó nhiều hơn.

Qwen2 thực hiện một cách đáng kinh ngạc trong bài kiểm tra “Kim trong đống cỏ khô” | Ảnh: Alibaba Cloud

Với phiên bản phát hành này, đội ngũ Qwen cũng đã thay đổi giấy phép cho các mô hình của mình. Trong khi Qwen2-72B và các mô hình điều chỉnh hướng dẫn của nó tiếp tục sử dụng giấy phép Qianwen gốc, tất cả các mô hình khác đã áp dụng giấy phép Apache 2.0, một tiêu chuẩn trong thế giới phần mềm nguồn mở.

“Trong tương lai gần, chúng tôi sẽ tiếp tục mở mã các mô hình mới để tăng tốc AI nguồn mở,” Alibaba Cloud cho biết trong một bài đăng blog chính thức.

Decrypt đã thử nghiệm mô hình và nhận thấy nó khá khả năng trong việc hiểu các nhiệm vụ bằng nhiều ngôn ngữ. Mô hình này cũng được kiểm duyệt, đặc biệt là trong các chủ đề được coi là nhạy cảm ở Trung Quốc. Điều này dường như phù hợp với tuyên bố của Alibaba rằng Qwen2 là mô hình ít có khả năng cung cấp kết quả không an toàn nhất – dù là hoạt động bất hợp pháp, gian lận, nội dung khiêu dâm, và vi phạm quyền riêng tư – dù ở ngôn ngữ nào.

Câu trả lời của ChatGPT cho câu hỏi nhạy cảm: “Đài Loan có phải là một quốc gia không?”

Ngoài ra, nó có khả năng hiểu tốt các lời nhắc hệ thống, điều này có nghĩa là các điều kiện áp dụng sẽ có ảnh hưởng mạnh hơn đến câu trả lời của nó. Ví dụ, khi được yêu cầu đóng vai một trợ lý hữu ích với kiến thức về luật pháp so với một luật sư hiểu biết luôn trả lời dựa trên luật pháp, các câu trả lời cho thấy sự khác biệt lớn. Nó cung cấp lời khuyên tương tự như GPT-4o, nhưng ngắn gọn hơn.

Nâng cấp mô hình tiếp theo sẽ mang tính đa phương thức vào Qwen2 LLM, có thể hợp nhất tất cả các gia đình thành một mô hình mạnh mẽ, đội ngũ cho biết. “Ngoài ra, chúng tôi mở rộng các mô hình ngôn ngữ Qwen2 đến đa phương thức, có khả năng hiểu cả thông tin hình ảnh và âm thanh,” họ nói thêm.

Trả lời của ChatGPT cho: “Một người hàng xóm đã xúc phạm tôi”

Qwen có sẵn để thử nghiệm trực tuyến qua HuggingFace Spaces. Những người có đủ khả năng tính toán để chạy nó cục bộ có thể tải trọng lượng miễn phí qua HuggingFace.

Mô hình Qwen2 có thể là một sự thay thế tuyệt vời cho những người muốn đặt cược vào AI nguồn mở. Nó có cửa sổ ngữ cảnh lớn hơn hầu hết các mô hình khác, làm cho nó thậm chí còn mạnh hơn LLama3 của Meta. Ngoài ra, nhờ vào giấy phép của nó, các phiên bản tinh chỉnh chia sẻ bởi những người khác có thể cải thiện nó, tăng điểm số và vượt qua thiên vị.

*Trí tuệ nhân tạo tổng quát (Artificial General Intelligence – AGI) là một dạng AI có khả năng thực hiện mọi nhiệm vụ trí tuệ mà con người có thể làm được. Khác với AI hẹp (ANI), AGI có khả năng hiểu, học hỏi và áp dụng kiến thức trong nhiều lĩnh vực khác nhau. AGI có thể tự học hỏi từ kinh nghiệm và dữ liệu mới mà không cần sự can thiệp liên tục của con người. Nó có thể thích nghi với các tình huống và vấn đề mới mà chưa từng gặp phải trước đây. AGI được coi là mục tiêu cuối cùng của nghiên cứu AI, nhưng hiện tại vẫn còn ít nhất 10 năm nữa để phát triển. AGI đang gây ra nhiều lo ngại về an ninh và rủi ro tiềm ẩn đối với nhân loại.

Tham gia Telegram của Tạp Chí Bitcoin: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Thạch Sanh

Theo Decrypt

MỚI CẬP NHẬT

Token Ethena (ENA) tăng mạnh sau khi Deribit tích hợp USDe

Deribit, một trong những sàn giao dịch phái sinh crypto lớn nhất thế giới, có kế hoạch tích hợp USDe của Ethena làm tài...
phân tích kỹ thuật

Phân tích kỹ thuật tối ngày 22 tháng 11: XRP, ADA, OP, SOL và...

Tuần này, chúng ta sẽ xem xét chi tiết về Ripple (XRP), Cardano (ADA), Optimism (OP), Solana (SOL) và Dogecoin (DOGE). Phân tích kỹ thuật...
tiền điện tử

Khối lượng giao dịch tiền điện tử liên tiếp thiết lập kỷ lục vào...

Khối lượng giao dịch tiền điện tử hàng ngày trên các sàn giao dịch đã đạt mức cao nhất trong 12 tháng là 117...
eth

CryptoQuant: OI hợp đồng tương lai ETH đạt mức cao kỷ lục mới hơn...

Thị trường phái sinh Ethereum (ETH) có lẽ đang báo hiệu động lực tăng giá khi hợp đồng mở (OI)* hợp đồng tương lai...

Texas đang thảo luận về dự luật dự trữ chiến lược Bitcoin

Theo thông tin từ nhóm vận động phi lợi nhuận Satoshi Action Fund (SAF), dự luật dự trữ chiến lược Bitcoin đang được thảo...

Tin vắn Crypto 22/11: Bitcoin mới chỉ bắt đầu giai đoạn parabol trong chu...

Từ nhận định Bitcoin "mới chỉ bắt đầu giai đoạn parabol trong chu kỳ hiện tại" đến CFPB loại ví tiền điện tử ra...

Mùa Altcoin đầy sôi động: Đừng bỏ lỡ cơ hội đầu tư vào các...

Thị trường tiền điện tử vài tuần gần đây liên tục ghi nhận đà tăng trưởng bùng nổ mạnh mẽ. Đồng Bitcoin (BTC) gần...

Tập đoàn Charles Schwab cân nhắc giao dịch crypto, tân CEO ‘cảm thấy ngớ...

Charles Schwab, một trong những tập đoàn tài chính lớn nhất Hoa Kỳ, có kế hoạch tham gia thị trường crypto giao ngay khi...

Giá Popcat giảm mạnh, CatSlap bùng nổ ngày ra mắt. Meme coin hệ mèo...

Hãy quên Popcat đi! Một meme coin mới có tên CatSlap ($SLAP) vừa chính thức ra mắt và nhanh chóng trở thành cái tên...
Sandeep Nailwal của Polygon cảnh báo Rug Pulls memecoin

Các vụ kéo thảm memecoin như QUANT có thể thu hút sự đàn áp...

Sandeep Nailwal, đồng sáng lập mạng Ethereum layer-2 Polygon, cảnh báo rằng sự gia tăng các vụ lừa đảo liên quan đến memecoin có...

Các vụ kiện của SEC sẽ “âm thầm khép lại” sau khi Gensler từ...

Nhiều vụ kiện liên quan đến chứng khoán nhằm vào các công ty crypto tại Hoa Kỳ có khả năng sẽ “âm thầm khép...

[QC] Dogizen, ICO Đầu Tiên Trên Telegram, Thu Hút Được 1,4 Triệu USD Khi...

Trong thời gian ngắn, Dogizen đã thu hút sự chú ý trên khắp thế giới tiền điện tử, huy động được hơn 1,4 triệu...

The Graph (GRT) giới thiệu tiêu chuẩn GRC-20 cho cấu trúc dữ liệu Web3

The Graph, một hệ thống lập chỉ mục phi tập trung tương tự Google dành cho blockchain, đã giới thiệu một tiêu chuẩn dữ...
xrp-chau-au

Giá XRP tăng hơn 30% sau khi nhà quản lý tài sản toàn cầu...

Công ty quản lý tài sản Wisdomtree đã thông báo vào thứ Năm về việc ra mắt sản phẩm giao dịch hoán đổi (ETP)...

Tòa án Hoa Kỳ ra phán quyết SEC vượt quá thẩm quyền, hủy bỏ...

Một tòa án liên bang đã hủy bỏ quy định gây tranh cãi liên quan đến 'dealer - đại lý' của Ủy ban Chứng...
TruthFi

Trump Media tiết lộ tham vọng về giao dịch và thanh toán tiền điện...

Công ty truyền thông xã hội Trump Media and Technology Group (TMTG) của Tổng thống đắc cử Donald Trump đã tiết lộ tham vọng...