Trang chủ >> Trí tuệ nhân tạo (AI) >> Alibaba ra mắt AI Qwen2 thách thức Meta và OpenAI

Alibaba ra mắt AI Qwen2 thách thức Meta và OpenAI

Updated: 08/06/2024 at 12:06

Alibaba, gã khổng lồ thương mại điện tử Trung Quốc, là một người chơi lớn trong lĩnh vực AI của Trung Quốc. Hôm nay, họ đã công bố ra mắt mô hình AI mới nhất của mình, Qwen2 – và theo một số biện pháp so sánh, nó là lựa chọn nguồn mở tốt nhất hiện nay.

Được phát triển bởi Alibaba Cloud, Qwen2 là thế hệ tiếp theo của dòng mô hình Tongyi Qianwen (Qwen) của công ty, bao gồm mô hình ngôn ngữ lớn Tongyi Qianwen LLM (còn được gọi là Qwen), mô hình AI hình ảnh Qwen-VL và Qwen-Audio.

Qwen được tiền huấn luyện trên dữ liệu đa ngôn ngữ bao phủ nhiều ngành công nghiệp và lĩnh vực khác nhau, với Qwen-72B là mô hình mạnh nhất trong dòng. Nó được huấn luyện trên 3 nghìn tỷ token dữ liệu. So với đó, biến thể mạnh nhất của Llama-2 của Meta dựa trên 2 nghìn tỷ token. Tuy nhiên, Llama-3 đang trong quá trình xử lý 15 nghìn tỷ token.

Theo một bài đăng blog gần đây của đội ngũ Qwen, Qwen2 có thể xử lý 128 nghìn token ngữ cảnh – tương đương với GPT-4o từ OpenAI. Qwen2 cũng đã vượt trội hơn LLama3 của Meta trong hầu hết các chỉ số tổng hợp quan trọng, đội ngũ này khẳng định, làm cho nó trở thành mô hình nguồn mở tốt nhất hiện có.

Tuy nhiên, đáng chú ý là Elo Arena độc lập xếp hạng Qwen2-72B-Instruct cao hơn một chút so với GPT-4-0314 nhưng dưới LLama3 70B và GPT-4-0125-preview, làm cho nó trở thành mô hình LLM nguồn mở được ưa chuộng thứ hai trong số các người thử nghiệm cho đến nay.

Qwen2 hoạt động tốt hơn Llama3, Mixtral và Qwen1.5 trong các tiêu chuẩn tổng hợp | Hình ảnh: Alibaba Cloud

Qwen2 có sẵn trong năm kích thước khác nhau, từ 0,5 tỷ đến 72 tỷ tham số, và phiên bản phát hành này mang lại những cải tiến đáng kể trong các lĩnh vực chuyên môn khác nhau. Ngoài ra, các mô hình đã được huấn luyện với dữ liệu bằng 27 ngôn ngữ nhiều hơn so với phiên bản trước, bao gồm tiếng Đức, tiếng Pháp, tiếng Tây Ban Nha, tiếng Ý và tiếng Nga, ngoài tiếng Anh và tiếng Trung.

“So với các mô hình ngôn ngữ nguồn mở tiên tiến nhất, bao gồm Qwen1.5 đã phát hành trước đó, Qwen2 nhìn chung đã vượt qua hầu hết các mô hình nguồn mở và thể hiện tính cạnh tranh với các mô hình độc quyền trên một loạt các chỉ số nhắm đến hiểu ngôn ngữ, sinh ngôn ngữ, khả năng đa ngôn ngữ, lập trình, toán học và lý luận,” đội ngũ Qwen tuyên bố trên trang chính thức của mô hình trên HuggingFace.

Các mô hình Qwen2 cũng cho thấy khả năng ấn tượng trong việc hiểu các ngữ cảnh dài. Qwen2-72B-Instruct có thể xử lý các nhiệm vụ trích xuất thông tin ở bất kỳ đâu trong ngữ cảnh khổng lồ của nó mà không gặp lỗi, và nó đã vượt qua bài kiểm tra “Needle in a Haystack” gần như hoàn hảo. Điều này quan trọng, vì truyền thống, hiệu suất của mô hình bắt đầu suy giảm khi chúng ta tương tác với nó nhiều hơn.

Qwen2 thực hiện một cách đáng kinh ngạc trong bài kiểm tra “Kim trong đống cỏ khô” | Ảnh: Alibaba Cloud

Với phiên bản phát hành này, đội ngũ Qwen cũng đã thay đổi giấy phép cho các mô hình của mình. Trong khi Qwen2-72B và các mô hình điều chỉnh hướng dẫn của nó tiếp tục sử dụng giấy phép Qianwen gốc, tất cả các mô hình khác đã áp dụng giấy phép Apache 2.0, một tiêu chuẩn trong thế giới phần mềm nguồn mở.

“Trong tương lai gần, chúng tôi sẽ tiếp tục mở mã các mô hình mới để tăng tốc AI nguồn mở,” Alibaba Cloud cho biết trong một bài đăng blog chính thức.

Decrypt đã thử nghiệm mô hình và nhận thấy nó khá khả năng trong việc hiểu các nhiệm vụ bằng nhiều ngôn ngữ. Mô hình này cũng được kiểm duyệt, đặc biệt là trong các chủ đề được coi là nhạy cảm ở Trung Quốc. Điều này dường như phù hợp với tuyên bố của Alibaba rằng Qwen2 là mô hình ít có khả năng cung cấp kết quả không an toàn nhất – dù là hoạt động bất hợp pháp, gian lận, nội dung khiêu dâm, và vi phạm quyền riêng tư – dù ở ngôn ngữ nào.

Câu trả lời của ChatGPT cho câu hỏi nhạy cảm: “Đài Loan có phải là một quốc gia không?”

Ngoài ra, nó có khả năng hiểu tốt các lời nhắc hệ thống, điều này có nghĩa là các điều kiện áp dụng sẽ có ảnh hưởng mạnh hơn đến câu trả lời của nó. Ví dụ, khi được yêu cầu đóng vai một trợ lý hữu ích với kiến thức về luật pháp so với một luật sư hiểu biết luôn trả lời dựa trên luật pháp, các câu trả lời cho thấy sự khác biệt lớn. Nó cung cấp lời khuyên tương tự như GPT-4o, nhưng ngắn gọn hơn.

Nâng cấp mô hình tiếp theo sẽ mang tính đa phương thức vào Qwen2 LLM, có thể hợp nhất tất cả các gia đình thành một mô hình mạnh mẽ, đội ngũ cho biết. “Ngoài ra, chúng tôi mở rộng các mô hình ngôn ngữ Qwen2 đến đa phương thức, có khả năng hiểu cả thông tin hình ảnh và âm thanh,” họ nói thêm.

Trả lời của ChatGPT cho: “Một người hàng xóm đã xúc phạm tôi”

Qwen có sẵn để thử nghiệm trực tuyến qua HuggingFace Spaces. Những người có đủ khả năng tính toán để chạy nó cục bộ có thể tải trọng lượng miễn phí qua HuggingFace.

Mô hình Qwen2 có thể là một sự thay thế tuyệt vời cho những người muốn đặt cược vào AI nguồn mở. Nó có cửa sổ ngữ cảnh lớn hơn hầu hết các mô hình khác, làm cho nó thậm chí còn mạnh hơn LLama3 của Meta. Ngoài ra, nhờ vào giấy phép của nó, các phiên bản tinh chỉnh chia sẻ bởi những người khác có thể cải thiện nó, tăng điểm số và vượt qua thiên vị.

*Trí tuệ nhân tạo tổng quát (Artificial General Intelligence – AGI) là một dạng AI có khả năng thực hiện mọi nhiệm vụ trí tuệ mà con người có thể làm được. Khác với AI hẹp (ANI), AGI có khả năng hiểu, học hỏi và áp dụng kiến thức trong nhiều lĩnh vực khác nhau. AGI có thể tự học hỏi từ kinh nghiệm và dữ liệu mới mà không cần sự can thiệp liên tục của con người. Nó có thể thích nghi với các tình huống và vấn đề mới mà chưa từng gặp phải trước đây. AGI được coi là mục tiêu cuối cùng của nghiên cứu AI, nhưng hiện tại vẫn còn ít nhất 10 năm nữa để phát triển. AGI đang gây ra nhiều lo ngại về an ninh và rủi ro tiềm ẩn đối với nhân loại.

Tham gia Telegram của Tạp Chí Bitcoin: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Thạch Sanh

Theo Decrypt

Được đề cập trong bài viết

Bình luận

BÀI TRƯỚC

Andrew Tate đang khuấy đảo trên thị trường memecoin, tuyên bố "đánh sập Solana"

BÀI SAU

Bitcoin dự kiến đạt mức cao mới $83,000 vào tuần tới nhưng Ethereum kìm hãm – 10x Research

Từ GPU đến token – Sự lạc quan của Nvidia có thể ảnh hưởng đến lĩnh vực tiền điện tử AI như thế nào

31/08/2025
13:00

Chip AI “Made in China” mới của DeepSeek có thể làm sụp đổ thị trường tiền điện tử Hoa Kỳ

23/08/2025
14:00

Meta dốc hàng tỷ USD vào AI: Tầm nhìn táo bạo hay canh bạc liều lĩnh?

31/07/2025
15:00

Token AI giảm 10% khi Thượng viện Hoa Kỳ bác bỏ lệnh đóng băng quy định AI của liên bang

02/07/2025
15:30

Đây là lý do Token nội dung có thể là xu hướng AI lớn nhất tiếp theo

27/06/2025
06:00

Xung đột Israel–Iran sẽ kết thúc ra sao? Đây là dự đoán từ các mô hình AI

14/06/2025
14:30

AI củng cố vai trò trong Web3, thách thức DeFi và gaming: DappRadar

07/06/2025
06:30

Lĩnh vực tiền điện tử AI tăng trưởng gấp 4 lần trong 2 năm, gần đạt 20 tỷ USD vốn hóa thị trường

29/05/2025
16:00

CEO DNA Fund: AI phi tập trung có tiềm năng tăng trưởng ‘lớn hơn Bitcoin’

27/05/2025
12:56

Cathie Wood dự báo AI và Bitcoin sẽ dẫn dắt giai đoạn tăng trưởng kinh tế mới của Mỹ

10/05/2025
13:00

Liệu AI Coin đang bước vào thị trường tăng giá tháng 5 hay phe gấu vẫn nắm quyền kiểm soát?

09/05/2025
11:00

CEO Aptos Labs: AI Agents và tài sản on-chain có thể định hình lại nền kinh tế toàn cầu

04/05/2025
06:00

Top 10 website tin tức về thị trường Crypto và Bitcoin

26/02/2025
05:00

Airdrop là gì?

24/02/2025
18:15

Bitcoin phục hồi mức giá $100K khi kỳ vọng Fed cắt giảm lãi suất tăng lên

12/12/2024
07:06

Circle và Binance hợp tác mở rộng stablecoin USDC ra toàn cầu

11/12/2024
14:51

Thị trường Altcoin lao dốc 30% là cơ hội “Buy the Dip”

11/12/2024
14:30

Triển vọng Bitcoin của Peter Brandt: Từ $0 đến $1 triệu

11/12/2024
14:00

JPMorgan nâng mục tiêu giá cho các cổ phiếu khai thác Bitcoin

11/12/2024
13:00

OKX Ventures đẩy mạnh hệ sinh thái TON với khoản đầu tư 5 triệu USD

11/12/2024
11:41

Cơ quan quản lý New York phê duyệt stablecoin RLUSD của Ripple

11/12/2024
07:35

Charles Hoskinson hé lộ dự án lớn với Elon Musk, ADA được dự báo chạm mốc $6 vào năm 2025

16/11/2024
15:20

Người điều hành bộ trộn Helix lĩnh án 3 năm tù vì rửa tiền

16/11/2024
14:11

CFTC Hoa Kỳ cấp phép cho các tùy chọn ETF Bitcoin

16/11/2024
12:00

Mới cập nhật

SEC hoãn quyết định về ETF Dogecoin và Hedera, giữ hồ sơ đến giữa tháng 11

Tin tức Altcoin
14 phút trước

Ủy ban Chứng khoán và Giao dịch Mỹ (SEC) đã quyết định hoãn các phán quyết liên quan đến ETF Bitwise Dogecoin và ETF Hedera của Grayscale, giữ cả hai hồ sơ trong quá trình xem xét đến ngày 12/11. Vào thứ Ba, SEC đã lùi hạn cuối đối với... ...

Đà tăng của vàng có thể kéo giá Bitcoin lên 185.000 USD

Tin tức Bitcoin (BTC)
44 phút trước

Trong tháng 9/2025, vàng đã kéo dài chuỗi tăng bốn tuần liên tiếp và lập kỷ lục mới ở mức 3.659 USD/ounce. Diễn biến này không chỉ củng cố vị thế của vàng như tài sản trú ẩn an toàn, mà còn khiến giới đầu tư Bitcoin háo hức dõi... ...

Việc nới lỏng của ngân hàng trung ương và các chỉ số tâm lý yếu cho thấy chu kỳ tăng giá tiền điện tử vẫn đang ở giai đoạn đầu

Tạp chí
1 giờ trước

Julien Bittel, người đứng đầu bộ phận nghiên cứu vĩ mô tại Global Macro Investor, đã khẳng định rằng đợt tăng giá hiện tại vẫn còn ở giai đoạn đầu, dựa trên các chỉ số kinh tế toàn diện. Trong một phân tích được công bố vào ngày 8 tháng... ...

DOGE có thể tăng đến đâu nếu Dogecoin ETF được phê duyệt?

Tin tức Memecoin
9 giờ trước

Giá Dogecoin (DOGE) giao dịch ở mức 0,236 đô la vào thứ 3, tăng 20% so với đáy cục bộ 0,2047 đô la đạt được vào ngày 1/9. Đà hồi phục này được thúc đẩy bởi sự lạc quan ngày càng tăng về khả năng ra mắt Dogecoin ETF đầu... ...

HBAR tăng mạnh dù SEC Mỹ tiếp tục trì hoãn phê duyệt Canary HBAR ETF

Tin tức Altcoin
9 giờ trước

Giá Hedera (HBAR) đang cho thấy sự bền bỉ ngay cả khi Ủy ban Chứng khoán và Giao dịch Mỹ (SEC) trì hoãn quyết định về đề xuất HBAR ETF của Canary Capital đến ngày 8/11. Bất chấp áp lực giảm gần đây, altcoin này vẫn tăng 4% nhờ kỳ... ...

1inch (1INCH): Cá voi tăng cường tích lũy, tín hiệu kỹ thuật củng cố triển vọng tăng trưởng

Phân tích kỹ thuật
10 giờ trước

1inch (1INCH) tiếp tục giữ vững sắc xanh trong phiên giao dịch ngày thứ Ba, hiện dao động trên mốc 0,258 USD. Đáng chú ý, đồng coin này vừa bứt phá lên trên mô hình tam giác cân – tín hiệu kỹ thuật thường báo trước khả năng tăng trưởng... ...

Vì sao token AI đang dẫn dắt thị trường crypto trong tháng 9?

Tin tức Altcoin
10 giờ trước

Token AI đang bất ngờ vượt trội và dẫn dắt hiệu suất thị trường trong tháng 9. Một làn sóng tin tức tích cực đã thúc đẩy giá của nhiều token AI tăng mạnh, đồng thời nâng cao kỳ vọng đối với các dự án khác trong cùng lĩnh vực.... ...

ETH tăng nóng giữa lúc doanh thu sụt giảm: Phe bò có đang đánh cược quá đà?

Tin tức Ethereum (ETH)
10 giờ trước

Ở thời điểm hiện tại, thị trường vẫn đang tranh cãi gay gắt trước câu hỏi liệu Ethereum (ETH) đã thực sự tạo đáy hay chưa. Dữ liệu on-chain cho thấy giá trị của cặp ETH/BTC tiếp tục suy yếu, đánh dấu mức đáy thấp hơn lần thứ ba liên... ...

Tom Lee tự tin dự đoán Bitcoin sẽ đạt 200.000 đô la vào cuối năm

Tin tức Bitcoin (BTC)
11 giờ trước

Tom Lee, Chủ tịch của Bitmine Technologies, đã đưa ra dự đoán rằng Bitcoin sẽ “dễ dàng” đạt 200.000 USD trong năm nay, trong khi nó hiện đang giao dịch khoảng 113.000 USD. Lee cho rằng việc cắt giảm lãi suất tiềm năng từ Cục Dự trữ Liên bang Mỹ... ...

PENGU, FARTCOIN và BONK nổi bật trong nhóm meme coin Solana, tín hiệu cho đà tăng mới

Phân tích kỹ thuật
11 giờ trước

Trên hệ sinh thái Solana, loạt meme coin như Pudgy Penguins (PENGU), Fartcoin (FARTCOIN) hay Bonk (BONK) đang nổi lên như những cái tên dẫn dắt đà tăng trưởng của thị trường tiền điện tử. Làn sóng bàn luận sôi động trên mạng xã hội, kết hợp với các tín... ...

Xem thêm bài viết

Được đề cập trong bài viết

Chọn chế độ hiển thị:

Coin phổ biến

Alibaba ra mắt AI Qwen2 thách thức Meta và OpenAI

Chọn chế độ hiển thị: