Trang chủ Trí tuệ nhân tạo (AI) Meta ra mắt Llama 3.2 mã nguồn mở: AI có thể “nhìn”...

Meta ra mắt Llama 3.2 mã nguồn mở: AI có thể “nhìn” và bỏ vừa trong túi bạn

Đây là một tuần đầy tích cực cho AI mã nguồn mở.

Vào thứ Tư, Meta công bố bản nâng cấp cho mô hình ngôn ngữ lớn hàng đầu của mình, Llama 3.2. Không chỉ có khả năng đàm thoại, Llama 3.2 còn có thể “nhìn thấy”.

Điều đặc biệt hơn là một số phiên bản của mô hình này có thể tích hợp vào điện thoại thông minh mà không làm giảm chất lượng, cho phép tương tác AI riêng tư trên thiết bị mà không cần gửi dữ liệu đến các máy chủ bên thứ ba.

Ra mắt tại sự kiện Meta Connect, Llama 3.2 có bốn phiên bản khác nhau, mỗi phiên bản đều có điểm mạnh riêng. Các mô hình tham số lớn – 11B và 90B – có khả năng xử lý cả văn bản và hình ảnh, thực hiện các nhiệm vụ phức tạp như phân tích biểu đồ, chú thích hình ảnh và xác định các đối tượng trong ảnh dựa trên mô tả ngôn ngữ tự nhiên.

Llama 3.2 được giới thiệu cùng tuần với Molmo của Viện Allen, tuyên bố là mô hình LLM thị giác đa phương tiện mã nguồn mở tốt nhất, hoạt động tương đương với các chatbot nổi tiếng như GPT-4o, Claude 3.5 Sonnet và Reka Core.

Meta cũng giới thiệu hai mô hình nhẹ: các mô hình 1B và 3B tham số, được thiết kế cho hiệu suất cao, tốc độ nhanh và các nhiệm vụ lặp đi lặp lại không đòi hỏi nhiều tính toán. Mặc dù kích thước nhỏ, chúng có khả năng “gọi công cụ” tốt hơn và một cửa sổ ngữ cảnh 128K token, lý tưởng cho việc tóm tắt, theo dõi hướng dẫn và viết lại trên thiết bị.

Đội ngũ kỹ thuật của Meta đã thực hiện các kỹ thuật tinh vi để đạt được điều này, sử dụng cắt tỉa có cấu trúc và chuyển giao tri thức để loại bỏ dữ liệu không cần thiết từ các mô hình lớn hơn và chuyển giao kiến thức từ các mô hình lớn sang các mô hình nhỏ hơn.

Kết quả là một bộ mô hình nhỏ gọn vượt trội hơn so với các đối thủ cạnh tranh trong cùng phân khúc, vượt qua các mô hình như Gemma 2 2.6B của Google và Phi-2 2.7B của Microsoft trên nhiều bài kiểm tra.

Meta cũng đang tăng cường AI trên thiết bị, hợp tác với các công ty phần cứng lớn như Qualcomm, MediaTek và Arm để đảm bảo Llama 3.2 hoạt động tốt với các chip di động. Các công ty điện toán đám mây như AWS, Google Cloud và Microsoft Azure cũng cung cấp quyền truy cập tức thì vào các mô hình mới.

Khả năng thị giác của Llama 3.2 được cải thiện nhờ các điều chỉnh kiến trúc thông minh, thêm trọng số bộ điều hợp vào mô hình ngôn ngữ hiện có, tạo cầu nối giữa các bộ mã hóa hình ảnh và lõi xử lý văn bản.

Llama 3.2 được phát hành dưới dạng mã nguồn mở theo tiêu chuẩn của Meta, có sẵn để tải xuống trên Llama.com và Hugging Face, cũng như thông qua hệ sinh thái đối tác rộng lớn của họ. Những ai muốn chạy mô hình trên đám mây có thể sử dụng Google Collab Notebook hoặc Groq cho các tương tác dựa trên văn bản, tạo ra gần 5000 token trong chưa đầy 3 giây.

Thử nghiệm Llama 3.2

Meta đã thử nghiệm Llama 3.2 trên nhiều nhiệm vụ khác nhau và nhận thấy mô hình này hoạt động tốt trong các tương tác dựa trên văn bản. Tuy nhiên, khả năng mã hóa của nó cho kết quả không đồng nhất. Khi thử nghiệm trên nền tảng của Groq, Llama 3.2 đã tạo ra mã cho các trò chơi phổ biến và các chương trình đơn giản, nhưng mô hình 70B gặp khó khăn khi được yêu cầu tạo mã cho một trò chơi tùy chỉnh. Ngược lại, mô hình 90B mạnh hơn lại hiệu quả và tạo ra một trò chơi hoàn chỉnh ngay lần thử đầu tiên.

Llama 3.2 xuất sắc trong việc xác định các yếu tố chủ quan trong hình ảnh, nhưng gặp khó khăn với văn bản nhỏ trong biểu đồ. Tuy nhiên, nó hoạt động xuất sắc khi đọc văn bản trong các hình ảnh lớn hơn, phân biệt đúng tên và vai trò công việc mà không mắc lỗi nào.

Tổng kết

Llama 3.2 là một cải tiến lớn so với thế hệ trước và là bổ sung tuyệt vời cho ngành công nghiệp AI mã nguồn mở. Điểm mạnh của nó nằm ở khả năng diễn giải hình ảnh và nhận diện văn bản lớn, với một số điểm cần cải thiện trong việc xử lý hình ảnh chất lượng thấp và các nhiệm vụ mã hóa phức tạp. Khả năng tương thích trên thiết bị cũng hứa hẹn tương lai của các nhiệm vụ AI cục bộ và riêng tư, là đối trọng tuyệt vời với các đề xuất độc quyền như Gemini Nano và các mô hình của Apple.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Thạch Sanh

Theo Decrypt

MỚI CẬP NHẬT

3 token mở khóa cho tuần thứ tư của tháng 4

Sự kiện mở khóa token có sức mạnh làm thay đổi thị trường. Chúng tạo ra thanh khoản mới, kích hoạt biến động giá...

Bitcoin có thể đạt $138K trong 3 tháng tới khi cơ hội vĩ mô...

Bitcoin đang đối mặt với mối tương quan "chưa từng có" với đô la Mỹ khi nghiên cứu giá BTC mới đưa ra mức...

Dogecoin giằng co ở mốc 0,15 USD: Cá voi tháo chạy, holder vẫn ôm...

Dogecoin (DOGE) đang "chảy máu" dưới sức nặng của chính những ông lớn nắm giữ nó. Chỉ trong vòng một tuần, 570 triệu DOGE đã...
Robert Kiyosaki bitcoin

Robert Kiyosaki: Bitcoin sẽ vượt 1 triệu USD, vàng đạt 1 tỷ đồng mỗi...

Robert Kiyosaki, doanh nhân nổi tiếng và tác giả cuốn sách tài chính cá nhân bán chạy toàn cầu Rich Dad Poor Dad (Cha...

Ethereum sắp bùng nổ? Đừng bỏ lỡ mốc giá sống còn này

Tại thời điểm viết bài, Ethereum (ETH) dường như đang tích lũy trong một vùng giá quan trọng, dao động giữa hai vùng cung...

Tin vắn Crypto 19/04: Bitcoin có khả năng lấy lại mốc $100.000 trước khi...

Từ nhận định Bitcoin có khả năng lấy lại mốc $100.000 trước khi kết thúc 2025 đến Astar giới thiệu mô hình Dynamic Tokenomics,...

Cá voi xả hàng, TRX lao dốc – Nhà đầu tư nhỏ lẻ liệu...

Thời gian gần đây, TRON (TRX) đã chứng kiến sự gia tăng mạnh mẽ về số lượng hợp đồng, đạt mức 316.072 trong chu...
Bitcoin

Hàng tỷ đô la quyền chọn Bitcoin và ETH sẽ hết hạn hôm nay:...

Một phiên giao dịch biến động đang dần hình thành khi 2,02 tỷ đô la trong các quyền chọn Bitcoin và 280 triệu đô...
btc-phuc-hoi

Bitcoin sẵn sàng lấy lại $90.000? Động thái lớn tiếp theo có thể xảy...

Giữa biến động thị trường, Bitcoin (BTC) vẫn chưa thể giành lại vùng giá $85.000-$86.000 bất chấp hiệu suất hàng tuần tích cực. Tuy...
aptos

Aptos đề xuất giảm 3% phần thưởng staking trong 3 tháng để thúc đẩy...

Một đề xuất quản trị mới cho blockchain layer 1 Aptos đề xuất giảm phần thưởng staking từ khoảng 7% xuống còn 3,79% trong...

Brazil tuyên án 171 năm tù cho ba lãnh đạo đứng sau vụ lừa...

Một tòa án tại Brazil vừa tuyên phạt tổng cộng 171 năm tù đối với ba lãnh đạo chủ chốt của Braiscompany – một...
xrp-tang

Dòng tiền 11 triệu USD có đủ để giúp giá XRP tăng mạnh trở...

Trong 24 giờ qua, XRP gần như đi ngang với mức giảm nhẹ 0,74% trên biểu đồ. Tuy nhiên, tại thời điểm viết bài,...

[QC] CEO Bybit gặp Bộ trưởng Bộ Tài chính Việt Nam để hỗ trợ...

Dubai, Các Tiểu vương quốc Ả Rập Thống nhất, ngày 19 tháng 4 năm 2025, Chainwire Ben Zhou, Đồng sáng lập kiêm CEO của...
bitcoin

Peter Schiff: Mỹ sẽ không mua Bitcoin, và các quốc gia khác cũng vậy

"Con bọ vàng" và người chống đối Bitcoin Peter Schiff vừa đưa ra dự đoán rằng chính phủ Mỹ sẽ không mua Bitcoin. “Mỹ...

Cổ phiếu token hóa có thể vượt mốc 1.000 tỷ USD khi nhu cầu...

Thị trường cổ phiếu token hóa đang trên đà vượt mốc vốn hóa 1.000 tỷ USD trong vài năm tới khi mức độ chấp...
7,8 triệu đồng Pi được mở khóa hôm nay

7,8 triệu đồng Pi được mở khóa hôm nay: Giá tăng 6%

Pi Coin đang cho thấy dấu hiệu hồi sinh sau khi tăng 6% trong 24 giờ qua, hiện đang giao dịch ở mức $0.645. Sự...