Trang chủ Trí tuệ nhân tạo (AI) Meta ra mắt Llama 3.2 mã nguồn mở: AI có thể “nhìn”...

Meta ra mắt Llama 3.2 mã nguồn mở: AI có thể “nhìn” và bỏ vừa trong túi bạn

Đây là một tuần đầy tích cực cho AI mã nguồn mở.

Vào thứ Tư, Meta công bố bản nâng cấp cho mô hình ngôn ngữ lớn hàng đầu của mình, Llama 3.2. Không chỉ có khả năng đàm thoại, Llama 3.2 còn có thể “nhìn thấy”.

Điều đặc biệt hơn là một số phiên bản của mô hình này có thể tích hợp vào điện thoại thông minh mà không làm giảm chất lượng, cho phép tương tác AI riêng tư trên thiết bị mà không cần gửi dữ liệu đến các máy chủ bên thứ ba.

Ra mắt tại sự kiện Meta Connect, Llama 3.2 có bốn phiên bản khác nhau, mỗi phiên bản đều có điểm mạnh riêng. Các mô hình tham số lớn – 11B và 90B – có khả năng xử lý cả văn bản và hình ảnh, thực hiện các nhiệm vụ phức tạp như phân tích biểu đồ, chú thích hình ảnh và xác định các đối tượng trong ảnh dựa trên mô tả ngôn ngữ tự nhiên.

Llama 3.2 được giới thiệu cùng tuần với Molmo của Viện Allen, tuyên bố là mô hình LLM thị giác đa phương tiện mã nguồn mở tốt nhất, hoạt động tương đương với các chatbot nổi tiếng như GPT-4o, Claude 3.5 Sonnet và Reka Core.

Meta cũng giới thiệu hai mô hình nhẹ: các mô hình 1B và 3B tham số, được thiết kế cho hiệu suất cao, tốc độ nhanh và các nhiệm vụ lặp đi lặp lại không đòi hỏi nhiều tính toán. Mặc dù kích thước nhỏ, chúng có khả năng “gọi công cụ” tốt hơn và một cửa sổ ngữ cảnh 128K token, lý tưởng cho việc tóm tắt, theo dõi hướng dẫn và viết lại trên thiết bị.

Đội ngũ kỹ thuật của Meta đã thực hiện các kỹ thuật tinh vi để đạt được điều này, sử dụng cắt tỉa có cấu trúc và chuyển giao tri thức để loại bỏ dữ liệu không cần thiết từ các mô hình lớn hơn và chuyển giao kiến thức từ các mô hình lớn sang các mô hình nhỏ hơn.

Kết quả là một bộ mô hình nhỏ gọn vượt trội hơn so với các đối thủ cạnh tranh trong cùng phân khúc, vượt qua các mô hình như Gemma 2 2.6B của Google và Phi-2 2.7B của Microsoft trên nhiều bài kiểm tra.

Meta cũng đang tăng cường AI trên thiết bị, hợp tác với các công ty phần cứng lớn như Qualcomm, MediaTek và Arm để đảm bảo Llama 3.2 hoạt động tốt với các chip di động. Các công ty điện toán đám mây như AWS, Google Cloud và Microsoft Azure cũng cung cấp quyền truy cập tức thì vào các mô hình mới.

Khả năng thị giác của Llama 3.2 được cải thiện nhờ các điều chỉnh kiến trúc thông minh, thêm trọng số bộ điều hợp vào mô hình ngôn ngữ hiện có, tạo cầu nối giữa các bộ mã hóa hình ảnh và lõi xử lý văn bản.

Llama 3.2 được phát hành dưới dạng mã nguồn mở theo tiêu chuẩn của Meta, có sẵn để tải xuống trên Llama.com và Hugging Face, cũng như thông qua hệ sinh thái đối tác rộng lớn của họ. Những ai muốn chạy mô hình trên đám mây có thể sử dụng Google Collab Notebook hoặc Groq cho các tương tác dựa trên văn bản, tạo ra gần 5000 token trong chưa đầy 3 giây.

Thử nghiệm Llama 3.2

Meta đã thử nghiệm Llama 3.2 trên nhiều nhiệm vụ khác nhau và nhận thấy mô hình này hoạt động tốt trong các tương tác dựa trên văn bản. Tuy nhiên, khả năng mã hóa của nó cho kết quả không đồng nhất. Khi thử nghiệm trên nền tảng của Groq, Llama 3.2 đã tạo ra mã cho các trò chơi phổ biến và các chương trình đơn giản, nhưng mô hình 70B gặp khó khăn khi được yêu cầu tạo mã cho một trò chơi tùy chỉnh. Ngược lại, mô hình 90B mạnh hơn lại hiệu quả và tạo ra một trò chơi hoàn chỉnh ngay lần thử đầu tiên.

Llama 3.2 xuất sắc trong việc xác định các yếu tố chủ quan trong hình ảnh, nhưng gặp khó khăn với văn bản nhỏ trong biểu đồ. Tuy nhiên, nó hoạt động xuất sắc khi đọc văn bản trong các hình ảnh lớn hơn, phân biệt đúng tên và vai trò công việc mà không mắc lỗi nào.

Tổng kết

Llama 3.2 là một cải tiến lớn so với thế hệ trước và là bổ sung tuyệt vời cho ngành công nghiệp AI mã nguồn mở. Điểm mạnh của nó nằm ở khả năng diễn giải hình ảnh và nhận diện văn bản lớn, với một số điểm cần cải thiện trong việc xử lý hình ảnh chất lượng thấp và các nhiệm vụ mã hóa phức tạp. Khả năng tương thích trên thiết bị cũng hứa hẹn tương lai của các nhiệm vụ AI cục bộ và riêng tư, là đối trọng tuyệt vời với các đề xuất độc quyền như Gemini Nano và các mô hình của Apple.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Thạch Sanh

Theo Decrypt

MỚI CẬP NHẬT

Token Ethena (ENA) tăng mạnh sau khi Deribit tích hợp USDe

Deribit, một trong những sàn giao dịch phái sinh crypto lớn nhất thế giới, có kế hoạch tích hợp USDe của Ethena làm tài...
phân tích kỹ thuật

Phân tích kỹ thuật tối ngày 22 tháng 11: XRP, ADA, OP, SOL và...

Tuần này, chúng ta sẽ xem xét chi tiết về Ripple (XRP), Cardano (ADA), Optimism (OP), Solana (SOL) và Dogecoin (DOGE). Phân tích kỹ thuật...
tiền điện tử

Khối lượng giao dịch tiền điện tử liên tiếp thiết lập kỷ lục vào...

Khối lượng giao dịch tiền điện tử hàng ngày trên các sàn giao dịch đã đạt mức cao nhất trong 12 tháng là 117...
eth

CryptoQuant: OI hợp đồng tương lai ETH đạt mức cao kỷ lục mới hơn...

Thị trường phái sinh Ethereum (ETH) có lẽ đang báo hiệu động lực tăng giá khi hợp đồng mở (OI)* hợp đồng tương lai...

Texas đang thảo luận về dự luật dự trữ chiến lược Bitcoin

Theo thông tin từ nhóm vận động phi lợi nhuận Satoshi Action Fund (SAF), dự luật dự trữ chiến lược Bitcoin đang được thảo...

Tin vắn Crypto 22/11: Bitcoin mới chỉ bắt đầu giai đoạn parabol trong chu...

Từ nhận định Bitcoin "mới chỉ bắt đầu giai đoạn parabol trong chu kỳ hiện tại" đến CFPB loại ví tiền điện tử ra...

Mùa Altcoin đầy sôi động: Đừng bỏ lỡ cơ hội đầu tư vào các...

Thị trường tiền điện tử vài tuần gần đây liên tục ghi nhận đà tăng trưởng bùng nổ mạnh mẽ. Đồng Bitcoin (BTC) gần...

Tập đoàn Charles Schwab cân nhắc giao dịch crypto, tân CEO ‘cảm thấy ngớ...

Charles Schwab, một trong những tập đoàn tài chính lớn nhất Hoa Kỳ, có kế hoạch tham gia thị trường crypto giao ngay khi...

Giá Popcat giảm mạnh, CatSlap bùng nổ ngày ra mắt. Meme coin hệ mèo...

Hãy quên Popcat đi! Một meme coin mới có tên CatSlap ($SLAP) vừa chính thức ra mắt và nhanh chóng trở thành cái tên...
Sandeep Nailwal của Polygon cảnh báo Rug Pulls memecoin

Các vụ kéo thảm memecoin như QUANT có thể thu hút sự đàn áp...

Sandeep Nailwal, đồng sáng lập mạng Ethereum layer-2 Polygon, cảnh báo rằng sự gia tăng các vụ lừa đảo liên quan đến memecoin có...

Các vụ kiện của SEC sẽ “âm thầm khép lại” sau khi Gensler từ...

Nhiều vụ kiện liên quan đến chứng khoán nhằm vào các công ty crypto tại Hoa Kỳ có khả năng sẽ “âm thầm khép...

[QC] Dogizen, ICO Đầu Tiên Trên Telegram, Thu Hút Được 1,4 Triệu USD Khi...

Trong thời gian ngắn, Dogizen đã thu hút sự chú ý trên khắp thế giới tiền điện tử, huy động được hơn 1,4 triệu...

The Graph (GRT) giới thiệu tiêu chuẩn GRC-20 cho cấu trúc dữ liệu Web3

The Graph, một hệ thống lập chỉ mục phi tập trung tương tự Google dành cho blockchain, đã giới thiệu một tiêu chuẩn dữ...
xrp-chau-au

Giá XRP tăng hơn 30% sau khi nhà quản lý tài sản toàn cầu...

Công ty quản lý tài sản Wisdomtree đã thông báo vào thứ Năm về việc ra mắt sản phẩm giao dịch hoán đổi (ETP)...

Tòa án Hoa Kỳ ra phán quyết SEC vượt quá thẩm quyền, hủy bỏ...

Một tòa án liên bang đã hủy bỏ quy định gây tranh cãi liên quan đến 'dealer - đại lý' của Ủy ban Chứng...
TruthFi

Trump Media tiết lộ tham vọng về giao dịch và thanh toán tiền điện...

Công ty truyền thông xã hội Trump Media and Technology Group (TMTG) của Tổng thống đắc cử Donald Trump đã tiết lộ tham vọng...