Trang chủ Trí tuệ nhân tạo (AI) Meta ra mắt Llama 3.2 mã nguồn mở: AI có thể “nhìn”...

Meta ra mắt Llama 3.2 mã nguồn mở: AI có thể “nhìn” và bỏ vừa trong túi bạn

Đây là một tuần đầy tích cực cho AI mã nguồn mở.

Vào thứ Tư, Meta công bố bản nâng cấp cho mô hình ngôn ngữ lớn hàng đầu của mình, Llama 3.2. Không chỉ có khả năng đàm thoại, Llama 3.2 còn có thể “nhìn thấy”.

Điều đặc biệt hơn là một số phiên bản của mô hình này có thể tích hợp vào điện thoại thông minh mà không làm giảm chất lượng, cho phép tương tác AI riêng tư trên thiết bị mà không cần gửi dữ liệu đến các máy chủ bên thứ ba.

Ra mắt tại sự kiện Meta Connect, Llama 3.2 có bốn phiên bản khác nhau, mỗi phiên bản đều có điểm mạnh riêng. Các mô hình tham số lớn – 11B và 90B – có khả năng xử lý cả văn bản và hình ảnh, thực hiện các nhiệm vụ phức tạp như phân tích biểu đồ, chú thích hình ảnh và xác định các đối tượng trong ảnh dựa trên mô tả ngôn ngữ tự nhiên.

Llama 3.2 được giới thiệu cùng tuần với Molmo của Viện Allen, tuyên bố là mô hình LLM thị giác đa phương tiện mã nguồn mở tốt nhất, hoạt động tương đương với các chatbot nổi tiếng như GPT-4o, Claude 3.5 Sonnet và Reka Core.

Meta cũng giới thiệu hai mô hình nhẹ: các mô hình 1B và 3B tham số, được thiết kế cho hiệu suất cao, tốc độ nhanh và các nhiệm vụ lặp đi lặp lại không đòi hỏi nhiều tính toán. Mặc dù kích thước nhỏ, chúng có khả năng “gọi công cụ” tốt hơn và một cửa sổ ngữ cảnh 128K token, lý tưởng cho việc tóm tắt, theo dõi hướng dẫn và viết lại trên thiết bị.

Đội ngũ kỹ thuật của Meta đã thực hiện các kỹ thuật tinh vi để đạt được điều này, sử dụng cắt tỉa có cấu trúc và chuyển giao tri thức để loại bỏ dữ liệu không cần thiết từ các mô hình lớn hơn và chuyển giao kiến thức từ các mô hình lớn sang các mô hình nhỏ hơn.

Kết quả là một bộ mô hình nhỏ gọn vượt trội hơn so với các đối thủ cạnh tranh trong cùng phân khúc, vượt qua các mô hình như Gemma 2 2.6B của Google và Phi-2 2.7B của Microsoft trên nhiều bài kiểm tra.

Meta cũng đang tăng cường AI trên thiết bị, hợp tác với các công ty phần cứng lớn như Qualcomm, MediaTek và Arm để đảm bảo Llama 3.2 hoạt động tốt với các chip di động. Các công ty điện toán đám mây như AWS, Google Cloud và Microsoft Azure cũng cung cấp quyền truy cập tức thì vào các mô hình mới.

Khả năng thị giác của Llama 3.2 được cải thiện nhờ các điều chỉnh kiến trúc thông minh, thêm trọng số bộ điều hợp vào mô hình ngôn ngữ hiện có, tạo cầu nối giữa các bộ mã hóa hình ảnh và lõi xử lý văn bản.

Llama 3.2 được phát hành dưới dạng mã nguồn mở theo tiêu chuẩn của Meta, có sẵn để tải xuống trên Llama.com và Hugging Face, cũng như thông qua hệ sinh thái đối tác rộng lớn của họ. Những ai muốn chạy mô hình trên đám mây có thể sử dụng Google Collab Notebook hoặc Groq cho các tương tác dựa trên văn bản, tạo ra gần 5000 token trong chưa đầy 3 giây.

Thử nghiệm Llama 3.2

Meta đã thử nghiệm Llama 3.2 trên nhiều nhiệm vụ khác nhau và nhận thấy mô hình này hoạt động tốt trong các tương tác dựa trên văn bản. Tuy nhiên, khả năng mã hóa của nó cho kết quả không đồng nhất. Khi thử nghiệm trên nền tảng của Groq, Llama 3.2 đã tạo ra mã cho các trò chơi phổ biến và các chương trình đơn giản, nhưng mô hình 70B gặp khó khăn khi được yêu cầu tạo mã cho một trò chơi tùy chỉnh. Ngược lại, mô hình 90B mạnh hơn lại hiệu quả và tạo ra một trò chơi hoàn chỉnh ngay lần thử đầu tiên.

Llama 3.2 xuất sắc trong việc xác định các yếu tố chủ quan trong hình ảnh, nhưng gặp khó khăn với văn bản nhỏ trong biểu đồ. Tuy nhiên, nó hoạt động xuất sắc khi đọc văn bản trong các hình ảnh lớn hơn, phân biệt đúng tên và vai trò công việc mà không mắc lỗi nào.

Tổng kết

Llama 3.2 là một cải tiến lớn so với thế hệ trước và là bổ sung tuyệt vời cho ngành công nghiệp AI mã nguồn mở. Điểm mạnh của nó nằm ở khả năng diễn giải hình ảnh và nhận diện văn bản lớn, với một số điểm cần cải thiện trong việc xử lý hình ảnh chất lượng thấp và các nhiệm vụ mã hóa phức tạp. Khả năng tương thích trên thiết bị cũng hứa hẹn tương lai của các nhiệm vụ AI cục bộ và riêng tư, là đối trọng tuyệt vời với các đề xuất độc quyền như Gemini Nano và các mô hình của Apple.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Thạch Sanh

Theo Decrypt

MỚI CẬP NHẬT

CEO Hashkey cho biết chính quyền Trump có thể tác động để Trung Quốc...

Xiao Feng, CEO của Hashkey Group, tin rằng chính sách ủng hộ tiền điện tử của chính quyền Trump có thể tạo áp lực...
Giá Bitcoin tăng đẩy lợi nhuận của các ngân hàng lớn lên tới hàng tỷ đô la

Mức cao kỷ lục của Bitcoin đẩy lợi nhuận của các ngân hàng Phố...

Theo Forbes, các ngân hàng Phố Wall đang ghi nhận khoản lợi nhuận lên tới 1,4 tỷ USD sau cuộc bầu cử tổng thống...

Ví Phantom hệ Solana gặp sự cố “đặt lại ứng dụng” sau khi cập...

Phantom, nhà phát triển ví Solana nổi tiếng, đã cảnh báo người dùng về sự cố "đặt lại ứng dụng" (reset app) mà một...
doge-tang-gia

Giá Dogecoin (DOGE) có thể tăng thêm 1.000% khi tuân theo nguyên tắc biểu...

Dogecoin (DOGE) là một trong những tài sản có hiệu suất tăng mạnh nhất trong tháng 11, khi đà tăng tốc của nó càng...

Jito hệ Solana gặp sự cố ngừng hoạt động, tạm thời đẩy phí giao...

Giao thức cơ sở hạ tầng MEV hàng đầu của Solana, Jito, đã gặp sự cố ngừng hoạt động vào sáng sớm thứ Tư,...
Cardano

Cardano Foundation báo cáo tổng tài sản khoảng 478 triệu đô la vào năm...

Cardano Foundation, một tổ chức phi lợi nhuận thúc đẩy hệ sinh thái Cardano, đã báo cáo tổng tài sản khoảng 478 triệu đô...

Bitcoin ETF của BlackRock vươn lên top 1% chỉ trong 211 ngày kỷ lục

Quỹ iShares Bitcoin Trust (IBIT) của BlackRock đã vượt qua tất cả các quỹ ETF Bitcoin được ra mắt trong suốt thập kỷ qua...
VanEck giới thiệu SUI ETN

VanEck ra mắt SUI ETN cho các nhà đầu tư châu Âu trong bối...

VanEck, công ty quản lý tài sản toàn cầu và nhà phát hành Bitcoin ETF giao ngay tại Mỹ, đã chính thức ra mắt...

Mua Bitcoin spot vượt trội hợp đồng tương lai dù đòn bẩy đạt đỉnh

Hợp đồng vĩnh viễn Bitcoin (BTC) định giá bằng USDT hiện đang có dấu hiệu sử dụng đòn bẩy quá mức, với tỷ lệ...

Giá Coin hôm nay 14/11: Bitcoin lập ATH mới trên $93.000, memecoin bật tăng...

Bitcoin tiếp tục bật tăng mạnh mẽ thiết lập ATH mới trên $93.000, tuy nhiên, tài sản đã phải đối diện với áp lực...

Bitcoin có vượt $100K? 9 nhà phân tích chia sẻ dự đoán giá BTC...

Bitcoin đã tăng giá mạnh sau khi Donald Trump được bầu làm tổng thống tiếp theo của Hoa Kỳ, tăng gần 30% và đạt...

Phân tích kỹ thuật ngày 14 tháng 11: BTC, ETH, SOL, BNB, DOGE, XRP,...

Bitcoin (BTC) không có dấu hiệu chậm lại khi vượt ngưỡng $93.000 vào ngày 13 tháng 11, cho thấy nhu cầu cao ở các...

FBI Hoa Kỳ đột kích nhà riêng của CEO Polymarket làm dấy lên các...

Vào ngày 13 tháng 11, Cục Điều tra Liên bang Hoa Kỳ (FBI) đã đột kích nhà riêng của Giám đốc điều hành Polymarket,...

Quỹ BUIDL của BlackRock mở rộng sang Aptos, Arbitrum, Avalanche, Optimism và Polygon

Quỹ BlackRock USD Institutional Digital Liquidity Fund (BUIDL), được token hóa thông qua sự hợp tác giữa BlackRock và Securitize, ban đầu ra mắt...

Immunefi đình chỉ TrustSec trong bối cảnh tranh chấp tiền thưởng lỗi

Nền tảng tiền thưởng lỗi Web3 Immunefi đã ban hành lệnh đình chỉ 90 ngày đối với công ty bảo mật mũ trắng Trust Security....

Phần mềm độc hại mới liên quan đến tiền điện tử của hacker Triều...

Các nhà nghiên cứu từ Jamf Threat Labs, chuyên theo dõi các mối đe dọa liên quan đến Apple, đã phát hiện phần mềm...