Trang chủ Trí tuệ nhân tạo (AI) Meta ra mắt Llama 3.2 mã nguồn mở: AI có thể “nhìn”...

Meta ra mắt Llama 3.2 mã nguồn mở: AI có thể “nhìn” và bỏ vừa trong túi bạn

Đây là một tuần đầy tích cực cho AI mã nguồn mở.

Vào thứ Tư, Meta công bố bản nâng cấp cho mô hình ngôn ngữ lớn hàng đầu của mình, Llama 3.2. Không chỉ có khả năng đàm thoại, Llama 3.2 còn có thể “nhìn thấy”.

Điều đặc biệt hơn là một số phiên bản của mô hình này có thể tích hợp vào điện thoại thông minh mà không làm giảm chất lượng, cho phép tương tác AI riêng tư trên thiết bị mà không cần gửi dữ liệu đến các máy chủ bên thứ ba.

Ra mắt tại sự kiện Meta Connect, Llama 3.2 có bốn phiên bản khác nhau, mỗi phiên bản đều có điểm mạnh riêng. Các mô hình tham số lớn – 11B và 90B – có khả năng xử lý cả văn bản và hình ảnh, thực hiện các nhiệm vụ phức tạp như phân tích biểu đồ, chú thích hình ảnh và xác định các đối tượng trong ảnh dựa trên mô tả ngôn ngữ tự nhiên.

Llama 3.2 được giới thiệu cùng tuần với Molmo của Viện Allen, tuyên bố là mô hình LLM thị giác đa phương tiện mã nguồn mở tốt nhất, hoạt động tương đương với các chatbot nổi tiếng như GPT-4o, Claude 3.5 Sonnet và Reka Core.

Meta cũng giới thiệu hai mô hình nhẹ: các mô hình 1B và 3B tham số, được thiết kế cho hiệu suất cao, tốc độ nhanh và các nhiệm vụ lặp đi lặp lại không đòi hỏi nhiều tính toán. Mặc dù kích thước nhỏ, chúng có khả năng “gọi công cụ” tốt hơn và một cửa sổ ngữ cảnh 128K token, lý tưởng cho việc tóm tắt, theo dõi hướng dẫn và viết lại trên thiết bị.

Đội ngũ kỹ thuật của Meta đã thực hiện các kỹ thuật tinh vi để đạt được điều này, sử dụng cắt tỉa có cấu trúc và chuyển giao tri thức để loại bỏ dữ liệu không cần thiết từ các mô hình lớn hơn và chuyển giao kiến thức từ các mô hình lớn sang các mô hình nhỏ hơn.

Kết quả là một bộ mô hình nhỏ gọn vượt trội hơn so với các đối thủ cạnh tranh trong cùng phân khúc, vượt qua các mô hình như Gemma 2 2.6B của Google và Phi-2 2.7B của Microsoft trên nhiều bài kiểm tra.

Meta cũng đang tăng cường AI trên thiết bị, hợp tác với các công ty phần cứng lớn như Qualcomm, MediaTek và Arm để đảm bảo Llama 3.2 hoạt động tốt với các chip di động. Các công ty điện toán đám mây như AWS, Google Cloud và Microsoft Azure cũng cung cấp quyền truy cập tức thì vào các mô hình mới.

Khả năng thị giác của Llama 3.2 được cải thiện nhờ các điều chỉnh kiến trúc thông minh, thêm trọng số bộ điều hợp vào mô hình ngôn ngữ hiện có, tạo cầu nối giữa các bộ mã hóa hình ảnh và lõi xử lý văn bản.

Llama 3.2 được phát hành dưới dạng mã nguồn mở theo tiêu chuẩn của Meta, có sẵn để tải xuống trên Llama.com và Hugging Face, cũng như thông qua hệ sinh thái đối tác rộng lớn của họ. Những ai muốn chạy mô hình trên đám mây có thể sử dụng Google Collab Notebook hoặc Groq cho các tương tác dựa trên văn bản, tạo ra gần 5000 token trong chưa đầy 3 giây.

Thử nghiệm Llama 3.2

Meta đã thử nghiệm Llama 3.2 trên nhiều nhiệm vụ khác nhau và nhận thấy mô hình này hoạt động tốt trong các tương tác dựa trên văn bản. Tuy nhiên, khả năng mã hóa của nó cho kết quả không đồng nhất. Khi thử nghiệm trên nền tảng của Groq, Llama 3.2 đã tạo ra mã cho các trò chơi phổ biến và các chương trình đơn giản, nhưng mô hình 70B gặp khó khăn khi được yêu cầu tạo mã cho một trò chơi tùy chỉnh. Ngược lại, mô hình 90B mạnh hơn lại hiệu quả và tạo ra một trò chơi hoàn chỉnh ngay lần thử đầu tiên.

Llama 3.2 xuất sắc trong việc xác định các yếu tố chủ quan trong hình ảnh, nhưng gặp khó khăn với văn bản nhỏ trong biểu đồ. Tuy nhiên, nó hoạt động xuất sắc khi đọc văn bản trong các hình ảnh lớn hơn, phân biệt đúng tên và vai trò công việc mà không mắc lỗi nào.

Tổng kết

Llama 3.2 là một cải tiến lớn so với thế hệ trước và là bổ sung tuyệt vời cho ngành công nghiệp AI mã nguồn mở. Điểm mạnh của nó nằm ở khả năng diễn giải hình ảnh và nhận diện văn bản lớn, với một số điểm cần cải thiện trong việc xử lý hình ảnh chất lượng thấp và các nhiệm vụ mã hóa phức tạp. Khả năng tương thích trên thiết bị cũng hứa hẹn tương lai của các nhiệm vụ AI cục bộ và riêng tư, là đối trọng tuyệt vời với các đề xuất độc quyền như Gemini Nano và các mô hình của Apple.

Tham gia Telegram: https://t.me/tapchibitcoinvn

Theo dõi Twitter (X): https://twitter.com/tapchibtc_io

Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin

Thạch Sanh

Theo Decrypt

MỚI CẬP NHẬT

avax-tang

Giá AVAX tái hiện xu hướng đầu tháng 11 – Lịch sử có lặp...

Giá Avalanche (AVAX) có thể đang chuẩn bị cho một đợt tăng trưởng mạnh mẽ khác nếu lịch sử lặp lại. Gần đây, AVAX...

[QC] Dự đoán giá Pepe Coin: Nhà đầu tư chuyển hướng sang Coldware khi...

Pepe Coin (PEPE) từng là một thế lực thống trị trong lĩnh vực meme coin, nhưng xu hướng thị trường gần đây cho...

[QC] Dự đoán giá Celestia: Liệu các đồng RWA có kích hoạt làn sóng...

Celestia (TIA) đã nhanh chóng nổi lên như một trong những giải pháp blockchain mô-đun phát triển nhanh nhất, thay đổi cục diện...

BTC phải lấy lại 106.000 đô la trước khi ‘khám phá vùng giá mới’

Nhiều trader nhận định rằng Bitcoin cần lấy lại mức 106.000 USD — tương đương việc tăng khoảng 13% so với giá hiện tại...
3 loại tiền điện tử hàng đầu để xây dựng sự giàu có

[QC] Từ Degen đến Millionaire: 3 loại tiền điện tử hàng đầu để xây...

Thế giới tiền điện tử là một lĩnh vực liên tục phát triển, thường xuyên đưa ra thị trường những đồng tiền mới. Các...

CEO Polygon Labs dự báo Bitcoin đạt 250.000 USD, nhấn mạnh tính đơn giản...

Marc Boiron, CEO Polygon Labs, nhận định Bitcoin có thể đạt 250.000 USD, khẳng định đà tăng trưởng dài hạn của tài sản này...
BTC, XRP và CHOW đóng vai trò như thế nào

[QC] Con đường đến sự giàu có: BTC, XRP và CHOW đóng vai trò...

Thị trường tiền điện tử đã cung cấp rất nhiều cách để cá nhân có thể tăng nguồn thu nhập của mình. Với tiền...
ton-coin

Ton Coin (TON) chạm vùng rủi ro thấp – Mở ra cơ hội tích...

Phân tích dữ liệu blockchain cho thấy vị thế hiện tại của Toncoin (TON) đang nằm trong "vùng rủi ro thấp". Đánh giá này dựa...
binance

Giao dịch Binance Pay cán mốc 72,4 tỷ đô la khi tốc độ chấp...

Sử dụng tiền điện tử để thanh toán tăng trưởng mạnh mẽ trong thời gian gần đây. Điều này được thể hiện rõ rệt...

CZ mua thử TST, giá token lập tức tăng hơn 50%

Changpeng Zhao (CZ) vừa mua $TST trị giá 1 BNB (khoảng 5.400 USD) và đang loay hoay tìm cách thêm vào pool thanh khoản (LP)....

Đầu tư Crypto theo chiến lược của huyền thoại Peter Lynch để x10 tài...

Peter Lynch (81 tuổi), một biểu tượng trong thế giới đầu tư, đã để lại dấu ấn sâu đậm khi dẫn dắt quỹ Fidelity...
meme-coin

TOP 3 meme coin đáng chú ý trong tuần cuối tháng 2

TST, BROCCOLI và DOGEai là ba meme coin thu hút sự chú ý đặc biệt trong tuần cuối cùng của tháng Hai. TST tiếp tục...

Shock: Trader 23 tuổi tự sát trên sóng livestream để tạo meme coin

Một trader có biệt danh MistaFuccYou đã tự sát trực tiếp trên nền tảng X (trước đây là Twitter) vào tối thứ Sáu sau...
btc-nhu-cau-giam

Bitcoin sẽ biến động thế nào khi nhu cầu giảm xuống dưới ngưỡng quan...

Trong các phiên giao dịch gần đây, giá Bitcoin đã tăng lên trên $98.000, củng cố kỳ vọng về một xu hướng tăng tiếp...
Liệu 100 đô la trong FXGuys ($FXG), SUI hoặc PEPE có thể biến thành 10.000 đô la không

[QC] Liệu 100 đô la trong FXGuys ($FXG), SUI hoặc PEPE có thể biến...

Thị trường tiền điện tử nổi tiếng với việc biến những khoản đầu tư nhỏ thành khoản lợi nhuận khổng lồ. Nhưng liệu việc...

Bybit đối mặt làn sóng rút tiền 4 tỷ USD, CEO Ben Zhou thảo...

Sau vụ hack lớn nhất trong lịch sử ngành công nghiệp crypto vào ngày 21/2, Bybit đã chứng kiến hơn 4 tỷ USD bị...