Không nên nhầm lẫn với nền tảng mạng xã hội TikTok, phương pháp nén TiTok mới này giảm đáng kể kích thước hình ảnh, làm cho nó trở nên thực tế hơn cho việc lưu trữ trên blockchain.
Buterin đã nhấn mạnh tiềm năng blockchain của TiTok trên nền tảng mạng xã hội phi tập trung Farcaster, tuyên bố rằng “320 bit cơ bản là một hàm băm. Nhỏ đủ để đưa vào chuỗi cho mỗi người dùng.”
Phát triển này có thể có những tác động đáng kể đến việc lưu trữ hình ảnh kỹ thuật số của ảnh hồ sơ (PFP) và non-fungible tokens (NFTs).
Nén hình ảnh TiTok
Được phát triển bởi các nhà nghiên cứu từ ByteDance và Đại học Kỹ thuật Munich, TiTok cho phép nén một hình ảnh thành 32 mảnh dữ liệu nhỏ (bit) mà không mất chất lượng.
Theo bài báo nghiên cứu về TiTok, nén hình ảnh AI tiên tiến cho phép TiTok nén một hình ảnh 256×256 pixel thành “32 token riêng biệt.”
TiTok là một khuôn khổ mã hóa hình ảnh một chiều (1D) “phá vỡ các ràng buộc lưới hiện có trong các phương pháp mã hóa 2D,” dẫn đến hình ảnh linh hoạt và gọn gàng hơn.
“Kết quả là, nó dẫn đến tăng tốc đáng kể trong quá trình lấy mẫu (ví dụ, nhanh hơn 410 lần so với DiT-XL/2) trong khi vẫn đạt được chất lượng tạo cạnh tranh.”
Hình ảnh máy học
TiTok sử dụng học máy và AI tiên tiến, sử dụng các mô hình dựa trên transformer để chuyển đổi hình ảnh thành các biểu diễn mã hóa.
Phương pháp này sử dụng tính dư thừa vùng, nghĩa là nó nhận diện và sử dụng thông tin dư thừa ở các vùng khác nhau của hình ảnh để giảm kích thước dữ liệu tổng thể của sản phẩm cuối cùng.
“Những tiến bộ gần đây trong các mô hình tạo đã nhấn mạnh vai trò quan trọng của mã hóa hình ảnh trong việc tổng hợp hiệu quả hình ảnh độ phân giải cao.” Theo bài báo nghiên cứu, “biểu diễn tiềm ẩn gọn nhẹ” của TiTok có thể mang lại “những biểu diễn hiệu quả và hiệu quả hơn nhiều so với các kỹ thuật thông thường.”
TiTok, không phải TikTok
Mặc dù có tên gần tương tự, nền tảng mạng xã hội TikTok không nhận được sự ủng hộ từ Buterin.
Người đồng sáng lập Ethereum, nhấn mạnh tiềm năng blockchain của TiTok, đã tăng thêm độ tin cậy cho phương pháp nén hình ảnh mới do AI điều khiển này.
“Không giống như các mô hình VQ 2D hiện có coi không gian tiềm ẩn hình ảnh là một lưới 2D, chúng tôi cung cấp một công thức gọn gàng hơn để mã hóa hình ảnh thành một chuỗi tiềm ẩn 1D.” Phương pháp mới được đề xuất có thể “đại diện cho một hình ảnh với số lượng token ít hơn từ 8 đến 64 lần” so với “các bộ mã hóa 2D,” và nhóm hy vọng nghiên cứu này có thể làm sáng tỏ “các biểu diễn hình ảnh hiệu quả hơn.”
Tham gia Telegram của Tạp Chí Bitcoin: https://t.me/tapchibitcoinvn
Theo dõi Twitter: https://twitter.com/tapchibtc_io
Theo dõi Tiktok: https://www.tiktok.com/@tapchibitcoin
- Blockchain và Trí tuệ nhân tạo (AI) – Tương lai của công nghệ
- Cái giá phải trả cho hiệu quả của AI là gì?
- Token AI là gì? Điểm danh những gương mặt nổi bật
- AI là gì? Danh sách những công ty và nhân vật AI ảnh hưởng nhất thế giới và Việt Nam
Thạch Sanh
Theo Cointelegraph