Trang chủ Trí tuệ nhân tạo (AI) DeepSeek ra mắt Janus Pro 7B, tuyên bố đánh bại các...

DeepSeek ra mắt Janus Pro 7B, tuyên bố đánh bại các đối thủ trong việc tạo hình ảnh AI

DeepSeek, công ty AI Trung Quốc đang rung chuyển Thung lũng Silicon tiếp tục tạo dấu ấn mạnh mẽ trên thị trường công nghệ toàn cầu. Sau khi sự xuất hiện đột phá của các mô hình AI tiên tiến của công ty này đã dẫn đến sự sụt giảm mạnh mẽ của cổ phiếu các công ty AI tại Mỹ, DeepSeek tiếp tục gây chấn động khi ra mắt một sản phẩm mới: Janus Pro 7B, một mô hình AI mã nguồn mở tập trung vào thị giác. Bạn có thể sử dụng thử nghiệm nó tại đây.

Việc phát hành bất ngờ này càng gia tăng mối lo ngại của các nhà đầu tư về sự vươn lên mạnh mẽ của Trung Quốc trong lĩnh vực AI, đồng thời đẩy thêm áp lực cho các công ty công nghệ Mỹ. Sự ra mắt của Janus Pro 7B, đúng vào thời điểm cổ phiếu AI Mỹ đang lao dốc, rõ ràng không phải là một sự trùng hợp ngẫu nhiên mà là một chiến lược nhằm khẳng định DeepSeek là một đối thủ đáng gờm, thách thức trực diện các ông lớn ở Silicon Valley.

Sản phẩm mới của DeepSeek là một sự tiếp nối đáng chú ý sau khi công ty ra mắt mô hình ngôn ngữ lớn R1 vào tuần trước. Các chuyên gia trong ngành đều đánh giá cao hiệu suất mạnh mẽ và khả năng tối ưu hóa của R1. Ngay lập tức, mô hình này đã khiến nhiều người lo ngại rằng Trung Quốc đang tiến nhanh trong lĩnh vực AI và có thể làm thay đổi cục diện ngành công nghiệp này. Thị trường đã có phản ứng mạnh mẽ: cổ phiếu của Nvidia, một trong những nhà sản xuất chip AI chủ chốt, mất 600 tỷ USD giá trị sau một đêm, và các công ty AI lớn khác cũng chứng kiến sự sụt giảm cổ phiếu khi nhà đầu tư bắt đầu đánh giá lại bối cảnh cạnh tranh.

Biểu đồ do DeepSeek công bố cho thấy các chỉ số hiệu suất của mô hình AI thị giác Janus Pro 7B mới. (Bên trái) Janus Pro 7B đạt hiệu suất trung bình cao với ít tham số hơn so với nhiều mô hình đa phương thức khác. (Bên phải) Mô hình này cũng đạt điểm chính xác cao nhất trong các bài kiểm tra tạo hình ảnh từ văn bản, vượt trội hơn các đối thủ. (Nguồn: DeepSeek)
 

Tại sao Janus Pro 7B lại tạo nên sự khác biệt

DeepSeek không chỉ giới hạn trong lĩnh vực xử lý ngôn ngữ mà đã mở rộng sang thị giác máy tính với Janus Pro 7B. Theo tài liệu kỹ thuật được công bố cùng với mô hình này, Janus Pro 7B được thiết kế để tối ưu hóa hiệu suất và tính linh hoạt, xuất sắc trong nhiều nhiệm vụ thị giác, từ việc tạo ra hình ảnh chân thực cho đến thực hiện các suy luận thị giác phức tạp.

“Janus là một loạt mô hình thị giác hiệu quả,” nhóm nghiên cứu của DeepSeek chia sẻ trong tài liệu, “nhắm đến mục tiêu đạt được sự cân bằng giữa hiệu suất và chi phí tính toán. Chúng tôi giới thiệu Janus-Pro-7B, một mô hình thị giác với 7 tỷ tham số, mang lại hiệu suất vượt trội trong một loạt các nhiệm vụ thị giác.”

Sự tập trung vào hiệu quả là yếu tố phân biệt quan trọng đối với các khách hàng doanh nghiệp. Khác với một số mô hình AI lớn và tốn kém tài nguyên, Janus Pro 7B, với 7 tỷ tham số, được tối ưu hóa để cung cấp hiệu suất cao mà không cần yêu cầu cơ sở hạ tầng tính toán phức tạp và đắt đỏ.

Hiệu quả này sẽ giảm đáng kể rào cản gia nhập đối với các doanh nghiệp mong muốn tích hợp AI thị giác tiên tiến vào quy trình hoạt động. Với các công ty từ startup đến tập đoàn đa quốc gia, khả năng áp dụng trí tuệ thị giác mạnh mẽ mà không cần đầu tư vào các cơ sở hạ tầng tốn kém trở thành một yếu tố hấp dẫn đáng kể.

Tài liệu nghiên cứu cũng chỉ ra rằng Janus-Pro-7B đạt hiệu suất ấn tượng trong các nhiệm vụ thị giác như tạo hình ảnh, trả lời câu hỏi về hình ảnh và mô tả hình ảnh. Điều này đặc biệt hấp dẫn đối với các doanh nghiệp muốn tận dụng AI trong các ứng dụng đa dạng. Hãy tưởng tượng một nhà bán lẻ toàn cầu sử dụng Janus Pro 7B để tự động hóa việc tạo hình ảnh marketing, trả lời các câu hỏi của khách hàng về sản phẩm, và tạo ra những mô tả chi tiết, sinh động cho các sản phẩm trực tuyến — tất cả đều được hỗ trợ bởi một mô hình AI duy nhất. Khả năng tối ưu hóa quy trình làm việc, nâng cao trải nghiệm khách hàng và cải thiện hiệu quả hoạt động là vô cùng lớn.

Đòn tấn công của DeepSeek: Mô hình R1 kết hợp với AI thị giác làm gia tăng lo ngại và cạnh tranh

Thời điểm ra mắt Janus Pro 7B càng làm tăng thêm sự chú ý đến sản phẩm này. Sự ra mắt của mô hình này ngay sau R1, cùng với biến động mạnh mẽ trên thị trường, củng cố thêm hình ảnh DeepSeek như một nhà đổi mới, có khả năng làm thay đổi cục diện ngành công nghiệp AI hiện nay.

Những lo ngại ban đầu của thị trường, bắt nguồn từ việc ra mắt R1 vào đúng ngày Trump tuyên bố đầu tư 500 tỷ USD vào AI của Mỹ, đã nhanh chóng leo thang thành sự hoảng loạn vào cuối tuần khi các bài kiểm tra và trình diễn trực tuyến làm nổi bật những khả năng ấn tượng của mô hình. Và hôm nay, khi cổ phiếu các công ty công nghệ tiếp tục giảm, DeepSeek tiếp tục gây chấn động với Janus Pro 7B, làm gia tăng áp lực cạnh tranh mà các công ty AI của Mỹ phải đối mặt.

Thị trường không chỉ phản ứng với một đối thủ AI mới, mà cảm nhận được sự thay đổi quy tắc. Trong suốt một thời gian dài, câu chuyện AI là sự mở rộng không ngừng: mô hình lớn hơn, tham số nhiều hơn, đặc biệt là chi phí cao hơn — điều nào tạo thành một rào cản lớn với các công ty nhỏ hơn và nghèo hơn khi cạnh tranh. Tuy nhiên, DeepSeek, với Janus Pro 7B và R1, đã phá vỡ khuôn mẫu này. Họ chứng minh rằng các mô hình linh hoạt và hiệu quả có thể vượt trội hơn, và chi phí chỉ cần chưa tới 6 triệu USD trong vòng 2 tháng. Đây là một sự thay đổi cơ bản trong kiến trúc AI, nơi lợi thế có thể chuyển từ quy mô máy chủ lớn sang sự đổi mới thông minh và phân phối rộng rãi.

Mô hình mã nguồn mở của Janus Pro 7B càng làm gia tăng sự gián đoạn này. Giống như các phong trào mã nguồn mở trước đây, việc này mở ra khả năng tiếp cận AI tiên tiến cho nhiều doanh nghiệp, khác với các mô hình độc quyền đóng. Các doanh nghiệp ngoài các gã khổng lồ công nghệ sẽ được hưởng lợi: họ có thể sử dụng AI tiên tiến mà không phải lo ngại về sự phụ thuộc vào nhà cung cấp hay chi phí cao. Đối với các công ty AI lớn, DeepSeek chính là một mối đe dọa trực tiếp. Liệu các mô hình độc quyền của họ có thể tồn tại trước những lựa chọn miễn phí và chất lượng cao? Việc bán tháo trên thị trường cho thấy các nhà đầu tư bắt đầu nghi ngờ về điều này.

Thông điệp dành cho các nhà quyết định công nghệ doanh nghiệp ngày càng rõ ràng: Cảnh quan AI đang thay đổi nhanh chóng, và DeepSeek là một lực lượng mới đầy sức mạnh.

Thung lũng Silicon choáng váng

Theo The Information, Mark Zuckerberg, CEO Meta, đã phát đi tín hiệu báo động và tập hợp đội ngũ kỹ sư vào bốn “phòng chiến tranh” để xác định chiến lược đối phó với việc High-Flyer, một trong những quỹ đầu tư hàng đầu của Trung Quốc, tài trợ toàn bộ cho DeepSeek, nhằm phát hành một công cụ AI có khả năng thay đổi cuộc chơi.

Việc sử dụng mã nguồn mở đột phá của DeepSeek cũng khiến các chuyên gia phải đặt câu hỏi về tính hiệu quả của các khoản đầu tư khổng lồ vào AI của các công ty Mỹ. Mathew Oldham, Giám đốc cơ sở hạ tầng AI của Meta, nhận định rằng mô hình mới của DeepSeek có thể vượt qua phiên bản tiếp theo của Llama AI, dự kiến ra mắt vào đầu năm 2025. Trong khi đó, Yann LeCun, Giám đốc khoa học AI của Meta, khẳng định rằng thành công của DeepSeek cho thấy các mô hình AI mã nguồn mở đang dần vượt qua các sản phẩm độc quyền.

Phát ngôn viên của Meta chia sẻ: “Chúng tôi liên tục đánh giá tất cả các mô hình cạnh tranh trong quá trình phát triển và đã thực hiện việc này kể từ khi bộ phận GenAI của công ty được thành lập.” Tuần trước, Meta đã công bố kế hoạch chi 65 tỷ USD cho các dự án AI trong năm nay, bao gồm việc xây dựng trung tâm dữ liệu quy mô lớn và tuyển dụng thêm nhân viên AI.

“Những thành tựu về hiệu quả của Trung Quốc không phải là ngẫu nhiên,” Angela Zhang, giáo sư luật tại Đại học Nam California, nhận định trên Financial Times. “Khi Mỹ hạn chế quyền tiếp cận của Trung Quốc đối với các chip AI tiên tiến, vô tình đã thúc đẩy sự đổi mới trong nước này.” Áp lực đã tạo nên kim cương.

CEO Microsoft, Satya Nadella, cũng không giấu sự ấn tượng với mô hình DeepSeek. Ông cho biết tại Diễn đàn Kinh tế Thế giới ở Davos vào ngày 22/1: “Mô hình của DeepSeek thực sự ấn tượng. Họ đã biết cách thực hiện hiệu quả một mô hình mã nguồn mở có khả năng suy luận và đạt được hiệu suất tính toán vượt trội. Chúng ta nên theo dõi những diễn biến ở Trung Quốc một cách nghiêm túc.”

DeepSeek được thành lập bởi Lương Văn Phong (Liang Wenfeng) vào tháng 5/2023, có trụ sở tại Hàng Châu, Chiết Giang và hiện được High-Flyer sở hữu. Công ty không có kế hoạch huy động vốn và tập trung vào phát triển công nghệ nền tảng, với sự hỗ trợ tài chính hoàn toàn từ quỹ đầu tư này.

Theo ChinaTalk, khác với các công ty AI khác tại Trung Quốc, DeepSeek tuyên bố sứ mệnh của mình là “giải mã bí ẩn của siêu trí tuệ nhân tạo AGI với sự tò mò.” Phòng thí nghiệm của công ty hiện đang tập trung vào việc cải tiến các kiến trúc và thuật toán có thể tạo ra những bước đột phá trong lĩnh vực trí tuệ nhân tạo.

Thời kỳ thống trị AI của Mỹ đang dần đi đến hồi kết, khi nền kinh tế toàn cầu bước vào một giai đoạn cạnh tranh sôi động và đầy tiềm năng gián đoạn trong lĩnh vực trí tuệ nhân tạo. Trung Quốc không chỉ bắt kịp Mỹ mà còn thực hiện được mọi điều Mỹ làm, với chi phí thấp hơn gấp 30 lần. Đặc biệt, mô hình R1 của DeepSeek được cung cấp miễn phí, trong khi người dùng muốn sử dụng OpenAI o1 phải trả tới 200 USD mỗi tháng.

Disclaimer: Bài viết chỉ có mục đích thông tin, không phải lời khuyên đầu tư. Nhà đầu tư nên tìm hiểu kỹ trước khi ra quyết định. Chúng tôi không chịu trách nhiệm về các quyết định đầu tư của bạn. 

Tham gia Telegram: https://t.me/tapchibitcoinvn

Twitter (X): https://twitter.com/tapchibtc_io

Tiktok: https://www.tiktok.com/@tapchibitcoin

Vương Tiễn

 

MỚI CẬP NHẬT

wif

Dogwifhat (WIF) tăng mạnh giữa đồn đoán về Las Vegas Sphere

Dogwifhat (WIF), memecoin trên Solana, đã tăng 9% trong 24 giờ qua, sau khi tài khoản chính thức trên X của token xác nhận,...

Hardfork Plomin của Cardano mở đường cho quản trị phi tập trung hoàn toàn

Cardano sắp chuyển sang một hệ thống bỏ phiếu hoàn toàn phi tập trung nhờ vào bản nâng cấp lớn sắp tới. Theo thông báo...

SFC Hồng Kông cấp giấy phép tiền điện tử đầu tiên trong năm 2025

Ủy ban Chứng khoán và Tương lai (SFC) của Hồng Kông vừa cấp giấy phép hoạt động đầu tiên trong năm 2025 cho hai...
trump

Cổ phiếu Trump Media tăng vọt khi ra mắt liên doanh fintech Truth.Fi

Trump Media & Technology Group (TMTG), công ty của Donald Trump đứng sau Truth Social và nền tảng phát trực tuyến Truth+, vừa công...
Pi Network

Pi Network đưa ra cảnh báo mới cho người dùng

Dự án tiền điện tử gây tranh cãi – Pi Network – đã khuyên người dùng chỉ tham khảo Pi Safety Center chính thức...
bitcoin

Séc có thể phân bổ 5% dự trữ quốc gia cho Bitcoin

Theo Financial Times, thống đốc Ngân hàng Quốc gia Séc (CNB) Aleš Michl dự kiến đề xuất bổ sung Bitcoin vào danh mục tài...
altcoin

Thị trường crypto tiếp tục suy thoái, altcoin chịu ảnh hưởng nặng nề

Thị trường crypto tiếp tục suy yếu với tổng vốn hóa giảm còn 3,48 nghìn tỷ đô la. Trong đó, altcoin chịu ảnh hưởng...
Bitcoin

Bitcoin giảm dưới 75.000 đô la trước tháng 4? Xác suất chỉ 10%

Theo phân tích của một chuyên gia, Bitcoin có một chút nguy cơ giảm tới 26% trong quý đầu năm 2025, đưa giá xuống...
Thị trường phái sinh DEX sẽ đạt 3,48 nghìn tỷ đô la vào năm 2025

Thị trường phái sinh DEX sẽ đạt 3,48 nghìn tỷ đô la vào năm...

Giao dịch phái sinh trên các sàn giao dịch DEX dự kiến sẽ tăng hơn gấp đôi trong năm nay khi ngày càng có...

Tin vắn Crypto 29/01: Bitcoin sắp chứng kiến đợt tăng giá parabol mới cùng...

Từ nhận định Bitcoin sắp tạo ra một đợt tăng giá parabol đến Coinbase đã nhận được sự chấp thuận để ra mắt nền...

Binance Research làm rõ cách DeSci giải quyết “Thung lũng chết” trong nghiên cứu...

Theo báo cáo gần đây của Binance Research, lĩnh vực nghiên cứu khoa học đang gặp rất nhiều khó khăn và thách thức, đặc...
World Liberty Financial

Movement Labs bác bỏ cáo buộc giao dịch nội gián liên quan đến World...

Rushi Manche, đồng sáng lập Movement Labs, cho biết tổ chức này không có "liên lạc trực tiếp" với dự án DeFi World Liberty...
defi

Andre Cronje tiết lộ nguyên nhân rút khỏi DeFi là do SEC “quấy rối”...

Nhà sáng lập Sonic và là một trong những nhà phát triển DeFi nổi bật, Andre Cronje, đã tiết lộ lý do tại sao...
crypto

Ủy ban Hạ viện Utah thông qua dự luật cho phép mua crypto

Một ủy ban của Hạ viện Utah vừa thông qua dự luật cho phép tiểu bang này đầu tư một phần quỹ công vào...

AI DAO ai16z đổi tên thành ElizaOS giữa lo ngại về sự nhầm lẫn...

Tổ chức tự trị phi tập trung ai16z vừa thông báo đổi tên thành ElizaOS sau những lo ngại về sự nhầm lẫn thương...

Movement (MOVE) là gì? Ethereum Layer 2 trong danh sách các blockchain thảo luận...

Movement là một blockchain layer 2 xây dựng trên nền tảng Ethereum xử lý giao dịch nhanh chóng và hiệu quả hơn, giảm tải...