Trang chủ Trí tuệ nhân tạo (AI) DeepSeek ra mắt Janus Pro 7B, tuyên bố đánh bại các...

DeepSeek ra mắt Janus Pro 7B, tuyên bố đánh bại các đối thủ trong việc tạo hình ảnh AI

DeepSeek, công ty AI Trung Quốc đang rung chuyển Thung lũng Silicon tiếp tục tạo dấu ấn mạnh mẽ trên thị trường công nghệ toàn cầu. Sau khi sự xuất hiện đột phá của các mô hình AI tiên tiến của công ty này đã dẫn đến sự sụt giảm mạnh mẽ của cổ phiếu các công ty AI tại Mỹ, DeepSeek tiếp tục gây chấn động khi ra mắt một sản phẩm mới: Janus Pro 7B, một mô hình AI mã nguồn mở tập trung vào thị giác. Bạn có thể sử dụng thử nghiệm nó tại đây.

Việc phát hành bất ngờ này càng gia tăng mối lo ngại của các nhà đầu tư về sự vươn lên mạnh mẽ của Trung Quốc trong lĩnh vực AI, đồng thời đẩy thêm áp lực cho các công ty công nghệ Mỹ. Sự ra mắt của Janus Pro 7B, đúng vào thời điểm cổ phiếu AI Mỹ đang lao dốc, rõ ràng không phải là một sự trùng hợp ngẫu nhiên mà là một chiến lược nhằm khẳng định DeepSeek là một đối thủ đáng gờm, thách thức trực diện các ông lớn ở Silicon Valley.

Sản phẩm mới của DeepSeek là một sự tiếp nối đáng chú ý sau khi công ty ra mắt mô hình ngôn ngữ lớn R1 vào tuần trước. Các chuyên gia trong ngành đều đánh giá cao hiệu suất mạnh mẽ và khả năng tối ưu hóa của R1. Ngay lập tức, mô hình này đã khiến nhiều người lo ngại rằng Trung Quốc đang tiến nhanh trong lĩnh vực AI và có thể làm thay đổi cục diện ngành công nghiệp này. Thị trường đã có phản ứng mạnh mẽ: cổ phiếu của Nvidia, một trong những nhà sản xuất chip AI chủ chốt, mất 600 tỷ USD giá trị sau một đêm, và các công ty AI lớn khác cũng chứng kiến sự sụt giảm cổ phiếu khi nhà đầu tư bắt đầu đánh giá lại bối cảnh cạnh tranh.

Biểu đồ do DeepSeek công bố cho thấy các chỉ số hiệu suất của mô hình AI thị giác Janus Pro 7B mới. (Bên trái) Janus Pro 7B đạt hiệu suất trung bình cao với ít tham số hơn so với nhiều mô hình đa phương thức khác. (Bên phải) Mô hình này cũng đạt điểm chính xác cao nhất trong các bài kiểm tra tạo hình ảnh từ văn bản, vượt trội hơn các đối thủ. (Nguồn: DeepSeek)
 

Tại sao Janus Pro 7B lại tạo nên sự khác biệt

DeepSeek không chỉ giới hạn trong lĩnh vực xử lý ngôn ngữ mà đã mở rộng sang thị giác máy tính với Janus Pro 7B. Theo tài liệu kỹ thuật được công bố cùng với mô hình này, Janus Pro 7B được thiết kế để tối ưu hóa hiệu suất và tính linh hoạt, xuất sắc trong nhiều nhiệm vụ thị giác, từ việc tạo ra hình ảnh chân thực cho đến thực hiện các suy luận thị giác phức tạp.

“Janus là một loạt mô hình thị giác hiệu quả,” nhóm nghiên cứu của DeepSeek chia sẻ trong tài liệu, “nhắm đến mục tiêu đạt được sự cân bằng giữa hiệu suất và chi phí tính toán. Chúng tôi giới thiệu Janus-Pro-7B, một mô hình thị giác với 7 tỷ tham số, mang lại hiệu suất vượt trội trong một loạt các nhiệm vụ thị giác.”

Sự tập trung vào hiệu quả là yếu tố phân biệt quan trọng đối với các khách hàng doanh nghiệp. Khác với một số mô hình AI lớn và tốn kém tài nguyên, Janus Pro 7B, với 7 tỷ tham số, được tối ưu hóa để cung cấp hiệu suất cao mà không cần yêu cầu cơ sở hạ tầng tính toán phức tạp và đắt đỏ.

Hiệu quả này sẽ giảm đáng kể rào cản gia nhập đối với các doanh nghiệp mong muốn tích hợp AI thị giác tiên tiến vào quy trình hoạt động. Với các công ty từ startup đến tập đoàn đa quốc gia, khả năng áp dụng trí tuệ thị giác mạnh mẽ mà không cần đầu tư vào các cơ sở hạ tầng tốn kém trở thành một yếu tố hấp dẫn đáng kể.

Tài liệu nghiên cứu cũng chỉ ra rằng Janus-Pro-7B đạt hiệu suất ấn tượng trong các nhiệm vụ thị giác như tạo hình ảnh, trả lời câu hỏi về hình ảnh và mô tả hình ảnh. Điều này đặc biệt hấp dẫn đối với các doanh nghiệp muốn tận dụng AI trong các ứng dụng đa dạng. Hãy tưởng tượng một nhà bán lẻ toàn cầu sử dụng Janus Pro 7B để tự động hóa việc tạo hình ảnh marketing, trả lời các câu hỏi của khách hàng về sản phẩm, và tạo ra những mô tả chi tiết, sinh động cho các sản phẩm trực tuyến — tất cả đều được hỗ trợ bởi một mô hình AI duy nhất. Khả năng tối ưu hóa quy trình làm việc, nâng cao trải nghiệm khách hàng và cải thiện hiệu quả hoạt động là vô cùng lớn.

Đòn tấn công của DeepSeek: Mô hình R1 kết hợp với AI thị giác làm gia tăng lo ngại và cạnh tranh

Thời điểm ra mắt Janus Pro 7B càng làm tăng thêm sự chú ý đến sản phẩm này. Sự ra mắt của mô hình này ngay sau R1, cùng với biến động mạnh mẽ trên thị trường, củng cố thêm hình ảnh DeepSeek như một nhà đổi mới, có khả năng làm thay đổi cục diện ngành công nghiệp AI hiện nay.

Những lo ngại ban đầu của thị trường, bắt nguồn từ việc ra mắt R1 vào đúng ngày Trump tuyên bố đầu tư 500 tỷ USD vào AI của Mỹ, đã nhanh chóng leo thang thành sự hoảng loạn vào cuối tuần khi các bài kiểm tra và trình diễn trực tuyến làm nổi bật những khả năng ấn tượng của mô hình. Và hôm nay, khi cổ phiếu các công ty công nghệ tiếp tục giảm, DeepSeek tiếp tục gây chấn động với Janus Pro 7B, làm gia tăng áp lực cạnh tranh mà các công ty AI của Mỹ phải đối mặt.

Thị trường không chỉ phản ứng với một đối thủ AI mới, mà cảm nhận được sự thay đổi quy tắc. Trong suốt một thời gian dài, câu chuyện AI là sự mở rộng không ngừng: mô hình lớn hơn, tham số nhiều hơn, đặc biệt là chi phí cao hơn — điều nào tạo thành một rào cản lớn với các công ty nhỏ hơn và nghèo hơn khi cạnh tranh. Tuy nhiên, DeepSeek, với Janus Pro 7B và R1, đã phá vỡ khuôn mẫu này. Họ chứng minh rằng các mô hình linh hoạt và hiệu quả có thể vượt trội hơn, và chi phí chỉ cần chưa tới 6 triệu USD trong vòng 2 tháng. Đây là một sự thay đổi cơ bản trong kiến trúc AI, nơi lợi thế có thể chuyển từ quy mô máy chủ lớn sang sự đổi mới thông minh và phân phối rộng rãi.

Mô hình mã nguồn mở của Janus Pro 7B càng làm gia tăng sự gián đoạn này. Giống như các phong trào mã nguồn mở trước đây, việc này mở ra khả năng tiếp cận AI tiên tiến cho nhiều doanh nghiệp, khác với các mô hình độc quyền đóng. Các doanh nghiệp ngoài các gã khổng lồ công nghệ sẽ được hưởng lợi: họ có thể sử dụng AI tiên tiến mà không phải lo ngại về sự phụ thuộc vào nhà cung cấp hay chi phí cao. Đối với các công ty AI lớn, DeepSeek chính là một mối đe dọa trực tiếp. Liệu các mô hình độc quyền của họ có thể tồn tại trước những lựa chọn miễn phí và chất lượng cao? Việc bán tháo trên thị trường cho thấy các nhà đầu tư bắt đầu nghi ngờ về điều này.

Thông điệp dành cho các nhà quyết định công nghệ doanh nghiệp ngày càng rõ ràng: Cảnh quan AI đang thay đổi nhanh chóng, và DeepSeek là một lực lượng mới đầy sức mạnh.

Thung lũng Silicon choáng váng

Theo The Information, Mark Zuckerberg, CEO Meta, đã phát đi tín hiệu báo động và tập hợp đội ngũ kỹ sư vào bốn “phòng chiến tranh” để xác định chiến lược đối phó với việc High-Flyer, một trong những quỹ đầu tư hàng đầu của Trung Quốc, tài trợ toàn bộ cho DeepSeek, nhằm phát hành một công cụ AI có khả năng thay đổi cuộc chơi.

Việc sử dụng mã nguồn mở đột phá của DeepSeek cũng khiến các chuyên gia phải đặt câu hỏi về tính hiệu quả của các khoản đầu tư khổng lồ vào AI của các công ty Mỹ. Mathew Oldham, Giám đốc cơ sở hạ tầng AI của Meta, nhận định rằng mô hình mới của DeepSeek có thể vượt qua phiên bản tiếp theo của Llama AI, dự kiến ra mắt vào đầu năm 2025. Trong khi đó, Yann LeCun, Giám đốc khoa học AI của Meta, khẳng định rằng thành công của DeepSeek cho thấy các mô hình AI mã nguồn mở đang dần vượt qua các sản phẩm độc quyền.

Phát ngôn viên của Meta chia sẻ: “Chúng tôi liên tục đánh giá tất cả các mô hình cạnh tranh trong quá trình phát triển và đã thực hiện việc này kể từ khi bộ phận GenAI của công ty được thành lập.” Tuần trước, Meta đã công bố kế hoạch chi 65 tỷ USD cho các dự án AI trong năm nay, bao gồm việc xây dựng trung tâm dữ liệu quy mô lớn và tuyển dụng thêm nhân viên AI.

“Những thành tựu về hiệu quả của Trung Quốc không phải là ngẫu nhiên,” Angela Zhang, giáo sư luật tại Đại học Nam California, nhận định trên Financial Times. “Khi Mỹ hạn chế quyền tiếp cận của Trung Quốc đối với các chip AI tiên tiến, vô tình đã thúc đẩy sự đổi mới trong nước này.” Áp lực đã tạo nên kim cương.

CEO Microsoft, Satya Nadella, cũng không giấu sự ấn tượng với mô hình DeepSeek. Ông cho biết tại Diễn đàn Kinh tế Thế giới ở Davos vào ngày 22/1: “Mô hình của DeepSeek thực sự ấn tượng. Họ đã biết cách thực hiện hiệu quả một mô hình mã nguồn mở có khả năng suy luận và đạt được hiệu suất tính toán vượt trội. Chúng ta nên theo dõi những diễn biến ở Trung Quốc một cách nghiêm túc.”

DeepSeek được thành lập bởi Lương Văn Phong (Liang Wenfeng) vào tháng 5/2023, có trụ sở tại Hàng Châu, Chiết Giang và hiện được High-Flyer sở hữu. Công ty không có kế hoạch huy động vốn và tập trung vào phát triển công nghệ nền tảng, với sự hỗ trợ tài chính hoàn toàn từ quỹ đầu tư này.

Theo ChinaTalk, khác với các công ty AI khác tại Trung Quốc, DeepSeek tuyên bố sứ mệnh của mình là “giải mã bí ẩn của siêu trí tuệ nhân tạo AGI với sự tò mò.” Phòng thí nghiệm của công ty hiện đang tập trung vào việc cải tiến các kiến trúc và thuật toán có thể tạo ra những bước đột phá trong lĩnh vực trí tuệ nhân tạo.

Thời kỳ thống trị AI của Mỹ đang dần đi đến hồi kết, khi nền kinh tế toàn cầu bước vào một giai đoạn cạnh tranh sôi động và đầy tiềm năng gián đoạn trong lĩnh vực trí tuệ nhân tạo. Trung Quốc không chỉ bắt kịp Mỹ mà còn thực hiện được mọi điều Mỹ làm, với chi phí thấp hơn gấp 30 lần. Đặc biệt, mô hình R1 của DeepSeek được cung cấp miễn phí, trong khi người dùng muốn sử dụng OpenAI o1 phải trả tới 200 USD mỗi tháng.

Disclaimer: Bài viết chỉ có mục đích thông tin, không phải lời khuyên đầu tư. Nhà đầu tư nên tìm hiểu kỹ trước khi ra quyết định. Chúng tôi không chịu trách nhiệm về các quyết định đầu tư của bạn. 

Tham gia Telegram: https://t.me/tapchibitcoinvn

Twitter (X): https://twitter.com/tapchibtc_io

Tiktok: https://www.tiktok.com/@tapchibitcoin

Vương Tiễn

 

MỚI CẬP NHẬT

Ethereum

Cộng đồng ủng hộ Danny Ryan trở thành lãnh đạo tiếp theo của Ethereum...

Một cuộc khảo sát không chính thức trong cộng đồng Ethereum đã chỉ ra rằng Danny Ryan, cựu nghiên cứu viên của Ethereum, đang...
memecoin

Chính sách sai lầm dưới thời Biden đã dẫn đến sự bùng nổ của...

Chris Dixon, đối tác sáng lập tại a16z Crypto, cho rằng các quy định sai lầm đã góp phần thúc đẩy sự bùng nổ...
solana

Solana hưởng lợi từ Ethereum khi thị phần DEX tăng

Theo thông tin từ sàn giao dịch OKX, Solana đã vươn lên chiếm gần một nửa thị trường sàn giao dịch phi tập trung...

Tin vắn Crypto 30/01: Bitcoin có thể sớm vượt $108.000 cùng tin tức ETH,...

Từ nhận định Bitcoin có thể sớm vượt $108.000 đến Bitso ra mắt chương trình tăng tốc để hỗ trợ các sáng kiến ​​tập...

Chi phí sử dụng Avalanche đã giảm 75% kể từ khi triển khai bản...

Avalanche, một blockchain hợp đồng thông minh nổi bật phục vụ chủ yếu cho các ứng dụng tài chính phi tập trung (DeFi), đã...

DeepSeek AI của Trung Quốc bị chỉ trích

Howard Lutnick, ứng viên Bộ trưởng Thương mại Mỹ, khi điều trần trước Thượng viện vào thứ Ba, đã cáo buộc DeepSeek gian lận...
bitcoin

2 tiểu bang Hoa Kỳ này chuẩn bị thành lập quỹ dự trữ Bitcoin...

Illinois và Indiana vừa giới thiệu các dự luật nhằm thiết lập Quỹ dự trữ Bitcoin chiến lược. Cả hai tiểu bang này cùng...

Hồng Kông cảnh báo hơn 30 nền tảng lừa đảo mạo danh HashKey

Ủy ban Chứng khoán và Hợp đồng tương lai Hồng Kông (SFC) vừa cảnh báo có thêm 33 trang web đáng ngờ giả mạo...

Lệnh hành pháp của Trump có thể làm gián đoạn chu kỳ 4 năm...

Lệnh hành pháp gần đây của Tổng thống Mỹ Donald Trump có thể sẽ làm thay đổi chu kỳ tăng trưởng và suy giảm...

ETH sẽ giữ dưới 3.500 đô la cho đến khi 3 điều này xảy...

Giá ETH đã giảm xuống dưới 3.500 đô la vào ngày 7/1 và kể từ đó phải vật lộn để lấy lại những gì...

Bẫy tăng giá XRP đang ẩn núp dưới ngưỡng 2,95 đô la

XRP đã có một tháng ấn tượng và có thể đóng nến với mức tăng mạnh hơn 54% so với mức cao trước đó...

Layer-3 gaming chain “B3” tiết lộ kế hoạch ra mắt token trong tuần này

B3, một layer-3 gaming chain được xây dựng trên nền tảng mạng lưới Ethereum layer 2 Base, đã công bố kế hoạch ra mắt token...

El Salvador vội vã ban hành luật Bitcoin mới để tuân thủ thỏa thuận...

Quốc hội El Salvador đã nhanh chóng thông qua luật sửa đổi quy định về Bitcoin, nhằm tuân thủ thỏa thuận đã đạt được...

DeepSeek là gì? Đối thủ của ChatGPT đến từ Trung Quốc đang gây bão...

DeepSeek, một startup Trung Quốc, đã gây ấn tượng với ngành công nghệ nhờ mô hình ngôn ngữ lớn mạnh mẽ, được xây dựng...

Tập đoàn DCG ra mắt hoạt động “khai thác mạo hiểm” Bitcoin

DCG đã chính thức ra mắt một doanh nghiệp khai thác mạo hiểm nhằm khám phá các phương thức mới để gia tăng doanh...

Một người dùng kiếm được 3,8 triệu đô la sau khi đúc 18.000 token...

Một người dùng đã tạo ra gần 18.000 token thông qua nền tảng khởi chạy memecoin Pump.fun, thu về gần 3,8 triệu đô la...