Trang chủ Trí tuệ nhân tạo (AI) Cách startup AI nhỏ bé của Trung Quốc, DeepSeek, gây chấn động...

Cách startup AI nhỏ bé của Trung Quốc, DeepSeek, gây chấn động Thung lũng Silicon

Một phòng thí nghiệm AI nhỏ tại Trung Quốc đã gây chấn động toàn cầu trong tuần qua khi công bố công thức kỹ thuật của mô hình tiên tiến nhất của mình, biến nhà sáng lập ẩn dật thành một biểu tượng quốc gia, đồng thời thách thức nỗ lực của Mỹ trong việc kìm hãm tham vọng công nghệ cao của Trung Quốc.

DeepSeek, được thành lập bởi nhà quản lý quỹ phòng hộ Lương Văn Phong (Liang Wenfeng), đã ra mắt mô hình R1 vào thứ Hai, kèm theo một báo cáo chi tiết cách xây dựng một mô hình ngôn ngữ lớn với ngân sách hạn chế, có khả năng tự học và cải thiện mà không cần sự giám sát từ con người.

Nhà sáng lập DeepSeek Lương Văn Phong

Các công ty Mỹ, như OpenAI và Google DeepMind, vốn dẫn đầu trong việc phát triển các mô hình suy luận – một lĩnh vực nghiên cứu AI tương đối mới nhằm tái tạo khả năng nhận thức của con người. Tuy nhiên, vào tháng 12 năm ngoái, OpenAI chỉ công bố phiên bản đầy đủ của mô hình o1 mà giữ bí mật về phương pháp phát triển.

Việc công bố mô hình R1 của DeepSeek đã làm dấy lên một cuộc tranh luận sôi động tại Thung lũng Silicon, xoay quanh việc liệu các công ty AI Mỹ với nguồn lực vượt trội, bao gồm Meta và Anthropic, có thể duy trì lợi thế kỹ thuật của mình hay không.

Tâm điểm của niềm tự hào quốc gia

Tại Trung Quốc, ông Lương nhanh chóng trở thành biểu tượng của niềm tự hào dân tộc. Tuần này, ông là nhà lãnh đạo AI duy nhất tham dự cuộc họp công khai với Thủ tướng Lý Cường, nơi các doanh nhân được kêu gọi “tập trung nỗ lực để chinh phục các công nghệ cốt lõi trọng yếu.”

Năm 2021, khi còn điều hành quỹ giao dịch định lượng High-Flyer, ông Lương đã bắt đầu mua hàng nghìn GPU Nvidia để phục vụ cho dự án AI cá nhân của mình. Nhiều người trong ngành từng coi đây là hành động kỳ quặc của một tỷ phú đang theo đuổi sở thích mới.

“Một người đàn ông với kiểu tóc kỳ lạ, nói về việc xây dựng cụm máy 10.000 chip để huấn luyện các mô hình riêng – chúng tôi từng nghĩ ông ấy không nghiêm túc,” một đối tác kinh doanh của ông chia sẻ.

Tuy nhiên, chính vị thế “người ngoài cuộc” trong lĩnh vực AI lại trở thành lợi thế bất ngờ của ông Lương. Tại High-Flyer, ông đã tích lũy kinh nghiệm trong việc sử dụng AI và thuật toán để xác định các mô hình ảnh hưởng đến giá cổ phiếu, đồng thời xây dựng đội ngũ kỹ thuật xuất sắc trong việc tối ưu hóa sức mạnh của chip Nvidia.

Chiến lược độc đáo, thành tựu ấn tượng

DeepSeek nổi bật với chiến lược “nội địa hóa” khi quy tụ đội ngũ toàn bộ là các tiến sĩ từ những trường đại học hàng đầu của Trung Quốc như Bắc Đại, Thanh Hoa và Hàng Không Bắc Kinh, thay vì dựa vào nhân tài trở về từ nước ngoài. Ông Lương từng nhấn mạnh trong một bài phỏng vấn năm ngoái rằng: “Chúng tôi không có nhân sự nào từ nước ngoài về. Họ đều là người trong nước… Chúng tôi phải tự mình phát triển nhân tài hàng đầu.”

DeepSeek tuyên bố chỉ sử dụng 2.048 GPU Nvidia H800 và chi phí 5,6 triệu USD để huấn luyện một mô hình với 671 tỷ tham số – một con số khiêm tốn so với chi phí của các công ty như OpenAI và Google.

Dù đạt được nhiều thành tựu, DeepSeek vẫn đối mặt với thách thức lớn khi các đối thủ tại Mỹ, như OpenAI hay xAI của Elon Musk, đang mở rộng quy mô cụm máy tính khổng lồ với ngân sách hàng tỷ USD, đe dọa tái lập khoảng cách về hiệu năng giữa các công ty Mỹ và Trung Quốc.

Tương lai đầy thách thức

DeepSeek, với đội ngũ kỹ sư tinh thông trong việc tối ưu hóa tài nguyên, hiện sở hữu một trong những cụm máy tính tiên tiến nhất tại Trung Quốc. Tuy nhiên, các chuyên gia cảnh báo rằng năng lực này có thể không đủ để duy trì lợi thế lâu dài trong ngành công nghiệp AI đang phát triển nhanh chóng.

Các công ty tại Mỹ không ngừng đầu tư mạnh mẽ vào AI. Gần đây, OpenAI tuyên bố hợp tác với SoftBank để thành lập liên doanh Stargate, dự kiến chi tới 500 tỷ USD vào cơ sở hạ tầng AI tại Mỹ. Trong khi đó, xAI của Elon Musk đang mở rộng siêu máy tính Colossus với hơn 1 triệu GPU để huấn luyện các mô hình AI Grok của mình.

Một đối tác kinh doanh của ông Lương kết luận: “DeepSeek hiện có đủ năng lực cho hiện tại, nhưng khó có thể duy trì điều đó trong tương lai.”

Disclaimer: Bài viết chỉ có mục đích thông tin, không phải lời khuyên đầu tư. Nhà đầu tư nên tìm hiểu kỹ trước khi ra quyết định. Chúng tôi không chịu trách nhiệm về các quyết định đầu tư của bạn. 

Tham gia Telegram: https://t.me/tapchibitcoinvn

Twitter (X): https://twitter.com/tapchibtc_io

Tiktok: https://www.tiktok.com/@tapchibitcoin

Theo Finance Times

MỚI CẬP NHẬT

Các cơ quan thương mại Anh kêu gọi chính phủ xem tiền điện tử...

Các hiệp hội thương mại hàng đầu tại Anh đã gửi lời kêu gọi tới văn phòng Thủ tướng Keir Starmer, đề xuất bổ...
Hacker Triều Tiên nhắm vào các công ty blockchain của Anh

Hacker Triều Tiên nhắm vào các công ty blockchain của Anh trong bối cảnh...

Các nhân viên công nghệ lừa đảo có liên hệ với Triều Tiên đang mở rộng hoạt động xâm nhập vào các công ty...
usdt Bitcoin

Hơn $1 tỷ USDT được đúc khi các nhà đầu tư Bitcoin chuẩn bị...

Bitcoin, tiền điện tử lớn nhất thế giới theo vốn hóa thị trường, đang có xu hướng tăng giá và chuẩn bị cho một...

Coinbase nhận 50% doanh thu dư từ dự trữ USDC của Circle

Sàn giao dịch Coinbase Global nhận được một nửa doanh thu dư từ Circle, phát sinh từ các quỹ dự trữ hỗ trợ stablecoin...
bitcoin

Holder Bitcoin ngắn hạn không bán tháo bất kể thua lỗ

Theo một bài đăng gần đây từ CryptoQuant Quicktake, các holder Bitcoin ngắn hạn chọn giữ tài sản kỹ thuật số của mình mặc...

Thượng nghị sỹ Mỹ tái giới thiệu dự luật hưu trí tiền điện tử...

Lần thứ ba, Thượng nghị sĩ Alabama, Tommy Tuberville, chuẩn bị tái giới thiệu một dự luật nhằm cho phép người dân Mỹ bổ...

Lạc quan ngắn hạn khi khối lượng hợp đồng BTC tăng vọt trên Binance...

Trên sàn Binance và OKX, ba cặp hợp đồng tương lai vĩnh cửu phổ biến nhất đã ghi nhận mức tăng giá đáng kể...

American Bitcoin liên kết với Trump có kế hoạch IPO

American Bitcoin Corp., một công ty khai thác tiền điện tử được hậu thuẫn bởi gia đình Trump, đang có kế hoạch huy động...

Uniswap DAO ủng hộ chương trình ‘Treasury Delegation’ trị giá 113 triệu USD để...

Theo cuộc bỏ phiếu quản trị sơ bộ kết thúc vào hôm thứ Ba, Uniswap DAO đã bỏ phiếu để tiếp tục "chương trình...
eth-phuc-hoi

Ethereum (ETH) nỗ lực phục hồi khi đà giảm đang dần suy yếu

Ethereum (ETH) bước vào tuần mới với những tín hiệu trái ngược khi các trader đón nhận thông báo thuế "Ngày Giải Phóng" vào...
Metaplanet tiếp tục đẩy mạnh chiến lược tích lũy Bitcoin

Metaplanet tiếp tục đẩy mạnh chiến lược tích lũy Bitcoin, nâng tổng số nắm...

Metaplanet, công ty niêm yết tại Tokyo, vừa công bố vào thứ Tư rằng họ đã bổ sung thêm 160 Bitcoin vào kho dự...
NEO

Neo Foundation phủ nhận việc bán token, điều tra chuyển khoản Binance sau khi...

Neo Foundation khẳng đinh không dính líu đến các giao dịch bán token NEO gần đây, sau khi giá trị giảm 35,85% từ ngày...

Nhiều altcoin sụp đổ vào ngày Cá tháng Tư, thị trường crypto vẫn ổn...

Một số altcoin và memecoin đã chứng kiến ​​đợt bán tháo mạnh vào Ngày Cá tháng Tư, với một số token, bao gồm Act...
sui-kho-khan

SUI gặp khó khăn dưới mức kháng cự khi mở khóa token trị giá...

Hôm nay, SUI đứng trước một thử thách quan trọng khi đợt mở khóa token trị giá 147 triệu USD có thể tạo ra...
Bitcoin như một hàng rào chống lạm phát

Standard Chartered báo hiệu vai trò của Bitcoin như một hàng rào chống lạm...

Bitcoin đang nổi lên như một hàng rào phòng ngừa lạm phát đầy tiềm năng trong bối cảnh thị trường ngày càng bất ổn....

Solana (SOL) phục hồi chậm lại gần mức kháng cự khi Ethereum tăng khối...

Solana (SOL) đang nỗ lực phục hồi sau đợt điều chỉnh gần 12% trong tuần qua với chỉ số RSI đã tăng vọt vào...