MỤC LỤC
Sinh ra tại Mililing – một ngôi làng nhỏ và yên ắng ở miền nam tỉnh Quảng Đông, Liang Wenfeng từng là cái tên ít ai biết đến. Nhưng giờ đây, nơi này đã trở thành điểm dừng chân của hàng trăm du khách mỗi ngày, những người đến bày tỏ sự ngưỡng mộ với nhà sáng lập 40 tuổi của DeepSeek – startup AI đang gây chấn động toàn cầu.
Kể từ khi DeepSeek công bố mô hình lý luận mạnh mẽ vào đầu năm 2025, Liang trở thành một trong những nhân vật có tầm ảnh hưởng lớn nhất tại Trung Quốc, được ví như những nhà khoa học hạt nhân và tên lửa của thế kỷ trước – những người từng góp phần định hình vị thế chiến lược quốc gia.
Trong nước, tên tuổi Liang xuất hiện trên áp phích trường học, được giáo viên nhắc đến như tấm gương vượt khó. Ngoài biên giới, ông được xem là đối thủ đáng gờm với các tên tuổi lớn như Sam Altman của OpenAI, và là đại diện mới trong cuộc cạnh tranh công nghệ Mỹ – Trung.
Từ học sinh nghèo đến sinh viên xuất sắc
Khi Liang chào đời năm 1985, Trung Quốc vẫn còn là nền kinh tế bao cấp với thu nhập bình quân đầu người chỉ khoảng 300 USD. Mililing lúc ấy là một làng quê cổ kính, nơi mọi người đều quen biết nhau.
Tỏa sáng từ sớm, Liang xuất sắc giành vị trí thủ khoa trong kỳ thi đại học tại khu vực Trạm Giang năm 2002 và đậu vào Đại học Chiết Giang – nơi từng sản sinh nhiều tỷ phú công nghệ nổi tiếng. Tại đây, ông theo học ngành kỹ thuật điện tử và sau đó là chương trình sau đại học về thị giác máy.

Khách du lịch chụp ảnh lưu niệm trước nhà của ông bà Liang Wenfeng. Ảnh: SCMP
Khác với các bạn cùng khóa, Liang từ chối đến văn phòng khi thực tập – một lựa chọn táo bạo phản ánh cá tính độc lập và tư duy vượt khuôn mẫu.
Thành công từ phòng giao dịch đến phòng thí nghiệm AI
Sau khi tốt nghiệp, Liang chuyển đến Thành Đô và bước chân vào lĩnh vực tài chính với niềm cảm hứng từ huyền thoại đầu cơ James Simons. Năm 2015, ông cùng người bạn đại học sáng lập quỹ đầu cơ High-Flyer Quant. Với khoản vốn khởi đầu chỉ 80.000 NDT, Liang đạt lợi nhuận trên 100% mỗi năm và nhanh chóng trở thành tỷ phú.
High-Flyer quản lý hơn 100 tỷ NDT tài sản, cho phép Liang xây dựng trung tâm máy tính khổng lồ với 10.000 GPU Nvidia – đặt nền móng cho bước ngoặt kế tiếp.
Tận dụng nguồn lực sẵn có, Liang chuyển hướng nghiên cứu AI. Năm 2019, ông lập phòng thí nghiệm riêng, và đến đầu năm 2023 – không lâu sau khi OpenAI giới thiệu ChatGPT – phòng lab này chính thức tách ra thành DeepSeek, tập trung phát triển các mô hình ngôn ngữ lớn (LLM).
DeepSeek: Thách thức các ông lớn và làm thay đổi cuộc chơi
Chỉ trong thời gian ngắn, DeepSeek vươn lên như một trong những đơn vị tiên phong trong lĩnh vực AI. Mô hình nền tảng V3 mã nguồn mở ra mắt tháng 12/2024 và mô hình lý luận R1 công bố tháng 1/2025 đã tạo ra một cú hích cho toàn ngành AI Trung Quốc.
Ngay cả “huyền thoại AI” Lee Kai-fu cũng thừa nhận dừng phát triển mô hình mới sau khi thấy DeepSeek bứt phá.
Hiện tại, startup này quy tụ hơn 100 nhà khoa học trẻ và đang không ngừng mở rộng năng lực. Với các kỹ thuật tối ưu như kiến trúc MOE và MLA, họ đã giảm đáng kể chi phí đào tạo AI, đồng thời cung cấp các mô hình nguồn mở giá rẻ – một lựa chọn cạnh tranh trực tiếp với các sản phẩm đắt đỏ đến từ Mỹ.
Alibaba và Tencent đều bày tỏ mong muốn tích hợp công nghệ DeepSeek vào sản phẩm của họ, cho thấy sức ảnh hưởng ngày càng lớn của startup này trong hệ sinh thái công nghệ Trung Quốc.
Tuy vậy, DeepSeek không tránh khỏi thách thức, nhất là khi ngày càng khó tiếp cận các loại chip cao cấp từ Mỹ – yếu tố quan trọng trong huấn luyện AI hiện đại.
Người trầm lặng đứng sau ánh hào quang
Dù DeepSeek ngày càng nổi tiếng, Liang lại là một nhân vật kín tiếng hiếm có trong giới công nghệ Trung Quốc. Ông từ chối phát biểu tại Hội nghị thượng đỉnh AI ở Paris, từ chối phỏng vấn báo chí, tránh tiếp xúc truyền thông và thậm chí không xuất hiện trên mạng xã hội.
Lần hiếm hoi ông xuất hiện công khai là tại hội nghị chuyên đề do Chủ tịch Tập Cận Bình chủ trì hồi tháng Hai. Ngoài ra, tên Liang chỉ xuất hiện trên các bài nghiên cứu khoa học được DeepSeek công bố – minh chứng duy nhất về vai trò dẫn dắt của ông tại startup này.
Liang từng chia sẻ rằng mục tiêu tối thượng của ông là đưa DeepSeek đạt đến AGI – trí tuệ nhân tạo tổng hợp, nơi máy móc có thể suy nghĩ và học hỏi ngang bằng hoặc vượt qua con người. “LLM sở hữu một số đặc điểm sơ khai của AGI và có thể là con đường duy nhất để đạt được điều đó,” ông khẳng định.
(Theo SCMP)


































