扒一扒Deepseek创始成员背景，看看这帮人到底什么来头

发布时间：2026/5/7 3:50:12

说实话，最近这半年，圈子里聊得最热的就是DeepSeek。不是因为它股价涨了多少，而是它那帮人干出的事，确实有点“不讲武德”。很多人问，这帮Deepseek创始成员到底什么背景？是不是又是哪个大厂出来的高管出来镀金搞创业？我在这行摸爬滚打9年了，见过太多PPT造车、概念炒股的案例，但DeepSeek这帮人，有点不一样。

先别急着去搜那些高大上的简历，什么清华北大、硅谷精英，那些都是表象。我最近跟几个做底层架构的朋友喝茶，聊起DeepSeek的技术路线，发现一个很有意思的现象：这帮人特别“极客”，甚至有点偏执。你看他们发布的模型，参数效率极高，推理成本压得极低。这在以前，只有那些烧钱无数的大厂才敢这么玩。但DeepSeek的创始团队，硬是用一种近乎野蛮的方式，把技术壁垒给拆了。

我记得去年年底，有个做量化交易的朋友跟我吐槽，说他们接入DeepSeek的API后，响应速度提升了不少，关键是费用省了一半。他原话是：“这帮人是不是对算力有什么误解？还是说他们把其他公司的利润都挤干了？”这话虽然糙，但理不糙。DeepSeek的创始成员里，有几个核心人物，之前在阿里和腾讯都待过，但不是那种坐办公室写PPT的管理层，而是真正能在代码堆里睡大觉的技术大牛。

比如他们的CTO，据说在开源社区是个“狠角色”。很多开源项目，他不仅贡献代码，还直接怼那些不合理的设计。这种性格，放在大公司里可能早就被边缘化了，但在创业公司，这就是核心竞争力。DeepSeek能这么快崛起，靠的不是营销，而是实打实的技术突破。他们搞的那个混合注意力机制，虽然听起来枯燥，但对于降低推理成本来说，简直是降维打击。

当然，也不能把DeepSeek神话。我接触了几个正在评估是否采用DeepSeek模型的企业客户，反馈并不全是好评。有个做智能客服的客户跟我说，虽然DeepSeek便宜又快，但在处理一些非常垂直、专业的行业术语时，偶尔还是会“胡言乱语”。这说明什么？说明这帮创始成员虽然技术强，但在数据清洗和领域适配上，还有很长的路要走。这也是我作为从业者，觉得他们最真实的地方：不完美，但在快速迭代。

再说说Deepseek创始成员的另一面：低调。跟那些天天上新闻、接受采访的创始人不同，DeepSeek的核心团队几乎不接受媒体采访。他们的GitHub账号比他们的官网还活跃。这种风格，在现在的AI圈子里，简直是一股清流。我猜，他们可能觉得，代码比嘴炮更有说服力。

不过，这也带来一个问题：普通用户很难深入了解他们的内部运作。很多人只知道DeepSeek好用，但不知道背后这群人是怎么想的。其实，从他们的技术博客和开源项目里，你能看到一种强烈的“工程师文化”。他们不讲究什么商业故事，只讲究怎么把模型跑得更顺、更快、更省。这种纯粹，反而让很多技术人员产生了共鸣。

当然，也有人质疑，DeepSeek的模式能不能持久？毕竟，算力成本摆在那里，如果大厂继续烧钱，小团队很难熬过寒冬。但我认为，Deepseek创始成员们早就想到了这一点。他们通过优化算法，降低了对算力的依赖，这本身就是一种护城河。而且，他们正在构建一个开放的生态，让开发者更容易基于他们的模型进行二次开发。这种思路，比单纯卖API要高明得多。

总之，DeepSeek这帮人，不是那种典型的“成功学”模板。他们有点固执，有点极客，甚至有点不合群。但正是这种特质，让他们在拥挤的AI赛道里，走出了一条不一样的路。对于咱们这些从业者来说，与其羡慕他们的成功，不如多看看他们是怎么解决问题的。毕竟，在这个行业，技术才是硬道理。

最后多说一句，别光盯着Deepseek创始成员的光环看，多看看他们的代码和文档，那里才有真正的宝藏。当然，如果你只是想知道他们是谁，那我只能说：一群不想被定义的技术疯子。这就够了。