别吹了，deepseek团队成员吴作凡到底是个啥来头？

发布时间：2026/5/11 14:04:23

说实话，最近这圈子真是吵翻天了。天天有人在那喊什么国产之光，什么弯道超车。我听着都累。咱们干这行的，看多了那种PPT造车式的AI公司，今天发个demo，明天就融资几个亿，后天就倒闭。所以当你看到deepseek团队成员吴作凡这个名字冒出来的时候，我第一反应不是崇拜，是怀疑。

真的，别一上来就跪舔。咱们得扒开看看，这哥们儿到底是个什么路数。

我有个朋友，之前在某个大厂做算法，后来跳槽去搞这种垂直领域的模型。他跟我说，现在的AI圈，水分比海水还大。你去看那些所谓的“核心成员”，简历写得花里胡哨，什么哈佛博士、MIT博士后，结果一问技术细节，连个Transformer的基本结构都讲不清楚。但是deepseek团队成员吴作凡，我在几个技术论坛的角落里翻过他的帖子。不是那种高高在上的说教，而是实打实地在讨论代码优化、显存占用这些脏活累活。

这就很有意思了。

你知道做LLM（大语言模型）最痛苦的是什么吗？不是模型架构多难设计，而是怎么在有限的算力下，把效果跑出来。这就是所谓的“炼丹”。我见过太多团队，拿着几百万的显卡，跑出来的模型比开源的还慢。吴作凡这人，据我了解，他特别抠细节。有一次在一个小型的技术分享会上，他提到一个关于MoE（混合专家模型）路由机制的优化方案。那方案并不新颖，甚至有点“土”，但他硬是把推理延迟压低了15%。这在工业界，15%意味着什么？意味着服务器成本能省下一大笔，意味着用户等待时间缩短，体验直接上一个台阶。

这种活儿，写论文可能发不了顶会，因为不够“性感”。但在实际落地中，这就是真金白银。

我接触过几个想融资的AI初创公司，老板张口闭口就是“颠覆行业”，一问技术底座，全是调包侠。他们根本不懂为什么模型会出现幻觉，也不懂怎么处理长文本的上下文窗口限制。而deepseek团队成员吴作凡的视角，完全是工程化的。他关注的是：这个模块能不能复用？那个接口能不能标准化？数据清洗的流程能不能自动化？

这种思维，才是国内AI行业最缺的。

当然，我也不是无脑吹。deepseek团队成员吴作凡也不是神。我也听到过一些负面声音，说他们的模型在某些特定领域的知识更新不够快。这很正常，没有完美的模型。任何模型都有短板。关键在于，他们有没有正视这些问题，以及有没有在迭代中解决。从目前公开的一些技术文档来看，他们的迭代速度确实不慢，而且很多优化思路非常务实，不整那些虚头巴脑的概念。

咱们普通人，或者中小企业主，别整天盯着那些花里胡哨的营销词。你要看的是，这个团队能不能帮你解决问题。能不能把成本降下来，能不能把效率提上去。deepseek团队成员吴作凡代表的这种务实派，虽然声音不大，但往往走得更远。

我见过太多昙花一现的项目，最后死在运维成本和数据质量上。而真正能活下来的，都是那些愿意啃硬骨头的。吴作凡这类人，就是啃骨头的人。他们不擅长讲故事，但擅长写代码，擅长调参，擅长在废墟上建起高楼。

所以，别光听风就是雨。多看看技术细节，多看看实际案例。deepseek团队成员吴作凡也好，其他人也罢，最终还是要看产品说话。毕竟，代码不会撒谎，数据不会撒谎。

在这个浮躁的圈子里，能沉下心来做点实事的人，值得多一点耐心。哪怕他有点固执，有点轴，只要技术过硬，能解决问题，那就够了。咱们做技术的，讲究的就是一个“实”字。其他的，都是浮云。

希望以后能看到更多这样的团队，少点PPT，多点代码。这样咱们的行业，才算有点希望。