deepseek创始团队背景揭秘:从科研到落地的真实故事
很多刚入行的大模型从业者,一听到“deepseek创始”这四个字,脑子里蹦出来的全是硅谷那些穿着连帽衫、拿着几千万美元融资的天才少年故事。但如果你真这么想,那就太天真了。我在这一行摸爬滚打七年,见过太多起起落落,今天不跟你扯那些虚头巴脑的融资额,咱们聊聊这背后的真…
说实话,最近这半年,圈子里聊得最热的就是DeepSeek。不是因为它股价涨了多少,而是它那帮人干出的事,确实有点“不讲武德”。很多人问,这帮Deepseek创始成员到底什么背景?是不是又是哪个大厂出来的高管出来镀金搞创业?我在这行摸爬滚打9年了,见过太多PPT造车、概念炒股的案例,但DeepSeek这帮人,有点不一样。
先别急着去搜那些高大上的简历,什么清华北大、硅谷精英,那些都是表象。我最近跟几个做底层架构的朋友喝茶,聊起DeepSeek的技术路线,发现一个很有意思的现象:这帮人特别“极客”,甚至有点偏执。你看他们发布的模型,参数效率极高,推理成本压得极低。这在以前,只有那些烧钱无数的大厂才敢这么玩。但DeepSeek的创始团队,硬是用一种近乎野蛮的方式,把技术壁垒给拆了。
我记得去年年底,有个做量化交易的朋友跟我吐槽,说他们接入DeepSeek的API后,响应速度提升了不少,关键是费用省了一半。他原话是:“这帮人是不是对算力有什么误解?还是说他们把其他公司的利润都挤干了?”这话虽然糙,但理不糙。DeepSeek的创始成员里,有几个核心人物,之前在阿里和腾讯都待过,但不是那种坐办公室写PPT的管理层,而是真正能在代码堆里睡大觉的技术大牛。
比如他们的CTO,据说在开源社区是个“狠角色”。很多开源项目,他不仅贡献代码,还直接怼那些不合理的设计。这种性格,放在大公司里可能早就被边缘化了,但在创业公司,这就是核心竞争力。DeepSeek能这么快崛起,靠的不是营销,而是实打实的技术突破。他们搞的那个混合注意力机制,虽然听起来枯燥,但对于降低推理成本来说,简直是降维打击。
当然,也不能把DeepSeek神话。我接触了几个正在评估是否采用DeepSeek模型的企业客户,反馈并不全是好评。有个做智能客服的客户跟我说,虽然DeepSeek便宜又快,但在处理一些非常垂直、专业的行业术语时,偶尔还是会“胡言乱语”。这说明什么?说明这帮创始成员虽然技术强,但在数据清洗和领域适配上,还有很长的路要走。这也是我作为从业者,觉得他们最真实的地方:不完美,但在快速迭代。
再说说Deepseek创始成员的另一面:低调。跟那些天天上新闻、接受采访的创始人不同,DeepSeek的核心团队几乎不接受媒体采访。他们的GitHub账号比他们的官网还活跃。这种风格,在现在的AI圈子里,简直是一股清流。我猜,他们可能觉得,代码比嘴炮更有说服力。
不过,这也带来一个问题:普通用户很难深入了解他们的内部运作。很多人只知道DeepSeek好用,但不知道背后这群人是怎么想的。其实,从他们的技术博客和开源项目里,你能看到一种强烈的“工程师文化”。他们不讲究什么商业故事,只讲究怎么把模型跑得更顺、更快、更省。这种纯粹,反而让很多技术人员产生了共鸣。
当然,也有人质疑,DeepSeek的模式能不能持久?毕竟,算力成本摆在那里,如果大厂继续烧钱,小团队很难熬过寒冬。但我认为,Deepseek创始成员们早就想到了这一点。他们通过优化算法,降低了对算力的依赖,这本身就是一种护城河。而且,他们正在构建一个开放的生态,让开发者更容易基于他们的模型进行二次开发。这种思路,比单纯卖API要高明得多。
总之,DeepSeek这帮人,不是那种典型的“成功学”模板。他们有点固执,有点极客,甚至有点不合群。但正是这种特质,让他们在拥挤的AI赛道里,走出了一条不一样的路。对于咱们这些从业者来说,与其羡慕他们的成功,不如多看看他们是怎么解决问题的。毕竟,在这个行业,技术才是硬道理。
最后多说一句,别光盯着Deepseek创始成员的光环看,多看看他们的代码和文档,那里才有真正的宝藏。当然,如果你只是想知道他们是谁,那我只能说:一群不想被定义的技术疯子。这就够了。