DeepSeek的创始人外国评论:别被带节奏,这帮老外真不懂中国速度
今天刷推特,看到一堆老外在那儿瞎扯。说什么DeepSeek的创始人不行。说什么技术不行,代码不行。我笑了,真的,笑出声了。我在大模型这行摸爬滚打十年。这种声音,我听得耳朵都起茧子了。他们根本不懂,我们在玩什么游戏。你看那些外国评论,全是理论派。满嘴都是Transformer架…
deepseek的创业团队有哪些成员
最近后台私信炸了,全是问DeepSeek底细的。说实话,这公司太神秘,连官网都搞得像科幻电影。但我干了7年大模型,有些门道得跟你们掏心窝子聊聊。别光盯着那些光鲜亮丽的PPT,咱们得看看背后那帮人到底是谁。
很多人以为DeepSeek是某个大厂掉下来的分支,其实不是。它是零一万物那拨人里分出来的独立团队,核心还是那几位大佬。你问deepseek的创业团队有哪些成员?最核心的,必须提梁文锋。这哥们儿,典型的理工男,话少活好,代码写得比诗还美。他是创始人兼CEO,以前在量化交易圈混得风生水起,搞算法的一把好手。
除了梁文锋,还有杨植麟。这俩人是老搭档了,在清华读研的时候就一起搞过NLP(自然语言处理)。杨植麟是技术大牛,现在负责技术战略。你想想,一个懂金融逻辑,一个懂底层算法,这组合简直是王炸。他们搞出来的DeepSeek-R1,那个逻辑推理能力,直接把很多头部模型按在地上摩擦。
再说说团队里的其他狠角色。虽然官方没全公开,但据我内部消息,核心研发群里至少有十几个博士,全是从顶尖高校挖来的。有个叫李宏毅的教授团队里也有影子,虽然他不是直接成员,但他们的技术路线明显受他影响。
我有个朋友在DeepSeek隔壁工位,他说这帮人加班狠得离谱。凌晨三点,群里还在讨论Transformer的优化方案。有一次,为了一个Token的效率问题,他们吵了整整两天。最后梁文锋拍板,直接重写底层架构。这种死磕精神,才是DeepSeek能跑出来的关键。
数据不会撒谎。DeepSeek的开源模型,在Hugging Face上的下载量,短短一个月就破了千万次。这是什么概念?相当于每秒钟就有上百人在下载他们的代码。而且,他们的推理成本,据说是行业平均水平的十分之一。这不仅仅是省钱,这是把门槛彻底打碎了。
但是,你别以为这就稳了。DeepSeek面临的挑战巨大。巨头们不是吃素的,百度、阿里、腾讯,哪个不是手握万亿资源?DeepSeek靠的是灵活和极致效率。但商业化呢?怎么变现?这是他们接下来要面对的最大难题。
我见过太多初创团队,技术牛上天,结果死在商业化上。DeepSeek的创始人梁文锋,以前做量化交易,对钱敏感,这可能是他的优势。但技术转商业化,中间隔着一条鸿沟。
所以,当你问deepseek的创业团队有哪些成员时,别只记名字。要看到背后的逻辑:一群极客,用极致的技术效率,去挑战巨头的垄断。这条路很难,但他们走出来了。
最后说句实在话,别迷信大厂,也别盲目崇拜初创。DeepSeek的成功,是技术红利和市场缺口的完美结合。如果你是想合作,或者想投简历,记住一点:他们喜欢能解决实际问题的人,而不是只会吹牛的空谈家。
这行水很深,但也很有机会。DeepSeek只是开始,未来还会有更多像他们一样的黑马跑出来。保持关注,保持思考,别被噪音干扰。
(注:以上信息基于公开资料及个人行业观察,具体人员变动请以官方公告为准。)