搞了7年AI，聊聊上海垂直大模型那些事儿，别被忽悠了

发布时间：2026/6/24 5:37:07

标题下边写入一行记录本文主题关键词写成'本文关键词：上海垂直大模型'

说实话，刚入行那会儿，谁都在吹大模型，我也跟着吹。那时候觉得，只要把参数调大，什么都能干。现在干了七年，头发掉了一半，看透了太多热闹背后的冷清。特别是最近，朋友圈里全是“上海垂直大模型”的风口，好像不沾边儿就落伍了。我忍不住想泼盆冷水，顺便说说真话。

很多人一听到“垂直”，第一反应就是“专”。觉得把通用大模型拿来，喂点行业数据，就能成神。这想法太天真了。我在上海跟几个创业团队聊过，有个做医疗影像的哥们，花了大半年时间，搞了个所谓的“垂直模型”，结果上线那天，医生骂娘了。为啥？因为模型虽然懂医学术语，但不懂“人话”。医生跟患者沟通，那是带着情绪、带着潜台词的，你那冷冰冰的概率预测，能解决医患矛盾吗？不能。

这就是垂直大模型最大的坑：你以为你在做技术，其实你在做服务。

上海这边的环境比较特殊，企业多，场景碎。不像北京全是搞算法的，也不像深圳全是搞硬件的。上海的企业老板，精得很。他们不看你模型有多牛，只看能不能帮我省钱，能不能帮我多赚钱。我见过一个做跨境电商的团队，他们没搞什么高大上的通用模型，就是针对“退换货沟通”这个单一场景，训练了一个小模型。这模型不大，也就几个亿参数，但效果出奇的好。它知道怎么在合规的前提下，用最软的态度处理最硬的纠纷。这就是垂直。

别总盯着那些百亿、千亿参数的巨无霸。对于中小企业来说，那些东西就是烧钱的黑洞。你需要的是“小而美”，是“准而狠”。

我记得有个做物流调度的客户，他们不需要模型去写诗画画，他们只需要模型在早高峰的时候，准确预测哪个路段会堵，哪辆车该绕路。这种需求，通用大模型根本帮不上忙，因为它太“泛”了。而垂直大模型，就是把路跑熟，把路况摸透。

当然，这也意味着你要忍受大量的脏活累活。数据清洗，那是真的累。上海很多传统企业，数据烂得像一锅粥。你要把那些非结构化的表格、扫描件、甚至手写单据，一点点变成模型能看懂的格式。这个过程，没有光鲜亮丽的发布会，只有满屏的代码报错和老板的催命电话。

但我依然看好上海垂直大模型的未来。因为这里不缺场景，不缺钱，更不缺对效率的极致追求。只是，别把简单的事情复杂化。

别迷信“大”，要迷信“准”。别追求“全”，要追求“深”。

我见过太多团队，为了炫技，搞了个能写诗能画画能算数的模型，结果客户一问：“这玩意儿能帮我少招两个客服吗？”回答不上来。这就很尴尬。

所以，如果你也想在上海这片热土上搞垂直大模型，先问问自己：你到底解决了什么具体问题？是帮医生多看了一个病人，还是帮销售员多签了一单？如果没有这个答案，趁早收手。

最后说句得罪人的话，那些还在吹嘘“通用大模型将取代一切”的专家，多半是没下过水。水深水浅，只有脚知道。上海的水，深得很，但也鲜得很。垂直大模型，就是那把最锋利的刀，但前提是你得知道往哪切。

别被那些华丽的PPT骗了，落地生根，才是硬道理。