推广 热搜： 金服务系统杯行业公司中国教师企业参数

大厂混战大模型：四大流派，没有赢家

日期：2023-08-12 浏览：125 移动：http://lanlanwork.gawce.com/mobile/quote/3212.html

大厂混战大模型：四大流派，没有赢家

大赢家竞彩周报有app吗_新加坡有濮阳面积大没_

图片来源@视觉中国

文字| 定焦，作者 | 谷文，编辑| 方展波

今年以来，整个科技圈最热闹的事件就是大机型的发布。

自3月份百度率先发布文信一言以来，阿里、科大讯飞、360、腾讯等纷纷跟进。 7月份，华为、京东、携程也相继召开了发布会，虽然来得较晚。

科技公司再次崛起。以至于某领先互联网公司的技术总监在发布会一开始就强调：“我们今天不会发布预训练的多模态大模型，今天不会抓住大模型的热点” ”。

7月17日下午，携程发布旅游行业垂直模型后，除了少数隐藏的互联网公司外，各大公司的大型模型基本集结完毕。

大型模型发布时间线绘制/定焦

大型模型越来越多。虽然来自大厂，但真假却很难辨别。每个人的伎俩也不同，有的沉迷于“写诗”，有的沉浸在“做事”，有的则“讲故事”。

根据资源容量、布局深度、战术，大厂的大模式可以分为不同的流派。《定焦》将其概括为四种：

业界普遍认为，第一梯队是百度、阿里巴巴、腾讯、华为，他们的综合实力最强。京东、字节跳动、科大讯飞位居第二梯队，商业属性较重； 360、携程、网易仍处于探索阶段；美团和小米尚未发布大机型。

当然，这种分类是动态的。行业变化太快，各大厂商的进步也很快，格局随时可能被改写。

接下来《定焦》就带大家讨论一下大厂的大车型是什么样的，哪款大车型最强，大厂的大车型是什么？

两条路线，三个层次

在讨论大工厂的大模式之前，我们先来科普一下背景。

首先，大型模型并不是什么新鲜事。它不是突然冒出来的，而是被点燃了。在去年11月底问世之前，百度、阿里、腾讯、华为等各大厂商都有自己的大型机型，并且经常在一些国际评测榜单中名列前茅。

具体到大车型这个品类，主要有两大路线，一是通用，二是垂直。

所谓“万能”可以简单理解为一个万能的大模型； “垂直”是指在某个特定领域特别擅长。区别就像一个高中毕业生，有基本能力和素养，但没有专业素养；另一种是职业高中毕业生，综合能力较差，但可能擅长砌砖或修车。。

还有百度文心易言、阿里同易钱文都是通用型大模型，能聊天、能写诗、能画画，看起来更加全能。但如果你想让它做专业的在线咨询和物流策划，那可能就很普通了。

与之相对应，华为的大型矿山模型、实时预测全球海浪的大型模型、京东金融业的大型模型则注重“做事”和“专业”。

这两条路线是我们认识大型模型的基础，也决定了各大厂商在布局大型模型赛道时的战略方向。

那么，无论是通用模式还是垂直模式，企业具体可以做什么呢？

百度创始人兼CEO李彦宏曾给创业公司一个建议：没必要重新打造基础模型，创业者的机会就在应用层，会有“新的、十次的”当前微信和抖音的创业机会”。

抛开这个观点的立场，这里提到“基础模型”和“应用层”。这涉及到三个层次的大模型。

在中国大模式的创业生态中，玩家定位在不同的层面——架构层、模型层、应用层。

架构层的进入门槛最高，其功能有些类似于基础设施。能够参与的主要玩家是各大云计算厂商，如阿里巴巴、腾讯、百度、华为四大巨头。

模型层一大重点是基础大模型，对算力、算法、数据、人才的要求非常高，一般初创公司做不到。一些企业选择在基础模型上进行一些微调，推出针对行业的模型。

应用层基于前两类大模型，调用API来开发应用程序，就像手机行业基于和iOS开发应用程序一样。这是大多数初创公司都能做到的。大众熟知的其实是对GPT-3模型进行微调后开发的对话机器人应用。

中国的科技企业，特别是像BAT这样的超级巨头，在布局时往往会跨三个层次。基本做法是先发布一个通用的大模型或者行业大模型库，然后其他企业根据这些基础模型，结合自己的行业数据，微调自己的大模型应用。

因为它的流行，很多人把大模型理解为一个应用程序或者一个产品，这是不准确的。大型模型正在形成一个生态，其中有修公路的、有盖房子的、有做精装修的。

雄心勃勃的顶级厂商想要拿下壁垒最高、赛道最宽的架构层和模型层，但难度和风险系数极高，投入后很可能见不到成果。中部地区大厂选择在一些垂直行业深耕，先在具体场景落地，见效后加大投入。更多的大工厂其实还处于摸索阶段，一边观望一边前行，摸着石头过河。

大昌的招式和武术

随着各大互联网公司陆续发布大型机型，各大公司的布局也逐渐明朗。

我们把百度、阿里、腾讯、华为放到第一梯队，一是因为他们在大模式上起步早，布局深，二是因为他们能力全面。

百度是国内第一家推出聊天机器人产品、开放内测、硬核的公司。

将时间再往前推四年，百度在2019年3月对标谷歌的BERT模型，推出文心大模型ERNIE 1.0，中文效果超越BERT。该模型的参数将于2021年12月达到1000亿，进入“智能涌现”的门槛。 ERNIE 3.0 Zeus也是国内第一个开放API调用的千亿大模型。

今年4月11日，阿里发布了标杆大型语言模型统一钱文，并快速接入钉钉、天猫精灵，随后在3个月内推出了大规模音频聚焦模型应用统一Hearu和AI画画等大型语言模型。大比例模型具有普遍意义，具有共同意义的大比例模型家族正在逐渐形成。

这么快的节奏是因为阿里已经做好了准备工作。阿里很早就发布了大语言模型Plug和多模态大模型M6。 2021年10月，M6的参数规模达到10万亿，是当时全球最大的AI预训练模型。这两个车型于去年9月合并，发展成为今天的统一大车型。

腾讯直到今年6月下旬才召开发布会，在各大厂商中算是比较晚的。而且，它并没有像百度、阿里那样发布通用的大规模模型，而是针对B端客户发布了行业大规模模型解决方案。对于华为来说也是如此。 7月7日发布了面向行业的盘古模型3.0，但没有发布聊天机器人。

腾讯和华为都拥有强大的硬实力。腾讯去年4月发布了混元大模型，这是一个融合计算机视觉和自然语言处理的多模态大模型，并已应用在腾讯的各个业务模块中。华为的盘古大模型早在2021年4月就发布了，一些特定场景也已经落地。

在这波AI2.0浪潮中，很多能力都是建立在云平台上的。无论是算力、模型还是工具链，都是通过云平台导出的。在此基础上，大公司构建大规模模型生态系统，支撑更多应用的增长，是比较先进的方式。目前只有这四大公司可以玩。

第二梯队的京东、字节跳动、科大讯飞，我们将他们归为“业务型”玩家，因为他们的能力集中在模型层，他们更感兴趣与业务结合。

以京东为例。 7月13日，京东推出AI大规模模型“延禧”，这是一个面向行业的垂直大规模模型，专注于解决真实场景中的实际问题。过去几年，除了电商销售商品外，京东还发展了物流、金融、医疗等业务。因此，“延禧”模式最初主要面向零售、金融、城市、健康、物流领域。早期主要供私人使用，后来对外开放。

另一个例子是科大讯飞。 5月6日，“星火认知模型”发布，并在教育、办公、汽车、数字化员工等领域落地应用。它还将连接学习机和录音转录工具“讯飞听力”等产品。

字节跳动的玩法相当特别。 6月28日发布了“火山方舟”。注意，这不是大型模型，官方术语是“企业级大型模型服务平台”。总之，是一个大型的模型超市。 Byte不生产大型模型，而只“处理”大型模型。

这三个大厂生意很好。对于他们来说，大模型更多的是一种工具。首先，要贯穿自己的内部，提高效率。看到真实效果后，他们会考虑加大推广投入。

360、网易、携程三大梯队还处于探索阶段。

其中，360可能不服气。自走红以来，长期低调的“红衣领军人物”周鸿祎突然又活跃起来，频频表态。被包装成“数字安全公司”的360于6月13日发布了“360大脑模型”和数字人产品。

不过，虽然产品功能丰富，但外界对360大机型的技术水平存在质疑。 360声称前期投资了AIGC技术。去年还启动了计划投资2.23亿元的项目。半年后，募集资金仅投入5%。

携程和网易在大模型上的布局还不是很系统。网易号称2021年开始打造“御智”多模态理解大模型，借助华为升腾AI力量，在行业中存在感并不强。携程发布了旅游行业大型垂直模式“携程问”，出发点是提高内部各项业务的工作效率。

美团和小米尚未发布大型机型，但内部已启动相关项目。美团的最新动态是，距离接替王慧文还有光年之遥。这对美团的规模化模特业务究竟有多大帮助，还有待观察。

大厂大车型，拼什么？

这么多大牌车型，如何评价好坏呢？

上半年的“百款大战”，中国厂商推出自己的大车型时，都喜欢谈论参数。事实证明，大模型存在“涌现”现象，而且大模型的参数数量越多，智能程度越高。

这是一个非常粗略的指标。阿里巴巴、百度等大公司几年前就推出了万亿参数的大模型，但参数大和能力强是两码事。

另一个常用的评价维度是公众评价采集和榜单评分。中国各大厂商都非常喜欢参与。

比如腾讯，去年腾讯的混元大模型发布后，就参与了很多榜单的排名。它在MSR-VTT、MSVD、LSMDC以及五个跨模态视频检索数据集的列表中获得了第一名。它在跨模态检索领域实现了大满贯，成绩打破了多项记录。

百度的文心模式在过去几年中经常位居全球权威GLUE排行榜榜首，甚至超过了微软、谷歌等公司。近日，IDC发布大型模型评测报告，百度文心大型模型在7个核心指标上获得满分，综合得分排名第一。

这种方法的局限性在于，会导致一些“测试型玩家”，测试成绩与实际表现相差甚远。

国内一家AI初创公司创始人季定宇告诉《定焦》，“大模型是综合能力的体现，所有的评价都不能反映全部。” “大厂商在排名上从来没有输过”。

当一个新的渠道出现时，企业家和资本就会涌向它，从而导致广泛的信息差距。尤其是在前期，外界缺乏足够的洞察力。这时候，谁的声音更大，就能获得更多的关注。

华为盘古模型推出两年来，普通人对其知之甚少。盘古模型火爆后，迅速升级至3.0版本，再次向外界发布。

盛景嘉成董事总经理刘迪对《定焦》表示：“对于大厂来说，大家在发布大型号的时候，你不能缺席。因为GPT的影响，大厂非常被动。什么？”计划2-3年完成的，可以压缩到三个月内快速完成。”

就像一场赛跑，每个人都在跑在前面，无论姿势和动作是否优雅。

对于一些大型厂商来说，发布什么产品和能力是一个选择题。大厂商还必须迎合热点、造势、包装。开发大会更多的是一种宣传行为，真正的作品在台下和幕后。

为了凸显自己的优势，很多大厂商都会对标GPT，采用“指标前加定语”的方法进行比较，尤其是“中文能力”这一指标。但目前从C端用户的反馈来看，它仍然是用户数量最多、体验最好的一款。

刘迪认为，从商业模式来看，各大厂商很难将大规模的模式包装成像微信这样广泛使用的付费C端产品，因为算力太稀缺。 “现在算力用于微调，日常B端业务处理已经很紧张，一旦C端量上来，大公司就支撑不了了。

这样做的结果是，出售算力资源的云厂商最先享受到大模型的红利。

我提前囤了1万多块 GPU，直到现在还没有推出自己的大型号。 4月，各大厂商发布大型机型最火爆的月份，其算力平台火山引擎推出了自研DPU（DPU是定制加速硬件）等一系列云产品，支持万卡级大型机比例模型训练。

字节跳动选择为其他大型公司提供算力服务，双方的关系就像微软和亚马逊。火山引擎总裁谭代表示，国内数十家大型模型企业中，70%以上已经上火山引擎云。

整体来看，大型模型赛道仍处于早期阶段。虽然各大厂商都发布了产品，但抢购意识强烈。由于赛道足够长，暂时的早发并不能形成长期的优势。而且行业变化迭代太快，技术和产品随时可能重新洗牌。

短暂的声量之战后，将进入硬实力较量阶段。

谁最有可能获胜？

从年初到现在，大家对于大车型的认识正在逐渐改变。

年初，业界的共识是通用大型机型是未来。大家感觉通用大模型在各种场景下表现都很好，可以解决所有问题。主要厂商中，百度、阿里巴巴、科大讯飞、360均发布了类似产品。

后来大家发现这些产品更像是玩具。他们很会说话，你可以和他们聊天，但要求他们做具体的任务可能不太靠谱。

大工厂很快就跟上了市场的变化。百度发现，问心一言发布后，一开始来交流的企业都是CEO级别的人，后来大多是技术或业务负责人。字节跳动发现，来到火山引擎的企业都是4、5月份的模型厂商。需求是训练模型。现在他们是一些行业客户，希望落地到营销、客服等场景。

于是到了下半年，风向就变了。业界很快达成了新的共识：行业模型更可靠，应该面向行业通用。大厂向外界讲故事的口径也发生了变化，开始发布行业的大型模型。

6月下旬，腾讯推出行业“精选模型店”时，腾讯云与智慧产业事业群CEO唐道生表示，“聊天机器人并不是服务大模型的唯一方式，也不一定是大模型的最佳解决方案。”满足行业需求。”

华为7月初发布的盘古模型3.0就是针对行业的。华为常务董事、华为云CEO张平安表示，华为的盘古模式不写诗，但必须扎根于行业，为各行业带来价值。

京东“延禧”大款的定位是直接面向行业的。京东云事业部总裁曹鹏表示，一般的对话大模不应该是大模的全部，大模也不应该只是聊天、写诗的玩具和绘画。

在吐槽通用模式的同时，这三大厂商开始在“行业”上大做文章，以凸显自身优势。他们的产品主要针对To B行业市场。

刘迪认为，对于大厂商来说，大车型有两个价值。一是内部降低成本，将优化的效率转化为利润；合理的利润。最终，它必须商业化。 “除了技术指标之外，评价一个模式好不好，还得看有多少人使用它。一是收费客户数量，二是产生的收入多少。”

MaaS模式（as a，模型即服务）已经开始被更多的大型制造商带到桌面上。去年的云栖大会，以及今年的百度文心一言发布会，都提到了这个概念。腾讯发布MaaS能力全景图。

就像当年的云计算市场一样，底层算力和平台能力可以构建壁垒，市场需要算力强大、模型全面的服务商。那些在算力、平台、模型、应用等方面都有布局的大工厂，对企业客户更有吸引力。

百度、阿里巴巴、华为除了自研大型机型产品外，也完成了从芯片到应用的布局。百度是“昆仑芯+飞桨平台+文芯大模型”，阿里是“含光800芯片+M6-OFA底座+统易大模型”，华为是“升腾芯片+框架+盘古大模型”，这是一个优势其他公司短期内很难赶上。

季定宇认为，最终只会出现一家做通用大型模型的公司，做好比早做更有价值。 “我最看好字节跳动和腾讯，一是团队的匹配，二是场景的匹配。”

刘迪更看好三大厂商——美团、字节跳动、华为。他对“定焦”的分析是：美团是基于场景寻找业务，基于C端用户的高频交易数据，能够快速迭代模型；华为专注于生态系统，在G端拥有强大的资源，拥有极其强大的行业数据。能力; 字节跳动此前已将多项AI技术应用到自家产品中，迭代能力极强。

不过，这一切都是基于现阶段的理论分析。行业格局如何演变，取决于各大厂商下一步如何动作。毕竟，大车型的赛道才刚刚铺开。

*应受访者要求，纪定宇为化名。

本文地址：http://lanlanwork.gawce.com/quote/3212.html 阁恬下 http://lanlanwork.gawce.com/ , 查看更多

特别提示：本信息由相关企业自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

相关行业动态

推荐行业动态

点击排行