推广 热搜:   公司    行业  系统  服务  参数  教师  企业  中国 

大厂混战大模型:四大流派,没有赢家

   日期:2023-08-12     浏览:125    移动:http://lanlanwork.gawce.com/mobile/quote/3212.html

大厂混战大模型:四大流派,没有赢家

大赢家竞彩周报有app吗_新加坡有濮阳面积大没_

图片来源@视觉中国

文字| 定焦,作者 | 谷文,编辑| 方展波

今年以来,整个科技圈最热闹的事件就是大机型的发布。

自3月份百度率先发布文信一言以来,阿里、科大讯飞、360、腾讯等纷纷跟进。 7月份,华为、京东、携程也相继召开了发布会,虽然来得较晚。

科技公司再次崛起。 以至于某领先互联网公司的技术总监在发布会一开始就强调:“我们今天不会发布预训练的多模态大模型,今天不会抓住大模型的热点” ”。

7月17日下午,携程发布旅游行业垂直模型后,除了少数隐藏的互联网公司外,各大公司的大型模型基本集结完毕。

大型模型发布时间线绘制/定焦

大型模型越来越多。 虽然来自大厂,但真假却很难辨别。 每个人的伎俩也不同,有的沉迷于“写诗”,有的沉浸在“做事”,有的则“讲故事”。

根据资源容量、布局深度、战术,大厂的大模式可以分为不同的流派。 《定焦》将其概括为四种:

业界普遍认为,第一梯队是百度、阿里巴巴、腾讯、华为,他们的综合实力最强。 京东、字节跳动、科大讯飞位居第二梯队,商业属性较重; 360、携程、网易仍处于探索阶段; 美团和小米尚未发布大机型。

当然,这种分类是动态的。 行业变化太快,各大厂商的进步也很快,格局随时可能被改写。

接下来《定焦》就带大家讨论一下大厂的大车型是什么样的,哪款大车型最强,大厂的大车型是什么?

两条路线,三个层次

在讨论大工厂的大模式之前,我们先来科普一下背景。

首先,大型模型并不是什么新鲜事。 它不是突然冒出来的,而是被点燃了。 在去年11月底问世之前,百度、阿里、腾讯、华为等各大厂商都有自己的大型机型,并且经常在一些国际评测榜单中名列前茅。

具体到大车型这个品类,主要有两大路线,一是通用,二是垂直。

所谓“万能”可以简单理解为一个万能的大模型; “垂直”是指在某个特定领域特别擅长。 区别就像一个高中毕业生,有基本能力和素养,但没有专业素养; 另一种是职业高中毕业生,综合能力较差,但可能擅长砌砖或修车。 。

还有百度文心易言、阿里同易钱文都是通用型大模型,能聊天、能写诗、能画画,看起来更加全能。 但如果你想让它做专业的在线咨询和物流策划,那可能就很普通了。

与之相对应,华为的大型矿山模型、实时预测全球海浪的大型模型、京东金融业的大型模型则注重“做事”和“专业”。

这两条路线是我们认识大型模型的基础,也决定了各大厂商在布局大型模型赛道时的战略方向。

那么,无论是通用模式还是垂直模式,企业具体可以做什么呢?

百度创始人兼CEO李彦宏曾给创业公司一个建议:没必要重新打造基础模型,创业者的机会就在应用层,会有“新的、十次的”当前微信和抖音的创业机会”。

抛开这个观点的立场,这里提到“基础模型”和“应用层”。 这涉及到三个层次的大模型。

在中国大模式的创业生态中,玩家定位在不同的层面——架构层、模型层、应用层。

架构层的进入门槛最高,其功能有些类似于基础设施。 能够参与的主要玩家是各大云计算厂商,如阿里巴巴、腾讯、百度、华为四大巨头。

模型层一大重点是基础大模型,对算力、算法、数据、人才的要求非常高,一般初创公司做不到。 一些企业选择在基础模型上进行一些微调,推出针对行业的模型。

应用层基于前两类大模型,调用API来开发应用程序,就像手机行业基于和iOS开发应用程序一样。 这是大多数初创公司都能做到的。 大众熟知的其实是对GPT-3模型进行微调后开发的对话机器人应用。

中国的科技企业,特别是像BAT这样的超级巨头,在布局时往往会跨三个层次。 基本做法是先发布一个通用的大模型或者行业大模型库,然后其他企业根据这些基础模型,结合自己的行业数据,微调自己的大模型应用。

因为它的流行,很多人把大模型理解为一个应用程序或者一个产品,这是不准确的。 大型模型正在形成一个生态,其中有修公路的、有盖房子的、有做精装修的。

雄心勃勃的顶级厂商想要拿下壁垒最高、赛道最宽的架构层和模型层,但难度和风险系数极高,投入后很可能见不到成果。 中部地区大厂选择在一些垂直行业深耕,先在具体场景落地,见效后加大投入。 更多的大工厂其实还处于摸索阶段,一边观望一边前行,摸着石头过河。

大昌的招式和武术

随着各大互联网公司陆续发布大型机型,各大公司的布局也逐渐明朗。

我们把百度、阿里、腾讯、华为放到第一梯队,一是因为他们在大模式上起步早,布局深,二是因为他们能力全面。

百度是国内第一家推出聊天机器人产品、开放内测、硬核的公司。

将时间再往前推四年,百度在2019年3月对标谷歌的BERT模型,推出文心大模型ERNIE 1.0,中文效果超越BERT。 该模型的参数将于2021年12月达到1000亿,进入“智能涌现”的门槛。 ERNIE 3.0 Zeus也是国内第一个开放API调用的千亿大模型。

今年4月11日,阿里发布了标杆大型语言模型统一钱文,并快速接入钉钉、天猫精灵,随后在3个月内推出了大规模音频聚焦模型应用统一Hearu和AI画画等大型语言模型。大比例模型具有普遍意义,具有共同意义的大比例模型家族正在逐渐形成。

这么快的节奏是因为阿里已经做好了准备工作。 阿里很早就发布了大语言模型Plug和多模态大模型M6。 2021年10月,M6的参数规模达到10万亿,是当时全球最大的AI预训练模型。 这两个车型于去年9月合并,发展成为今天的统一大车型。

腾讯直到今年6月下旬才召开发布会,在各大厂商中算是比较晚的。 而且,它并没有像百度、阿里那样发布通用的大规模模型,而是针对B端客户发布了行业大规模模型解决方案。 对于华为来说也是如此。 7月7日发布了面向行业的盘古模型3.0,但没有发布聊天机器人。

腾讯和华为都拥有强大的硬实力。 腾讯去年4月发布了混元大模型,这是一个融合计算机视觉和自然语言处理的多模态大模型,并已应用在腾讯的各个业务模块中。 华为的盘古大模型早在2021年4月就发布了,一些特定场景也已经落地。

在这波AI2.0浪潮中,很多能力都是建立在云平台上的。 无论是算力、模型还是工具链,都是通过云平台导出的。 在此基础上,大公司构建大规模模型生态系统,支撑更多应用的增长,是比较先进的方式。 目前只有这四大公司可以玩。

第二梯队的京东、字节跳动、科大讯飞,我们将他们归为“业务型”玩家,因为他们的能力集中在模型层,他们更感兴趣与业务结合。

以京东为例。 7月13日,京东推出AI大规模模型“延禧”,这是一个面向行业的垂直大规模模型,专注于解决真实场景中的实际问题。 过去几年,除了电商销售商品外,京东还发展了物流、金融、医疗等业务。 因此,“延禧”模式最初主要面向零售、金融、城市、健康、物流领域。 早期主要供私人使用,后来对外开放。

另一个例子是科大讯飞。 5月6日,“星火认知模型”发布,并在教育、办公、汽车、数字化员工等领域落地应用。 它还将连接学习机和录音转录工具“讯飞听力”等产品。

字节跳动的玩法相当特别。 6月28日发布了“火山方舟”。注意,这不是大型模型,官方术语是“企业级大型模型服务平台”。 总之,是一个大型的模型超市。 Byte不生产大型模型,而只“处理”大型模型。

这三个大厂生意很好。 对于他们来说,大模型更多的是一种工具。 首先,要贯穿自己的内部,提高效率。 看到真实效果后,他们会考虑加大推广投入。

360、网易、携程三大梯队还处于探索阶段。

其中,360可能不服气。 自走红以来,长期低调的“红衣领军人物”周鸿祎突然又活跃起来,频频表态。 被包装成“数字安全公司”的360于6月13日发布了“360大脑模型”和数字人产品。

不过,虽然产品功能丰富,但外界对360大机型的技术水平存在质疑。 360声称前期投资了AIGC技术。 去年还启动了计划投资2.23亿元的项目。 半年后,募集资金仅投入5%。

携程和网易在大模型上的布局还不是很系统。 网易号称2021年开始打造“御智”多模态理解大模型,借助华为升腾AI力量,在行业中存在感并不强。 携程发布了旅游行业大型垂直模式“携程问”,出发点是提高内部各项业务的工作效率。

美团和小米尚未发布大型机型,但内部已启动相关项目。 美团的最新动态是,距离接替王慧文还有光年之遥。 这对美团的规模化模特业务究竟有多大帮助,还有待观察。

大厂大车型,拼什么?

这么多大牌车型,如何评价好坏呢?

上半年的“百款大战”,中国厂商推出自己的大车型时,都喜欢谈论参数。 事实证明,大模型存在“涌现”现象,而且大模型的参数数量越多,智能程度越高。

这是一个非常粗略的指标。 阿里巴巴、百度等大公司几年前就推出了万亿参数的大模型,但参数大和能力强是两码事。

另一个常用的评价维度是公众评价采集和榜单评分。 中国各大厂商都非常喜欢参与。

比如腾讯,去年腾讯的混元大模型发布后,就参与了很多榜单的排名。 它在MSR-VTT、MSVD、LSMDC以及五个跨模态视频检索数据集的列表中获得了第一名。 它在跨模态检索领域实现了大满贯,成绩打破了多项记录。

百度的文心模式在过去几年中经常位居全球权威GLUE排行榜榜首,甚至超过了微软、谷歌等公司。 近日,IDC发布大型模型评测报告,百度文心大型模型在7个核心指标上获得满分,综合得分排名第一。

这种方法的局限性在于,会导致一些“测试型玩家”,测试成绩与实际表现相差甚远。

国内一家AI初创公司创始人季定宇告诉《定焦》,“大模型是综合能力的体现,所有的评价都不能反映全部。” “大厂商在排名上从来没有输过”。

当一个新的渠道出现时,企业家和资本就会涌向它,从而导致广泛的信息差距。 尤其是在前期,外界缺乏足够的洞察力。 这时候,谁的声音更大,就能获得更多的关注。

华为盘古模型推出两年来,普通人对其知之甚少。 盘古模型火爆后,迅速升级至3.0版本,再次向外界发布。

盛景嘉成董事总经理刘迪对《定焦》表示:“对于大厂来说,大家在发布大型号的时候,你不能缺席。因为GPT的影响,大厂非常被动。什么?”计划2-3年完成的,可以压缩到三个月内快速完成。”

就像一场赛跑,每个人都在跑在前面,无论姿势和动作是否优雅。

对于一些大型厂商来说,发布什么产品和能力是一个选择题。 大厂商还必须迎合热点、造势、包装。 开发大会更多的是一种宣传行为,真正的作品在台下和幕后。

为了凸显自己的优势,很多大厂商都会对标GPT,采用“指标前加定语”的方法进行比较,尤其是“中文能力”这一指标。 但目前从C端用户的反馈来看,它仍然是用户数量最多、体验最好的一款。

刘迪认为,从商业模式来看,各大厂商很难将大规模的模式包装成像微信这样广泛使用的付费C端产品,因为算力太稀缺。 “现在算力用于微调,日常B端业务处理已经很紧张,一旦C端量上来,大公司就支撑不了了。

这样做的结果是,出售算力资源的云厂商最先享受到大模型的红利。

我提前囤了1万多块 GPU,直到现在还没有推出自己的大型号。 4月,各大厂商发布大型机型最火爆的月份,其算力平台火山引擎推出了自研DPU(DPU是定制加速硬件)等一系列云产品,支持万卡级大型机比例模型训练。

字节跳动选择为其他大型公司提供算力服务,双方的关系就像微软和亚马逊。 火山引擎总裁谭代表示,国内数十家大型模型企业中,70%以上已经上火山引擎云。

整体来看,大型模型赛道仍处于早期阶段。 虽然各大厂商都发布了产品,但抢购意识强烈。 由于赛道足够长,暂时的早发并不能形成长期的优势。 而且行业变化迭代太快,技术和产品随时可能重新洗牌。

短暂的声量之战后,将进入硬实力较量阶段。

谁最有可能获胜?

从年初到现在,大家对于大车型的认识正在逐渐改变。

年初,业界的共识是通用大型机型是未来。 大家感觉通用大模型在各种场景下表现都很好,可以解决所有问题。 主要厂商中,百度、阿里巴巴、科大讯飞、360均发布了类似产品。

后来大家发现这些产品更像是玩具。 他们很会说话,你可以和他们聊天,但要求他们做具体的任务可能不太靠谱。

大工厂很快就跟上了市场的变化。 百度发现,问心一言发布后,一开始来交流的企业都是CEO级别的人,后来大多是技术或业务负责人。 字节跳动发现,来到火山引擎的企业都是4、5月份的模型厂商。 需求是训练模型。 现在他们是一些行业客户,希望落地到营销、客服等场景。

于是到了下半年,风向就变了。 业界很快达成了新的共识:行业模型更可靠,应该面向行业通用。 大厂向外界讲故事的口径也发生了变化,开始发布行业的大型模型。

6月下旬,腾讯推出行业“精选模型店”时,腾讯云与智慧产业事业群CEO唐道生表示,“聊天机器人并不是服务大模型的唯一方式,也不一定是大模型的最佳解决方案。”满足行业需求。”

华为7月初发布的盘古模型3.0就是针对行业的。 华为常务董事、华为云CEO张平安表示,华为的盘古模式不写诗,但必须扎根于行业,为各行业带来价值。

京东“延禧”大款的定位是直接面向行业的。 京东云事业部总裁曹鹏表示,一般的对话大模不应该是大模的全部,大模也不应该只是聊天、写诗的玩具和绘画。

在吐槽通用模式的同时,这三大厂商开始在“行业”上大做文章,以凸显自身优势。 他们的产品主要针对To B行业市场。

刘迪认为,对于大厂商来说,大车型有两个价值。 一是内部降低成本,将优化的效率转化为利润; 合理的利润。 最终,它必须商业化。 “除了技术指标之外,评价一个模式好不好,还得看有多少人使用它。一是收费客户数量,二是产生的收入多少。”

MaaS模式(as a,模型即服务)已经开始被更多的大型制造商带到桌面上。 去年的云栖大会,以及今年的百度文心一言发布会,都提到了这个概念。 腾讯发布MaaS能力全景图。

就像当年的云计算市场一样,底层算力和平台能力可以构建壁垒,市场需要算力强大、模型全面的服务商。 那些在算力、平台、模型、应用等方面都有布局的大工厂,对企业客户更有吸引力。

百度、阿里巴巴、华为除了自研大型机型产品外,也完成了从芯片到应用的布局。 百度是“昆仑芯+飞桨平台+文芯大模型”,阿里是“含光800芯片+M6-OFA底座+统易大模型”,华为是“升腾芯片+框架+盘古大模型”,这是一个优势其他公司短期内很难赶上。

季定宇认为,最终只会出现一家做通用大型模型的公司,做好比早做更有价值。 “我最看好字节跳动和腾讯,一是团队的匹配,二是场景的匹配。”

刘迪更看好三大厂商——美团、字节跳动、华为。 他对“定焦”的分析是:美团是基于场景寻找业务,基于C端用户的高频交易数据,能够快速迭代模型; 华为专注于生态系统,在G端拥有强大的资源,拥有极其强大的行业数据。 能力; 字节跳动此前已将多项AI技术应用到自家产品中,迭代能力极强。

不过,这一切都是基于现阶段的理论分析。 行业格局如何演变,取决于各大厂商下一步如何动作。 毕竟,大车型的赛道才刚刚铺开。

*应受访者要求,纪定宇为化名。

本文地址:http://lanlanwork.gawce.com/quote/3212.html    阁恬下 http://lanlanwork.gawce.com/ , 查看更多

特别提示:本信息由相关企业自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


相关行业动态
推荐行业动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2023001713号