推广 热搜:   服务    系统  行业  公司  中国  教师  企业  参数 

全球开发者集聚上海,“开源”激活AI新生态

   日期:2025-03-16     浏览:58    移动:http://lanlanwork.gawce.com/mobile/quote/11553.html

图片

22日8时,上海徐汇滨江的西岸大剧院不远处,两三个拖着行李箱的行人在询问西岸大剧院怎么走。这个即将对外开放的地址,也是本次全球开发者先锋大会(GDC)的开幕式所在地,而在不远处的穹顶艺术中心和西岸艺术中心A馆、B馆,分别是本次大会另外三个场馆,展示来自各家人工智能(AI)企业的最新技术和产品。

这一源于世界人工智能大会的开发者“派对”,到今年已是第三年举行。上届GDC,仅线下参会的开发者就多达3.56万。今年GDC会期为2月21日至23日,前来赴约的海内外开发者社区从首届的20家增至逾百家。

“开发者是人工智能技术进步和产业发展的重要推动力量,在广大开发者的推动下,人工智能飞速发展,尤其是近期开源大模型技术和产品加快突破,为我国人工智能产业发展带来新机遇和新空间。”工业和信息化部副部长熊继军说。

图片

开源引领潮流

DeepSeek的出现让业内对大模型“开源”有了更多的探讨,也成为今年大会最热的词。

在22日举行的2025GDC开幕式上,香港科技大学校董会主席、美国国家工程院外籍院士沈向洋在开始主旨演讲时称,做得非常好,一个重要的影响就是开源,在他看来,中国已经从原来的一名获益者变成今天在开源社区的贡献者。“大模型时代,开源并没有像以往那么多、那么快,我相信开源这件事情会越做越好。中国的团队、上海的团队一定会引领开源潮流”。

Linux基金会金融科技开源基金会前任全球董事安德鲁·艾肯(Andrew Aitken)也表示,开源透明对AI发展至关重要。开源将提升社区凝聚力,在降低成本的同时,提高AI技术使用率。开源也将提升产业信任度。现有的AI投资存在大量重复性投资,缺乏可持续性。未来AI企业需要在盈利性和商业价值上找到新的平衡点。

就在2月18日,阶跃星辰开源了两款阶跃Step系列多模态大模型——Step-Video-T2V视频生成模型和Step-Audio语音模型。在阶跃星辰副总裁李璟看来,相关开源大模型发布后,不论是云厂商、芯片厂商还是生态社区等,都第一时间、自发推进适配。正是在这种开源社区蓬勃生机和力量的感召下,更多生态企业愿意拥抱开源生态。

图片

阶跃星辰创始人、CEO姜大昕表示,开源以来,公司的产品收到了非常多的关注和好评,全球创作者使用阶跃星辰的模型创作了海量视频。同时,越来越多的伙伴加入了阶跃星辰的开源生态,包括技术社区、创作社区、云厂商、芯片厂商等。他说,3月,阶跃星辰还将继续开源图生视频产品。

“最近两天我们发现非常多的产业合作伙伴开始接入我们的模型,比如内容创作社区、智能终端,以及上游的云厂商、算力芯片层,都在陆续接入。”阶跃星辰品牌公关负责人袁珊珊对第一财经说。

稍早一些的今年1月,拥有全球第一大视频生成网站——“海螺AI”的MiniMax,发布并开源了新一代01系列人工智能模型。该系列模型实现突破性创新,以大规模应用“线性注意力”机制突破了Transformer(转换器)大模型架构的记忆瓶颈。

MiniMax副总裁刘华介绍,作为一家中国的大模型公司,他们将持续保持开源,也期待通过开源,让更多开发者能够参与打造非Transformer架构的底层生态。

而对于开源,上海也有更多的布局。上海市经济和信息化委员会副主任张宏韬近日表示,上海将坚持平台牵引、主体带动、支撑保障、生态续航的方式,全力推进开源工作。通过盘活开源组织、开源社区、开源项目、开源人才等要素资源,建设人工智能“上海高地”。

语料为何重要

人工智能大模型取决于三大要素:算力、算法、语料。伴随着人工智能技术的深入发展和大规模应用,模型后期训练和推理需求可能很快会超过预训练算力需求,需要为新一轮产业和技术革命的到来提前做好算力保障和稳定供应的准备。

在AI应用中,高质量语料数据集也将决定模型能力上限。高质量的训练数据能够有效减少模型在推理过程中的错误率,提高模型在实际应用中的创作能力和生成质量。

去年3月,全国首家人工智能语料公司“库帕思”在上海成立。库帕思CEO黄海清介绍,目前,围绕1个综合语料库、X个行业语料库,库帕思成品语料总容量已达260T。“我们还在领先布局合成数据和思维链数据,这将是大模型实现更好推理能力的核心语料。”

上海库帕思科技有限公司生态总监路长鹿对第一财经表示,库帕思作为一个功能性的功能化平台,将利用好自己的身份,做好在整个行业中连接的身份。

图片

“大数据开源使大家手里都有了工具。简单来说,我们现在虽然有了内燃机,但是其实还需要柴油才能跑起来,尤其是稀缺的高质量语料,就相当于经过提炼之后的汽柴油产品,有了整体能源的来源,然后去推进大模型的普惠性应用,或者使普适性应用到各行各业,这样才能更加流畅,才能激发各行各业、各个细分场景领域下的一个模型化的整体的应用过程。”

去年,上海近二十家企业共同发布了团体标准《语料库建设导则》。计划建立一批通用和专用语料库,打造多层次语料体系,支撑基础大模型研发和垂直应用。聚焦前沿大模型训练需求,推动打造基础大模型训练语料库。

“在AI应用中,大家可以看到这一段时间以来,语料实际成为下一步关注的一个非常重要的环节,高质量的训练数据其实能够提高模型训练的效率,也能够在推理过程中降低模型的错误率,这就体现出了语料是下一步竞争的一个关键,上海在这一步其实已经做好了布局。”上海市经信委人工智能发展处处长潘焱日前对第一财经介绍。

创新生态构建

22日大会开幕式上,全球科学智能开发者社区、模速空间载体升级计划、上海市“模塑申城”开源创新生态建设行动宣布正式启动。

图片

对于未来大模型的发展目标,上海去年已明确。根据《关于人工智能“模塑申城”的实施方案》,到2025年底,上海要构筑起一个涵盖算力、语料、模型、应用等层面的世界级人工智能产业生态。

上海市经信委主任张英透露,2024年,上海人工智能产业规模突破4500亿元,同比增长超过7.8%,已提前完成“十四五”目标。目前上海已初步形成西有徐汇模速空间、东有浦东模力社区的发展格局,大批创新企业和青年才俊入驻,创新浓度持续提升。

21日,2025GDC期间,国内首个“算力生态超市”——模速空间算力生态平台发布。上海大模型生态发展有限公司董事长杨晶晶表示:“模速空间算力生态平台发布后,将为入驻企业提供‘全周期、全要素、全流程’一站式算力服务。”

本文地址:http://lanlanwork.gawce.com/quote/11553.html    阁恬下 http://lanlanwork.gawce.com/ , 查看更多

特别提示:本信息由相关企业自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


相关行业动态
推荐行业动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2023001713号