商务服务
AMD开源30亿小参数模型,媲美Qwen-2.5
2025-03-26 18:32

专注AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地,聚焦LLM的市场研究和AIGC开发者生态,欢迎关注!

AMD在官网开源了最新小参数模型Instella-3B。比较特别的是,这是一个基AMD Instinct™ MI300X GPU从头训练的模型。

根据测试数据显示,Instella-3B的性能超过了Llama-3.2-3B、Gemma-2-2B,可以媲美阿里开源的Qwen-2.5-3B,这也证明了AMD的GPU也能训练出高性能的大模型。

图片

开源地址:https://huggingface.co/amd/Instella-3B

Instella-3B-SFT是经过监督微调的模型,使用了89.02亿tokens的数据,增强了遵循指令的能力。Instella-3B-Instruct则是经过直接偏好优化的模型,使用了7.6亿tokens的数据,使模型的输出更符合人类偏好,增强了聊天能力。

架构方面,Instella模型是基于文本的自回归Transformer架构,拥有30亿参数,包含36个解码器层,每层有32个注意力头,支持最长4096tokens的序列长度,词汇量约为50,000tokens。

在预训练和微调过程中,AMD使用了FlashAttention-2、Torch Compile和bfloat16混合精度训练,以减少内存使用,提高计算速度和资源利用率。此外,AMD还采用了全分片数据并行(FSDP)与混合分片技术,以平衡集群内节点间的内存效率和节点内通信开销。

图片

Instella模型的训练分为四个阶段,每个阶段都逐步增强了模型从基础自然语言理解到遵循指令以及与人类偏好对齐的能力。在第一阶段预训练中,AMD使用了4.065万亿tokens的数据,这些数据来自OLMoE-mix-0924,是一个涵盖编码、学术、数学和网络爬取等领域的高质量数据集组合。这一阶段为Instella模型奠定了自然语言理解的基础。

在第二阶段预训练中,AMD在第一阶段的基础上进一步训练了模型,使用了额外的575.75亿tokens的数据,这些数据来自多个高质量和多样化的数据集,包括Dolmino-Mix-1124、SmolLM-Corpus(python-edu)、Deepmind Mathematics以及对话数据集等。

图片

此外,AMD还使用了内部合成数据集,专注于数学问题。这些合成数据是通过使用GSM8k数据集的训练集生成的,通过抽象数值、生成Python程序解决问题,并替换数值以生成新的问题-答案对。这一阶段的训练使Instella-3B模型在多个基准测试中表现出色,与现有的先进开源权重模型相比具有竞争力。

在指令微调阶段,AMD使用Instella-3B作为基础模型,使用89亿tokens的高质量指令-响应对数据进行了三个周期的训练,以增强模型在交互式环境中的表现,使其更适合执行用户指令的任务。训练数据来自多个任务和领域的精选数据集,确保模型能够泛化各种指令类型。

在最后的对齐阶段,AMD使用直接偏好优化(DPO)技术,以Instella-3B-SFT为基础模型,使用7.6亿tokens的数据进行了训练,以确保模型的输出符合人类价值观和期望,从而提高其输出的质量和可靠性。

Instella-3B在多个基准测试中超越了现有的全开源模型,并且与阿里开源的Qwen-2.5-3B能力差不多。例如,在MMLU、BBH和GSM8k等基准测试中,Instella-3B模型的表现优于Llama-3.2-3B和Gemma-2-2B等模型。

图片

经过指令微调和对齐后的Instella-3B-Instruct模型在指令遵循任务和多轮问答任务中表现出色,同时在训练数据量上更少。

    以上就是本篇文章【AMD开源30亿小参数模型,媲美Qwen-2.5】的全部内容了,欢迎阅览 ! 文章地址:http://lanlanwork.gawce.com/news/12958.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 阁恬下移动站 http://lanlanwork.gawce.com/mobile/ , 查看更多   
最新新闻
走,去音乐会“看”声音!等等,声音居然有形状吗?
声音的形状是怎样的?试想一下,你正在一场音乐会上,周围灯光渐暗,而舞台中央,聚光灯打在小提琴手的身上,全场观众安静下来,
苹果手机怎么跟车载蓝牙配对手机通过蓝牙投屏汽车「苹果手机怎么跟车载蓝牙配对」
苹果手机跟车载蓝牙配对很简单。首先确保汽车和手机的蓝牙功能都开启。在手机上进入“设置”找到“蓝牙”并点击打开。然后在汽车
外媒:日本3月米价同比涨92.1% 创1971年以来最大涨幅
  中新经纬4月18日电 日本3月大米类价格同比上涨92.1%。  据日本共同社18日报道,日本总务省公布的3月去除生鲜食品后的核心
除了依赖大股东广汽集团外,众诚保险还能拓展哪些非车险业务?
作者:宋涵出品:全球财说2024年在资本市场回暖契机下,头部险企盈利大增。在财险江湖里强者恒强局面未改,财险老三家地位固若金
如何轻松恢复华为手机删除的短信免费恢复手机短信「如何轻松恢复华为手机删除的短信」
华为作为近年来崛起的国产手机代表,其在通讯领域的尖端技术实力已经得到了广泛认可。尽管近期遭遇了制裁,但华为手机的忠实用户
我的世界手机版免费领8000钻石2022 九月份最新可用103条钻石兑换码分享钻石手机「我的世界手机版免费领8000钻石2022 九月份最新可用103条钻石兑换码分享」
我的世界手机版中可以使用钻石兑换码获得8000钻石,本次为大家整理了6月1日到9月13日的最新104条可重复使用钻石兑换码,其中最新
日本手机品牌nec手机「日本手机品牌」
  大家都知道OPPO、vivo、一加、华为、荣耀等都是国产手机品牌,那么日本手机品牌有哪些?下面就让我来为你介绍一下!日本手机
截至目前,华为无线充电手机共有多少款?支持无线充电的手机「截至目前,华为无线充电手机共有多少款?」
去年,华为Mate60系列未发布就上市开售,大家购买后发现华为手机又支持5G通信了,华为手机又重新回到主流水平。最新发布的华为Pu
瞭望 | “李鬼车险”几时休
  2024年全国消协组织受理投诉情况分析提到,车辆统筹保险投诉量激增,成为投诉新热点  近年我国新能源车、网约车数量激增,
“童阅京彩 智引未来” 2025年北京市红领巾读书活动发布
4月2日,在国际儿童图书日到来之际,2025年“童阅京彩 智引未来”北京市红领巾读书活动在北京城市图书馆正式发布,为少年儿童拉