业界动态
雷布斯重金挖人,发力大模型
2025-02-27 13:03

文 | 本原财经

雷布斯发力大模型。

总裁在线挖人的风还是传到了雷军这里。

据第一财经报道,雷军开出千万年薪招揽了一位95后AI天才少女——DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉

罗福莉其人,硕士毕业于北京大学计算语言学专业,曾在阿里巴巴达摩院任职,因在国际顶会发表8篇论文而走红。加入小米后,罗福莉或将供职于小米AI实验室,领导小米大模型团队。

小米在大模型领域的布局相对较晚,如今总裁雷军亲自出手摇人,AI领域或许也要掀起一阵“腥风血雨”了。

被雷军看中的罗福莉到底何许人也?

大家给罗福莉起了个“95后AI天才小萝莉”的称呼。

自称“起点很低”的罗福莉出生在四川小城一个普通家庭,甚至在上大学之前几乎没接触过电脑。

本科就读于北京师范大学,误打误撞进入计算机专业,起初成绩垫底,经历一段清苦但充实的时光,成绩终于爬到了前几。

大三被打击“你没有天赋做科研”,却凭借天赋和努力保研进入北京大学计算语言学研究所。

人生转折发生在2019年。身为北大硕士的她,在NLP国际顶会ACL上发表8篇论文(其中2篇一作),迅速登上知乎热搜而走红。

人生转折发生在2019年。身为北大硕士的她,在NLP国际顶会ACL上发表8篇论文(其中2篇一作),迅速登上知乎热搜而走红。

她提出的词义消歧方法,和文本风格转换框架等成果,推动了NLP技术发展,因而成为“天才AI少女”。

研究生时期的罗福莉已经达到了博士生的毕业标准,却选择了直接毕业参加校招进入工业界。

这对于罗福莉来说,是一步想把路走得更宽的棋——“既然已经具备了博士毕业的学术水平,那在最好的年纪就去做一些不一样的事情。”

那一年,她基本上拿下了国内各个大厂的最Top的硕士offer,包括阿里星、腾讯技术大咖、百度AIDU计划等等。

她选择了加入阿里达摩院机器智能实验室,主导开发多语言预训练模型VECO。此外,她还主导了AliceMind的开源工作。

此后,加入幻方量化(量化对冲基金公司)从事深度学习相关策略建模和算法研究。

2022年,她又跳槽DeepSeek担任深度学习研究员,参与研发MoE大模型DeepSeek-V2。

DeepSeek-V2模型一大亮点是性价比,罗福莉表示1元/百万输入Tokens的价格,只有GPT4的1/100,这或许正是小米看中的点。

今天的罗福莉,学术成果丰硕、职场履历精彩,但她依旧谦逊低调,经常在自媒体端分享自己的心得,想激励那些和她一样不是一开始就领跑的伙伴们,与网友的互动也十分接地气。

深耕自然语言处理领域,技术实力深厚,又自带“天才AI少女”“95后AI萝莉”的标签,符合“营销天团”小米的调性,可以想象小米发布会热搜霸屏的场景了。

雷军上次高调挖人还是做小米汽车的时候,对大模型的重视可见一斑。

AI Agent在智能手机上的应用逐渐成为常态,未来通过AI Agent为用户高度定制化的私人助理,这一趋势将成为品牌维护用户群体的核心护城河。

相比友商,小米在AI大模型上的真正发力确实有点晚,虽然2016年它便组建了AI团队。

你知道小米小爱目前用的哪家模型:小米大模型?文心一言?阿里通义?字节豆包?

大概是:全都有。

2023年4月,小米AI实验室下设了专门的大模型团队,任命栾剑担任负责人,向小米技术委员会副主席、AI实验室主任王斌汇报。同年11月,AI实验室主任王斌接受采访时,明确表示过小米不做ChatGPT、不搞AI的军备竞赛。

对于“烧钱”的预训练大模型,小米相较于其他厂商更显谨慎。其中也有同步造车,要优先保住“现金王”在成本上的考虑

内部认为,轻量级模型亦有其存在的市场空间,且在某些特定任务上相比千亿大模型亦能具备一定的优势。

作为对比,2023年11月,友商Vivo已经推出第一代蓝心大模型矩阵,包括十亿、百亿、千亿三个参数量级的五款语言大模型。

同年的年度演讲中,雷军宣布小米将全面拥抱AI大模型,大模型技术的主力突破方向只是「轻量化」和「本地部署」

小米几乎是全球,拥有最丰富AI入口和应用场景的公司。2024年Q3财报显示,小米集团的AIoT平台已连接的IoT设备数超8.61亿,同比增长23.2%

被称为“杂货铺”的小米,这些海量的AIoT设备,轻量化、需要借助分布式算力的终端设备,目前主要依赖于云端的AI能力,想要实现本地化部署,对于轻量化的需求确实更高。

2024年底,荣耀CEO赵明在发布会上,用手机AI点了2000杯瑞幸咖啡。这种“自动驾驶”式的手机功能引发了热议。

而小米15与竞品相比,虽配备基础AI功能,但是在多模态交互与跨App联动等方面的应用,就有些乏善可陈,宣传上也略显不足

如今国产手机价格已经迈过4000元大关,各家厂商芯片算力不断提升,AI Agent与手机硬件的融合已势不可挡。AI Agent在人机交互中显得尤为重要,AI的加持与否,也将成为区别手机高低端的关键。

另据IDC预测,2025年中国新一代AI手机市场出货量将达1.18亿台,同比增长59.8%,整体市场占比达到40.7%。

在其他手机厂商All in AI时,小米警觉自己已经默默地落后了。为了拿下新一轮的高端智能手机军备,小米必须加注大模型也是势在必行的事情。

雷军曾表示,小米将继续加大在AI、物联网(IoT)等前沿技术的投入,力争在全球科技创新中占据一席之地。

2017年,小米正式成立AI实验室。在AI领域,小米已经发布了自研芯片澎湃C1、成立自动驾驶团队、小米机器人实验室,去年其AI相关团队已经超过3000人。

近期小米大模型也已升级至第二代。目前,MiLM2已经在澎湃OS、小爱同学、智能座舱、智能客服中应用落地。

在大模型领域,小米其实是有优势的,其“人车家”战略最不缺大模型的落地场景,其中汽车领域的大模型实践,既是体验赋能、也是落地样板,一旦储备了丰富的人才和技术积累,把这块短板补上来,无数的应用场景能迅速反哺大模型的能力。

这样看来,小米大模型的上限会很高。

如何将“轻量化”和“本地部署”战略真正转化为用户可感知的体验差异,并在多样化场景中形成闭环生态,是小米必须回答的新课题。

AI人才对整个产品举足轻重,在雷军给出发力大模型的信号之后,相关人才的招募正在如火如荼的进行。

随着罗福莉以及更多的人才加入AI版块,小米奋起直追还不算晚,至于能不能像小米汽车一样惊艳全场呢?还有待实践验证。

另据12月26日界面新闻报道,小米正在着手搭建自己的GPU万卡集群。而小米大模型团队在成立时已有6500张GPU资源。

值得注意的是,字节跳动和腾讯,在2024年采购的英伟达GPU都超过20万张。看来,小米在买卡方面还得努力努力再努力。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

    以上就是本篇文章【雷布斯重金挖人,发力大模型】的全部内容了,欢迎阅览 ! 文章地址:http://lanlanwork.gawce.com/news/12372.html 
     资讯      企业新闻      行情      企业黄页      同类资讯      首页      网站地图      返回首页 阁恬下移动站 http://lanlanwork.gawce.com/mobile/ , 查看更多   
最新新闻
陈晓卿:美食是我们看到这个世界不同容颜的望远镜丨对话
作为“风味”IP的最新力作,《风味人间5·香料传奇》首次聚焦香料题材,为观众呈现个性鲜明的香料世界。香料是人类最早的全球化
七成长剧亏损,98%短剧赔钱,谁能卷死谁?
文 | 文娱先声,作者 | 雨过炊烟,编辑 | 先声编辑部‍‍‍最近,短剧三大男主何健麒、孙樾、王道铁录制芒果综艺的消息冲上了热
杭电股份股价近期有较大涨幅 多位董监高宣布减持
每经记者:赵李南    每经编辑:陈俊杰2月21日,(SH603618,股价6.85元,市值47.36亿元)公告称,公司5位董监高人员计划减
汉邦科技IPO明日上会:研发费用率低于同行 专利诉讼案悬而未决科创“硬伤”多
  中国网财经2月20日讯 据上交所上市审核委员会公告,江苏汉邦科技股份有限公司(以下简称“汉邦科技”)的科创板IPO申请将于2月
2025年北京市中招体检问答来了
新京报讯 2月19日,北京教育考试院发布《2025年北京市中招体检问题解答》。一、体检工作什么时候进行2025年北京市中招体检时间安
品牌观察:百果园一年亏4亿、关店近千家,前路维艰
百果园发布的2024年度业绩预告显示,全年预计亏损3.5亿至4亿元,营收同比下滑15%,加盟门店一年净减少965家。截至2月18日收盘,
“福建舰”舰徽公开,暗示舰载机搭载模式生变?
时隔良久,关于国产首艘电磁弹射型航母“”的发展动态,官方终于给出了最新的消息,实可谓是信息量满满。报道中出现了“福建舰”
2024年年底山东老年人健康素养达到26.75%,较去年提高2.2个百分点
在山东省卫健委2月21日召开的新闻发布会上,山东省卫生健康委医养健康处处长、一级调研员吴黎明介绍,老年健康是健康山东建设的
iQOO 13一跌再跌,12GB+256GB+6150mAh+2K屏幕,低至3497元起
搭载骁龙8至尊版芯片的手机,发布初期的溢价都比较高,大部分手机都要4499元起,不过也有例外的时候,比如iQOO 13就是如此,和上
年度盘点:2024年令人印象深刻的三人篮球球队
2024年接近尾声,对于三人篮球运动而言,这是一个足以载入史册的年份。大师赛、挑战赛和女子系列赛在世界各地激战正酣,巴黎奥运