您现在的位置是:首页 > 产经 >正文

又一家清华系AI团队发大招 面壁发布端侧旗舰大模型

发布时间:2024-02-06 14:16杜彩晴来源:

导读 2月5日消息,近日,拥有清华系研发创始团队的面壁智能开源发布了端侧旗舰大模型MiniCPM,显著特点有三,以小博大,在最接近用户体感的 MT-...

2月5日消息,近日,拥有清华系研发创始团队的面壁智能开源发布了端侧旗舰大模型MiniCPM,显著特点有三,以小博大,在最接近用户体感的 MT-Bentch 上,表现优异;其次,部署多模态能力,能说会看,还具备编程能力;其三,高效且部署成本低。

网易科技获悉,面壁智能成立于2022年8月,深耕通用 AI 领域,专注大模型技术创新与应用转化。目前,公司正在构建 Al Agent 智能体协作平台以充分释放大模型高效生产力。

此次发布的端侧旗舰大模型MiniCPM就是团队在助力通往AGI道路上的重要一步,目前,众多主流手机、PC 与汽车品牌相继宣告接入大模型,端侧模型则是云端协同的关键一环。

又一家清华系AI团队发大招 面壁发布端侧旗舰大模型

据介绍,Mistral-7B 是“以小博大”的标杆模型。相比而言,面壁 MiniCPM 以2B 的参数规模、1T tokens,中英文平均成绩超越 Mistral-7B,表现优异。

与此同时,在同等规模模型中,面壁 MiniCPM 取得主流榜单的大幅领先成绩,相比 Llama2-13B、甚至40B 量级的大个子,也在代码、逻辑能力等重要榜单上毫不逊色。

演示中,我们可以看到,语言能力方面,面壁 MiniCPM 可以把中英语言夹杂的句子翻译成法语。

又一家清华系AI团队发大招 面壁发布端侧旗舰大模型

他还能准确地进行知识问答,譬如准确答出山东最高山是泰山,还知道它和黄山的准确海拔,并计算出差值。

又一家清华系AI团队发大招 面壁发布端侧旗舰大模型

此外,可以为你言语中的情感流露配上可爱小表情,也能对人物性格进行活灵活现的演绎。

又一家清华系AI团队发大招 面壁发布端侧旗舰大模型

MiniCPM还能够写出一串「复刻自己」的代码片段。

又一家清华系AI团队发大招 面壁发布端侧旗舰大模型

具体在部署方面,面壁 MiniCPM 可以支持 CPU 推理,降低模型推理成本。同时发布的量化版本,可以做到压缩75%,性能基本无损。

面壁智能 CEO 李大海以现场演示所使用手机为例,做了一道数学题。骁龙855芯片,成本约600元人民币,按照运行5年计算,每秒7.5 tokens,那么170万 tokens 的推理成本是人民币1元。低成本端侧推理之外,仅需一台电脑、一张显卡就能完成对 MiniCPM 的 SFT。

据了解,团队还对 iOS,、Android 和 Harmony 等操作系统进行了模型适配。目前,MiniCPM 已跑通了国际主流手机品牌和终端 CPU 芯片。

值得一提的是,面壁还一并开源了一个12B 多模态模型OmniLMM,并取得 Object HalBench 榜单第一,在 MMHal-Bench 仅次于 GPT-4。

李大海表示,这是面壁“大模型+Agent ”双引擎战略的关键一步,从智能发展而言,我们坚定认为智能体化是未来迈向通用智能的必由之路,而智能体必然要在端侧服务用户,我们接下来会进一步探索 Agent +云端协同的工作机制,实现智能赋能万物。

面壁智能联合创始人、清华大学副教授刘知远认为:从技术研判而言,2023年 ChatGPT 和 GPT-4的推出,表明大模型技术路线已经基本确定。

“接下来就是要探索其科学机理,并极致地优化效率,我们这次推出端侧大模型,也是向大家分享一个2B 级别大模型所能达到的性能机制,让大家认识到即使2B 尺寸大模型的效果极限还没有被充分挖掘出来,这是一个科学问题也是一个技术问题,需要大家共同探索。”(定西)

本文系网易科技原创报道,更多新闻资讯和深度解析,关注我们。

标签:

上一篇
下一篇

最新文章