万卡训练史上最大参数模型!百度文心大模型4.0最快下周见

彩绘7个月前 (10-09)科技电玩127

快科技10月9日消息,日前有媒体报道称,百度正加紧训练文心大模型4.0,已经接近可发布状态,这将是文心大模型3.5版本后,又一个重磅版本。

消息称,文心大模型4.0进展比预期快很多,将是基础模型的大升级,理解、生成、逻辑、记忆核心能力都将提升,特别是在逻辑推理、代码和数学等方面提升最明显。

根据我们获得的最新消息,上述消息基本属实。目前了解到,文心大模型4.0实际上已经在小流量测试。

根据我们拿到的消息,文心大模型4.0的参数规模要大于目前所有公开发布参数的LLM,也是国内首次使用万卡集群训练的大模型。这意味着文心大模型4.0的参数规模预计能突破万亿级别。

万卡集群什么概念?国内之前只有华为、阿里透露已建成万卡AI集群,但我们都没看到基于它推出的具体模型。万卡集群就不容易建了,如果用起来发挥最大化作用则更难了。

据分析,正是因为飞桨的深度联合,才能高效地基于万卡集群训练起如此规模的模型。

不仅训练成本在增加,文心4.0的推理成本比3.5增加很多,我们还没拿到具体每千token的推理成本,但据传大概是此前的8-10倍,这还是在高利用率(MFU)的情况下。如果利用率更低,估计成本还会继续增加。

不得不说,大模型真的很费钱。可见,打造领先的底层基础打模型,就是一场巨头的游戏。

根据IDC发布的首个大模型评估报告——《AI大模型技术能力评估报告,2023》,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一,综合能力在众多国产大模型中遥遥领先。

经过全面升级后,文心大模型4.0的训练速度、推理速度等将进一步提升,能否与GPT-4一战甚至超越后者的表现,我们拭目以待。


相关文章

科大讯飞股价大跌怪AI小作文 文心一言市场负责人怒怼:别动不动就碰瓷

科大讯飞股价大跌怪AI小作文 文心一言市场负责人怒怼:别动不动就碰瓷

5月25日消息,针对科大讯飞因AI小作文股价大跌一事,百度文心一言市场负责人张全文在朋友圈怒怼:“听闻有友商把自己股价大跌,归咎于有人利用文心一言写了篇命题小作文,也是醉了。先别说小作文这事真假 (目...

云知声发布“山海”通用大模型,称目标年内通用能力比肩ChatGPT|钛快讯

云知声发布“山海”通用大模型,称目标年内通用能力比肩ChatGPT|钛快讯

钛媒体App获悉,5月24日下午,国内 AI 语音独角兽云知声在北京发布GPT产品“山海”大模型(UniGPT)。据介绍,“山海”大模型参数量达千亿级,支持语言生成、语言理解、知识问答、逻辑推理、代码...

百度的唯一 | 百度袁佛玉:云智一体新生态,共创大模型新时代

百度的唯一 | 百度袁佛玉:云智一体新生态,共创大模型新时代

 “大模型时代会带来三大产业机会:新型云计算、行业模型精调、应用开发。客户和伙伴无论希望在哪个方向加大投入,百度智能云都能提供所需的可靠服务,包括有文心千帆大模型服务平台、 百度AI大底座等...

李彦宏:AI将让知识工作者效率提高4倍,会提问的人收入更高

李彦宏:AI将让知识工作者效率提高4倍,会提问的人收入更高

5月26日,2023中关村论坛,百度创始人、董事长兼CEO李彦宏发表题为《大模型改变世界》演讲。“这是一个以大模型为核心的人工智能新时代,大模型改变了人工智能,大模型即将改变世界。”李彦宏认为,全球都...

李彦宏:“提示词”写得好不好,决定你薪资有多少

李彦宏:“提示词”写得好不好,决定你薪资有多少

现代快报讯(记者 是钟寅)" 我做过一个预测,10 年后,全世界有 50% 的工作会是提示词工程。"5 月 26 日,在北京举办的 2023 中关村论坛上,百度创始人、董事长兼 C...

小米,确实很难!

小米,确实很难!

于业绩,靠“节衣缩食”抠出利润,这种逻辑天然欠缺成长性;于“新故事”,苏州过后无艇搭,待潮水逐渐退去,小米又能在夹缝中取得多少胜算?“寒冬”、低谷、冰封……无疑是对最近几年手机行业的最佳诠释。根据ID...