智源最新评测结果发布:豆包大模型“主观评测”排名第一,多榜单位居国内第一

来源: 今日热点网 2024-12-20 19:24:23

12月19日,智源研究院发布国内外100余个,开源和商业闭源的大模型综合及专项评测结果。“大语言模型评测能力榜单”中,豆包通用模型pro(Doubao-pro-32k-preview),在主观评测中排名第一。

智源研究院 FlagEval 大语言模型评测能力榜单-主观评测

“多模态模型评测榜单”中,豆包·视觉理解模型(Doubao-Pro-Vision-32k-241028)。在视觉语言模型中排名第二,仅次于GPT-4o,是得分最高的国产大模型。

智源研究院 FlagEval 多模态模型评测榜单-视觉语言模型

“FlagEval大模型角斗场榜单”中,豆包通用模型pro(Doubao-pro-32k-240828)。

在大语言模型榜单中位居第一梯队,评分排名第二,仅次于OpenAI的o1-mini,是得分最高的国产大模型。

智源研究院 FlagEval 大模型角斗场榜单-大语言模型榜单

据智源研究院介绍,大模型评测台FlagEval目前已覆盖全球800多个开闭源模型,在评测方法与工具上联合了全国10余家高校和机构合作共建。此次公布的榜单中,大语言模型主观评测重点考察的是模型的中文能力,多模态模型评测榜单视觉语言模型主要考察的是模型在图文理解、长尾视觉知识、文字识别以及复杂图文数据分析能力;FlagEval大模型角斗场则是向用户开放的模型对战评测服务,反映了用户对模型的偏好。

大使用量才能打磨出更好的模型。刚刚结束的2024火山引擎冬季FORCE原动力大会公布了豆包大模型最新进展——豆包大模型12月日均tokens使用量超过4万亿,较5月发布时期增长超过33倍,在不同应用场景中调用量快速增长。

使用量和应用场景的提升,也让豆包大模型迎来了全新的升级。其中在“大语言模型评测能力榜单”的主观评测中排名第一的豆包通用模型pro完成新版本迭代,综合处理能力较5月发布时提升了32%,在推理上提升13%,在指令遵循上提升9%,在代码上提升58%,在数学上提升43%,在专业知识领域能力提升54%。

在“多模态模型评测榜单”的视觉语言模型中,得分国内最高的豆包·视觉理解模型也在FORCE原动力大会上正式对外发布。豆包·视觉理解模型可以理解用户所输入的文本和图片相关的信息,并给出准确的回答。通过更强的内容识别能力、更强的理解和推理能力、更细腻的视觉描述能力,豆包·视觉理解模型极大地拓宽了大模型场景边界,基于对真实世界的信息处理,可以更好的辅助人类完成复杂的任务。

豆包·视觉理解模型在教育、旅游、电商等场景有着非常广泛的应用。为了更好地帮助企业开拓大模型的创新应用场景,豆包·视觉理解模型的价格为每千tokens 0.003元,比行业平均价格降低85%,相当于一块钱可以处理284张720P图片,让企业和开发者用好视觉理解模型,找到更多创新场景。

从能力升级到模态丰富,火山引擎将持续拓展豆包大模型的能力边界及应用场景,加速推动AI大模型应用的普及与落地,为更多企业智能化升级提供有力支撑。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

智源最新评测结果发布:豆包大模型“主观评测”排名第一,多榜单位居国内第一
12-20
梨花教育母公司十方融海董事长黄冠受邀参加《红色青春—毛岸英》开机仪式
12-20
火山引擎数据飞轮2.0全新发布:Data Fabric驱动下的ChatBI智能体解决方案
12-20
火山引擎数据飞轮2.0:用“多模态数据湖”,更好应对大模型时代的数据管理
12-20
“招标雷达”将更名为“标标达”,品牌升级倒计时开启!
12-19
火山引擎云基础、模型服务等多产品更新发布,为企业大模型应用落地再提效
12-19
基于豆包·视频生成模型打造创新体验,即梦成为“想象力的相机”
12-19
AI助力数据飞轮再升级,2.0模式撬动数智化变革奇点
12-19
网御星云:公立医院改革浪潮下,网络安全场景建设如何破局?
12-19
豆包大模型家族全面升级,重磅发布视觉理解模型
12-18
为了这个心愿,五位七旬老汉退休十年只做一件事
12-18
中国人文纪录片《云朵之上》获奖开创英国TVE电影奖历史
12-18
百利好:全球原油需求放缓 短期震荡偏强
12-17
来自黔南的礼物——黔南盒子单品视频全新出炉!
12-17
央视今年五次重点报道!作为科技引领智慧养老消费新潮流
12-16
中国商业文化研究会茶产业专业委员会在京揭牌成立
12-16
“如画江西·风景独好”文化和旅游全球发布会在北京举行
12-12
700PB数据的数仓依然“快稳省”!ByteHouse这本白皮书揭秘关键
12-12
画画吧少年!吉利打造亚冬文化盛宴 开启榜样少年书画作品征集
12-10
百利好:全球央行“购金热”延续,黄金作为避险资产受青睐
12-10