事件:
2024 年 12 月 18-19 日, 2024 冬季火山引擎 FORCE 原动力大会在上海召开,会上展示了豆包大模型家族的更新升级,并发布了豆包视觉理解模型等新品。
点评如下:
豆包大模型调用量呈爆发式增长。 24年5月豆包大模型刚推出时日均调用tokens量约1200亿, 12月15日突破4万亿,七个月增长超33倍; 从应用来看, 在信息处理、客户销售、终端硬件、 AI工具等场景调用量分别增长39倍、 16倍、 13倍、 9倍; 当前已与八成主流汽车品牌合作,覆盖手机、 PC等智能终端设备约3亿台,来自智能终端的豆包大模型调用量在半年时间内增长100倍,在各个场景的应用覆盖加速渗透。
豆包通用模型pro升级后综合任务处理能力大幅提升。 相较5月份,此次升级后的豆包通用模型pro综合任务处理能力提升32%,分别在推理上提升13%,在指令遵循上提升9%,在代码上提升58%,在数学上提升43%,在专业知识领域能力提升54%。
豆包视觉理解模型有望催化AI终端。 通过豆包视觉理解模型,用户可同时输入文本和图像相关的问题, 模型能精准识别视觉内容, 结合出色的理解和推理能力, 给出准确回答。豆包视觉理解模型能做到理解图像中物体之间的关系、空间布局及场景中的整体含义,并可根据图像信息进行复杂的逻辑计算,完成分析图表、处理代码、解答学科问题等任务,同时该模型在视觉描述和创作能力方面亦颇为细腻。基于以上特点,豆包视觉理解模型将在教育、旅游、电商等场景得到广泛应用。 如为学生优化作文,为游客讲解旅途中某一建筑背景知识, 以及帮助商家充分描述商品细节,高效发布种草广告等等。 未来随着模型视觉理解能力的不断提升,大模型的场景将进一步拓展至更多行业领域。
从定价来看,豆包视觉理解模型价格为每千token 0.003元, 1块钱可处理284张720P图片,比行业平均价格低85%,相同价格下GPT-4o生成图片数为52张, 豆包大模型的成本优势显著。
我们认为, 本次大会亮相的豆包大模型系列产品展现了其技术优势, 能为企业提供高性价比的多模态大模型,用AI赋能企业成长,亦提升C端用户体验感。 据量子位智库数据,截至11月底,豆包2024年累计用户规模已超过1.6亿; 11月平均每天有80万新用户下载豆包,单日活跃用户近900万,位居AI应用全球第二、国内第一。据11月AI全球月活跃用户排行榜,豆包APP的MAU已近6000万, 仅次于ChatGPT, 位列全球第二且在国内显著领先。
此外, 人类接受的信息超过80%来自视觉,视觉理解将进一步拓展大模型的能力边界,降低大模型交互门槛,解锁更多应用场景。
从终端载体来看, AI眼镜作为视觉感知入口, 通过摄像头的嵌入,实现计算机视觉和人类视觉的结合, 且具有便携性和可交互性, 是端侧AI理想的落地场景之一。 24年10月, 字节跳动发布Ola Friend智能体耳机,接入豆包AI大模型, OPPO、 vivo、荣耀、小米、三星、华硕亦联合火山引擎发起智能终端大模型联盟,纷纷布局AI终端。 以AI眼镜为例, 2023年全球出货量仅为智能手机的1%, 渗透提升空间广阔。 2025年,预计在AI应用蓬勃发展趋势下,全球科技类公司将在AI端侧产品方面进一步发力, 将催化光学、显示、音频模组等硬件环节持续复苏, 同时SoC芯片、存储、算力等领域在此趋势下亦有望迎来量价齐增。
给予行业“中性”评级。
风险提示: 全球宏观经济下行,贸易摩擦加剧, 技术创新不达预期,下游需求不达预期, 业绩增长低于预期,中美关系进一步恶化, 乌克兰危机,黑天鹅事件,国内经济复苏低于预期, 国内外二级市场系统性风险等。
2、如遇本站资源无法下载、无法查看,请计时联系我们,站长将第一时间修复。