【研报精选】豆包大模型推出,AI应用加速发展(附股)
2025/1/21 18:20:46豆包即将发布最新实时语音大模型,并将基于此模型全量上线豆包App实时语音通话功能。目前,豆包APP已小范围测试最新能力,部分用户在豆包App的实时通话界面已更新。此前,业内就曾有消息称豆包将上线最新情感语音大模型,测试效果超过GPT-4o。
据了解,该传言提及模型即为上述实时语音模型。最新模型通过面向语音生成和理解进行统一建模,区别于此前的ASR+LLM+TTS级联方式,在对话效果上有大幅提升,实时交互上不仅低延时,也能流畅打断。
根据火山引擎2024冬季force原动力大会披露的数据,豆包大模型的日均调用量在高速增长,2024年5月豆包大模型的日均tokens调用量为1200亿,7月增长到5000亿,9月达1.3万亿,截止2024年12月15日已经突破了4万亿,在7个月的时间里增长超过33倍。
大模型升级:全方位看一下,豆包大模型的优化
2024年12月18日火山引擎 FORCE 原动力大会上,火山引擎展示了其全新升级的豆包大模型家族,包含豆包视觉理解模型、豆包3D生成模型,以及全面更新的豆包通用模型pro、音乐模型、文生图模型等,为企业提供多模态大模型能力。豆包大模型于12月实现日均 tokens 使用量超过4万亿,较5月发布时期增长超过33倍,稳居行业领先地位。
视觉理解模型重磅发布。视觉理解模型具备以下三种能力:更强的内容识别能力,可识别出图像中的物体类别、形状等基本要素以及理解物体之间的关系、空间布局以及场景的整体含义;更强的理解和推理能力,能根据所识别的文字和图像信息进行复杂的逻辑计算;更细腻的视觉描述能力,可以基于图像信息,更细腻地描述图像呈现的内容以及多种文体创作。
视觉理解模型:理解和推理能力,大幅度提升
以上能力极大拓展了大模型的场景边界,在金融、医疗、建筑、地理、体育、物流等诸多行业有着广阔应用前景。除此之外,视觉理解的输入价格为每千tokens0.003元,比行业平均价格降低85%,相当于1元钱可以处理284张720P的图片,具备高性价比优势,视觉理解模型正式走进厘时代。
同时火山引擎还将提供更高的初始流量,RPM达到15000次,TPM达到120万,让企业和开发者用好视觉理解模型,找到更多创新场景。
投资建议
豆包大模型表现超预期,体现字节跳动在AI的投入形成正反馈,国内AI产业追赶海外的效果开始体现,国内龙头公司有望加速在AI领域的投入。
今年以来,视觉理解模型在GPT-4o、Google的ProjectAstra,以及iPhone16和一众旗舰机型上都加速落地,可以留意板块的中线投资机会,另外人工智能应用端的机器人,在特斯拉Opimus2025~2027的出货量的预期下,机器人概念依然也应用端的热点方向之一。
择时关注:AI大模型、AI芯片、机器人等
(结合五绝战法+三红指标筛选)
长华集团 (605018)、克劳斯 (600579)、森源电气 (002358)
方正电机 (002196)、精锻科技 (300258)、浪潮信息 (000977)
风险提示:
AI及云计算发展不及预期、机柜上架不及预期、行业竞争加剧等
参考资料:财联社、华鑫证券《计算机行业周报》、开源证券《通信行业点评报告》
老师梳理不易
亲们记得一键三连
点赞+评论+打赏
特别是点赞和评论
❤策略币多少都是爱 ❤
大佬可以打赏888
-
新闻标题新闻标题新闻标题新闻标题
2016-03-25 09:39:02