字节跳动正式发布豆包视觉理解模型：1元可处理近300张高清图|字节跳动|火山引擎_新浪科技

快科技12月18日消息，在今天举办的火山引擎Force大会上，字节跳动正式发布豆包视觉理解模型，为企业提供极具性价比的多模态大模型能力。

豆包视觉理解模型千tokens输入价格仅为3厘，一元钱就可处理284张720P的图片，比行业价格便宜85％，以更低成本推动AI技术普惠和应用发展。

火山引擎总裁谭待介绍，豆包视觉理解模型不仅能精准识别视觉内容，还具备出色的理解和推理能力，可根据图像信息进行复杂的逻辑计算，完成分析图表、处理代码、解答学科问题等任务。

此前，豆包视觉理解模型已经接入豆包App和PC端产品。

值得一提的是，字节跳动还将在2025年春季将推出具备更长视频生成能力的豆包视频生成模型1.5版，豆包端到端实时语音模型也将很快上线

目前，豆包大模型已经与八成主流汽车品牌合作，并接入到多家手机、PC等智能终端，覆盖终端设备约3亿台，来自智能终端的豆包大模型调用量在半年时间内增长100倍。

【本文结束】如需转载请务必注明出处：快科技

责任编辑：拾柒

关键词 : 字节跳动火山引擎

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻，精彩的震撼图片

字节跳动正式发布豆包视觉理解模型：1元可处理近300张高清图