智谱首个免费多模态模型 GLM-4V-Flash 上线,支持图像描述生成、视觉问答等

智谱首个免费多模态模型 GLM-4V-Flash 上线,支持图像描述生成、视觉问答等
2024年12月09日 21:18 IT之家

感谢IT之家网友 有鲫雪狐 的线索投递!

IT之家 12 月 9 日消息,继 8 月语言模型 GLM-4-Flash 免费后,智谱 AI 在今天上线第一款免费的多模态模型 —— GLM-4V-Flash。GLM-4V-Flash 不仅基于 4V 系列模型的各项优秀能力,更在图像处理上实现了精确度的提升。

据介绍,GLM-4V-Flash 模型拥有图像描述生成、图像分类、视觉推理、视觉问答(VQA)以及图像情感分析等高级图像处理功能,并且支持包括中文、英语、日语、韩语、德语在内的 26 种语言。

在企业应用中,GLM-4V-Flash 能够针对特定垂直行业提供精准的场景解决方案,以低成本投入助力开发者迅速融入大模型时代,无需顾虑大模型图像处理的高昂成本。

官方举例:

1、解读图片生成社交媒体文案

2、识图答题支持教育创新

3、肤质图片测试建议

4、安全检测

5、OCR 保险单信息提取

6、工单质量检测

7、电商商品描述生成

8、多模态数据标注

IT之家附相关链接如下:

  • 体验中心:https://www.bigmodel.cn/console/trialcenter

  • 说明文档:https://www.bigmodel.cn/dev/api/normal-model/glm-4v

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片