快科技6月21日消息,腾讯云大模型知识引擎新鲜出炉,它有一项新能力——大模型知识引擎文档解析!
基于腾讯优图实验室自研新一代多模态文档解析大模型,它能先通过版面分析定位文档所有内容的位置和类型,再对文本表格公式等内容进行精准识别,最后按照我们人类的阅读顺序输出连贯可读的内容。
![](http://n.sinaimg.cn/spider20240621/266/w600h466/20240621/19c1-b9d12e97d7741facb6864e1dbebc0a2c.png)
比如,面对带表的PDF文档,特别表格没有框的,它能通过融合行列关系特征和元素特征来预测表格的行列间隔线。
![](http://n.sinaimg.cn/spider20240621/266/w600h466/20240621/4ec0-af300bbc201165e08ef01cf5799744f7.png)
![](http://n.sinaimg.cn/spider20240621/161/w600h361/20240621/dd50-0935068ec2189e0b3914029b0b5fbddb.png)
算法能推理并对表格数据和结构进行正确复原,极大提高识别准确率。每次复制表格都数据错位的人有福了!
不仅中英文,它还支持20+语言,以及繁体字、生僻字等多种类字体。
更惊喜的是,它还支持将识别后的图片、PDF文档转换为Markdown格式输出。
腾讯表示,大模型知识引擎文档解析目前对复杂文档的解析准确率可达98%以上。
目前,这项文档解析功能已在多个产品上线,大家也可点此在线体验。
![【本文结束】如需转载请务必注明出处:快科技责任编辑:随心文章内容举报](http://n.sinaimg.cn/spider20240621/343/w600h543/20240621/d231-da42c424f7776d32e0e13b34874a6770.png)
【本文结束】如需转载请务必注明出处:快科技
责任编辑:随心
![新浪科技公众号 新浪科技公众号](http://n.sinaimg.cn/tech/content/tech_qr2x.png)
新浪科技公众号
“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)
![](http://n.sinaimg.cn/tech/content/tech_weixin2.png)