全国客服电话
13555555555
产品中心
PRODUCT CENTER
全国客服电话
13555555555

当前位置: 网站首页 > 新闻动态 > 行业动态

360 亿方大模型 2.0 重磅发布,全面提升复杂场景下多模态知识处理能力

发布时间:2026-03-13 21:37:40 点击量: 8


近日,360 亿方智能与 360 人工智能研究院推出的知识大模型“360 亿方大模型”正式迎来 2.0 版本更新。 本次升级不仅显著增强了该模型的视觉布局分析、跨模态混合检索、多模态向量化等多项能力,并同步面向广大企业与用户上线至 360AI 知识库,进一步有效解决传统文本知识库难以处理的复杂布局和非结构化知识场景的问题。 360 亿方大模型 2.0 基于 360 人工智能研究院的 RzenEmbed 多模态 Embedding 模型及 FG-CLIP 图文跨模态模型进行整合升级,重点在“多模态理解、多模态生成、文档智能解析”三大技术领域取得重大突破。不同于现有知识大模型,360 亿方大模型打破了大模型在复杂逻辑与长尾知识处理上的边界,在模型核心上实现了三大核心创新: · 攻克 AI 视觉“细粒度”难题:传统 CLIP 模型善于理解图像的全局概念,但在区分细微的物体属性、复杂的空间关系以及精准的语言表达时,往往力不从心。360 亿方大模型 2.0 面对包含多个物体的复杂场景,其细节识别置信度仍高达 96%。这种从“宏观”到“微观”、从“看得见”到“看得清”的能力跃迁,是 AI 真正理解物理世界的关键一步。 · 打破文本、图像等不同模态的数据壁垒:通过构建统一的语义嵌入空间,实现跨模态与混合模态的精准语义对齐,支持用户以“单一模态”(如文本描述、单张图像)或“模态组合”(如“指令 + 文本 + 图像”)为检索条件,高效匹配其他模态的相关内容,解决传统检索中“模态割裂”“上下文丢失”等痛点。360 亿方大模型 2.0 实现了文字、图片、图表等多元信息的深度语义融合,让机器真正“看懂”企业文档中的每一处细节。 · 实现从“基础识别”到“深度研读”的跨越:360 亿方大模型 2.0 通过视觉布局分析技术,实现了对文档形态的“像素级”感知与“人类视角”的逻辑还原。它不仅能精准识别倾斜、折叠、满屏水印等极端场景下的内容,更首次实现了对文档内部引注关系、图表关联及上下文脉络的深度理解。将碎片化的非结构化数据转化为逻辑严密的结构化知识资产,彻底攻克了企业知识管理中长尾知识识别难、逻辑推导不可信的顽疾。 综合实力领跑,多项权威评测稳居全球第一梯队 360 亿方大模型 2.0 的强大性能,源于其深度整合了 360 人工智能研究院自主研发的两大顶级模型。这两大底层模型在国际权威基准测试中表现卓越,为 360 亿方大模型提供了世界领先的视觉理解与检索动力。 首先,在视觉语言理解层面,360 亿方大模型 2.0 内置了专为细粒度图文对齐设计的 FG-CLIP2 模型。该模型在涵盖长短文本检索、开放世界目标检测等 29 项权威公开基准测试中,表现全面超越了科技巨头 Google 的 SigLIP 2 与 Meta 的 MetaCLIP 2。依托这一算法底层的重大破局,360 亿方大模型实现了从“看清”到“看懂”的质变,不仅能精准识别图像主体,更能捕捉微小的属性关系与深层语义细节,开启了视觉理解“超清、精准”的新篇章。 其次,在决定知识获取效率的向量化技术上,360 亿方大模型 2.0 深度集成了 RzenEmbed 多模态 Embedding 模型。该模型在国际知名评测基准 MMEB 中凭借卓越的综合性能,斩获总榜排名第一与单项第一的双重桂冠。特别是在最能体现企业应用价值的 VisDoc(多模态文档检索)专项测试中,其以绝对优势稳居榜首。这确保了 360 亿方大模型在处理复杂办公文档、消除“模态割裂”方面具备行业顶级的核心竞争力,通过将顶尖底层能力转化为产品原动力,正式定义了企业级 RAG 检索与知识管理的新标准。 相较于其他知识管理类大模型,360 亿方大模型 2.0 以“省力、省心、省时、省钱”四大核心优势,成为企业级知识管理的优选。其价值不仅体现在整体技术能力的跨越,更聚焦于业务全流程成本的极致优化,多维度为企业知识管理减负提效。 省力:SaaS 化即开即用,零门槛拥抱 AI 提供成熟的 SaaS 化服务形态,企业无需经历复杂的开发周期。通过直观的交互界面与标准化 API,基于 360AI 知识库产品实现“部署即实战”,让非技术背景的业务人员也能轻松驾驭顶尖 AI 能力。 具备极高的架构稳定性与并发支撑能力,原生支持多模态交互。无论是处理海量公文流转,还是跨部门的复杂知识协同,模型都能在保障数据安全的前提下,提供丝滑、可靠的技术底座。 省时:从“周”级到“秒”级,极速激活沉睡知识 凭借先进的文档布局分析与向量检索技术,原本需要数周人工梳理的非结构化资料,现在仅需分钟级即可完成入库;毫秒级的响应速度,让员工获取精准答案不再需要漫长等待,极大缩短了决策链路。 省钱:极致效能比,大幅降低企业综合 TCO 通过多模态推理数据合成技术,模型在保持 SOTA