人工智能进入从实验室走向商业应用的关键阶段,企业关注点由追求模型能力转向解决实际问题。在文档数据处理这一高频场景,复杂排版、多格式文件和信息分布不规则等难点,长期制约着数据价值的高效流转。
作为企业数据处理的核心,文档智能领域的难题日益清晰:如何在多样化的文档处理中实现高效、可靠的解析与价值转化?
在文档智能领域持续深耕并推进产业化落地,最近完成全面升级,覆盖技术迭代、产品进化与品牌焕新,全面提升企业级AI应用在复杂文档与数据场景下的智能处理能力,标志着从AI文档工具向AI文档智能体平台的关键跨越。
模型升级与架构重塑,筑牢性能底座
技术是价值的核心支撑,此次升级在模型能力与底层架构方面实现双重突破。
01自研模型DocMind,深度升级
在企业实际应用场景中,公文、合同、财报、科研论文等文档往往具有结构复杂、排版多样、信息分布不规则等特征,通用大语言模型难以覆盖所有解析需求。
司马阅自研文档智能模型DocMind升级至3.0版本,采用多模型协同机制,由若干专业化模型组成完整的文档处理链路,将文档、表格、扫描件等非结构化数据转化为可用于分析和AI应用的结构化数据。通过高效精准的文档数据处理,最大程度降低AI落地的“幻觉”问题,提升企业AI落地应用的可靠性。
DocMind-V3.0的多模型协同机制:
版面模型:负责版式与段落结构识别,能够准确识别文档中的段落、表格、图片、标题等内容区块。
OCR模型:处理扫描文档,针对通用扫描文档实现95%以上的准确率。
图表模型:聚焦于复杂表格数据处理。
公式模型:针对专业领域的符号化内容进行识别。
通过“任务编排 + 结果互证”,各模型形成协同效应,大幅提升复杂场景下的综合解析鲁棒性,确保从海量文档中提取高质量、高可信度的数据。

02底层架构升级,适配商业环境
除模型层优化,底层技术架构也完成重构,强化商业场景的适配能力:
Embedding模型与ReRank重排模型升级:通过对企业专属数据的训练,实现高质量的召回,召回率达到80%以上。

推理语言迁移:将原推理语言升级为RUSt语言,凭借内存安全、并行高效、低延迟等特性,为大规模文档解析场景降低推理延迟,同时提升系统稳定性与可扩展性。

Agent架构落地:整体底层升级为Agent架构,每个模块和工具独立运行,拔插自由,降低耦合度。相较传统架构,该模式具备更强的模块化、可扩展性与自适应性,未来遇到新文档类型或业务需求时,无需大规模重构系统,只需扩展功能模块即可快速响应,强调在真实商业环境中的长期可用性。
低门槛交互与全场景功能,让技术落地更高效
技术价值需通过产品形态落地,升级围绕降低使用门槛、优化部署成本、覆盖全场景需求展开,让企业用户更容易获得AI能力。
01灵活配置:业务驱动的模块化编排
在实际应用中,企业往往需要根据不同场景灵活配置流程,但传统流程配置高度依赖技术人员,沟通与实现周期较长。
利用平台,业务人员无需编码,只需通过模块化组件的自由配置,即可完成智能体创建。这一“所见即所得”的配置方式将使用门槛降至零技术基础,大幅缩短上线周期,使知识库真正融入日常业务,成为提升效率的智能工具。

02智能知识库:企业的数字化大脑
此次升级推出智能知识库,将信息存储工具升级为企业智慧中枢,使知识资产具备可沉淀、可调用、可进化的能力:
多模态管理:支持文本、图片、扫描件等多种格式的统一收纳与管理,打破信息孤岛;
版本化管控:完整记录知识更新轨迹,确保信息可追溯、可管控,保障数据安全准确;
协同编辑:支持多人在线协作与维护,提升知识库建设效率与内容一致性。

在未来,智能知识库还将进一步开放与外部系统的连接能力:
灵活对接:可接入外部存储设备及第三方知识库,实现数据跨系统流动与整合;
智能处理链路:用户可根据业务场景,自由选择文档处理方式,包括嵌入、重排、清洗、标注、召回测试、分段查询等多样化流程,构建更符合实际需求的知识引擎。
此次升级在“管理与控制”层面实现平台化提升:
多企业管理与切换:平台支持多个企业账号的统一管理与快速切换,适配集团化、多子公司架构,帮助管理者清晰划分不同企业的知识边界与应用场景。

组织与成员管理:提供完善的组织架构配置,支持部门级权限划分与精细化管理;管理员可通过成员邀请机制,灵活设置角色与协作范围,确保知识使用的高效与安全。


用户自定义模型管理:企业可根据自身需求,自主上传、配置与迭代专属模型,实现知识库与业务逻辑的深度耦合,构建差异化竞争力。


司马阅智能知识库应用场景价值举例:
企业培训场景
在企业培训中,新员工学习资料分散在不同系统与文件夹,培训路径不清晰,导致培训周期偏长,效果参差。依托智能知识库,企业能够构建统一培训资源池,将制度文件、流程规范和业务案例沉淀至知识库,并通过智能问答与学习路径推荐实现个性化、精准化培训。
研发知识管理
在研发管理中,技术文档与代码版本往往缺乏统一管理,易造成版本混乱和知识断层,影响协作与迭代效率。智能知识库通过版本化管理和语义关联,将文档、代码与研发流程紧密结合,确保知识全生命周期可追溯与演进,实现知识共享与协同。
03多模型调用:完善的AI生态
平台已接入主流大语言模型,企业可按任务场景选择最优模型,支持本地化或专属模型部署,确保数据安全与合规性。

04实时监控:及时调整资源分配
平台通过监控不同时段的智能体Token消耗及会话情况,包括全部会话数、全部消息数、Token消耗、Token输出速度等,以便企业及时调整资源分配和优化系统性能。

05部署升级:从复杂到极简
通过模块化部署设计,平台实现灵活、高效、安全的企业级落地能力。与传统“一体化部署”相比,部署更简单,企业仅部署所需模块,避免冗余占用,资源消耗下降,模块独立运行,故障可快速隔离,保障核心业务稳定。
从“工具”到“平台”,构建B端价值生态
此次升级不仅是技术与产品的迭代,也是品牌的战略升级——从高效的AI文档工具,升级为AI文档智能体平台,专注于B端企业需求,强调专业化、平台化、共建化,并与多地合作伙伴形成长期共生关系,将技术能力转化为行业智能成果。

合作生态
司马阅已与麦腾Mytech达成生态战略合作,赋能园区企业AI转型升级。麦腾运营科创园区约30座,其中国家级3座,省市级7座,服务企业超2000家。

与英博瑞达成生态战略合作,推动人力资源服务智能化升级。英博瑞覆盖全国多座城市,服务企业数千家,累计安置就业人员数十万。
此次升级,是对企业需求的深度洞察及前沿技术的持续探索,在底层性能、用户体验和平台价值方面实现系统性演进。全新平台即将开启公测,期待与更多伙伴共同推动文档智能在商业场景落地。
全新升级的司马阅AI文档智能体平台,正进入公测阶段,期待与更多伙伴携手推动文档智能在更多场景落地。