AGISURGE INSIGHT

制药业 eTMF 智能归档助手:架构方法与落地实践白皮书

在创新药研发加速的背景下,文档数量与合规要求不断提升,传统的归档方式已难以支撑当前的复杂性。大模型与智能助手技术的发展,为提升 eTMF 等文档体系的效率和稳定性提供了新的路径。 本白皮书介绍一套面向医药场景的智能文档归档方案,并结合实践经验展示其可行性与扩展潜力。

2025年11月27日15 分钟阅读作者AGISurge 研发团队
白皮书行业案例架构设计
cover
加载中...

摘要

随着创新药研发规模的扩大,临床试验的项目数量、中心数量与数据流通复杂度持续上升。文档归档作为研发质量体系的关键环节,其合规性、可追溯性与处理效率直接影响试验进度及审计风险。

本白皮书结合行业趋势与具体落地案例,提出一种基于 大模型、多模态识别与可扩展工具体系 的 eTMF 智能归档方案。该方案不仅聚焦于解决当前文档处理效率低、规则复杂、质量不稳定等痛点,更通过 Agentic 架构 构建了一个具备长期扩展能力的智能助手平台。

在这一平台中,流程不再固化于代码,而是可通过自然语言定义与调整;任务执行通过符合 MCP 标准的插件式工具完成,具备高度灵活的组合能力。这意味着:尽管本项目的切入点是 eTMF 文档智能归档,但底层能力已被设计为可复用的通用智能助手范式。企业未来可以在同一平台上快速构建和部署更多智能助手,用于 QA、药政、注册、生产供应链甚至 IT 运维的任务自动化,实现持续的数字化创新。

本白皮书旨在帮助医药企业构建一个可审核、可扩展、安全合规 的智能文档处理能力,同时为未来的企业级 AI 工作流奠定基础。

1. 行业背景与痛点

1.1 eTMF 文档量级与复杂度迅速增长

以一个创新药项目为例,临床试验可能覆盖上百个中心、数百名 CRA、成千上万份 PDF 扫描件。文档通常包含以下特征:

  • 多来源:医院站点上传、纸质扫描、照片拍摄;
  • 多格式:表单、表格、手写体、扫描件清晰度参差不齐;
  • 多规则:不同文档类型有不同的命名规则(如访视日期、中心编号、受试者信息) , 不同的归档系统规则也可能不同。

这些因素使得传统人工归档耗时巨大、错误频发。

1.2 传统自动化方案的局限性

许多企业曾尝试基于 OCR 或 RPA 的自动化流程,但存在共性问题:

  • 模板化规则及餐厅OCR难以适应复杂 PDF
  • 跨项目配置成本高
  • 业务变更导致脚本频繁失效

在 LLM(大模型)出现前,没有一种可真正通用且能理解业务语义的基础能力。

2. AI 驱动的新范式:智能文档归档助手

基于多模态大模型+工具链的体系,企业可构建全新的 “AI 智能归档助手”。

01
加载中...

2.1 核心理念:从“写死流程”到“自然语言定义流程

传统方式:流程固定在代码里,改一次流程要改一次代码。

智能助手方式:

  • 使用自然语言定义流程
  • 插件式工具和资源(如读取 PDF、提取内容、重命名、移动文件)
  • 模型理解意图,自行调用工具和资源

2.2 智能助手的四大能力组件

智能文档归档助手并非单一功能的自动化工具,而是由一套可扩展的智能任务执行体系构成。为确保在复杂且高度合规的医药研发环境中稳定运行,本方案将能力划分为四个核心组件,每个组件都承担关键职责,并与其它组件协同工作。

(1) 多模态大模型(LLM + Vision):替代传统 OCR 的关键基础能力

在实际临床试验文档中,扫描件往往存在 格式不统一、表格嵌套、手写内容、照片伪影、压缩模糊等情况。传统 OCR 难以适应这些“真实世界中的文档噪声”,并且只能输出纯文本,无法理解文档结构、上下文语义或业务规则。

选择多模态大模型的原因:

具备语义理解能力

不仅读取内容,还能理解“这是哪类文档”“哪段文本是签字日期”“哪段是项目编号”等业务逻辑。

具备结构识别能力

能识别表格、标题、手写内容、盖章位置,而 OCR 只能按字面提取。

适应扫描件质量差异

多模态模型能从模糊、旋转、阴影等图片中正确提取关键字段,实际项目中 OCR 的失败率远高于 LLM Vision。

直接输出结构化数据

模型可直接按项目规则提取字段,减少后处理成本。

因此,多模态模型为整个方案提供了“读懂文档”的核心基础,使系统能够在复杂 eTMF 文档场景中保持稳定识别能力。

(2) 工具链(Tools):确保执行能力的插件式扩展体系

02
加载中...

在本方案中,智能助手通过 MCP 协议的插件化工具 执行具体操作,例如:

  • PDF 转图片
  • 文档识别工具
  • 调用外部资源
  • 文件操作(打开、重命名、移动、复制、创建文件夹)

这种设计使系统具备可观的工程稳定性——模型负责思考,工具负责执行。

采用工具链体系的原因:

兼容业界标准

采用 Model Context Protocol

极强的扩展性

企业未来需要新的任务(如 Excel 解析、接口提交、数据库查询),只需新增 MCP 工具,无需重新调整代码

工具链将系统从“一个智能程序”,扩展为“一个可不断增长的任务执行平台”。

(3) Agent(任务拆解与调度):让自动化从固定脚本迈向可调整的智能工作流

在传统 RPA/OCR 脚本中,流程是硬编码的:流程一旦改变,脚本必须重写。

在本方案中,Agent 的作用是:

  • 将用户的自然语言需求拆解为多步骤任务(Planning)
  • 根据步骤顺序调用合适的工具(Action)
  • 维护任务状态、错误处理、结果合并(Memory + Control)
  • 支持批量任务调度(大量文件的稳定处理)

采用 Agent 架构的原因:

流程不固化,可配置可扩展

企业可以通过自然语言定义新的流程,而不是修改代码。

多步骤任务更稳定

Agent 通过预定义的流程结构和模板化 Prompt,避免了模型推理的不稳定性。

支持复杂任务编排

如:解析 PDF → 识别文档类型 → 提取字段 → 命名 → 移动 → 审计记录

企业可快速构建其他助手

不只是 eTMF归档助手,任何“多步骤+数据+规则”的业务都能复用 Agent 系统。

Agent 是系统能够在“智能”与“可控”之间取得平衡的关键枢纽。

(4) 服务端管理体系:确保安全、审计与规模化使用

03
加载中...

在医药行业中,任何自动化系统必须满足高标准的合规要求。本方案的服务端承担一整套管理与审核职责:

  • 统一管理模型配置(Endpoint、Keys、模型名称)
  • 管理 MCP 工具及其版本
  • 管理用户、用户组、权限与限流
  • 审计日志(用户提问、模型使用量、任务执行记录)
  • 满足 TLS、MFA、RBAC 等安全要求

采用服务端管理体系的原因:

满足医药行业合规要求(网络安全法、个人信息保护法)

便于大规模推广

CRA 不需要手动配置模型或工具,可统一下发

安全因素可控

工具与模型 Key 对用户不可见

便于产品演进

新模型、新 Prompt、新工具可在服务端发布,不需要重装客户端

这一组件确保智能助手能在医药企业内部安全运行、逐步扩展并纳入正规 IT 管控体系。

总结:四大组件构成一个完整的“现在问题 + 未来能力”体系

  • 多模态模型解决“读懂文档”的核心问题(解决现在)
  • MCP 工具链解决“稳定执行任务”的工程问题(解决现在)
  • Agent 解决“流程可配置与可扩展”的业务问题(解决未来)
  • 服务端解决“规模化、安全合规”的企业 IT 问题(解决未来)

3. 方案架构总览

以下架构已在实际医药企业试点中落地验证,并可复制到更多场景。

1.1. 端–管–云三层架构

04
加载中...

AI 智能文档归档助手采用“端–管–云”三层协同架构,以保证系统在各类医药企业环境下均具有较高的灵活性、扩展性与可管理性。相比传统的单体式自动化工具,这种架构能在安全合规、可运维性、持续扩展性方面显著提升表现。

(1) 端(Edge):任务执行与用户交互层

“端”侧通常部署在用户的本地设备或企业内部客户端中,承担以下职责:

  • 处理实际任务执行:如文档解析请求、文件重命名、任务状态展示等。
  • 提供直观交互界面:支持非专业用户以自然语言方式发起归档任务。
  • 本地运行部分工具:如 PDF 处理工具,减少网络延迟与敏感数据传输风险。
  • 支持企业内部的身份认证系统:包括统一身份验证、内部账号体系或其他 SSO 能力。

端侧的目标是让用户“无需理解 AI,也能获得 AI 的能力”。

(2) 管(Control):统一配置、权限与任务治理层

“管”层是整个系统的核心管理平面,通常部署在企业内部服务器或隔离网络下,用于满足医药企业所需的安全、合规与可控性要求。

其核心职责包括:

  • 集中管理模型与任务模板:包括模型地址、提示词模板、任务流程等。
  • 工具与版本管理:确保 MCP 工具在受控环境中发布、升级和审核。
  • 用户、角色与权限治理:支持灵活的 RBAC 机制,用于不同部门、不同项目的权限隔离。
  • 任务审计与日志记录:满足合规审计、回溯要求,并支持对 AI 行为可解释的透明化管理。
  • 资源与限流策略:实现对不同用户组的访问额度、模型调用量的精细化控制。

“管”层确保系统能够在大型企业环境中稳定扩展和长期运维。

(3) 云(Model & Resource ):智能能力与外部资源

“云(Model & Resource)”承担着整个智能助手体系的核心能力供给与资源管理功能。相比传统仅依赖模型的方案,本架构将云端定义为“可统一托管智能能力 + 可扩展外部资源 + 插件式工具注册中心”的综合能力层,使企业能够在未来不断引入新的 AI 能力与业务资源,同时保持可控、安全与可治理。

云层主要由以下要素构成:

模型能力(LLM)

提供文档理解、任务推理、字段识别等智能能力,包括:

  • 文本模型(用于规则推理、命名生成、流程拆解)
  • 多模态模型(用于识别扫描件、表格、手写体等)

这种模型层结构允许企业根据策略选择自研模型、行业模型或私有化部署模型。

资源与服务能力(Resource Services)

云层可以整合企业内外部的各类资源,包括但不限于:

  • 文档解析服务(如结构化识别服务)
  • 插件式工具托管(MCP Tools):提供 PDF 解析、文档结构化、文件操作等组件。
  • 内部数据服务(如项目库、中心库、受试者库)
  • 外部合规、安全或调用控制服务
  • 医药行业特定资源,如质量系统 API、注册系统接口(如临床中心信息、试验元数据)

可扩展的插件式任务资源

  • 插件式工具注册与托管
  • 企业未来可将新的任务资源(如接口调用、特定业务引擎、知识库服务)加入云层,为 Agent 调度提供更多执行节点。

技术可替换与演进能力

云层的核心理念是“能力组合”而非“单一模型”,所有模型与资源均可替换、升级或按需组合,使系统在未来具备持续适应能力。

通过模型与资源的协同,云层成为整个智能助手体系中“可扩展、可演化”的智能底座,让企业能够不断接入新的能力与服务,同时保证安全、合规与可控。

4. 案例研究:一家创新药研发企业的智能归档实践

在与一家创新药研发企业的合作中,我们见证了智能文档归档助手从探索性试点到正式落地的完整过程。

最初,企业面临的挑战非常明确:随着临床试验规模不断扩大,eTMF 文档数量增长迅速,文档格式复杂且质量差异明显,传统人工归档与规则化 OCR 的方式已难以支撑高效、稳定的管理需求。团队希望找到一种能够理解文档内容、适应多种格式并减少重复劳动的智能化解决方案。

基于这一目标,我们从小范围试点开始,重点关注大模型在文档理解、字段识别和多样化扫描件处理中的可行性。结果显示,AI 在文档结构识别与关键字段提取方面具备较好的可靠性,为进一步落地奠定了基础。

在此之后,方案从“功能验证”转向“可运行体系”的建设。我们采用了基于 Agentic 架构的方式,将大模型的语义理解能力与工具的稳定执行能力结合,并通过控制层实现配置管理、权限治理与审计追踪。这样不仅满足了文档归档的核心需求,也使系统能够纳入企业既有的 IT 管理体系。

05.
加载中...

在小范围上线后,临床团队逐步将智能助手应用于实际项目的文件整理与归档。随着业务反馈的不断融入,任务规则被进一步细化,流程配置被优化,而这些改进无需重新开发,通过自然语言规则与工具组合即可实现。这使系统能够在实际的、多变的文档环境中保持稳定和灵活性。

尽管案例的切入点集中在 eTMF 文档归档,但该方案真正的价值不仅在于解决当前的归档工作,更在于形成一套能够兼容未来需求的基础能力架构。随着底层模型、工具与管控体系的逐步完善,这一智能助手框架可在未来支持更多与文档处理、流程执行或规则校验相关的业务场景。

通过这一实践,企业从局部痛点出发,在稳定落地的过程中形成了一个可扩展、可复用的智能助手体系。这种路径为正在探索 AI 应用的医药企业提供了一条具有参考价值的落地方式。

5. 结语

医药研发的文档体系正在经历从“量变”到“质变”的阶段:项目规模更大、文档类型更多、监管要求更高。传统的人工处理与脚本化自动化方式在灵活性和可持续性方面已难以满足需求。本白皮书提出的智能文档归档方案,以大模型的理解能力、多模态解析能力、工具化执行体系以及可治理架构为基础,为企业提供了一条可行的技术路径。

从实践来看,这种基于 Agentic 架构的智能助手在 eTMF 场景中已经展现出良好的适配性与稳定性。它不仅能够解决当前文档归档中的复杂性问题,也使流程具备了可配置、可扩展和可持续演进的特性,为企业未来的数字化建设奠定基础。

随着智能模型、工具生态和企业自身业务需求的发展,类似的体系将能够自然延伸到更多与文档理解、流程执行和规则校验相关的场景。智能文档归档助手因此不仅是一个单一场景的解决方案,而是构建长期智能化能力的起点。