Skip to content

[Feature] 会话支持文件上传与解析(办公智能体场景) #96

Description

@wjh747770454-creator

功能建议:会话支持文件上传与解析

场景

办公智能体场景:用户需要把本地撰写的会议纪要交给智能体,由智能体自动更新到钉钉文档并做有价值的商机情报分析;同时会偶尔提供参考材料(如与客户交流的 PPT、方案文档)让智能体更好地理解本次交流内容。

现状与痛点

当前智能体对话框仅支持纯文本输入,不支持文件上传

  1. 大记录只能整段粘贴:几小时的会议转写粘贴进文本框体验很差,且存在长度上限风险。
  2. 二进制文档完全无法处理:PPT、Word 方案、PDF 等参考材料无法上传,智能体拿不到客户交流的上下文,影响商机分析的准确度。
  3. "会话文件(workFiles)"机制是面向预配置 workspace 的,不支持单次会话临时上传附件,无法满足"这次交流附一份 PPT"的轻量需求。

期望能力

  1. 会话级文件附件上传:在对话框直接上传一个或多个文件(txt / md / docx / pdf / pptx 等),作为本次会话的输入。
  2. 文件内容自动解析并注入上下文
    • 纯文本类直接读取;
    • Office/PDF 类由平台解析为文本后注入(PPT 尤其需要,因为它是客户交流的核心载体)。
  3. 与工作目录解耦:附件作为本次消息的参考材料进入 LLM 上下文,不必污染持久工作目录,会话结束即可清理。
  4. 大文件分片/摘要:超大文档支持分片读取或自动摘要,避免撑爆 LLM 上下文。

价值

  • 办公智能体的核心入口能力:办公场景的输入本来就是文档(纪要、PPT、方案),没有文件上传等于强迫用户把文档转成文本再粘贴,严重限制平台在办公场景的可用性。
  • 解锁商机情报分析:能读取客户交流的 PPT/方案,智能体才能结合长亭产品体系做准确的商机判断,而不只是处理干瘪的转写文本。
  • 降低使用门槛:非技术用户也能直接拖文件进去,无需 scp/docker cp 等操作。

备注

作为参考,当前我们在内部用 agent-compose + OctoBus 部署了售前情报分析类智能体,产品知识已通过镜像内文件注入,但本地文档输入这一环仍只能粘贴,成为落地的主要阻碍之一。期待平台原生支持文件上传与解析。

Metadata

Metadata

Assignees

No one assigned

    Labels

    enhancementNew feature or request

    Type

    No type
    No fields configured for issues without a type.

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions