伯索开放平台
首页API文档SDK文档伯索官网
首页API文档SDK文档伯索官网
  1. SDK接入文档
  • 产品介绍
    • SDK简介
    • SDK支持的业务场景
    • 产品特色
  • 产品功能
    • 实时课堂功能介绍
    • 微课功能介绍
    • 作业批改功能介绍
    • 上传课件功能介绍
    • SDK后台功能介绍
  • 接入指引
    • SDK对接标准流程说明
    • 关键概念
  • SDK接入文档
    • 历史课堂数据回调接入
    • 签名示例
    • 历史课堂转视频接入方式
    • 历史课堂/微课下载接口
    • query参数说明
    • 文档解析接口
    • SDK预解析服务接入说明
    • Web SDK
      • PlasoStyleUpime API说明
      • 云盘接入
      • 直播SDK
        • 快速接入
      • 微课SDK
        • 快速接入
      • 批注SDK
        • 快速接入
    • Android SDK
      • 直播SDK
        • 快速接入
      • 微课SDK
        • 快速接入
      • 批注SDK
        • 快速接入
    • iOS SDK
      • 直播SDK
        • 快速接入
      • 微课SDK
        • 快速接入
      • 批注SDK
        • 快速接入
    • 播放器SDK
      • Web播放器
    • 「伯索云学堂」跳转接入指南
      • 跳转接入指南
  • 最佳实践
  • Open API帮助文档
    • Open API 主要功能
    • Open API集成常用场景
    • 数据字典
    • 接入须知
      • 调用流程
      • 在线调试
      • 通用错误码
    • 用户信息管理
      • 添加用户
      • 修改密码
      • 删除用户
      • 更新用户
      • 用户精确查询
      • 查询多个用户
      • 用户访问Token
      • 验证用户Token有效期
      • 批量添加用户
      • 恢复删除的用户
      • 随机分配课程顾问
    • 教材包管理
      • 查询机构教材包
      • 查询教材包内教材
      • 向学生分发教材包
    • 实时课堂管理
      • 创建实时课堂
      • 创建实时课堂(班)
      • 更新实时课堂
      • 更新实时课堂(班)
      • 删除实时课堂
      • 查询实时课堂列表
      • 更新实时课堂下听众用户
      • 获取实时课堂监控地址
      • 控制单个学员是否可以回看单次课
      • 获取单个课堂的回看地址
      • 删除单个历史课堂
      • 获取课堂考勤数据
      • 获取历史课堂信息
      • 获取历史课堂观看数据
      • 获取课堂互动信息
      • 获取课堂列表(新)
      • 获取实时课堂旁听链接
      • 获取极速直播推流地址
      • 获取课堂下板书图片
    • 班级管理
      • 创建班级
      • 更新班级
      • 删除班级
      • 查询班级列表
      • 向班级中添加学生
      • 从班级中移除学生
      • 更换学生所在班级
      • 老师列表中查询机构分校学科
      • 根据班级获取获取班级详情和人员信息
    • 学情数据
      • 获取学生课堂明细数据
      • 获取学生巩固明细数据
      • 获取学生测验明细数据
      • 获取学生辅导明细数据
      • 获取学生积分明细数据
    • 商城管理
      • 获取商品详情
      • 获取商品列表
      • 获取分校自定义商品栏目列表
      • 订单查询
      • 订单详情查询
    • 作业管理
      • 查询学生作业列表
      • 查询老师作业列表
    • 测验管理
      • 查询机构测评列表
      • 获取测评统计
      • 查询机构测验列表
      • 获取测验明细
    • 积分管理
      • 机构积分规则
      • 查下学生当前积分数
      • 查下机构每天的积分明细记录
  • 产品更新记录
    • Open API 更新日志
    • SDK 更新日志
  • 常见问题
    • PPT制作事项
    • 课件常见问题与解决方法
    • 网络相关问题
    • 声音相关问题
    • 网络测速
  • 推荐
    • 浏览器推荐
    • 常见软件推荐
    • 教育硬件推荐
  • 历史课堂视频
    POST
  • 查询历史课堂
    POST
  1. SDK接入文档

文档解析接口

文档解析服务 API文档#

本文档描述了文档解析服务的对外API接口,支持PPT、Word、Excel、PDF等格式的文档解析。

服务概述#

文档解析服务提供异步文档解析能力,支持多种文档格式转换为标准格式。服务采用异步处理模式,通过回调机制通知解析结果。

基础信息#

服务地址: https://www.plaso.cn/dataentry/document
Content-Type: application/json
字符编码: UTF-8
认证方式: AppId + SecretKey 签名示例

API接口#

1. 创建文档解析任务#

提交文档解析任务,系统会异步处理并在完成后通过回调通知结果。
接口地址: POST /parser
请求参数:
参数名类型必填说明
appIdstring是应用ID,用于标识调用方及其配置
sourcePathstring是源文件的存储路径(OSS路径格式:oss://bucket/file)
taskTypenumber是任务类型,详见任务类型说明
callbackUrlstring是任务处理完成后用于通知结果的回调URL
validBeginnumber是请求开始时间戳(秒)
validTimenumber是请求有效时长(秒),建议300秒
signaturestring是签名,用于请求验证
exportBoardboolean否是否生成用于导出板书的文件,需要导出课堂板书的话,需要传true
任务类型 (taskType):
类型值说明
EXTERNAL_PPT4PPT文档
EXTERNAL_DOC5Word/Excel文档
EXTERNAL_PDF8PDF文档
导出课堂板书需要在伯索云配置回调接口(getFileAddr),用于获取解析后文件信息。
请求示例:
{
  "appId": "your-app-id",
  "sourcePath": "oss://your-bucket/path/to/document.pptx",
  "taskType": 4,
  "callbackUrl": "https://your-callback-url.com/api/callback/document",
  "validBegin": 1703123456,
  "validTime": 300,
  "signature": "A1B2C3D4E5F6G7H8I9J0K1L2M3N4O5P6Q7R8S9T0"
}
解析后文件保存路径:
解析完成后,文件将保存在源文件路径后附加 _i 的目录中,即 ${sourcePath}_i/。
回调信息中的 targetPath 字段会返回此目录路径 (OSS Key)。
例如,如果 sourcePath 是 oss://bucket/docs/file.pptx,则 targetPath 将是 docs/file.pptx_i/。
具体的解析后文件(如图片)需要将此 targetPath 与文件名(如 1.jpg)拼接后获取。
成功响应:
{
  "code": 0,
  "msg": "success",
  "obj": {
    "taskId": "654e1c9a7b8d9e001a2b3c4d"
  }
}
错误响应:
{
  "code": 1001,
  "msg": "源文件路径不存在"
}
cURL示例:

回调机制#

解析结果回调#

文档解析完成后,服务会调用您提供的回调URL通知解析结果。
回调地址: 您在创建任务时提供的 callbackUrl
调用方: 文档解析服务
请求参数:
参数名类型必填说明
taskIdstring是任务ID
taskStatusnumber是任务状态,详见状态值说明
targetPathstring是解析后保存的路径
convertPagesnumber否WORD,PDF解析成功时返回,表示成功转换的页数
状态值说明:
状态值状态名称说明
100DONE解析成功
101FAILED解析失败

回调重试机制#

服务会按照以下策略重试回调:
重试策略:
首次回调失败后,等待5秒重试
最多重试3次
重试间隔递增:5秒、10秒、20秒
3次重试后仍失败,任务标记为回调失败
重试条件:
HTTP状态码 >= 500
网络超时
连接失败

错误码说明#

错误码错误类型说明
0SUCCESS成功
4INPUT_DATA_ERROR输入数据错误(例如,sourcePath 未提供)
7INADEQUATE_PRIVILEGE权限不足(例如,机构未开通服务或OSS配置不存在)
270000NOT_SUPPORT不支持的文件解析
270001TASK_HAS_FULL任务队列已满

接入参考Demo#

https://github.com/PlasoOpenPlatform/DocParseDemo
以下流程图和说明描述了如何完整地集成和使用文档解析服务,并展示了本Demo中的后端实现逻辑。
修改于 2025-10-29 02:13:00
上一页
query参数说明
下一页
SDK预解析服务接入说明
Built with