OCR功能演示

runtimes.cloud - 完整的OCR文件处理系统

PaddleOCR已配置,功能完全就绪!

系统概述

这是一个完整的OCR文件处理系统,集成在runtimes.cloud主页中。系统使用PaddleOCR进行文档解析,支持多种文件格式和输出格式。

文件上传

支持PDF、PNG、JPG、JPEG、BMP、TIFF格式,最大50MB,支持拖拽上传。

OCR解析

使用PaddleOCR进行高质量的文档解析,支持文本、表格、公式识别。

结果下载

提供TXT、JSON、Markdown三种格式下载,满足不同使用需求。

使用步骤

访问主页

打开 https://runtimes.cloud/,查看OCR服务器状态。

选择文件

在右侧OCR区域,点击选择文件或拖拽文件到上传区域。支持PDF和图像文件。

上传文件

点击"上传文件"按钮,等待文件上传完成。系统会显示上传进度和结果。

OCR解析

点击"OCR解析"按钮,系统将调用PaddleOCR API进行文档解析。这可能需要一些时间。

查看和下载

查看解析结果,并选择TXT、JSON或Markdown格式下载文件。

系统状态

OCR服务器状态 检查中...
PaddleOCR API ✅ 已配置
文件上传目录 /root/.openclaw/workspace/uploads
支持格式 PDF, PNG, JPG, JPEG, BMP, TIFF
最大文件大小 50 MB

API接口

系统提供以下REST API接口:

POST /api/upload - 文件上传

Content-Type: multipart/form-data

参数: file (文件字段)


POST /api/ocr - OCR解析

Content-Type: multipart/form-data

参数: file (文件字段)


GET /api/health - 健康检查

返回服务器状态信息


GET /api/files - 文件列表

获取已上传的文件列表

技术配置

系统使用以下技术栈:

后端

Node.js + Express,提供REST API服务,处理文件上传和OCR调用。

OCR引擎

PaddleOCR文档解析,支持版面分析、表格识别、公式提取。

前端

HTML5 + CSS3 + JavaScript,响应式设计,支持桌面和移动设备。