OCR功能演示 - runtimes.cloud

系统概述

这是一个完整的OCR文件处理系统，集成在runtimes.cloud主页中。系统使用PaddleOCR进行文档解析，支持多种文件格式和输出格式。

支持PDF、PNG、JPG、JPEG、BMP、TIFF格式，最大50MB，支持拖拽上传。

使用PaddleOCR进行高质量的文档解析，支持文本、表格、公式识别。

提供TXT、JSON、Markdown三种格式下载，满足不同使用需求。

打开 https://runtimes.cloud/，查看OCR服务器状态。

在右侧OCR区域，点击选择文件或拖拽文件到上传区域。支持PDF和图像文件。

点击"上传文件"按钮，等待文件上传完成。系统会显示上传进度和结果。

点击"OCR解析"按钮，系统将调用PaddleOCR API进行文档解析。这可能需要一些时间。

查看解析结果，并选择TXT、JSON或Markdown格式下载文件。

OCR服务器状态检查中...

PaddleOCR API ✅ 已配置

文件上传目录 /root/.openclaw/workspace/uploads

支持格式 PDF, PNG, JPG, JPEG, BMP, TIFF

最大文件大小 50 MB

系统提供以下REST API接口：

POST /api/upload - 文件上传

Content-Type: multipart/form-data

参数: file (文件字段)

POST /api/ocr - OCR解析

Content-Type: multipart/form-data

参数: file (文件字段)

GET /api/health - 健康检查

返回服务器状态信息

GET /api/files - 文件列表

获取已上传的文件列表

系统使用以下技术栈：

Node.js + Express，提供REST API服务，处理文件上传和OCR调用。

PaddleOCR文档解析，支持版面分析、表格识别、公式提取。

HTML5 + CSS3 + JavaScript，响应式设计，支持桌面和移动设备。