系统概述
这是一个完整的OCR文件处理系统,集成在runtimes.cloud主页中。系统使用PaddleOCR进行文档解析,支持多种文件格式和输出格式。
文件上传
支持PDF、PNG、JPG、JPEG、BMP、TIFF格式,最大50MB,支持拖拽上传。
OCR解析
使用PaddleOCR进行高质量的文档解析,支持文本、表格、公式识别。
结果下载
提供TXT、JSON、Markdown三种格式下载,满足不同使用需求。
使用步骤
访问主页
打开 https://runtimes.cloud/,查看OCR服务器状态。
选择文件
在右侧OCR区域,点击选择文件或拖拽文件到上传区域。支持PDF和图像文件。
上传文件
点击"上传文件"按钮,等待文件上传完成。系统会显示上传进度和结果。
OCR解析
点击"OCR解析"按钮,系统将调用PaddleOCR API进行文档解析。这可能需要一些时间。
查看和下载
查看解析结果,并选择TXT、JSON或Markdown格式下载文件。
系统状态
API接口
系统提供以下REST API接口:
POST /api/upload - 文件上传
Content-Type: multipart/form-data
参数: file (文件字段)
POST /api/ocr - OCR解析
Content-Type: multipart/form-data
参数: file (文件字段)
GET /api/health - 健康检查
返回服务器状态信息
GET /api/files - 文件列表
获取已上传的文件列表
技术配置
系统使用以下技术栈:
后端
Node.js + Express,提供REST API服务,处理文件上传和OCR调用。
OCR引擎
PaddleOCR文档解析,支持版面分析、表格识别、公式提取。
前端
HTML5 + CSS3 + JavaScript,响应式设计,支持桌面和移动设备。