多模态 AI 自动化评测平台

上传数据文件后进行批量评测。必须使用你自己的「评测 API Endpoint」与「API Key」，请求由浏览器直接发往你的网关；本站不会、也不可用站长的密钥代付，避免产生站长的模型费用。

请务必为你的 API 配置 CORS，允许当前站点来源（浏览器地址栏的 origin），否则浏览器会拦截跨域请求。

1) 基本设置

评测 API Endpoint（必填） API Key（必填）模型名称（必填）任务类型

2) 评测模板与自定义维度

每个维度需填写独立评测提示词；提示词中可使用占位符 {{item}}（当前样本 JSON）、{{dimension_name}}、{{criteria}}、{{task_type}}、{{dimensions}}（当前维度一行说明）。模型需按该维度返回 scores 中含对应维度名的分数。

3) 上传数据

支持 文本（JSON / JSONL / XLSX）+ 图片 + 视频（含音轨）+ ZIP 压缩包，可任选一种或两者结合：
• 结构化数据文件（可选）：JSON / JSONL / XLSX（第一行为表头）。
支持的列名（中英均可，系统自动识别）： id / 编号、 input_text / prompt / 提示词 / 输入的prompt、 output_text / 输出 / 回答、 video_url / 视频 / 视频地址 / 输出的视频、 image_url / 图片 / 图片地址、 frame_urls / 关键帧、 file / 文件名（用于与已上传媒体按文件名匹配）。
• 媒体文件（可选，多选）：直接上传图片 / 视频，或一个 .zip（自动解包，兼容 Windows 中文 GBK 文件名）。未提供数据文件时每个媒体文件成为一条样本；提供数据文件时按行中 file 或 id 与文件名匹配，自动注入为 image_url / video_url（Base64 Data URL，视频完整包含音轨）。
• ⚠ 表格里不能写本机路径：file:///D:/... 或 C:\Users\... 这类是你电脑硬盘上的位置，浏览器受沙箱限制无法读取。遇到这种情况系统会自动取文件名，请把对应的视频 / 图片同时通过「媒体文件」输入框上传上来，系统会按文件名自动匹配。若是公网可访问的 http(s):// 链接则可直接写在表格里。
• 浏览器会把媒体读成 Base64 并随请求直传你的 API，单文件建议 ≤ 8 MB（视频尤需压缩），否则可能触发模型上下文或 API 限制。

结构化数据文件（可选，.json / .jsonl / .xlsx / .zip）媒体文件（可选，图片 / 视频 / ZIP，可多选）视频抽取关键帧数量（推荐 6–8；0 = 不抽帧，大多数网关不支持原生视频会导致模型看不到内容）

快速入口

查看本次报告查看历史记录管理访问密钥退出登录