多模态 AI 自动化评测平台
上传数据文件后进行批量评测。必须使用你自己的「评测 API Endpoint」与「API Key」,请求由浏览器直接发往你的网关;本站不会、也不可用站长的密钥代付,避免产生站长的模型费用。
请务必为你的 API 配置 CORS,允许当前站点来源(浏览器地址栏的 origin),否则浏览器会拦截跨域请求。
1) 基本设置
2) 评测模板与自定义维度
每个维度需填写独立评测提示词;提示词中可使用占位符 {{item}}(当前样本 JSON)、{{dimension_name}}、{{criteria}}、{{task_type}}、{{dimensions}}(当前维度一行说明)。模型需按该维度返回 scores 中含对应维度名的分数。
3) 上传数据
支持 文本(JSON / JSONL / XLSX)+ 图片 + 视频(含音轨)+ ZIP 压缩包,可任选一种或两者结合:
• 结构化数据文件(可选):JSON / JSONL / XLSX(第一行为表头)。
支持的列名(中英均可,系统自动识别):
id / 编号、
input_text / prompt / 提示词 / 输入的prompt、
output_text / 输出 / 回答、
video_url / 视频 / 视频地址 / 输出的视频、
image_url / 图片 / 图片地址、
frame_urls / 关键帧、
file / 文件名(用于与已上传媒体按文件名匹配)。
• 媒体文件(可选,多选):直接上传图片 / 视频,或一个 .zip(自动解包,兼容 Windows 中文 GBK 文件名)。未提供数据文件时每个媒体文件成为一条样本;提供数据文件时按行中 file 或 id 与文件名匹配,自动注入为 image_url / video_url(Base64 Data URL,视频完整包含音轨)。
• ⚠ 表格里不能写本机路径:file:///D:/... 或 C:\Users\... 这类是你电脑硬盘上的位置,浏览器受沙箱限制无法读取。遇到这种情况系统会自动取文件名,请把对应的视频 / 图片同时通过「媒体文件」输入框上传上来,系统会按文件名自动匹配。若是公网可访问的 http(s):// 链接则可直接写在表格里。
• 浏览器会把媒体读成 Base64 并随请求直传你的 API,单文件建议 ≤ 8 MB(视频尤需压缩),否则可能触发模型上下文或 API 限制。