多模态 AI 自动化评测平台

上传数据文件后进行批量评测。必须使用你自己的「评测 API Endpoint」与「API Key」,请求由浏览器直接发往你的网关;本站不会、也不可用站长的密钥代付,避免产生站长的模型费用。

请务必为你的 API 配置 CORS,允许当前站点来源(浏览器地址栏的 origin),否则浏览器会拦截跨域请求。

1) 基本设置

2) 评测模板与自定义维度

每个维度需填写独立评测提示词;提示词中可使用占位符 {{item}}(当前样本 JSON)、{{dimension_name}}{{criteria}}{{task_type}}{{dimensions}}(当前维度一行说明)。模型需按该维度返回 scores 中含对应维度名的分数。

3) 上传数据

支持 文本(JSON / JSONL / XLSX)+ 图片 + 视频(含音轨)+ ZIP 压缩包,可任选一种或两者结合:
结构化数据文件(可选):JSON / JSONL / XLSX(第一行为表头)。
  支持的列名(中英均可,系统自动识别): id / 编号input_text / prompt / 提示词 / 输入的promptoutput_text / 输出 / 回答video_url / 视频 / 视频地址 / 输出的视频image_url / 图片 / 图片地址frame_urls / 关键帧file / 文件名(用于与已上传媒体按文件名匹配)。
媒体文件(可选,多选):直接上传图片 / 视频,或一个 .zip(自动解包,兼容 Windows 中文 GBK 文件名)。未提供数据文件时每个媒体文件成为一条样本;提供数据文件时按行中 fileid 与文件名匹配,自动注入为 image_url / video_url(Base64 Data URL,视频完整包含音轨)。
⚠ 表格里不能写本机路径file:///D:/...C:\Users\... 这类是你电脑硬盘上的位置,浏览器受沙箱限制无法读取。遇到这种情况系统会自动取文件名,请把对应的视频 / 图片同时通过「媒体文件」输入框上传上来,系统会按文件名自动匹配。若是公网可访问的 http(s):// 链接则可直接写在表格里。
• 浏览器会把媒体读成 Base64 并随请求直传你的 API,单文件建议 ≤ 8 MB(视频尤需压缩),否则可能触发模型上下文或 API 限制。

快速入口

查看本次报告 查看历史记录 管理访问密钥 退出登录