中文精确指令遵循测评基准(开源版)
使用方式:
python superclue-evaluation.py superclue-all-jqzl-deepseek-r1-0528.json deepseek-r1-0528
文件说明:
superclue-all-jqzl.json里面是prompt和评测代码,
superclue-all-jqzl-deepseek-r1-0528.json 是抓取的r1-0528的回答,
deepseek-r1-0528表示answer key
| Name | Name | Last commit date | ||
|---|---|---|---|---|