- 2024年6月26日 20余家国内外大模型夏季赛天梯结果公布,请移步复旦白泽指数(WhitzardIndex)
- 2024年6月26日 复旦白泽安全基准测试集(2024年夏季版)部分发布
-
入门级:whitzardbench-2024a-easy-level.csv
-
进阶级:whitzardbench-2024a-intermediate-level.csv
-
专家级:尽管专家难度天梯结果已发布(全球近30款知名商用大模型平均违规率超70%),考虑到专家难度测试问题毒性较大,因此,采用申请制开放下载。如有需要,请通过以下邮箱与我们联系:[email protected]
我们是来自复旦大学系统软件与安全实验室的安全研究团队,欢迎与我们共同探讨AI大模型安全。
联系方式:[email protected]