Skip to content

复旦白泽大模型安全基准测试集(2024年夏季版)

Notifications You must be signed in to change notification settings

WhitzardIndex/WhitzardBench-2024A

Repository files navigation

复旦白泽通用大模型安全基准测试集

访问量

2024年夏季版,欢迎挑战🐉(版本号:WhitzardBench-2024A)

  • 2024年6月26日 20余家国内外大模型夏季赛天梯结果公布,请移步复旦白泽指数(WhitzardIndex)
  • 2024年6月26日 复旦白泽安全基准测试集(2024年夏季版)部分发布
  • 入门级:whitzardbench-2024a-easy-level.csv

  • 进阶级:whitzardbench-2024a-intermediate-level.csv

  • 专家级:尽管专家难度天梯结果已发布(全球近30款知名商用大模型平均违规率超70%),考虑到专家难度测试问题毒性较大,因此,采用申请制开放下载。如有需要,请通过以下邮箱与我们联系:[email protected]

持续监测AI大模型安全水位,复旦白泽一直都在

我们是来自复旦大学系统软件与安全实验室的安全研究团队,欢迎与我们共同探讨AI大模型安全。

联系方式:[email protected]

如果对您有帮助,请为复旦白泽点亮Star⭐⭐

Star History Chart

About

复旦白泽大模型安全基准测试集(2024年夏季版)

Resources

Stars

Watchers

Forks

Packages

No packages published