Individual Contributor SWE-Lancer(Diamond)
OpenAI开源的评测大模型解决独立软件工程任务能力的评测基准
237
OpenAI
代码生成
Pass @K
模型简称 | 得分 | 发布机构 | 发布时间 | 参数规模(亿) |
---|---|---|---|---|
GPT-4.1 mini | 33.0 |
![]() |
2025-04-14 | 未知 |
GPT-4.5 | 32.6 |
![]() |
2025-02-28 | 未知 |
GPT-4o | 23.3 |
![]() |
2024-05-13 | 未知 |
GPT-4.1 nano | 15.3 |
![]() |
2025-04-14 | 未知 |
GPT-4.1 | 14.4 |
![]() |
2025-04-14 | 未知 |