4月10日,字节跳动豆包大模型团队正式开源首个多语言类 SWE 数据集——Multi-SWE-bench,可用于评估和提升大模型“自动修 Bug”能力。在 SWE-bench 基础上,Multi-SWE-bench 首次覆盖 Python 之外的 7 种主流编程语言,是真正面向“全栈工程”的评测基准。其数据均来自 GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。
字节跳动豆包大模型团队正式开源首个多语言类SWE数据集
0次浏览
发布时间:2025-04-10 14:29:00
相关文章
- 2025-05-10 · 851度电池,亿纬锂能想让商用车也用上大电池
- 2025-05-09 · “天下黄河洛阳美”主题原创歌曲征集
- 2025-05-07 · “患儿把生命托付给我们,我们要把春天还给他们”——记衡阳市中心医院普儿科护理团队
- 2025-05-07 · 迈瑞医疗:以数智化撬动国际化 冲刺全球医疗器械前20强
- 2025-05-07 · “空中之眼”助巡检,“工匠之心”促新质 记全国劳动模范何涛
最新文章
热门文章