中国の中山大学とアリババグループに所属する研究者らは、AIが長期的にコードの品質を維持できるかを評価するベンチマークを提案した研究報告を発表した。


原文リンク: AIの“長期的なコードの保守能力”はどれほどか? 新たな評価テスト「SWE-CI」 中国チームが提案