CWM是一个仅解码器的密集型LLM,支持最大131k上下文长度训练。在通用代码和数学任务中表现优异:在 SWE-bench Verified 达到65.8% pass@1,在 LiveCodeBench 达到68.6%,在 Math-500 上达到96.6%,在 AIME 2024 上达到76%。 Meta发布了 Code World Model (CWM,论文:CWM: An ...