DeepSeek:deepseek-reasoner

模型介绍

性能对齐 OpenAI-o1 正式版

DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。

image 1

滚动至顶部
申请收录
请填写您的推荐网站,我们将尽快收录