选择
法币
虚拟币
"" 没有结果
找不到符合您搜索条件的任何内容。请使用其他关键词再试一次。
阿里云确认李飞飞团队的s1模型是基于Qwen训练
Panews 2 小时前
PANews 2月6日消息,据新浪科技,李飞飞等斯坦福大学和华盛顿大学研究人员以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型,该模型在数学和编码能力测试中的表现与OpenAl的o1和Depsek的R1等尖端推理模型类似,引发广泛关注。不过很快,该s1模型被指“并非从零开始训练”,其基座模型为“阿里通义千问(Qwen)模型”。对此,记者向阿里云方面求证,阿里云方面确认了这一消息,并回应称:“他们以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,在16块H100GPU上监督微调26分钟,训练出新模型s1-32B,取得了与OpenAI的o1和DeepSeek的R1等尖端推理模型数学及编码能力相当的效果,甚至在竞赛数学问题上的表现比o1-preview高出27%。”
- 喜欢使用社交软件关注?关注我们的 Twitter,或者加入 Telegram!
- 想关注最新资讯? 下载CoinCarp App吧
- 有新闻需要爆料,官方公告需要发布? 来给我们发邮件吧![email protected]
免责声明:CoinCarp 上的信息均为作者引用。这并不代表CoinCarp对是否购买、出售或持有任何投资的意见。建议您在做出任何投资决策前自行研究。使用所提供的信息,风险自担。更多信息请参阅免责声明。