“哦~好像有点印象,怎么,这篇R1有很大的提升吗?”他一边说着一边看向下面的摘要部分。
“Reinfortlearning(强化学习)?这不是和我们现在做的方向一样吗?”不过当他看到第一张图片的时候不由得歪了歪脑袋,发出了同样的惊呼:“Holy*?真的假的?”
图片上面显示了,其效果几乎和GPT-o1持平,而且文中写到了其推理成本的二十分之一还不到。
Leo苦笑着摇头“不知道,我希望是假的,但我感觉应该是真的。”
搞科研最为悲伤的事情之一——你有了一个很好的idea,并且已经做了一段时间,就在快要有成果的时候,却发现人家已经做出来了,而且比自己做的更好。
好消息:LLM有了新的突破,坏消息:你论文白写了。
“哎~没办法,我再看看吧,如果是真的,估计老板肯定会要求我们复现的。”
“说的也是。”
和他们一样反应还有很多人,公司的工程师们,高校的学生老师,对搞科研的人来说熬夜是常态,所以哪怕论文是在夜里发的也有很多人看到了这篇文章。
仅仅是论文发布后的第二天,各个视频网站或者学术论坛上就涌现出了不少针对R1的解读。
之后几天,随着不断有人成功复现出DeepSeek,谷歌、Meta等大厂的AI部门负责人连夜召集紧急会议。
内容未完,下一页继续阅读