Navigation menu

新闻中心

DeepSeek过多少周另有大招!春节期间加班加点地推

近期,科技界最为热议的词汇当属“DeepSeek”。据悉,DeepSeek-R1在数学、代码天然言语推理等范畴的表示曾经可能与OpenAI的GPT-1正式版相媲美,其火爆水平囊括寰球。这一冲破性停顿不只彰显了DeepSeek团队的技巧气力,也激发了业界对人工智能将来开展的普遍探讨。克日,DeepSeek的研讨员在线流露了一个令人奋发的新闻:R1的练习进程仅仅耗时两到三周。这一高效的练习速率无疑为DeepSeek的进一步研发奠基了坚固的基本。据悉,研讨员们在春节时期也未停歇,持续尽力推动研讨,以期在将来推出更多分量级的模子。多少天前,Daya Guo宣布了一条推文,分享了他春节时期最为高兴的事件——亲眼目击了R1-Zero模子机能曲线的“连续增加”,并深切感触到了强化进修(RL)的强盛力气。Daya Guo的言辞中流露出对DeepSeek将来开展的动摇信念跟等待。在复兴网友对于DeepSeek R1的成绩及公司后续打算时,Daya Guo流露,DeepSeek的R1只是一个开端,外部研讨正在疾速推动。他夸大,研讨员们在春节时期始终在加班加点地推动研讨,以期尽快向社区宣布愈加优良的模子。当被问及“假如不是机密的话,此次RL练习跑了多久?”时,Daya Guo回应称,660B参数的R1-Zero跟R1是在V3版本宣布后才开端练习的,全部进程大概破费了2-3周的时光。别的,Daya Guo还流露团队正在实验将R1利用于情势化证实情况,并盼望尽快向社区宣布愈加优良的模子。从Daya Guo的言辞中不丢脸出,DeepSeek团队在这方面曾经获得了明显的停顿,将来或将有更多存在推翻性的模子问世。