DeepSeek 坚定开源路线,密集更新 MoE、推理、多模态模型。近期,DeepSeek 连续发布并开源多个大模 型,其低成本、高性能的特性迅速引发全球用户的关注。
其中,2024 年 12 月 26 日发布的 DeepSeek-V3 为 671B 参数的自研 MoE 模型,运行时仅需激活 37B,在 14.8T token 的数据上进行了预训练;2025 年 1 月 20 日发布 的 DeepSeek-R1 为 660B 的高性能推理模型,对用户开放思维链输出,允许用户通过蒸馏技术借助 R1 训练其 他模型;2025 年 1 月 27 日,DeepSeek 在 Hugging Face 平台上传了视觉模型 Janus-Pro 和多模态理解模型 JanusFlow -1.3B,进一步在图像领域发力。
清华大学发布“清华大学:DeepSeek从入门到精通(2025)”,围绕Deepseek是什么?Deepseek能够做什么?如何使用Deepseek?对Deepseek进行了全面深入解读。
下载链接见右侧按钮
声明:1、学神资源吧资源均通过互联网公开合法渠道获取,资源价格仅代表资源收集整理的费用,绝不代表原作品本身的价值。资源仅供阅读测试,请在下载后24小时内删除,谢谢合作!2、由于部分资源中不可避免的存在一些敏感关键词,如果购买后提示网盘资源链接失效,或者提示此类资源无法分享的情况,您无需担心,只需要联客服联系为您补发资源即可。
3、版权归原作者或出版方所有,本站不对涉及的版权问题负法律责任。若版权方认为学神资源吧侵权,请联系客服或发送邮件处理。。。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理,微信: xueshen2025。