谁是本地部署的王者——阿里千问开源大模型 QwQ 32B 大战 DeepSeek R1 32B 问题1 - 复杂逻辑陷阱题:如果所有会飞的动物都是鸟... 📅 2025年03月08日 · ☕ 9 分钟 DeepSeek-R1 32B 和 QwQ-32B 一些问题,测试其性能。
DeepSeek 疯狂开源周完全回顾 📅 2025年02月24日 · ☕ 7 分钟 DeepSeek 不仅开源了模型,第一时间公开了训练方法。上周五,DeepSeek 宣称,将在下周,也就是本周连续开源5个项目库。果不其然,本周一,DeepSeek 开源了生产环境的加速工具了 FlashMLA。
条条大路通罗马,DeepSeek 满血版汇总 📅 2025年02月15日 · ☕ 2 分钟 DeepSeek 满血版需要满足三个条件:参数要大,深度思考,联网搜索。DeepSeek 官网无疑是最好的,但是经常卡顿,所以有了第三方平台,提供了相似的功能和服务。于是我收集了一些 DeepSeek 满血版的第三方平台,试用了其中
大模型开源与传统软件开源的区别 📅 2025年02月04日 · ☕ 3 分钟 大模型(如大语言模型、多模态模型)的开源与传统软件工程开源在核心理念上有相似之处,但在技术复杂性、数据依赖性、应用场景等方面存在显著差异。本文对比了两者的核心差异,探讨了大模型开源的意义和挑战。