官媒认证顶流!DeepSeek 凭啥打破 OpenAI 纪录,成为新晋顶流?
春节期间,“DeepSeek”的AI对话模型火遍社交平台,仅2岁的DeepSeek(该团队成立于2023年)在众AI应用中突出重围,在全类别大模型排名中飙升至第三,登上全球140个国家应用商店榜首,成为2025的开年“爆款”,是人民日报认证的“全球顶流”。
DeepSeek-R1 为何能在全球爆火出圈?
DeepSeek-R1 是国内深度求索团队推出的一款高性能大模型,它在多项自然语言处理任务中表现出色,在数学、代码生成、逻辑推理等领域的表现更是对齐 OpenAI o1 正式版。
在训练成本方面,DeepSeek-R1 的预训练费用仅为约550万美元,远低于行业主流模型的训练成本,如 GPT-4 花费10亿美元训练。DeepSeek-R1 的发布一举攻破了这场 AI 价格战,引发了人们对 AI 行业高额资本投入必要性的思考。
更值得一提的是,DeepSeek-R1 模型免费供商业使用且完全开源,在API定价方面,更是比 OpenAI 低了一个数量级,真的可以被称之为“AI 界的活菩萨”了。
曾经 OpenAI 被认为是 AI 领域无可替代的一员大将,如今 DeepSeek 以低成本高性能的优势让众多用户争相体验,乃至许多行业大佬都不得不对其投来关注的目光。
目前,DeepSeek-R1 有不同规模的蒸馏版本,参数量从1.5B到70B不等,用户可以根据自己的硬件配置选择合适的模型进行部署。
说再多不如亲自感受 —— 算力云平台为大家准备了「开年福利」,邀请大家成为算力云福利体验官:平台已在高端显卡4090中预装好 Ollama 镜像,并部署了 DeepSeek-R1 模型,2月11日-3月10日内供算力云用户免费使用。用户仅需登录算力云控制后台,点击控制台右下角deepseek的小鲸鱼图标即可进入福利入口。
在弹出的对话框里,您可以直接在终端中输入问题或指令,与DeepSeek-R1进行对话:在终端中输入你的问题或指令,模型会立即生成回复,可尝试用它处理任务。
1.5B 的小参数模型,普通电脑配置或许就能运行,但仅适合做一些基础应用,如简单的文本生成,日常对话等使用场景;像 70B 的大参数模型,在复杂任务处理上的能力更加强大,在处理代码编写任务,数学与逻辑推理等应用场景也能如鱼得水,相应的,它对硬件的算力要求更高,通常需要高端的服务器、大量的 GPU 内存算力来支持其运行。
因此,普通电脑用户通过租用 4090显卡 等高性能的GPU资源,结合 Ollama 和 DeepSeek-R1 就能实现轻松部署和运行大模型,即使是处理复杂的推理任务也能提供强大的支持。
平价亲民的AI的时代已经来临,快前往开启你的大模型探索之旅吧!
以上是算力云今日内容分享,感兴趣的朋友可以多多关注我们。
|
|
|
|
|