欢迎光临
一起进步吧

一分钟:免费在Cloud Studio上部署、使用Deepseek-R1:14B

腾讯云 2 月 2 日宣布,DeepSeek-R1大模型可一键部署至腾讯云 HAI(腾讯云高性能应用服务)上,开发者仅需 3 分钟就能接入调用。通过 HAI,开发者可以省去买卡、装驱动、配网络、配存储、装环境、装框架、下载模型等繁琐步骤,只需两步即可调用 DeepSeek-R1 模型。国内可用的云端 AI 算力平台,百度飞浆 AI Studio 仅可部署运行 PaddlePaddle 深度学习开发框架,而作为国内竞品的「腾讯 Cloud Studio」则没有这一限制,并且每月可免费使用 10000 分钟,随用随开、即时关闭,是轻量化 DeepSeek-R1 部署的绝佳平台。这不,甚至有传闻说腾讯是 deepseek 背后的较大股东。

在腾讯 Cloud Studio 以及 Google Colab、SageMaker Studio Lab 等提供免费 16GB 显存的 GPU 平台上,没有必要委屈自己部署 7b、8b 模型,都是可以部署 14b 模型的。本文将快速(1分钟)在 tencent cloud studio 部署 deepseek-r1:14b 的过程进行演示,在 google colab 等其他平台上同理。具体操作过程可参考对应「视频分享」。

腾讯 Cloud Studio

提供免费配额部署 AI 模型应用的主流云端算力平台包括 Google colab、Amazon SageMaker Studio Lab、Kaggle、Gradient、阿里云天池、百度 AI Studio、腾讯 Cloud Studio等。

Google Colab」- 没有总计使用时间限制,每次连续使用时间不超过 12 小时,提供多种 GPU 选项;

Amazon SageMaker」- 作为对标 google colab 的竞品,SageMaker Studio Lab 提供 Tesla T4 GPU,显存为 16GB,持久化存储空间 15 GB,每天运行时间不超过 8 小时,单次使用时间被限制为 4 小时;

Kaggle– 提供 16GB 显存的 P100,每周总运行时间不超过 40 小时,单次限制 6 小时,持久化存储空间 20GB;

Gradient」- 提供 8vCPU和 30GB RAM,Quadro M4000 GPU 仅 8GB 显存,且持久化存储空间只有 5GB;

Azure 100/student」- Microsoft Azure 学生账户的 100 美元赠金可用于购买、使用 GPU 算力资源,可以选择 16GB 或更大显存的 Tesla T4 GPU 以及 50GB 的持久化存储空间;

阿里云天池」- 提供总计 60 小时 GPU 使用时间,显存 16 GB,每次可连续使用 8 小时;

百度 AI Studio」- 提供多种 GPU 选项,仅支持 paddlepaddle 框架,没有任何吸引力。

和国内的几家主流平台不同,腾讯 Cloud Studio 目前没有设置总免费配额,而是按月赠送体验时长(配额),非常良心。Cloud Studio 提供两类工作空间,即通用工作空间、高性能(HAI)工作空间,对这两类空间,每月分别赠送的体验时长为 3000、10000 分钟。

  • 通用工作空间

免费版规格为 1 核处理器、2G 存储(实际为突发可使用内存)、4G 系统空间,不消耗配额(体验时长)。额外所需的资源则使用赠送的月度 3000 分钟体验时长进行兑换/扣费。要注意的是,通用工作空间体验时长用完是不会自动关机的,而是转为后付费计划,因此务必即用即开、即停即关。相比早已取消免费配额的 SCF(Serverless Cloud Function),Cloud Studio 通用工作空间是更好的升级替代,网络流量费用务必自行查阅、知晓。

levels
  • 高性能工作空间

高性能工作空间,为高性能应用服务 HAI 提供的 GPU 空间。每月赠送体验时长至 10000分钟,可兑换免费基础型高性能工作空间的使用,而免费基础型使用的就是 HAI 基础型空间(T4 16GB显存、32GB内存)。每个空间每分钟扣除 1 分钟体验时长,多个空间同时运行会叠加计时,直到体验时长用完,会自动关机。对于付费层级的 HAI 基础型和进阶型,因为用完就自动关机,所以不必担心 GPU 资源被额外收费,但持久化存储空间和网络流量就需要注意了,在运行时免费搭配 80GB 云硬盘(包括 30GB 系统盘及 50GB 数据盘)及每月 500GB 的公网流量。即使关机,超过 80GB 的存储资源也同样按照小时计费,超出 500GB 的网络流量为 0.8元/GB。

tencent hai

Ollama 部署 Deepseek-R1:14B

腾讯 Cloud Studio 免费基础型使用 HAI 基础型高性能工作空间,默认免费搭配 80GB 云硬盘,包括 30GB 系统盘和 不到 50GB 的数据盘,结合免费的 HAI 基础型 GPU 资源 16GB 的显存,最高可以部署、运行 deepseek-R1 14B,相比本地部署一般都是 7B、8B 的版本,性能、体验更好,10000 分钟/月体验时长可以完成不少零碎的推理任务。与 HAI 基础型的差别在于不能使用工作台功能以及会自动关机,不能使用工作台功能意味着所有工作都需要在控制台完成,需要敲命令行,而不是点鼠标,自动关机意味着不能持续占用计算资源,最多 24 小时。其他差别可自行查阅产品文档,本文不再赘述。总体上来看,如果一直保持 10000分钟/月的赠送体验时长,那么在云端 AI 算力平台领域是非常有竞争力的,至少是国内同类平台的 no.1。

登录后,选择 DeepSeek R1,就可以直接部署好完整的 deepseek r1:7b。如果需要部署 14b,则可删除已有的 7b,加载运行 14b 模型即可。这里示例选择 olama,默认预置的 llama3 可在部署完成后删除。

select model

部署完成后,会显示“运行中”的提示。部署失败(显示“失效”)的原因多由于资源有限,过于火爆导致缺少库存,可以删除后再重新部署,一般多尝试几次都可以部署成功。

ollama

可以使用快捷 “CTRL+~” 切换到终端控制台,以输入命令。免费基础型只能使用控制台命令,不能使用工作台。

switch console

输入命令行貌似是个门槛,其实很简单,可直接输入最后两条(ollama rm llama3、ollama run deepseek-r1:14b),等待自动下载完成后运行即可。

shell of linux

-以人类可读的方式显示存储空间信息。

df -h

-查看可使用内存信息,单位为 m

free -m

– 查看显卡信息

nvidia-smi

-查看并删除预加载的 llama 模型

ollama list
ollama rm llama3

-加载运行 deepseek r1 14B

ollama run deepseek-r1:14b

Cloud Studio 为 HAI 基础型提供了最高 100Mbps 的网络带宽,月流量配额 500GB,模型自动下载过程会需要一定时间,如果长期卡死,可杀死上述进程后再运行一遍。如果一切正常的话,deepseek r1:14b 就运行起来了,可以在控制台和 deepseek r1 进行对话了,非常符合腾讯官方所强调的“2步、3分钟”的易用性。

在推理(对话)过程中,<think></think>包裹的内容就是 deepseek r1 的思维链,closeai(openai)被迫发布甚至免费提供的 O3 mini 也是有的,但并不会显示。奥特曼前几日惺惺作态表示了对 open 的认可,但并不作为当前优先选项。O3 mini high 的效果可能会比 deepseek 好,但需要翻墙,Close 名声又实在太臭,没有跨代式的差异,还是拉倒吧。

think of deepseek

要退出 deepseek 对话,可直接输入 “/bye”,“/clear”则用于清除上下文,当发现 deepseek r1 输出存在偏差并且难以纠正时,清除上下文是最佳方式。

exit deepseek r1

注意事项

WebUI

Cloud Sudio 不能安装 docker,并且没有配置公网 ip,需要通过内网穿透将 deepseek 发布公网,才能接入各类(包括本地)WebUI。内网穿透,可以使用 cloudflared 或之前介绍过的各种内容穿透工具。cloudflared 不需要接入 cloudflare 网络(warp 或 zero trust),只需要将运行 deepseek 的 cloud studio 虚拟实例配置为服务端。

实例创建失败

Deepseek 持续火爆,腾讯的计算资源是有限的,出现创建失败的情况在所难免,换个时间或者删除后重新、多次尝试,一般都可以成功创建需要的 HAI 基础型实例。

控制台命令

虚拟实例就是台 ubuntu 主机,一般会配置一张 T4 显卡和 80GB 持久化存储空间,实例不删除,存储空间会一直保留。腾讯 Cloud studio 给予的权限高于 google colab,绝大多数命令都可以成功运行,所以,安装内网穿透服务端也不在话下。

SSH 与 SCP

Cloud studio 支持密钥验证方式的 ssh 连接,自然也支持 scp 上传、下载文件。所以,对于开发者而言,webui 并不是必须的。

10000分钟体验时长

部分小伙伴可能无法获得 10000 分钟的体验时长,官方文档明确显示了“至多 10000 分钟”的用词,应该是区分有无云服务购买记录的。毕竟,任何商家都不喜欢始终一毛不拔的白嫖党。

更多精彩,敬请关注「老E的博客」!

赞(0)
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《一分钟:免费在Cloud Studio上部署、使用Deepseek-R1:14B》
文章链接:一分钟:免费在Cloud Studio上部署、使用Deepseek-R1:14B
本站信息及资源仅供个人学习交流,请于下载后24小时内删除,不得用于商业用途,否则由此引起的法律问题须自行承担。

评论 抢沙发

更好地应用AI

共同记录与分享优秀的合规AI平台、AI应用实践、工具以及AI领域最新动态,无论是熊孩子的教育还是一些工作、生活中的任务,都可以让AI这一强大的“副驾驶”帮助我们更接近一个个小目标

关于我们联系我们

登录

找回密码

注册