欢迎光临
一起进步吧

标签:deepseek

普通人如何免费用上满血版Deepseek-R1-AI学用

普通人如何免费用上满血版Deepseek-R1

满血版 deepseek-R1, 参数 671B,理论上需要 350G 以上显存/内存才能够部署 FP4 的量化版本。对于家用电脑来说,这是不可能的,即使采用压缩、分层等优化方法,使用最新的 Nvidia RTX5090 显卡(32G 显存),每秒低于 10tokens 的推理输出速度不具备实用价值。普通人能实际部署的仅仅是 Deepseek-R1-distill 蒸馏版模型,这是大家可以真正用得上的版本;模型大小从 1.5B 到 70B 都有。那么问题来了,普通人为什么要部署呢?作者是没有“雅兴”在自己电脑上部署大模型的,而之前采用 tencent cloud studio 部署的最大尺寸就是 14b,距离“白嫖”上 671b 满血版本还差得远。 在线使用方面,deepseek 官方频繁提示“服务器繁忙,请稍后再试”并且停止了 API 充值,普通用户使用 API 可以是解决在线翻译、本地 UI 调用等需求的,好在 Deepseek-R1 是开源的,那我们就来看看哪些地主家有余粮(显卡/计算卡),要求当然是提供全尺寸 R1 模型的推理服务和一定的免费 API 额度。 Nvidia Nvidia 要是没余粮了,那其他家就更不可能有余粮了。无需注册,打开「Nvidia NIM Deepseek-R1」就可以在网页端直接使用上满血版的 deepseek r1 推理服务了,「Nvidia NIM Deepseek-R1」是当下最稳定、响应最快的平台,没有之一。目前,匿名用户使用 deepseek r1 会存在排队现象,但一般不会超时。本文示例在不进行注册登录的前提下,对话排序为第 149(line 149),发送问题到实际输出显示的等待时间约 10 秒,老黄家的余粮一定是最充足的。 作为测试对比,在 deepseek 官方 api 调用出现错误的情况下,匿名状态在网页端翻译本文标题,没有任何排队等待,使用下文的硅基流动 api 也很慢,某为不是纯国产不受任何制约吗?舍不得堆量!登陆后同样使用 nvidia nim 提供的 api 也没有报错,并且响应输出快速。 Nvidia 提供免费免注册的在线全尺寸 deepseek r1 推理服务的同时,也可以注册 nvidia nim 账号以使用 api,注册用户赠送 5000 点积分。在右侧 api 调用代码区,可以直接使用给出的 base_url(https://intergrate.api.nvidia.com/v1),api_key 则可以通过点击右上方的『Get API Key』进行注册并创建。 点击页面右上角的『Login』或右侧的『Get API Key』,都可以打开注册界面。输入电子邮箱开始注册,注册过程参考「视频分享」。 完成注册后,将获得 1000 点积分,使用企业邮箱、额外填写企业信息,进一步获得 4000 点积分,也就是说,普通用户通常可以获得 5000 点积分。企业信息的角色、行业等都可以随意填写,但建议尽量保证企业名称的真实性。填写完成之后点击『Continue』就可以完成填报,会自动进行验证、积分增加和页面重定向。 接下来,就可以将创建 API key 并在相关应用中使用。本文以沉浸式翻译为例,打开设置后,选择『翻译服务』,不要下拉选择 deepseek,而应该点击顶部的添加OpenAI兼容服务。 在自定义 AI 设置页面,关键信息如下: API 接口地址(Base_url):https://integrate.api.nvidia.com/v1/chat/completions API KEY:你的 api key 模型(Model name):deepseek-ai/deepseek-r1 填写完毕之后,可点击页面顶部右侧的『点此验证服务』进行验证,填写无误的情况下,都会验证成功。接下来,就可以无视 deepseek 官方抽疯,继续爽玩全尺寸 deepseek-r1 了。 硅基流动 硅基流动是一家中国...

赞(0)webmasterwebmaster工具 阅读(879)去评论
在cursor中配置添加deepseek v3、google gemini2模型-AI学用

在cursor中配置添加deepseek v3、google gemini2模型

近期国产大模型 deepseek v3 刷屏,根据其发布的数据,deepseek v3 在所有的开源大模型中位列榜首,评测成绩与当今最先进的闭源模型 Claude-3.5-Sonnet、GPT-4o 等相比也不分伯仲。更重要的是价格便宜,每百万输入 token 优惠期内 0.1 元。如果把 deepseek v3 接入到 cursor 中,比起每月 20$ 美元真的很香。能接入吗?当然可以!cursor 基于 vscode,vscode 下 cline 能做的 cursor 必定也支持。cursor 中不仅能接入 deepseek v3,还能接入 gemini 2.0 以及其他你心仪的模型。本文简要介绍接入 deepseek v3 和 gemini 2.0 flash 的方法,也为大家提供在 cursor 中接入其他非官方/第三方大语言模型的思路。 在 cursor 中的操作简单 5 个步骤: 第一步 点击 cursor 上方的齿轮图标,打开 cursor 设置 第二步 选择第二项『Models』后,点击模型列表底部的『+Add  Model』,添加模型。模型名称为 deepseek-chat,输入后回车即可。 第三步 在下方 OpenAI API Key 处输入 API Key 和 Base URL,Base URL 为 https://api.deepseek.com 或 https://api.deepseek.com/v1。 第四步 除新添加的 deepseek-chat 外,取消模型列表中其他所有模型的勾选(或取消所有 OpenAI 模型的勾选)。 第五步 点击 API Key 右侧的『Verify』按钮,稍等片刻即可完成模型添加。 完成模型添加之后,就可以在 chat 或 composer 模式中选择、使用 deepseek v3 了,也可以彻底甩掉梯子,不用再忍受“慢吞吞”的响应回复了。 Gemini 2.0 flash 也可以添加到 cursor 中,与 deepseek v3 稍有不同,新版的 cursor 模型列表已经内置了 gemini 2.0 flash,不需要在额外添加模型(Add model)。 同样,Gemini API key 的输入,自然应该在独立的 Google API Key 板块,在进行验证时无需取消其他模型的勾选,当前版本的 cursor 默认的 google LLM 就是 gemini...

赞(0)webmasterwebmaster工具 阅读(791)去评论

Cline+Deepseek v3-AI编程最具性价比搭配-AI学用

Cline+Deepseek v3-AI编程最具性价比搭配

DeepSeek 新版 v3 模型正式发布,AI 饭圈转疯了!延续便宜大碗特点的基础之上,DeepSeek V3发布即完全开源,并且网页在线和 API 同步更新。Deepseek官方还延续了一贯的新版本模型发布送 token 的优良传统,国内首注册的新用户赠送等值¥10 的 500万 token。AI 编程/开发领域竞争日趋激烈,cline、cursor、github copilot 等可以接入、堪用的模型越来越多。小朋友全民信息学的今天,普罗大众也应该具备基本的编程思想,已经或即将为人父母的,自然也不能缺席。用了 AI,仍然可以不会,但不能不用。 作者并非程序员,但参考一些开源小项目,是绝不会从头造轮子的。无论是 shell 脚本还是流行的 go、js、rust 程序,借助 AI copilot 应用,可以大大提高效率。热门的 cursor、codeium/windsurf 都有尝试,但免费续杯太折腾,而且对网络环境有要求。Cline+deepseek 组合应该是尤其适合非专业人士使用的,cline 免费、deepseek 便宜,个人认为即便对于专业开发领域的需求也足以应付。 Cline Cline(原Claude Dev)是一个可以使用你的命令行界面和编辑器的人工智能助手。在热门的 AI 编程助手工具中,cline 是免费、开源的,几乎允许接入所有热门大模型的 API。 Cline 作为 VSCode 插件安装,搭建开发环境更加简便。Cline 用来学习编程语言或者开发框架是非常有用,可以快速帮你搭建起一个可用的 demo,自动识别搭建过程中出现的错误并进行改进。Cline 支持大量主流的大模型,由于支持 OpenAI compatible API 和 Ollama,也就是说基本可以使用绝大部分大模型帮助完成任务。尽管当前在 AI 编程领域代码的天花板取决于 Claude 3.5 Sonnet,Cline 也推荐 Claude 3.5 Sonnet,但 deepseek v3 的发布,应该会在 Cline 2.0 以来使用 customized XML tags 的基础上,获得相比之前更好的效果。 当然,最新可免费接入使用的是 gemini 2.0 flash。Gemini 2.0 可直接登录「 Google AI studio」创建 API key,在 cline 中设置即可。 普通用户要撕开“开发者”的神秘面纱,尝试 AI 编程与开发,可以按照以下步骤安装使用 cline: 首先,在「vscode 官方站点」下载、安装 VSCode。 接下来,打开 VSCode,在扩展市场中搜索 cline ,点击第一个搜索结果右侧的『安装/Install』。 Deepseek v3 Deepseek v3 发布以来,一直在进行注册即送体验金(10元/500万tokens)的活动。无论是网页端还是接入API,只要输入国内 +86 手机号注册就可以获得 500 tokens 的赠送额度。 在「Deepseek 官网」点击点击『接入 API』并通过手机号注册,500 tokens 实时体现,无需额外操作。 进入接入 API 页面后,点击左侧的『API keys』,再点击『创建 API key』,将创建的 API key 复制备用,在 cline 等接口工具中就可以使用了。 Deepseek v3...

赞(0)webmasterwebmaster工具 阅读(617)去评论

更好地应用AI

共同记录与分享优秀的合规AI平台、AI应用实践、工具以及AI领域最新动态,无论是熊孩子的教育还是一些工作、生活中的任务,都可以让AI这一强大的“副驾驶”帮助我们更接近一个个小目标

关于我们联系我们

登录

找回密码

注册