deepseekv3是近期震惊全球的知名AI大模型,这款全新的AI大模型拥有着和国外的chatgpt一样的性能,但是目前deepseekv3却是免费开放向大家使用的,不收取任何的费用,而chatgpt使用的费用却更加的高昂。
DeepSeek 官方推出的 AI 助手,免费体验与全球领先 AI 模型的互动交流。
使用一经开源即在海内外引起震动、总参数超过 600B 的 DeepSeek-V3 大模型,多项性能指标对齐海外顶尖模型,用更快的速度、更加全面强大的功能为你答疑解惑,助力高效美好的生活。
性能对齐海外领军闭源模型
DeepSeek-V3 为自研 MoE 模型,671B 参数,激活 37B,在 14.8T token 上进行了预训练。
论文链接:
https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdfDeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。
百科知识:DeepSeek-V3 在知识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平相比前代 DeepSeek-V2.5 显著提升,接近当前表现最好的模型 Claude-3.5-Sonnet-1022。
长文本:长文本测评方面,在DROP、FRAMES 和 LongBench v2 上,DeepSeek-V3 平均表现超越其他模型。
代码:DeepSeek-V3 在算法类代码场景(Codeforces),远远领先于市面上已有的全部非 o1 类模型,并在工程类代码场景(SWE-Bench Verified)逼近 Claude-3.5-Sonnet-1022。
数学:在美国数学竞赛(AIME 2024, MATH)和全国高中数学联赛(CNMO 2024)上,DeepSeek-V3 大幅超过了所有开源闭源模型。
中文能力:DeepSeek-V3 与 Qwen2.5-72B 在教育类测评 C-Eval 和代词消歧等评测集上表现相近,但在事实知识 C-SimpleQA 上更为领先。
生成速度提升至 3 倍
通过算法和工程上的创新,DeepSeek-V3 的生成吐字速度从 20 TPS 大幅提高至 60 TPS,相比 V2.5 模型实现了 3 倍的提升,为用户带来更加迅速流畅的使用体验。
API 服务价格调整
随着性能更强、速度更快的 DeepSeek-V3 更新上线,我们的模型 API 服务定价也将调整为每百万输入tokens 0.5 元(缓存命中)/ 2 元(缓存未命中),每百万输出tokens 8元,以期能够持续地为大家提供更好的模型服务。
与此同时,我们决定为全新模型设置长达45天的优惠价格体验期:即日起至2025年2月8日,DeepSeek-V3 的 API 服务价格仍然会是大家熟悉的每百万输入tokens 0.1元(缓存命中)/ 1元(缓存未命中),每百万输出tokens 2元,已经注册的老用户和在此期间内注册的新用户均可享受以上优惠价格。
开源权重和本地部署
DeepSeek-V3 采用 FP8 训练,并开源了原生 FP8 权重。得益于开源社区的支持,SGLang和LMDeploy 第一时间支持了 V3 模型的原生 FP8 推理,同时TensorRT-LLM和MindIE则实现了 BF16 推理。此外,为方便社区适配和拓展应用场景,我们提供了从 FP8 到 BF16 的转换脚本。
“以开源精神和长期主义追求普惠 AGI”是 DeepSeek 一直以来的坚定信念。我们非常兴奋能与社区分享在模型预训练方面的阶段性进展,也十分欣喜地看到开源模型和闭源模型的能力差距正在进一步缩小。
这是一个全新的开始,未来我们会在 DeepSeek-V3 基座模型上继续打造深度思考、多模态等更加丰富的功能,并将持续与社区分享我们最新的探索成果。
先看一下使用效果:
使用效果如下:
下面给大家详细讲解一下我的搭建方法,下载书籍我使用的是zlibrary,https://zh.z-lib.gs/
构建知识库我使用的是https://cherry-ai.com/ 这个软件,他是一个集成了多个AI模型的客户端。
主要的功能有下面这些
知识库构建
下面我们就可以开始去构建我们自己的知识库了,首先第一步我们需要设置解析书籍的模型,将书籍向量化,也就是变成一个个单词方便模型进行读取。
进入地址 https://siliconflow.cn/zh-cn/ 注册一个账号
然后在模型里添加BAAI/bge-m3模型,这是一个免费的模型
看到最下面就添加成功了,然后我们填入api密钥
将密钥填写到对应的位置之后,就可以开始上传我们的书籍,点击左侧知识库
点击添加,名称自己可以进行设置,模型选择刚才设置的模型
点击添加文件,上传刚才下载的书籍,这里只支持几种格式要记得进行转换
deepseek模型配置
等待向量化完成就可以了,接下来需要配置deepseek模型,因为硅基流动里是没有V3模型供我们使用的,所以我们需要自己去注册Deepseek官方的api。
点击下面的按钮,先打开deepseek的使用
然后我们进deepseek的官方 https://platform.deepseek.com/去充值并获取api,目前deepseek价格非常便宜,充10块钱送10块钱就可以使用百万token,完全够我们使用了。
充值之后点击左侧API keys,创建一个API key然后填到上面要填api key的地方就可以开始使用了。
使用方法
进入默认的助手
点击知识库,选择导入的书籍
选择模型,这里的deepseek chat就是我们对应的模型,然后进行提问即可。
感谢大家的阅读,给大家准备了一个精心整理的黑科技工具箱。包含各类日常使用的工具以及好用的AI提效工具。
版本:v1.1.4 语言:中文 名称:DeepSeek 版本:1.1.4 包名:com.deepseek.chat MD5值:8d134587ffd8318e59c798c2d46c6d20 厂商:杭州深度求索人工智能基础技术研究有限公司 官网:https://chat.deepseek.com/ 隐私政策:点击查看
同类排行
grok3下载免费安装安卓版(xai)v1.0系统软件 / 16.5M / 中文grok3这是一款由马斯克旗下开发的Ai大模型Grok,这款
下载mt管理器2025最新版v2.16.7系统软件 / 19.6M / 中文MT管理器是一款功能强大的软件。它既是出色的文件管
下载flightradar24中文破解版v10.6.0系统软件 / 58.3M / 中文flightradar24是一款航班追踪工具软件,平台为各位实
下载猪猪软件库2025最新版本v2.1系统软件 / 5.7M / 中文猪猪软件库APP这是一款手机中的用户开发的精品软件分
下载magisk下载最新版本v28.1系统软件 / 11.2M / 中文magisk是一款强大的手机软件。主要用于安卓设备的系
下载ruru环境检测工具安卓版v1.1.1系统软件 / 2.6M / 中文RuRu环境检测工具是一款专注于环境监测的实用软件。
下载Voicemod Controller软件安卓最新版下载v1.0.17系统软件 / 24.1M / 中文Voicemod是一款在国外广受好评的免费在线游戏变声软
下载闪电下载app官方下载v3.0.0.1系统软件 / 33.8M / 中文闪电下载(com.flash.download)是一款优质的资源下
下载Fake Location虚拟定位免费版下载v1.3.5系统软件 / 22.7M / 中文FakeLocation(com.lerist.fakelocation)是一款功能
下载看播助手2025最新版下载v2.9.1.116896系统软件 / 12.4M / 中文看播助手app这是一款直播助手软件,可以应用主流平台
下载