界面新闻记者 | 宋佳楠
2月26日,明星大模子公司DeepSeek通知即日起在北京时辰逐日00:30至08:30的夜间悠然时段,大幅下调API调用价钱,其中DeepSeek-V3降至原价的50%,DeepSeek-R1更是低至25%,降幅最高达75%。该公司称,这一举措旨在饱读吹用户充分哄骗夜间时段,享受更经济、更运动的工作体验。
这并非DeepSeek初次转机API价钱。客岁8月,DeepSeek曾将API输入用度下调至0.1元/百万tokens,输出用度为2元/百万tokens,激刊行业升沉。
估量词在2月初,由于工作器资源病笃,DeepSeek一度暂停API工作充值,直至2月25日才从头绽放,并转机了DeepSeek-chat模子的调用价钱,为每百万输入tokens 2元,每百万输出tokens 8元。
若是与豆包和通义千问的调用价钱进行对比,会发现普通时段下,豆包大模子的价钱相对较低,通义千问不同模子价钱有各异,而DeepSeek在圭臬时段价钱相对较高,但在优惠时段价钱有较大幅度下落,具有一定竞争力。
以豆包通用模子pro-32k为例,后付费花样下,推理输入0.0008元/千Tokens、推理输出0.002元/千Tokens,模子推理的详细价钱为0.001元/千Tokens;预支费花样下,10K TPM的包月价钱为2000元,平均价钱为0.0046元/千Tokens。
通义千问的qwen1.5-110b-chat模子,输入价钱为0.007元/千Tokens,输出价钱为0.014元/千Tokens;qwen-72b-chat输入和输出价钱均为0.02元/千Tokens;Qwen-VL-Plus输入价钱为0.0015元/千Tokens;Qwen-VL-Max输入价钱为0.003元/千Tokens。
参考之前DeepSeek的调用价钱,优惠时段内DeepSeek-V3百万Tokens输入(缓存射中)为0.25元,百万Tokens输入(缓存未射中)为1元,百万Tokens输出为4元;DeepSeek-R1百万Tokens输入(缓存射中)为0.25元,百万Tokens输入(缓存未射中)为1元,百万Tokens输出为4元。
DeepSeek的降价战略有助于进一步缩小中小企业和个东说念主树立者的使用门槛,推进AI期间的普及。此前,DeepSeek的降价曾激刊行业四百四病,包括阿里云、百度、腾讯等头部企业纷纷跟进,通知各自的降价方法。这次夜间优惠是否会再次掀翻价钱战,还要看其他大模子公司的进一步看成。
DeepSeek推出优惠方法之时,正好其“开源周”。首个开源的代码库为针对Hopper GPU优化的FlashMLA,第二日是首个用于MoE模子历练和推理的开源EP通讯库DeepEP,26日则开源了一个因循密集和MoE GEMM的FP8 GEMM 库,为V3/R1历练和推理提供因循。
另据媒体报说念,DeepSeek缱绻提前发布新一代AI模子R2,展望在编程才能、多话语推理等方面有所晋升,还可能在图像生成、语音识别和合成等多模态方面有所升级。R2模子的发布或进一步安定DeepSeek在AI限度的地位,并推进新一轮的期间修订。

包袱裁剪:刘万里 SF014亚bo体育网