2025-01-10
分享到
12月26日晚间,杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)宣布,全新系列模型DeepSeek-V3首个版本上线并同步开源。
Meta AI研究科学家田渊栋对DeepSeek-V3各个方向上的进展都表示赞赏,称“这是一项了不起的工作”。
据官方技术论文披露,DeepSeek-V3模型的总训练成本为557.6万美元,而GPT-4o等模型的训练成本约为1亿美元。深度求索表示,“这是一个全新的开始。”。
公开信息显示,深度求索成立于2023年7月17日,由知名量化资管巨头幻方量化创立,幻方量化创始人梁文峰在量化投资和高性能计算领域具有深厚的背景和丰富的经验。成立半年后,发布了第一代大模型DeepSeek Coder;2024年5月发布了其第二代开源Mixture-of-Experts(MoE)模型——DeepSeek-V2。DeepSeek V2模型因在中文综合能力评测中九游体育的出色表现,且以极低的推理成本九游体育引发行业关注,被称为“AI界的拼多多”。DeepSeek-V3模型API服务定价为每百万输入tokens为0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens价格为8元,并享有45天的优惠价格体验期。
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
FCS 文章精要:北京航空航天大学张日崇等——用于上位词检测和发现的多重投影循环模型