DeepSeek
-
DeepSeek核心高管离职创业
虎嗅从多个独立信源获悉,半年前,某DeepSeek核心高管已悄然离职创业,并将于2025年圣诞节前后发布Agent产品。 有信源告诉虎嗅,该高管系原DeepSeek CTO。不过另有知情人士向虎嗅透露,DeepSeek内部并无明确的CTO一职,即在DeepSeek内部并无明确为“CTO”的职位,但有承担相应工作的人士。 上述知情人士向…
-
周鸿祎解读DeepSeek更新:中美AI实力已平起平坐
电脑知识网6月9日消息,360公司创始人周鸿祎今日发文解读DeepSeek更新。 据报告显示,此次DeepSeek-R1模型的小版本更新,使得DeepSeek重回全球AI排名的第二名,全球开源模型的第一名。 周鸿祎表示:“DeepSeek目前和美国的顶尖大模型团队平起平坐,堪称我们在人工智能领域的一次重大突破,中美的AI实力也已势均力敌、平起平坐…
-
玩完DeepSeek R1新版 外国网友又蚌埠住了
几天前,没有预热,没有发布会,DeepSeek 低调上传了 DeepSeek R1(0528)的更新。 海外媒体最关注的是,DeepSeek 的更新将幻觉率削减约 45%-50%,并把 R1 的性能推进至 OpenAI o3 与 Google Gemini 2.5 Pro 的相近水平。 与此同时,海外一些开发者、AI 圈研究人员开始跑基准测试,并在社交媒体平…
-
你以为这是DeepSeek的一次小更新 实际上它又超神了
还没等来 DeepSeek-R2,DeepSeek-R1 昨天晚上先悄悄更新了一波。 和上次 V3-0324 版本一样,这回 DeepSeek 又又又往 Hugging Face 上默默扔了一个 DeepSeek-R1-0528,Model Card 和官方的更新公告都没出。 而在大伙儿还没反应过来的时候,R1 新版本已经是大模型热搜榜的第一了。…
-
DeepSeek宣布R1小版本试升级:网友实测编程能力已达到国际一线水平
电脑知识网5月29日消息,让不少人意外的是,R2没有等来,却迎来了R1的小版本升级,但实测后实力依然惊人。 昨日晚间,DeepSeek在官方交流群中发布通知:DeepSeek R1模型已完成小版本试升级,欢迎前往官方网页、App、小程序测试(打开深度思考),API接口和使用方式保持不变。 有人实测了开源R1最新0528版本,其编程能力炸裂(编程能力已达到国际…
-
华为:让DeepSeek的“专家们”动起来 推理延迟降10%!
要问最近哪个模型最火,混合专家模型(MoE,Mixture of Experts)绝对是榜上提名的那一个。 它的巧妙之处,就在于把不同的任务分配给擅长处理的专家网络,让整个系统性能得以提升。 但你知道吗? 正是这个关键的专家网络,也是严重影响系统推理性能的因素之一。 因为在大量任务来临之际(尤其是超大规模时),MoE并不是以“雨露均沾&rdquo…
-
中国AI大厂 被Deepseek掀了牌桌之后
过去几个月,尤其是 2025 年一季度,国内大厂在 AI 大模型领域的声量明显低调了不少。最直观的感受就是,发布会明显少了许多。对比去年同期,大厂几乎是轮番上阵、接连发布新成果,而今年则低调了不少,声音变得谨慎,动作也更克制。 这种转变,多少跟 DeepSeek-R1 在春节期间的发布有关,这个模型以开源、低价、高性能的组合,打破了「大模型=高投入、高门槛」…
-
华为+DeepSeek!性能全面超越英伟达Hopper架构
部署超大规模MoE这件事,国产芯片的推理性能,已经再创新高了—— 不仅是“英伟达含量为0”这么简单,更是性能全面超越英伟达Hopper架构! 而做到这一点的,正是华为昇腾;具体而言,共包含两个产品: CloudMatrix 384超节点部署DeepSeek V3/R1,在50ms时延约束下单卡Decode吞吐突…
-
R2来之前 DeepSeek又放了个烟雾弹
5月前后,DeepSeek的动作倒是频繁,却都不是大家期待的R2。不过,一系列前菜已经给R2做足了铺垫。 5月14日,一篇DeepSeek V3论文,揭示了梁文峰是如何做到“极致降本”的。这篇论文也让业界得以一窥这家以技术立身的公司,其“内功”究竟修炼到了何种火候。 与此前发布的V3技术报告不同,这篇论文详细阐…
-
DeepSeek API Client:轻松接入 DeepSeek AI 模型的 .NET 开发利器
大家好,我是深山踏红叶,在当今快速发展的技术领域,人工智能(ai)已经成为我们不可或缺的工具之一。无论是自然语言处理、图像识别还是数据分析,ai 都在不断推动着技术的边界。今天,我们来介绍一款名为 deepseek.apiclient 的 .net 库,它为我们提供了一种简单而强大的方式,用于与 deepseek 的 ai 模型进行交互。 概述 DeepSe…