大模型

  • 苹果炮轰AI推理模型:全是假思考!所谓思考只是一种假象

    电脑知识网6月8日消息,苹果近日发表了一篇研究论文,称推理模型全都没真正思考,无论DeepSeek、o3-mini还是Claude 3.7都只是另一种形式的“模式匹配”,所谓思考只是一种假象。 有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。 苹果团队认为,现有评估主要集中在既定的数学和编码基准上,看模型最终答案是否正…

    2025-06-08
    900
  • 训练MoE足足提速70% 华为只用了3招

    Scaling Law之下,MoE(混合专家)如今已经成为各大模型厂商扩展模型能力的制胜法宝。 不过,在高效实现模型参数规模化的同时,MoE的训练难题也日益凸显: 训练效率不足,甚至一半以上训练时间都浪费在“等待”上。 现在,为了突破MoE的训练瓶颈,华为出手了: 构建了一套名为Adaptive Pipe & EDPB的优化方…

    2025-06-03
    1600
  • 你以为这是DeepSeek的一次小更新 实际上它又超神了

    还没等来 DeepSeek-R2,DeepSeek-R1 昨天晚上先悄悄更新了一波。  和上次 V3-0324 版本一样,这回 DeepSeek 又又又往 Hugging Face 上默默扔了一个 DeepSeek-R1-0528,Model Card 和官方的更新公告都没出。 而在大伙儿还没反应过来的时候,R1 新版本已经是大模型热搜榜的第一了。…

    2025-05-30
    1200
  • 中国石油发布3000亿参数昆仑大模型:华为、中国移动、科大讯飞联合打造

    电脑知识网5月29日消息,日前,中国石油发布3000亿参数昆仑大模型,标志着中国石油在人工智能领域迈出关键一步。 据了解,昆仑大模型由中国石油、中国移动、华为、科大讯飞联合打造,2024年8月完成备案,成为中国能源化工行业首个通过备案的大模型。 去年8月28日,330亿参数昆仑大模型发布,11月28日又发布700亿参数昆仑大模型。 此次发布的3000亿参数昆…

    2025-05-29
    1100
  • 腾讯混元上线“游戏工业级”视觉生成平台:效率最高提升数十倍!

    电脑知识网5月20日消息,腾讯今日发布混元游戏视觉生成平台。 据悉,这是一款依托混元大模型打造的AI内容引擎,专为游戏工业级内容生产而生。 作为游戏美术设计师的AI助手,该平台可快速生成符合创作意图的高质量游戏素材或概念草案,真正实现创作闭环。 据腾讯介绍,新上线的游戏视觉生成平台可流程压缩、节奏提速,效率最高可提升数十倍。 如腾讯混元推出的AI美术管线,将…

    2025-05-20
    2000
  • AI遭遇灵魂拷问!这道题所有模型集体翻车 网友:我也不会啊

    拷打AI的难度还在升级?这不,图像推理又出现了新难题。 该问题在Reddit上引起热议:目前没有任何AI能真正解决复杂推理问题。 问题定义其实非常简单——在下图中还需要添加多少个小立方体能形成一个完整的大立方体? 针对这一难题,国内外支持图像输入的大模型纷纷给出了不同的答案。 其中,o3给出的答案是45个,Gemini 2.5Pro给…

    2025-05-19
    2000
  • 5G-A+智算+大模型护航!中兴通讯协同三大运营商让电竞激情零卡顿

    近日,第十一届王者荣耀全国大赛总决赛在湖北孝感奥体公园隆重举行,为期两天的电竞盛宴令人震撼。中兴通讯与三大运营商紧密合作,响应孝感市委市政府的号召,搭建了“终端+专线+5g-a”的全方位通信保障体系,为全国参赛选手、观众及线上用户提供了“无延迟、低时延、高稳定”的极致赛事体验,让每位参与者都能充分享受电竞带来的激情与欢乐。 5G-A智能升级,网络体验飞跃 作…

    2025-05-09
    3000
  • 国内大模型人才大战打响!大厂各出奇招 薪资不设上限

    眼花缭乱了。为争夺AI人才,大厂们齐齐放大招! 各种天才、顶尖人才计划简直看不过来。 每个都扒开粗略一看,满满都是薪资不设上限、CTO亲自参与指导,无需实习经验…… 老天奶,都2025年了抢人咋还这么疯。 而与抢人同步进行的是,他们还到处挖大牛,以大牛的明星效应来吸引大量业内顶级人才加盟—— 字节挖来谷歌D…

    2025-05-09
    1100
  • 再见了NVIDIA!华为昇腾NPU跑出了准万亿参数大模型

    现在,跑准万亿参数的大模型,可以彻底跟NVIDIA Say Goodbye了。 完成此举的,正是华为! 要知道,在此之前,训练万亿参数大模型这事,是有诸多“拦路虎”在身上的。 例如负载均衡难、通信开销大、训练效率低等等。 华为盘古团队(包含诺亚方舟实验室、华为云等)基于昇腾国产算力平台,一举攻破了上述所有的挑战—&mdas…

    2025-05-08
    3300
  • 为什么DeepSeek回答前总先“嗯”一下

    在人工智能与人类对话的边界逐渐融合消弭的今天,许多用户发现DeepSeek的回复中常常出现一个有趣的细节——这个AI似乎格外喜欢在回答中插入“嗯”这样的语气词。 这个看似简单的小习惯,背后其实藏着人工智能理解人类语言的独特逻辑。 01模拟人类自然语言习惯 人类对话中,语言从来不只是信息的搬运工。中国社会科学院语…

    2025-04-29
    1200

联系我们

在线咨询: QQ交谈

邮件:442814395@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信公众号