大模型

  • 蚂蚁万亿参数思考模型Ring-1发布即开源 刷新多项开源SOTA 综合能力逼近GPT-5

    电脑知识网10月14日消息,今日凌晨,蚂蚁集团正式推出万亿参数思考模型Ring-1T,并全面开源模型权重、训练配方。 Ring-1T在9月30日开源的预览版Ring-1T-preview基础上,持续扩展大规模可验证奖励强化学习(RLVR)训练,进一步激发万亿基座的自然语言推理能力,并通过 RLHF 训练完善模型通用能力,在各项任务榜单上表现更加均衡。 为了持…

    2025-10-14
    1400
  • 华人AI大神霸气离职:绝不接受反华

    近日,清华物理系传奇特奖得主 Yao Shunyu(姚顺宇)已离开Anthropic,加入 Google DeepMind。 从2024年10月加入,到2025年9月离开,入职仅一年,姚顺宇为何要离开? 他在个人博客中提及,40%的原因是反对Anthropic最新发言中将中国称为“敌对国家”,另外60%因素源于无法公开的内部信息判断。…

    2025-10-09
    1200
  • 猪猪侠开YU7 CEO卖蜜雪 Sora 2被网友玩坏了 律师警告!

    国庆假期期间,Sora 2引爆了整个AI圈子,甚至被网友称为“AI版抖音”、“下一个超级App”。 9月30日,OpenAI发布其迄今为止最先进的视频生成模型Sora 2,并同步推出了一款名为“Sora by OpenAI”的iPhone应用。短短几天后,Sora就登顶了美国App St…

    2025-10-06
    1600
  • AI三巨头之一的LeCun不想再忍了!亲口承认要辞职

    我惊! 图灵奖得主、AI三巨头之一的LeCun在Meta待得是如坐针毡。 Yann LeCun已经直接跟同事表示,自己可能会辞去FAIR首席科学家的职务。 LeCun可是FAIR的联合创始人之一,这么多年一直驻扎FAIR,起着学术研究和前瞻洞悉的引领作用。 知情人士透露,这不是LeCun的一时冲动,而是LeCun对Meta近几个月在AI部门组织调整等骚操作不…

    2025-10-03
    1600
  • 豆包大模型1.6-vision正式发布:首次具备工具调用能力

    电脑知识网9月30日消息,据“火山引擎”微信公众号发文,豆包大模型1.6-vision正式发布,这是豆包大模型家族首个具备工具调用能力的视觉深度思考模型,拥有更强的通用多模态理解和推理能力,并支持Responses API。  新模型以工具调用的差异化能力,将图像融入其思维链中,实现对图片的定位、剪裁、点选、画线、缩放、旋转…

    2025-09-30
    1000
  • DeepSeek-V3.2-Exp发布:华为昇腾、寒武纪、海光等芯片厂商集体宣布Day 0适配

    电脑知识网9月30日消息,日前,深度求索宣布,正式发布DeepSeek-V3.2-Exp模型。尽管这是一个实验性(Experimental)的版本,还是吸引了多家芯片厂商集体宣布Day 0适配。 据华为计算微信公众号消息,昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持,并面向开发者开源所有推理…

    2025-09-30
    1000
  • 迈入1T模型阵营!蚂蚁开源首个万亿参数推理大模型 代码生成能力超GPT-5

    电脑知识网9月30日消息,今日凌晨,蚂蚁集团开源了自研的首个万亿参数大模型Ring-1T-preview。 该模型是一款自然语言推理大模型,也是全球首个开源的万亿参数推理大模型。 据百灵大模型官方信息,此次发布的Ring-1T-preview是万亿参数推理大模型Ring-1T的预览版模型,但也同样展示了卓越的自然语言推理能力。 在考察数学能力的AIME 25…

    2025-09-30
    700
  • 阿里通义7大模型霸榜全球开源前十,千问Qwen3-Omni登顶

    9月28日,全球最大 AI 开源社区 Hugging Face公布了新一期模型榜单,阿里通义7款模型入选全球前十开源模型榜单,几乎实现屠榜,其中刚刚开源的全模态大模型Qwen3-Omni 登顶。 图说:Qwen3-Omni登顶Hugging Face 全球开源榜单 据了解,Qwen3-Omni是阿里最新开源的全模态大模型,音视频能力狂揽32项开源最佳性能SO…

    2025-09-28
    1300
  • 智元机器人GO-1通用具身基座大模型开源 向全球开发者免费开放

    电脑知识网9月23日消息,据媒体报道,智元机器人今日宣布,通用具身基座大模型GO-1(Genie Operator-1)已在GitHub正式开源,成为全球首个采用Vision-Language-Latent-Action(ViLLA)架构的通用具身智能模型。 这一突破性架构通过引入隐式动作标记,有效弥合了图像-文本输入与机器人动作执行之间的语义鸿沟,显著提升…

    2025-09-23
    2800
  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    电脑知识网9月23日消息,美团LongCat团队正式发布全新高效推理模型——LongCat-Flash-Thinking。 在保持了LongCat-Flash-Chat极致速度的同时,全新发布的LongCat-Flash-Thinking更强大、更专业。 综合评估显示,LongCat-Flash-Thinking在逻辑、数学、代码、智…

    2025-09-23
    1200

联系我们

在线咨询: QQ交谈

邮件:442814395@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信公众号