模型相关文章列表 - 叮当号

LLM全搞定！OmniDrive：集3D感知、推理规划于一体（英伟达最新）

写在前面&笔者的个人理解
这篇论文致力于解决当前多模态大语言模型（MLLMs）在自动驾驶应用中存在的关键挑战，即将MLLMs从2D理解扩展到3D空间的问题。由于自动驾驶车辆（AVs）需要针对3D环境做出准确的决策，这一扩展显得尤为重要。3D

牧草

2024-05-09

97000

科技

微调和量化竟会增加越狱风险！Mistral、Llama等无一幸免

大模型又又又被曝出安全问题！
近日，来自Enkrypt AI的研究人员发表了令人震惊的研究成果：量化和微调竟然也能降低大模型的安全性！论文地址：https://arxiv.org/pdf/2404.04392.pdf
在作者的实际测试中，M

牧草

2024-05-07

83000

科技

挑战OpenAI，微软自研5000亿参数绝密武器曝光！前谷歌DeepMind高管带队

不需要OpenAI，微软或许也会成为AI领头羊！
外媒Information爆料称，微软内部正在开发自家首款5000亿参数的大模型MAl-1。这恰好是，纳德拉带领团队证明自己的时候到了。
在向OpenAI投资100多亿美元之后，微软才获得了

叮当

2024-05-07

101000

科技

全球最强开源 MoE 模型来了，中文能力比肩 GPT

想象一下，一个人工智能模型，不仅拥有超越传统计算的能力，还能以更低的成本实现更高效的性能。这不是科幻，deepseek-v2[1]，全球最强开源 moe 模型来了。DeepSeek-V2 是一个强大的专家混合（MoE）语言模型，具有训练经济

momo

2024-05-07

109000

科技

爆火后反转？「一夜干掉MLP」的KAN：其实我也是MLP

多层感知器（MLP），也被称为全连接前馈神经网络，是如今深度学习模型的基础构建块。MLP 的重要性无论如何强调都不为过，因为它们是机器学习中用于逼近非线性函数的默认方法。
但是最近，来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法

城南北边

2024-05-07

76000

科技

看透物体的3D表示和生成模型：NUS团队提出X

项目主页：https://tau-yihouxiang.github.io/projects/X-Ray/X-Ray.html
论文地址：https://arxiv.org/abs/2404.14329
代码地址：https://githu

代号邱小姐

2024-05-06

108000

科技

58行代码把Llama 3扩展到100万上下文，任何微调版都适用

堂堂开源之王llama 3，原版上下文窗口居然只有……8k，让到嘴边的一句“真香”又咽回去了。
在32k起步，100k寻常的今天，这是故意要给开源社区留做贡献的空间吗？
开源社区当然不会放过这个机会：
现在只需58行代码，任何Llama 3

牧草

2024-05-06

90000

科技

LeCun上月球？南开、字节开源StoryDiffusion让多图漫画和长视频更连贯

两天前，图灵奖得主 Yann LeCun 转载了「自己登上月球去探索」的长篇漫画，引起了网友的热议。在《Story Diffusion：Consistent Self-Attention for long-range image and v

叮当

2024-05-06

106000

科技

特斯拉机器人进厂打工，马斯克：手的自由度今年将达到22个！

特斯拉机器人Optimus最新视频出炉，已经可以在厂子里打工了。
正常速度下，它分拣电池（特斯拉的4680电池）是这样的：官方还放出了20倍速下的样子——在小小的“工位”上，拣啊拣啊拣：这次放出的视频亮点之一在于Optimus在厂子里完成这

叮当

2024-05-06

75000

科技

AI学会隐藏思维暗中推理！不依赖人类经验解决复杂任务，更黑箱了

ai做数学题，真正的思考居然是暗中“心算”的？
纽约大学团队新研究发现，即使不让AI写步骤，全用无意义的“……”代替，在一些复杂任务上的表现也能大幅提升！
一作Jacab Pfau表示：只要花费算力生成额外token就能带来优势，具体选择了

牧草

2024-05-06

85000

模型

联系我们