模型
-
LLM全搞定!OmniDrive:集3D感知、推理规划于一体(英伟达最新)
写在前面&笔者的个人理解
这篇论文致力于解决当前多模态大语言模型(MLLMs)在自动驾驶应用中存在的关键挑战,即将MLLMs从2D理解扩展到3D空间的问题。由于自动驾驶车辆(AVs)需要针对3D环境做出准确的决策,这一扩展显得尤为重要。3D -
微调和量化竟会增加越狱风险!Mistral、Llama等无一幸免
大模型又又又被曝出安全问题!
近日,来自Enkrypt AI的研究人员发表了令人震惊的研究成果:量化和微调竟然也能降低大模型的安全性!论文地址:https://arxiv.org/pdf/2404.04392.pdf
在作者的实际测试中,M -
挑战OpenAI,微软自研5000亿参数绝密武器曝光!前谷歌DeepMind高管带队
不需要OpenAI,微软或许也会成为AI领头羊!
外媒Information爆料称,微软内部正在开发自家首款5000亿参数的大模型MAl-1。这恰好是,纳德拉带领团队证明自己的时候到了。
在向OpenAI投资100多亿美元之后,微软才获得了 -
全球最强开源 MoE 模型来了,中文能力比肩 GPT
想象一下,一个人工智能模型,不仅拥有超越传统计算的能力,还能以更低的成本实现更高效的性能。这不是科幻,deepseek-v2[1],全球最强开源 moe 模型来了。DeepSeek-V2 是一个强大的专家混合(MoE)语言模型,具有训练经济
-
爆火后反转?「一夜干掉MLP」的KAN:其实我也是MLP
多层感知器(MLP),也被称为全连接前馈神经网络,是如今深度学习模型的基础构建块。MLP 的重要性无论如何强调都不为过,因为它们是机器学习中用于逼近非线性函数的默认方法。
但是最近,来自 MIT 等机构的研究者提出了一种非常有潜力的替代方法 -
看透物体的3D表示和生成模型:NUS团队提出X
项目主页:https://tau-yihouxiang.github.io/projects/X-Ray/X-Ray.html
论文地址:https://arxiv.org/abs/2404.14329
代码地址:https://githu -
58行代码把Llama 3扩展到100万上下文,任何微调版都适用
堂堂开源之王llama 3,原版上下文窗口居然只有……8k,让到嘴边的一句“真香”又咽回去了。
在32k起步,100k寻常的今天,这是故意要给开源社区留做贡献的空间吗?
开源社区当然不会放过这个机会:
现在只需58行代码,任何Llama 3 -
LeCun上月球?南开、字节开源StoryDiffusion让多图漫画和长视频更连贯
两天前,图灵奖得主 Yann LeCun 转载了「自己登上月球去探索」的长篇漫画,引起了网友的热议。在《Story Diffusion:Consistent Self-Attention for long-range image and v
-
特斯拉机器人进厂打工,马斯克:手的自由度今年将达到22个!
特斯拉机器人Optimus最新视频出炉,已经可以在厂子里打工了。
正常速度下,它分拣电池(特斯拉的4680电池)是这样的:官方还放出了20倍速下的样子——在小小的“工位”上,拣啊拣啊拣:这次放出的视频亮点之一在于Optimus在厂子里完成这 -
AI学会隐藏思维暗中推理!不依赖人类经验解决复杂任务,更黑箱了
ai做数学题,真正的思考居然是暗中“心算”的?
纽约大学团队新研究发现,即使不让AI写步骤,全用无意义的“……”代替,在一些复杂任务上的表现也能大幅提升!
一作Jacab Pfau表示:只要花费算力生成额外token就能带来优势,具体选择了