模型
-
比PID更丝滑的控制算法&卡内基梅隆大学
MPC控制算法,全称Model Predictive Control(模型预测控制),是一种基于系统动态模型的控制技术。它的工作原理是通过数学模型预测系统的未来行为,并基于这些预测结果来优化系统的控制输入,从而实现期望的输出。MPC控制算
-
Yolov10:详解、部署、应用一站式齐全!
一、前言 在过去的几年里,YOLOs由于其在计算成本和检测性能之间的有效平衡,已成为实时目标检测领域的主导范式。研究人员探索了YOLO的架构设计、优化目标、数据扩充策略等,取得了显著进展。同时,依赖非极大值抑制(NMS)进行后处理阻碍了
-
清华接手,YOLOv10问世:性能大幅提升,登上GitHub热榜
目标检测系统的标杆 YOLO 系列,再次获得了重磅升级。自今年 2 月 YOLOv9 发布之后, YOLO(You Only Look Once)系列的接力棒传到了清华大学研究人员的手上。
上周末,YOLOv10推出的消息引发了AI界的关注 -
适应多形态多任务,最强开源机器人学习系统「八爪鱼」诞生
在机器人学习方面,一种常用方法是收集针对特定机器人和任务的数据集,然后用其来训练策略。但是,如果使用这种方法来从头开始学习,每一个任务都需要收集足够数据,并且所得策略的泛化能力通常也不佳。
“原理上讲,从其他机器人和任务收集的经验能提供可能 -
模块化重构LLaVA,替换组件只需添加1
TinyLLaVA+项目由清华大学电子系多媒体信号与智能信息处理实验室 (MSIIP) 吴及教授团队和北京航空航天大学人工智能学院黄雷老师团队联袂打造。清华大学 MSIIP 实验室长期致力于智能医疗、自然语言处理与知识发现、多模态等研究领域
-
港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体
当前,多模态大模型 (mllm)在多项视觉任务上展现出了强大的认知理解能力。
然而大部分多模态大模型局限于单向的图像理解,难以将理解的内容映射回图像上。
比如,模型能轻易说出图中有哪些物体,但无法将物体在图中准确标识出来。
定位能力的缺失直 -
DiffMap:首个利用LDM来增强高精地图构建的网络
论文标题:
DiffMap: Enhancing Map Segmentation with Map Prior Using Diffusion Model
论文作者:
Peijin Jia, Tuopu Wen, Ziang Luo, M -
全面超越DPO:陈丹琦团队提出简单偏好优化SimPO,还炼出最强8B开源模型
为了将大型语言模型(LLM)与人类的价值和意图对齐,学习人类反馈至关重要,这能确保它们是有用的、诚实的和无害的。在对齐 LLM 方面,一种有效的方法是根据人类反馈的强化学习(RLHF)。尽管 RLHF 方法的结果很出色,但其中涉及到了一些优
-
Meta首发「变色龙」挑战GPT
GPT-4o的横空出世,再次创立了一个多模态模型发展的新范式!
为什么这么说?
OpenAI将其称为「首个『原生』多模态」模型,意味着GPT-4o与以往所有的模型,都不尽相同。传统的多模态基础模型,通常为每种模态采用特定的「编码器」或「解码 -
HuggingFace教你怎样做出SOTA视觉模型
前有openai的gpt-4o,后有谷歌的系列王炸,先进的多模态大模型接连炸场。
其他从业者在震撼之余,也再次开始思考怎么追赶这些超级模型了。
在这篇HuggingFace和法国索邦大学的一篇论文中,总结出了构建视觉大模型的关键经验,给开发