模型
-
Karpathy称赞,从零实现LLaMa3项目爆火,半天1.5k star
一个月前,meta+发布了开源大模型 llama3 系列,在多个关键基准测试中优于业界 sota 模型,并在代码生成任务上全面领先。
此后,开发者们便开始了本地部署和实现,比如 llama3 的中文实现、llama3 的纯 NumPy 实现 -
谷歌Gemini 1.5技术报告:轻松证明奥数题,Flash版比GPT
今年 2 月,谷歌上线了多模态大模型 Gemini1.5,通过工程和基础设施优化、MoE 架构等策略大幅提升了性能和速度。拥有更长的上下文,更强推理能力,可以更好地处理跨模态内容。
本周五,Google DeepMind 正式发布了 Gem -
李彦宏欧洲谈AI:比起GPT
中固 ai 与西方的最大区别是应用。中国有数百个基础模型,但人们越来越多地在讨论什么是 ai 时代的超级应用。
应用正在驱动中的AI的快速发展。应用领域的进步可以推动基础模型的创新,也有助于加速从互联网时代到人工智能时代的转变。
“欧洲AI -
首个GPU高级语言,大规模并行就像写Python,已获8500 Star
经过近10年的不懈努力,对计算机科学核心的深入研究,人们终于实现了一个梦想:在gpu上运行高级语言。
上周末,一种名为 Bend 的编程语言在开源社区引发了热烈的讨论,GitHub 的 Star 量已经超过了 8500。GitHub:htt -
替代MLP的KAN,被开源项目扩展到卷积了
本月初,来自 MIT 等机构的研究者提出了一种非常有潜力的 MLP 替代方法 ——KAN。
KAN在准确性和可解释性方面表现优于MLP。而且它能以非常少的参数量胜过以更大参数量运行的MLP。比如,作者表示,他们用KAN以更小的网络和更高的自 -
简单通用:视觉基础网络最高3倍无损训练加速,清华EfficientTrain++入选TPAMI 2024
论文链接:https://www.php.cn/link/6e361e90ca5f9bee5b36f3d413c51842
代码和预训练模型已开源:https://www.php.cn/link/154d7da9e669c75ee317d4 -
我们一起聊聊AI模型组合指南
实施需要周密的计划、资源管理以及采用现代部署实践和工具。
译自a guide to model composition,作者 sherlock xu。
考虑一款旨在识别和分类野生动物照片的AI驱动的图像识别应用程序。您上传一张足够时拍摄的照 -
开源!V2Xverse:上交发布首个面向V2X的仿真平台与端到端模型
车路协同的同步驾驶数据车路协同辅助的自动驾驶V2X-AD(Vehicle-to-everything-aided autonomous driving)在提供更安全的驾驶策略方面具有巨大潜力。研究者们在V2X-AD的通信和通信层面进行了大
-
众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸
大模型排行榜哪家强?还看LLM竞技场~
截至此刻,已有共计90名LLM加入战斗,用户总投票数超过了77万。
图片
然而,在网友们吃瓜调侃新模型冲榜、老模型丧失尊严的同时,
人家竞技场背后的组织LMSYS,已经悄悄完成了成果转化:从实战中诞生 -
李飞飞「空间智能」系列新进展,吴佳俊团队新「BVS」套件评估计算机视觉模型
在不久之前的 2024 TED 演讲中,李飞飞详细解读了 空间智能(Spatial Intelligence)概念。她对计算机视觉领域在数年间的快速发展感到欣喜并抱有极大热忱,并为此正在创建初创公司
在此演讲中,曾提到斯坦福团队的一个研究成