模型相关文章列表 - 叮当号

Karpathy称赞，从零实现LLaMa3项目爆火，半天1.5k star

一个月前，meta+发布了开源大模型 llama3 系列，在多个关键基准测试中优于业界 sota 模型，并在代码生成任务上全面领先。
此后，开发者们便开始了本地部署和实现，比如 llama3 的中文实现、llama3 的纯 NumPy 实现

张大嘴

2024-05-24

82000

科技

谷歌Gemini 1.5技术报告：轻松证明奥数题，Flash版比GPT

今年 2 月，谷歌上线了多模态大模型 Gemini1.5，通过工程和基础设施优化、MoE 架构等策略大幅提升了性能和速度。拥有更长的上下文，更强推理能力，可以更好地处理跨模态内容。
本周五，Google DeepMind 正式发布了 Gem

走不完的路

2024-05-24

65000

科技

李彦宏欧洲谈AI：比起GPT

中固 ai 与西方的最大区别是应用。中国有数百个基础模型，但人们越来越多地在讨论什么是 ai 时代的超级应用。
应用正在驱动中的AI的快速发展。应用领域的进步可以推动基础模型的创新，也有助于加速从互联网时代到人工智能时代的转变。
“欧洲AI

走不完的路

2024-05-24

75000

科技

首个GPU高级语言，大规模并行就像写Python，已获8500 Star

经过近10年的不懈努力，对计算机科学核心的深入研究，人们终于实现了一个梦想：在gpu上运行高级语言。
上周末，一种名为 Bend 的编程语言在开源社区引发了热烈的讨论，GitHub 的 Star 量已经超过了 8500。GitHub：htt

牧草

2024-05-24

81000

科技

替代MLP的KAN，被开源项目扩展到卷积了

本月初，来自 MIT 等机构的研究者提出了一种非常有潜力的 MLP 替代方法 ——KAN。
KAN在准确性和可解释性方面表现优于MLP。而且它能以非常少的参数量胜过以更大参数量运行的MLP。比如，作者表示，他们用KAN以更小的网络和更高的自

周斌

2024-05-23

62000

科技

简单通用：视觉基础网络最高3倍无损训练加速，清华EfficientTrain++入选TPAMI 2024

论文链接：https://www.php.cn/link/6e361e90ca5f9bee5b36f3d413c51842
代码和预训练模型已开源：https://www.php.cn/link/154d7da9e669c75ee317d4

老板不要肥肉

2024-05-23

83000

科技

我们一起聊聊AI模型组合指南

实施需要周密的计划、资源管理以及采用现代部署实践和工具。
译自a guide to model composition，作者 sherlock xu。
考虑一款旨在识别和分类野生动物照片的AI驱动的图像识别应用程序。您上传一张足够时拍摄的照

木子

2024-05-23

78000

科技

开源！V2Xverse：上交发布首个面向V2X的仿真平台与端到端模型

车路协同的同步驾驶数据车路协同辅助的自动驾驶V2X-AD（Vehicle-to-everything-aided autonomous driving）在提供更安全的驾驶策略方面具有巨大潜力。研究者们在V2X-AD的通信和通信层面进行了大

老板不要肥肉

2024-05-23

55000

科技

众包新玩法！LLM竞技场诞生基准测试，严格分离学渣学霸

大模型排行榜哪家强？还看LLM竞技场~
截至此刻，已有共计90名LLM加入战斗，用户总投票数超过了77万。
图片
然而，在网友们吃瓜调侃新模型冲榜、老模型丧失尊严的同时，
人家竞技场背后的组织LMSYS，已经悄悄完成了成果转化：从实战中诞生

张大嘴

2024-05-23

71000

科技

李飞飞「空间智能」系列新进展，吴佳俊团队新「BVS」套件评估计算机视觉模型

在不久之前的 2024 TED 演讲中，李飞飞详细解读了空间智能（Spatial Intelligence）概念。她对计算机视觉领域在数年间的快速发展感到欣喜并抱有极大热忱，并为此正在创建初创公司
在此演讲中，曾提到斯坦福团队的一个研究成

城南北边

2024-05-23

62000

模型

联系我们