模型
-
10万美元训出Llama
想了解更多aigc的内容,
请访问:51CTO AI.x社区
https://www.51cto.com/aigc/
“只需”10万美元,训练Llama-2级别的大模型。
尺寸更小但性能不减的MoE模型来了:
它叫JetMoE,来自MIT、 -
开源大模型AI代理操作系统:像Windos一样,操控AI代理
本文经AIGC开放社区 授权转载,转载请联系出处。
想了解更多aigc的内容,请访问:51cto ai.x社区
https://www.51cto.com/aigc/
去年,AutoGPT的出现让我们认识到了AI代理强大的自动化能力,并开创 -
更好、更安全、更不依赖OpenAI,微软的AI新动向,推出大模型安全工具Azure AI
编译丨伊风
出品 | 51CTO技术栈(微信号:blog51cto)生成性人工智能(generative AI)的需求正不断增长,而对LLM安全和可靠性的担忧也变得比以往任何时候都更加突出。企业希望能确保为内外部使用而开发的大规模语言模型( -
谷歌狂喜:JAX性能超越Pytorch、TensorFlow!或成GPU推理训练最快选择
谷歌力推的JAX在最近的基准测试中性能已经超过Pytorch和TensorFlow,7项指标排名第一。而且测试并不是在JAX性能表现最好的TPU上完成的。虽然现在在开发者中,Pytorch依然比Tensorflow更受欢迎。但未来,也许有更
-
0门槛免费商用!孟子3
澜舟科技官宣:孟子3-13b大模型正式开源!
这一主打高性价比的轻量化大模型,面向学术研究完全开放,并支持免费商用。
在MMLU、GSM8K、HUMAN-EVAL等各项基准测评估中,孟子3-13B都表现出了不错的性能。
尤其在参量20B以内 -
GPT
首个ai软件工程师devin正式亮相,立即引爆了整个技术界。
Devin虽然不能够轻松解决编码任务,但可以自主完成软件开发的整个周期——从项目规划到部署。他尽力挖掘,但不限于构建网站、自主寻找并修复BUG、培训和微调AI模型等。
这种 “强 -
DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源
大模型的幻觉终于要终结了?
今日,社交媒体平台Reddit上的一则帖子引起网友热议。帖子讨论的是谷歌DeepMind昨日提交的一篇论文《Long-form factuality in large language models(大语言模型的 -
马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文
以上就是马斯克大模型Grok1.5来了:推理能力大升级,支持128k上下文的详细内容,更多请关注叮当号网其它相关文章!
-
大佬出走后首个发布!Stability官宣代码模型Stable Code Instruct 3B
大佬出走后,第一个模型来了!
就在今天,Stability AI官宣了新的代码模型Stable Code Instruct 3B。
图片
Stability是非常重要的,首席执行官离职对Stable Diffusion造成了一些困扰,投资公 -
DifFlow3D:场景流估计新SOTA,扩散模型又下一城!
原标题:difflow3d: toward robust uncertainty-aware scene flow estimation with iterative diffusion-based refinement
论文链接:http