英伟达开源「推理新王者」Llama-Nemotron:碾压DeepSeek-R1,14万H100小时训练细节全公开!
2025-05-06
英伟达发布开源Llama-Nemotron系列模型(含253B参数的LN-Ultra),在推理能力与效率上超越DeepSeek-R1。该模型通过合成数据监督微调、神经架构搜索及强化学习等技术优化,在单个H100节点上实现高效运行,支持推理模式切换功能。训练过程耗时14万H100小时,采用FP8精度等创新技术,显著提升开源模型性能与部署效率。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
