浙大&腾讯联合研发新技术精准调控大模型行为,DeepSeek-R1干预实验效果显著
2025-06-05
浙江大学与腾讯联合团队提出Steering Target Atoms(STA)方法,通过精准调控大模型内部神经元行为,提升生成内容的安全性和准确性。该技术在Gemma、Llama及DeepSeek-R1等大模型上验证有效,可抑制违规同时保持智能表现,尤其在DeepSeek-R1的MoE架构中干预专家神经元显著提升了推理能力。研究已开源部分方法,为可控AI发展提供新路径。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表希财网官方立场,不构成投资建议。如需阅读详细说明,请点击此处
