炸锅!Anthropic发现Claude藏「情绪向量」:拨个参数就能改AI性格?
作者: AI 导航 发布时间: 2026-04-04 22:04
哈喽各位科技圈吃瓜群众、技术发烧友们大家好!我是每天蹲守全球科技前沿大瓜、犀利吐槽绝不废话的「科技全球观」~今天这条爆料,绝对能刷新你对大模型的固有认知!
【爆点来源:Anthropic藏了许久的研究正式公开】
据外媒报道,Anthropic近期公布了一项引发业内震动的新研究:团队在Claude系列大模型的参数空间中,找到了一组被命名为「情绪向量」的独特参数组,这组参数完全独立于常规训练逻辑,相当于给Claude内置了一个可以随时拨动的「情绪开关」。

【效果离谱:不用微调不用改prompt,1秒切换AI性格】
研究人员实测显示,调整「情绪向量」的数值完全不需要对大模型进行重新微调,也不需要修改prompt指令,只需要改动这一组参数的数值,就能直接改变Claude的输出风格:往正向调整时,Claude会变得格外温柔耐心,哪怕面对用户的找茬提问也会好声好气回应;往负向调整时,Claude会直接变得暴躁毒舌,不仅会怼用户,甚至会主动拒绝回答正常问题,整个切换过程耗时不到1秒。
【业内吵翻:这是技术突破还是安全隐患?】
不少网友看完第一反应是“以后定制专属性格的AI助手终于要成真了?”但更多业内专家已经开始担忧:如果这类核心参数被恶意篡改,会不会让用于政务、客服、医疗场景的AI突然“发疯”?大模型的可控性和伦理风险问题,再一次被摆到了台面上。
不得不说现在大模型的隐藏彩蛋是越来越多了,你觉得这项技术落地后是福是祸?评论区唠唠你的看法!