
有AI加持的游戏越来越有趣,但带来的安全风险同样不小。如何两全?近日,PG电子旗下盛趣游戏与火山引擎展开合作,通过部署“火山引擎大模型应用防火墙”,结合盛趣游戏内部的知识库,打造了一站式、全链路安全防线,让智能NPC既聪明灵动,又安全放心。同时,领先的低延时技术也令游戏玩家体验更流畅。
《传奇世界》智能NPC“玄玄老人”
对玩家、厂商而言,游戏世界有着严格的内容合规边界,AI大模型增强了游戏交互性、可玩性的同时,也让剧情内容更加随机,增大了合规隐患。不过,智能NPC也面临着大模型领域所特有的安全风险,比如内容输入与输出合规、提示词注入攻击等。NPC不但需要严格避免输出敏感、违规内容,还要在遇到玩家输入违规指令时,第一时间拦截并对玩家做出正确引导。另外还有攻击者通过角色扮演、对话模拟、越狱攻击和目标劫持等方式设置“语言陷阱”,诱导大模型输出不安全信息,甚至导致模型“越狱”,绕过大模型安全机制,执行恶意操作。
大模型让NPC拥有“自由意志”的同时,也放大了安全风险——如果NPC被玩家诱导产出暴力粗俗、违背伦理道德的言论怎么办?如果大模型“越狱”,跨过合规边界,被不法分子利用了怎么办?如何在保障玩家体验的同时,对智能NPC进行全面的安全防护?这是一道安全与性能必须兼顾的难题。而这正是盛趣游戏与火山引擎合作的初衷和目标——当技术赋能游戏体验升级的同时,盛趣游戏亦以行业责任感为标尺,严守技术应用的安全边界,防止技术“越界”被不法利用。
此次盛趣游戏联合火山引擎展开协作,围绕大模型全生命周期构建起一道坚实的防火墙,不仅有效保障了NPC内容输入和输出合规,还针对大模型特有的攻防难点如提示词注入、算力滥用、模型滥用等展开全面防护。例如针对敏感词防护,“火山引擎大模型应用防火墙“可基于游戏场景与内容调优,对敏感词“加白”放行,大幅降低误触与误报率;针对游戏行业常见的“角色扮演”提示词注入攻击,防火墙可快速识别风险,引导用户提出正确问题。截止目前,“火山引擎大模型应用防火墙”已成功拦截近10万次攻击。另外,火山引擎通过与盛趣游戏的打磨、模型调优,将延时降低至180ms,在安全的基础上保障了玩家体验。
防火墙的“加入”,让NPC输入输出更合规、攻击防护更严密、游戏体验更流畅。目前,盛趣游戏旗下《传奇世界》《龙之谷》已经部署了“火山引擎大模型应用防火墙”,未来还有3款待上线的游戏将会接入。