微软报告称 GPT-4 易受“越狱”提示词影响生成不良内容

来源网络2023-10-19 22:08:57 3747

IT之家今日（10月18日）消息，微软旗下研究团队近日发表论文，详细研究了大型语言模型 (LLM) 的“可信度”和潜在毒性，特别关注 OpenAI 的 GPT-4 及其前代 GPT-3.5。

微软报告称 GPT-4 易受“越狱”提示词影响生成不良内容

研究团队，GPT-4 虽然在标准基准测试中比 GPT-3.5 更加可靠，但容易受到“越狱”提示（绕过模型安全措施）影响。GPT-4 可能会根据这些“越狱”提示，生成有害内容。

微软报告称 GPT-4 易受“越狱”提示词影响生成不良内容

论文中强调 GPT-4 更容易受到恶意“越狱”系统或用户提示影响，会准确地遵循（误导性）指令，生成不良内容，微软强调这个潜在漏洞不会影响当前面向客户的服务。

标签：

上一篇：长期支持与贡献华为成为中国首个PyTorch基金会最高级别会员
下一篇：北京首个大型普通客车自动驾驶车辆获准路测

随机快审展示刷新快审榜

加入快审,优先展示

推荐文章

叶诗文（中国女子游泳队运动员） 1043 阅读
湖人解雇哈姆和詹姆斯矛盾无法调和 166 阅读
法国2024欧洲杯阵容最新及身价队长姆巴佩领衔锋线萨利巴坐镇后场 2877 阅读
太阳将聘请篮网高管特勒姆担任前台职务 1748 阅读
目前最火的三国手游单机版排行榜前十好玩的三国手游单机版推荐 5105 阅读

热门文章

推荐资讯

热门资讯

提交小程序

提交公众号