英伟达推出 NIM AI 护栏服务,防止模型遭用户“越狱”
作者:高维数码时间:2025-03-25 12:05:02
本站 1 月 18 日消息,英伟达宣布推出一项名为“NIM”的 AI 护栏服务,该服务现已以英伟达 NeMo 护栏(NeMo Guardrails)套件的形式提供,可以让开发人员为大语言模型(LLM)添加一系列护栏规则,旨在解决用户通过提示词“越狱”大模型,防止 AI 生成不符合预期的内容。
英伟达表示,相应AI护栏服务套件基于英伟达的 Aegis 内容安全数据集进行训练而成,该数据集包含了 3.5 万个标注的数据样本,并已在 Hugging Face 上公开,本站附地址如下(点此访问)。
英伟达指出,相应AI护栏套件具有体积小、效率高的特点,在大部分场合中都能流畅运行,企业可以在开发 AI 模型时直接嵌入相应安全套件,可以改善医疗、汽车、制造业等领域部署的AI安全性。
此外,英伟达还提供了公布了一项名为 Garak 的漏洞扫描工具,用于检测模型的安全性,防止模型可能输出幻觉内容或泄露企业内部机密信息。
相关文章
-
华为小艺助手纯血鸿蒙版 App 获 11.2.10.310 升级,新增智能体广场等功能
感谢本站网友 衣蓑 的线索投递! 本站 1 月 20 日消息,华为小艺助手纯血鸿蒙版 App 已陆续获 11 2 10 310 版本更新,应用大小约 99
-
AI 造梦师:香港大学携手快手科技推出 GameFactory 框架,突破游戏场景泛化难题
本站 1 月 20 日消息,香港大学携手快手科技,组建科研团队,提出名为 GameFactory 的创新框架,目标是解决游戏视频生成中的场景泛化难题。该框架利用在开放域视频数据上预训练的视频扩散模型,
-
OPPO Find N5 真机公布:号称“全球最薄折叠旗舰”,二月见
感谢本站网友 王多肉、蓝爵怪蜀黍、软媒新友1933769 的线索投递! 本站 1 月 20 日消息,OPPO Find 系列产品负责人周意保昨晚分享了 F
-
洛图科技:2024 年中国智能门锁销量 1747 万套同比下降 3.0%,小米线上第一
本站 1 月 20 日消息,根据洛图科技最新发布的数据显示,2024 年,中国智能门锁市场的全渠道销量为 1747 万套,同比下降 3 0%。本站从报告获悉,C 端市场的销售占比首次超过一半,达到 5
-
优化主题动效、系统稳定性,华为 nova 12 / Pro 手机获鸿蒙 HarmonyOS NEXT 5.0.0.105 升级
感谢本站网友 最亮的派大星 的线索投递! 本站 1 月 20 日消息,华为 nova 12 标准版和 Pro 款机型于昨日获鸿蒙 HarmonyOS NE
-
OpenAI o3 碾压式 AI 数学成绩遭质疑:既当选手又是裁判,翻版 Theranos 世纪骗局
本站 1 月 20 日消息,科技媒体 TechCrunch 昨日(1 月 19 日)发布博文,报道称 Epoch AI 因未及时披露 OpenAI 的资助而引发争议,其开发的数学基准测试 Fronti