AI资讯中心

汇聚全球AI行业动态，掌握最新技术趋势

标签筛选(6)

研究人员发现Hugging Face上存在伪装成OpenAI发布的恶意仓库，向Windows机器传递信息窃取恶意软件，在被移除前已记录约24.4万次下载。安全专家还发现了另外六个具有相同攻击基础设施的仓库。这一事件凸显了AI开发工作流程中的安全风险，攻击者正利用AI仓库作为入侵途径。

Laserfiche宣布推出可通过自然语言提示执行任务的AI智能体。这些智能助手遵循Laserfiche的集成安全规则和合规要求，确保敏感数据得到保护。Laserfiche CEO表示，AI智能体的引入标志着内容管理信息生命周期处理方式的变革，将繁琐工作交给智能体自动完成。

ChatGPT推出可选安全功能'可信联系人'，当检测到严重的自残风险时会通知用户信任的人。这一功能是OpenAI安全措施的重要组成部分，旨在为可能处于危机中的用户提供额外支持，同时保护用户隐私和自主权。

OpenAI推出安全漏洞赏金计划，旨在识别AI滥用和安全风险，包括智能体漏洞、提示注入和数据泄露等问题。该计划鼓励安全研究人员参与AI安全防护，共同构建更安全的AI生态系统。

OpenAI更新Model Spec，新增18岁以下原则，定义ChatGPT如何以安全、适龄的方式支持青少年，基于发展科学研究提供指导。更新加强了高风险情况下的防护措施。

OpenAI介绍如何改进模型从硬性拒绝到安全完成的转变，提升模型在敏感话题上的有用性和安全性。这一改进使AI能更好地处理复杂内容。

OpenAI发布更新后的防范框架，详细说明如何识别和管理前沿AI模型的风险。该框架是AI安全治理的重要组成部分。

OpenAI推出网络安全拨款计划，支持研究人员发现和修复AI系统的安全漏洞。该计划有助于构建更安全的AI生态系统。

为支持高能力AI系统的安全，OpenAI正在开发应对灾难性风险的方法，包括建立防范团队和启动挑战赛。这一框架是AI安全治理的重要组成。