AI资讯中心
汇聚全球AI行业动态,掌握最新技术趋势
Hugging Face托管恶意软件伪装成OpenAI发布
研究人员发现Hugging Face上存在伪装成OpenAI发布的恶意仓库,向Windows机器传递信息窃取恶意软件,在被移除前已记录约24.4万次下载。安全专家还发现了另外六个具有相同攻击基础设施的仓库。这一事件凸显了AI开发工作流程中的安全风险,攻击者正利用AI仓库作为入侵途径。
Laserfiche发布自然语言工作流AI智能体
Laserfiche宣布推出可通过自然语言提示执行任务的AI智能体。这些智能助手遵循Laserfiche的集成安全规则和合规要求,确保敏感数据得到保护。Laserfiche CEO表示,AI智能体的引入标志着内容管理信息生命周期处理方式的变革,将繁琐工作交给智能体自动完成。
ChatGPT推出'可信联系人'安全功能
ChatGPT推出可选安全功能'可信联系人',当检测到严重的自残风险时会通知用户信任的人。这一功能是OpenAI安全措施的重要组成部分,旨在为可能处于危机中的用户提供额外支持,同时保护用户隐私和自主权。
OpenAI安全漏洞赏金计划上线
OpenAI推出安全漏洞赏金计划,旨在识别AI滥用和安全风险,包括智能体漏洞、提示注入和数据泄露等问题。该计划鼓励安全研究人员参与AI安全防护,共同构建更安全的AI生态系统。
更新Model Spec加强青少年保护
OpenAI更新Model Spec,新增18岁以下原则,定义ChatGPT如何以安全、适龄的方式支持青少年,基于发展科学研究提供指导。更新加强了高风险情况下的防护措施。
从硬性拒绝到安全完成:改进模型输出
OpenAI介绍如何改进模型从硬性拒绝到安全完成的转变,提升模型在敏感话题上的有用性和安全性。这一改进使AI能更好地处理复杂内容。
更新后的防范框架
OpenAI发布更新后的防范框架,详细说明如何识别和管理前沿AI模型的风险。该框架是AI安全治理的重要组成部分。
通过网络安全拨款赋能防御者
OpenAI推出网络安全拨款计划,支持研究人员发现和修复AI系统的安全漏洞。该计划有助于构建更安全的AI生态系统。
前沿风险与防范
为支持高能力AI系统的安全,OpenAI正在开发应对灾难性风险的方法,包括建立防范团队和启动挑战赛。这一框架是AI安全治理的重要组成。