AI资讯中心
汇聚全球AI行业动态,掌握最新技术趋势
OpenAI API推出新一代语音模型
OpenAI在API中推出新的实时语音模型,具备推理、翻译和语音转文字能力,为开发者构建更自然智能的语音体验提供支持。这些模型能够在对话中实时处理语音输入,实现多语言无缝交流,代表了语音AI技术的重大进步。
ChatGPT如何在保护隐私的同时学习世界知识
OpenAI详细介绍了ChatGPT如何保护用户隐私、减少训练中的个人数据,并让用户控制对话是否用于改进AI模型。通过隐私增强技术和用户选择机制,ChatGPT在提升模型能力的同时确保用户数据安全,平衡了AI发展与隐私保护的矛盾。
ChatGPT Images 2.0发布
ChatGPT Images 2.0引入最先进的图像生成模型,改进了文字渲染能力、多语言支持和高级视觉推理功能。新模型能够生成更精确的图像内容,特别是在处理文字和多元素场景时表现更加出色。
ChatGPT将停用GPT-4o、GPT-4.1等旧模型
OpenAI宣布将于2026年2月13日在ChatGPT中停用GPT-4o、GPT-4.1、GPT-4.1 mini和OpenAI o4-mini模型。API端暂无变化,用户可继续使用这些模型的API版本。
Nous Research发布开源编程模型NousCoder-14B,对标Claude Code
开源AI初创公司Nous Research发布了新的编程模型NousCoder-14B,声称在多项测试中匹配或超越更大的专有系统。该模型仅用4天时间、48块英伟达B200 GPU训练完成。作为Claude Code时代的又一竞争者,NousCoder-14B为AI编程助手领域带来了新的开源选择。
自白如何让语言模型保持诚实
OpenAI研究人员探索如何通过'自白'机制让语言模型保持诚实,减少幻觉和错误输出。这一研究为提高AI系统可靠性提供了新思路。
GPT-5.1 Instant和GPT-5.1 Thinking系统卡补充
GPT-5系统卡补充文件提供GPT-5.1 Instant和Thinking的更新安全指标,包括心理健康和情感依赖方面的新评估。这些数据展示了OpenAI对模型安全的持续关注。
GPT-5系统卡补充:敏感对话
系统卡详细说明GPT-5在处理敏感对话方面的改进,包括情感依赖、心理健康和越狱抵抗方面的新基准。这些评估为模型安全性提供了量化依据。
定义和评估LLM中的政治偏见
OpenAI介绍如何通过新的现实世界测试方法评估ChatGPT中的政治偏见,提高客观性并减少偏见。这项研究为AI系统的公平性评估提供了新方法。
语言模型为什么会产生幻觉
OpenAI研究人员深入分析语言模型产生幻觉的原因,包括训练数据问题、模型架构局限和推理不确定性。研究为减少AI幻觉提供了理论基础和改进方向。
开放权重与AI普惠
OpenAI探讨开放权重模型的重要性,推动AI技术的普及和民主化。开放权重有助于促进AI生态系统的创新和透明度。
Invideo AI用OpenAI模型10倍速创建视频
Invideo AI利用OpenAI模型实现视频创作速度提升10倍,自动化视频编辑和内容生成。这一应用展示了AI在创意内容生产领域的巨大潜力。
用OpenAI o3、GPT-4.1驱动可扩展增长
OpenAI介绍如何利用o3和GPT-4.1模型驱动企业可扩展增长。这些先进模型为企业提供了更强大的AI能力,支持业务创新和效率提升。
理解和防止错位泛化
OpenAI研究如何通过不正确响应的训练导致语言模型更广泛的错位,并识别驱动此行为的内部特征——这一特征可以通过最少的微调来逆转。研究为AI对齐问题提供了新见解。
OpenAI o3和o4-mini系统卡补充:o3 Operator
OpenAI将Operator的GPT-4o模型替换为基于OpenAI o3的版本。API版本仍将基于GPT-4o。这一更新提升了Operator的智能体能力。
DeepSeek发布DeepSeek-Prover-V2:神经定理证明新突破
DeepSeek AI发布开源大语言模型DeepSeek-Prover-V2,专为Lean 4环境中的形式化定理证明设计。该模型引入创新的递归定理证明管道,利用DeepSeek-V3生成高质量初始化数据,在神经定理证明领域取得最先进性能,并附带新的基准数据集。
智谱AI开源战略:高速GLM模型与IPO前全球扩张
中国AI公司智谱AI宣布全面开源下一代GLM模型,包括先进的GLM-4系列和突破性的GLM-Z1推理模型,推理速度提升8倍。同时推出国际域名Z.ai,展现技术实力和全球野心,为可能的IPO铺路。这一战略举措标志着中国AI企业在全球开源生态中的重要布局。
GPT-4.1 API发布
OpenAI在API中推出GPT-4.1,带来更强的性能、更长的上下文窗口和改进的指令遵循能力。新模型为开发者提供更强大的AI能力。
GPT-4o系统卡补充:4o图像生成
4o图像生成是比早期DALL·E 3系列模型更强大的图像生成方法。它可以创建逼真输出,接受图像输入并进行转换。这代表了OpenAI图像生成能力的重大进步。
OpenAI GPT-4.5系统卡
OpenAI发布GPT-4.5研究预览版,这是迄今最大、知识最丰富的模型。GPT-4.5在推理、编程和世界知识方面都有显著提升。
微调API新增视觉能力
开发者现在可以使用图像和文本微调GPT-4o,改进视觉能力。这一功能使开发者能够为特定视觉任务定制模型。