2月11日消息,OpenAI宣布升级其Responses API,新增Server-side Compaction(服务器端记忆压缩)、Hosted Shell Containers(托管终端容器)以及对开放“Skills”标准的支持。这一系列更新直指AI代理在实际应用中最核心的两个难题:记忆衰减和执行能力不足。
【新智元导读】Feeling AI凭借CodeBrain-1在权威榜单Terminal-Bench 2.0中强势突围,仅次于OpenAI最新旗舰,位居全球第二。不仅打破了美系巨头的绝对垄断,更标志着中国AI在 Agentic ...
Anthropic 和 OpenAI 硬碰硬推出 Claude Opus 4.6 和 GPT-5.3-Codex 后,基础大模型的较量正式进入了实战比拼阶段。模型规划更加谨慎,维持更长时间的自主工作流等能力提升正在试图回应大模型商业化落地 “最后一公里” 的能力要求和用户期待。 在两家顶尖模型的硬核指标评测中,Opus 4.6 和 5.3-Codex 都不约而同的亮出了各自在 Terminal-B ...
AI圈迎来了新年的第一个双响炮啊, Anthropic刚发了Claude Opus 4.6,OpenAI也发了GPT‑5.3-Codex,在Codex ...
在知识工作能力的评测GDPval-AA 上,Opus 4.6比OpenAI的GPT-5.2高出约144Elo分,比自己的前代Opus 4.5高出190分。这个测试涵盖了金融、法律等领域的实际工作任务,比如制作财务分析报告、起草法律文件、做市场调研等。
2026年2月5日,AI行业发生了一件载入史册的事。OpenAI和Anthropic在相隔不到20分钟的时间内,分别发布了GPT-5.3-Codex和Claude Opus 4.6——两个代表完全不同进化方向的顶级模型。一个学会了"自我繁殖": ...
智能Agent的“守护卫士”:博特智能大模型安全围栏为OpenClaw筑牢安全防线,博特,大模型,围栏,agent,openclaw,隔离 ...
2026年的这一天注定会被写入AI发展史。 Claude Opus 4.6和GPT-5.3 Codex在相隔不到一个小时的时间里先后发布。 两家公司似乎都憋着一口气,要在同一个时间节点上交出自己的答卷。 “撞车”的背后,是一场关于资本、技术和市场话语权的较量。 就在两周前,英伟达 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果