java python - 搜索 News

7 小时

北航开源Code2Bench：双扩展动态评测，代码大模型告别躺平刷分

在衡量大语言模型（LLM）代码生成能力的竞赛中，一个日益严峻的问题正浮出水面：当模型在 Humaneval、MBPP 等经典基准上纷纷取得近乎饱和的成绩时，我们究竟是在评估其真实的泛化推理能力，还是在检验其对训练语料库的「记忆力」？现有的代码基准正面临两大核心挑战：数据污染的风险，以及测试严谨性不足。前者使评测可能退化为「开卷考试」，后者则常常导致一种「正确的幻觉」（Illusion of Co ...

5 小时

OpenClaw 爆红内幕：Peter 首谈 Meta / OpenAI 争夺战，Agent 自修改代码意味 ...

2026 年开年，技术圈真正的核爆点，不是某个新模型参数翻倍，而是全球第一播客一场 3 小时的深度对谈。主角是 Peter Steinberger ——OpenClaw 的创始人。主持人是 Lex Fridman ——技术播客顶流。 OpenClaw 的起点并不复杂。 Peter 只是把 WhatsApp 消息流接到了模型 CLI。消息进来 → 调模型 → 把结果发回去。逻辑简单到极致。

9 小时

全线开放！OpenAI 发布 GPT-5.3-Codex：深度融合推理能力的“最强编程 ...

继本月初小范围测试后，OpenAI 旗下的编程大模型 GPT-5.3-Codex 现已正式面向全球开发者全线开放。现在，所有用户均可通过 OpenAI API 官方平台或 OpenRouter 等第三方平台直接调用这款目前最强的智能体式编程工具。

腾讯网

AI写论文不用愁！这5款AI论文生成神器，全程助力毕业论文写作！

在2025年，随着学术写作智能化的浪潮席卷而来，使用AI写论文的工具的人越来越多。当面临撰写硕士和博士论文这样的长篇论文时，很多工具往往无法满足学术需求。这些AI论文写作工具在理论深度上有所欠缺，逻辑结构也常常显得松散，难以真正解决专业领域的写作问题 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果