LLM 每日资讯 - 2026-02-24
共采集 415 条,去重排序后精选 Top 10
🎧 语音播报
1. OpenAI announces Frontier Alliance Partners
📂 blog / OpenAI ⭐ 9.0/10 ★★★★★★★★★☆
📅 2026-02-23 05:30 UTC
OpenAI宣布了Frontier Alliance合作伙伴计划,帮助企业从AI试点转向生产,实现安全、可扩展的代理部署。
2. Introducing EVMbench
📂 blog / OpenAI ⭐ 9.0/10 ★★★★★★★★★☆
📅 2026-02-18 00:00 UTC
OpenAI和Paradigm推出了EVMbench,一个评估AI代理检测、修补和利用高严重性智能合约漏洞能力的基准。
3. GGML and llama.cpp join HF to ensure the long-term progress of Local AI
📂 blog / Hugging Face ⭐ 9.0/10 ★★★★★★★★★☆
📅 2026-02-20 00:00 UTC
GGML和llama.cpp加入Hugging Face,这代表了本地AI生态系统的重要发展,有助于确保本地AI的长期进步。
4. Rubrics as an Attack Surface: Stealthy Preference Drift in LLM Judges
📂 hf_papers / HF Daily Papers ⭐ 8.0/10 ★★★★★★★★☆☆
📅 2026-02-13 22:19 UTC
研究揭示了基于LLM的评估流程中一个未被充分认识的安全漏洞,可能导致评分标准诱导的偏好漂移。
5. 4RC: 4D Reconstruction via Conditional Querying Anytime and Anywhere
📂 hf_papers / HF Daily Papers ⭐ 8.0/10 ★★★★★★★★☆☆
📅 2026-02-10 13:57 UTC
研究提出了4RC,一个从单目视频进行4D重建的统一前馈框架,能够学习结合运动和几何的整体4D表示。
6. DeepVision-103K: A Visually Diverse, Broad-Coverage, and Verifiable Mathematical Dataset for Multimodal Reasoning
📂 hf_papers / HF Daily Papers ⭐ 8.0/10 ★★★★★★★★☆☆
📅 2026-02-17 20:51 UTC
研究提出了DeepVision-103K,一个视觉多样化、广泛覆盖且可验证的数学数据集,用于增强大型多模态模型的视觉推理能力。
7. VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training
📂 hf_papers / HF Daily Papers ⭐ 8.0/10 ★★★★★★★★☆☆
📅 2026-02-11 04:48 UTC
研究提出了VESPO,一种变分序列级软策略优化方法,解决了LLM离线训练中的稳定性挑战。
8. Generated Reality: Human-centric World Simulation using Interactive Video Generation with Hand and Camera Control
📂 hf_papers / HF Daily Papers ⭐ 8.0/10 ★★★★★★★★☆☆
📅 2026-02-20 13:45 UTC
研究提出了生成现实,一种以人为中心的视频世界模型,能够响应手部和相机控制信号。
9. CrispEdit: Low-Curvature Projections for Scalable Non-Destructive LLM Editing
📂 hf_papers / HF Daily Papers ⭐ 8.0/10 ★★★★★★★★☆☆
📅 2026-02-17 13:58 UTC
研究提出了CrispEdit,一种低曲率投影方法,实现了可扩展的非破坏性LLM编辑,同时保留通用能力。
10. NESSiE: The Necessary Safety Benchmark – Identifying Errors that should not Exist
📂 hf_papers / HF Daily Papers ⭐ 8.0/10 ★★★★★★★★☆☆
📅 2026-02-18 04:41 UTC
研究提出了NESSiE,一个必要安全基准,能够揭示给定任务复杂度下不应存在的安全相关故障。