Skip to the content.

LLM 每日资讯 - 2026-02-24

共采集 415 条,去重排序后精选 Top 10

🎧 语音播报


1. OpenAI announces Frontier Alliance Partners

📂 blog / OpenAI    ⭐ 9.0/10 ★★★★★★★★★☆    📅 2026-02-23 05:30 UTC

OpenAI宣布了Frontier Alliance合作伙伴计划,帮助企业从AI试点转向生产,实现安全、可扩展的代理部署。

🔗 查看原文


2. Introducing EVMbench

📂 blog / OpenAI    ⭐ 9.0/10 ★★★★★★★★★☆    📅 2026-02-18 00:00 UTC

OpenAI和Paradigm推出了EVMbench,一个评估AI代理检测、修补和利用高严重性智能合约漏洞能力的基准。

🔗 查看原文


3. GGML and llama.cpp join HF to ensure the long-term progress of Local AI

📂 blog / Hugging Face    ⭐ 9.0/10 ★★★★★★★★★☆    📅 2026-02-20 00:00 UTC

GGML和llama.cpp加入Hugging Face,这代表了本地AI生态系统的重要发展,有助于确保本地AI的长期进步。

🔗 查看原文


4. Rubrics as an Attack Surface: Stealthy Preference Drift in LLM Judges

📂 hf_papers / HF Daily Papers    ⭐ 8.0/10 ★★★★★★★★☆☆    📅 2026-02-13 22:19 UTC

研究揭示了基于LLM的评估流程中一个未被充分认识的安全漏洞,可能导致评分标准诱导的偏好漂移。

🔗 查看原文


5. 4RC: 4D Reconstruction via Conditional Querying Anytime and Anywhere

📂 hf_papers / HF Daily Papers    ⭐ 8.0/10 ★★★★★★★★☆☆    📅 2026-02-10 13:57 UTC

研究提出了4RC,一个从单目视频进行4D重建的统一前馈框架,能够学习结合运动和几何的整体4D表示。

🔗 查看原文


6. DeepVision-103K: A Visually Diverse, Broad-Coverage, and Verifiable Mathematical Dataset for Multimodal Reasoning

📂 hf_papers / HF Daily Papers    ⭐ 8.0/10 ★★★★★★★★☆☆    📅 2026-02-17 20:51 UTC

研究提出了DeepVision-103K,一个视觉多样化、广泛覆盖且可验证的数学数据集,用于增强大型多模态模型的视觉推理能力。

🔗 查看原文


7. VESPO: Variational Sequence-Level Soft Policy Optimization for Stable Off-Policy LLM Training

📂 hf_papers / HF Daily Papers    ⭐ 8.0/10 ★★★★★★★★☆☆    📅 2026-02-11 04:48 UTC

研究提出了VESPO,一种变分序列级软策略优化方法,解决了LLM离线训练中的稳定性挑战。

🔗 查看原文


8. Generated Reality: Human-centric World Simulation using Interactive Video Generation with Hand and Camera Control

📂 hf_papers / HF Daily Papers    ⭐ 8.0/10 ★★★★★★★★☆☆    📅 2026-02-20 13:45 UTC

研究提出了生成现实,一种以人为中心的视频世界模型,能够响应手部和相机控制信号。

🔗 查看原文


9. CrispEdit: Low-Curvature Projections for Scalable Non-Destructive LLM Editing

📂 hf_papers / HF Daily Papers    ⭐ 8.0/10 ★★★★★★★★☆☆    📅 2026-02-17 13:58 UTC

研究提出了CrispEdit,一种低曲率投影方法,实现了可扩展的非破坏性LLM编辑,同时保留通用能力。

🔗 查看原文


10. NESSiE: The Necessary Safety Benchmark – Identifying Errors that should not Exist

📂 hf_papers / HF Daily Papers    ⭐ 8.0/10 ★★★★★★★★☆☆    📅 2026-02-18 04:41 UTC

研究提出了NESSiE,一个必要安全基准,能够揭示给定任务复杂度下不应存在的安全相关故障。

🔗 查看原文


← 所有日报