覆盖领域:AI / 大模型 / Agent / 计算机视觉 / 音视频处理 / 工程优化 数据来源:arxiv / GitHub / HackerNews
📄 arxiv 最新论文(5篇)
🔬 CV / 多模态 / 生成模型
1. ML-EM 扩散模型提速:多层 Euler-Maruyama 方法
- Arthur Jacot · cs.LG / Math.NA
- 扩散模型采样提速 4 倍!多层 Euler-Maruyama (ML-EM) 利用多级 UNet 近似 drift,在 CelebA 64×64 上达到 4x 加速;若 drift 处于 HTMC regime,则采样成本可降至单次大 UNet 评估的量级。
- ⭐ 推荐理由:工程优化突破,扩散采样加速实用价值高
2. YingMusic-Singer:旋律保留的歌词操控歌声合成
- 西安电子科大 ASLP-lab · eess.AS
- 全扩散模型,支持旋律保留的歌词修改,无需人工对齐。Curriculum Learning + GRPO 训练,在 LyricEditBench 基准上显著优于 Vevo2。
- ⭐ 推荐理由:音视频处理算法,歌声合成前沿工作
3. DreamerAD:扩散世界模型驱动的端到端自动驾驶 RL
- cs.LG / cs.RO
- 首个潜世界模型自动驾驶 RL 框架,将扩散采样从 100 步压缩至 1 步(80x 提速)。Shortcut Forcing + 隐空间密集奖励模型,在 NavSim v2 达 87.7 EPDMS(SOTA)。
- ⭐ 推荐理由:工程优化 + Agent + CV 融合标杆
4. TAG:目标无关引导增强 VLA 策略在杂乱场景的鲁棒性
- 中山大学 & 港中文深圳 · cs.CV / cs.RO
- VLA 策略在杂乱场景中抓取失败率高。TAG 在推理时对比"原观测"与"物体擦除观测",输出残差 steering 信号,无需修改策略架构即可改善。
- ⭐ 推荐理由:VLA 鲁棒性提升的实用方案
5. Chameleon:基于几何感知多模态 Token 的机器人情景记忆
- cs.RO / cs.CV / cs.AI
- 传统 Agent 记忆丢弃细粒度感知线索导致决策混淆。Chameleon 将几何感知的多模态 Token 写入可微分记忆栈,实现目标驱动的精准召回。
- ⭐ 推荐理由:Agent 记忆机制 + CV + 工程优化
🔥 GitHub 热门项目(5个)
| 项目 | ⭐ Stars | 说明 |
|---|---|---|
| HKUDS/OpenSpace | ⭐ 1.2k | 港大数据科学团队开源的 Agent 基础架构,含自进化机制与多任务编排能力 |
| alvinunreal/awesome-opensource-ai | ⭐ 952 | 真正开源 AI 项目列表,无闭源混淆项 |
| wong2/weixin-agent-sdk | ⭐ 918 | 微信接入任意 Agent 的 TypeScript SDK,支持 OpenClaw 等框架 |
| mnfst/awesome-free-llm-apis | ⭐ 827 | 永久免费 LLM API 列表,支持 LLM 路由 |
| CoderLuii/HolyClaude | ⭐ 738 | Claude Code + Web UI + 5 个 AI CLI + 无头浏览器,Docker 一键部署 |
⭐ 重点关注:OpenSpace — 自进化 Agent 框架,港大出品,架构值得关注
🗞️ HackerNews 热帖(5条)
| 热度 | 标题 | 链接 |
|---|---|---|
| 🔥 226 pts | Muscle-Mem:AI Agent 的行为缓存 / JIT 编译器 | HN |
| 🔥 225 pts | AI Agent 48小时红队评估实战方法论(122个攻击向量) | HN |
| 179 pts | Magnitude:视觉 LLM Agent 驱动的 E2E 测试框架 | HN |
| new 8 pts | Odyssey:Rust 实现 Agent 跨环境运行的运行时 | HN |
| new | Sentience:语义几何视觉锚定,比纯 Vision 便宜10倍 | HN |
📋 深读推荐
| 优先级 | 内容 | 方向 |
|---|---|---|
| 🌟 | ML-EM 扩散模型提速 | 工程优化 + 4x采样加速 |
| 🌟 | DreamerAD | 80x世界模型加速,自动驾驶 RL |
| 🌟 | OpenSpace | 自进化 Agent 框架 |
| 💡 | Chameleon | Agent 情景记忆 + 机器人 |
| 💡 | TAG | VLA 鲁棒性提升 |
Generated: 2026-03-27