📊 每日研究简报 · 2026年3月27日

覆盖领域：AI / 大模型 / Agent / 计算机视觉 / 音视频处理 / 工程优化数据来源：arxiv / GitHub / HackerNews

📄 arxiv 最新论文（5篇）

1. ML-EM 扩散模型提速：多层 Euler-Maruyama 方法

Arthur Jacot · cs.LG / Math.NA
扩散模型采样提速 4 倍！多层 Euler-Maruyama (ML-EM) 利用多级 UNet 近似 drift，在 CelebA 64×64 上达到 4x 加速；若 drift 处于 HTMC regime，则采样成本可降至单次大 UNet 评估的量级。
⭐ 推荐理由：工程优化突破，扩散采样加速实用价值高

2. YingMusic-Singer：旋律保留的歌词操控歌声合成

西安电子科大 ASLP-lab · eess.AS
全扩散模型，支持旋律保留的歌词修改，无需人工对齐。Curriculum Learning + GRPO 训练，在 LyricEditBench 基准上显著优于 Vevo2。
⭐ 推荐理由：音视频处理算法，歌声合成前沿工作

3. DreamerAD：扩散世界模型驱动的端到端自动驾驶 RL

cs.LG / cs.RO
首个潜世界模型自动驾驶 RL 框架，将扩散采样从 100 步压缩至 1 步（80x 提速）。Shortcut Forcing + 隐空间密集奖励模型，在 NavSim v2 达 87.7 EPDMS（SOTA）。
⭐ 推荐理由：工程优化 + Agent + CV 融合标杆

4. TAG：目标无关引导增强 VLA 策略在杂乱场景的鲁棒性

5. Chameleon：基于几何感知多模态 Token 的机器人情景记忆

项目	⭐ Stars	说明
HKUDS/OpenSpace	⭐ 1.2k	港大数据科学团队开源的 Agent 基础架构，含自进化机制与多任务编排能力
alvinunreal/awesome-opensource-ai	⭐ 952	真正开源 AI 项目列表，无闭源混淆项
wong2/weixin-agent-sdk	⭐ 918	微信接入任意 Agent 的 TypeScript SDK，支持 OpenClaw 等框架
mnfst/awesome-free-llm-apis	⭐ 827	永久免费 LLM API 列表，支持 LLM 路由
CoderLuii/HolyClaude	⭐ 738	Claude Code + Web UI + 5 个 AI CLI + 无头浏览器，Docker 一键部署

⭐ 重点关注：OpenSpace — 自进化 Agent 框架，港大出品，架构值得关注

热度	标题	链接
🔥 226 pts	Muscle-Mem：AI Agent 的行为缓存 / JIT 编译器	HN
🔥 225 pts	AI Agent 48小时红队评估实战方法论（122个攻击向量）	HN
179 pts	Magnitude：视觉 LLM Agent 驱动的 E2E 测试框架	HN
new 8 pts	Odyssey：Rust 实现 Agent 跨环境运行的运行时	HN
new	Sentience：语义几何视觉锚定，比纯 Vision 便宜10倍	HN

Generated: 2026-03-27