📊 每日研究简报 · 2026年3月21-22日

📊 每日研究简报 · 2026年3月21-22日

覆盖领域:AI / 大模型 / Agent / 计算机视觉 / 音视频处理 / 工程优化 数据来源:arxiv / GitHub Trending / HackerNews / 中文社区(知乎/掘金需登录暂不可用)


📄 arxiv 最新论文摘要(3月19-22日)

⭐ CV / 多模态 / 生成模型

1. VEGA-3D: Generation Models Know Space

  • 利用视频生成模型的隐式 3D 先验进行场景理解,MLLM 虽语义能力强但存在空间盲区
  • ⭐ 推荐理由:CV + 生成模型 + 3D 场景理解的前沿融合

2. Matryoshka Gaussian Splatting

  • 实现从单一模型可调保真度的场景渲染(Level of Detail),对 3D GS 实际部署意义重大
  • ⭐ 推荐理由:工程优化 + 3D 重建实用突破

3. Cubic Discrete Diffusion: Discrete Visual Generation

  • 将离散扩散与高维表征 Token 结合,实现与语言模型统一的 Token 预测范式
  • ⭐ 推荐理由:多模态 Token 统一生成范式新思路

4. EffectErase: Joint Video Object Removal and Insertion

  • 消除视频中动态目标及其视觉影响(阴影、倒影等)并高质量修复
  • ⭐ 推荐理由:视频编辑 + CV 实用工程

5. SAMA: Factorized Semantic Anchoring and Motion Alignment

  • 解决指令引导视频编辑中语义修改与运动保持的平衡难题

🤖 大模型 / Agent / 优化

6. FinTradeBench: Financial Reasoning Benchmark for LLMs

  • 构建金融决策推理基准,需综合公司基本面、异构信号进行推理
  • ⭐ 推荐理由:LLM 金融领域应用评估标准

7. Nemotron-Cascade 2: Post-Training LLMs

  • 采用 Cascade RL + 多域 On-Policy 蒸馏的后训练方法
  • ⭐ 推荐理由:大模型后训练优化方向

8. F2LLM-v2: Multilingual Embeddings(8 sizes, 80M-14B)

  • 多语言通用嵌入模型,兼顾包容性、性能与效率

9. DriveTok: 3D Driving Scene Tokenization

  • 统一多视角重建与理解的 3D 驾驶场景 Token 化方案

10. Not All Features Are Created Equal (VLA Models)

  • 对 Vision-Language-Action 模型进行机制化研究,揭示特征不等价问题

🔥 GitHub AI 热门项目(近一周)

项目 ⭐ Stars 说明
ClawTeam / HKUDS ⭐ 2,602 Agent Swarm Intelligence,单命令→全自动化,港大数据挖掘组
wangziqi06/724-office ⭐ 530 自主进化 AI Agent 系统,26工具、3500行纯Python、MCP/三层记忆、自修复
NeoVertex1/nuggets ⭐ 315 首个全息记忆 AI 助手
huggingface/hf-agents ⭐ 314 本地编码 Agent,llama.cpp 驱动
mattprusak/autoresearch-genealogy ⭐ 856 AI 辅助族谱研究结构化提示模板

重点关注:ClawTeam — 多 Agent 协作 Swarm 框架,2600+ Stars,架构设计值得深入研究


🗞️ HackerNews 热帖(3月20-22日)

热度 标题 链接
🔥 116👍 24💬 Patchwork – 开源框架自动化开发琐事 github
10👍 Pomerium Agentic Access Gateway – AI Agent 动态认证
6👍 2💬 Cheevly – 自然语言 IDE 构建协作 AI Agent
5👍 nanochat C++ 重写(ggml 推理) github
5👍 2💬 Claude Sonnet 4.5 免费(靠广告支持)
4👍 Forge – 3MB Rust 二进制协调多 AI 编程 Agent github

📋 今日深读推荐

优先级 内容 方向
🌟 VEGA-3D CV + 生成模型 + 3D 场景理解
🌟 Cubic Discrete Diffusion 多模态 Token 统一生成范式
🌟 ClawTeam Agent Swarm 协作标杆项目
💡 FinTradeBench LLM 金融推理能力评估
💡 724-office 自主进化 AI Agent 工程实践

⚠️ 说明

  • 知乎 / 掘金中文社区目前 API 需登录,暂无法自动抓取内容
  • GitHub Trending 直连有时不稳定,备用方案使用 GitHub API 搜索近一周新晋热门项目
  • HackerNews 借助 Algolia API 过滤 AI/ML 相关热帖

Generated: 2026-03-22