覆盖领域:AI / 大模型 / Agent / 计算机视觉 / 音视频处理 / 工程优化 数据来源:arxiv / GitHub Trending / HackerNews / 中文社区(知乎/掘金需登录暂不可用)
📄 arxiv 最新论文摘要(3月19-22日)
⭐ CV / 多模态 / 生成模型
1. VEGA-3D: Generation Models Know Space
- 利用视频生成模型的隐式 3D 先验进行场景理解,MLLM 虽语义能力强但存在空间盲区
- ⭐ 推荐理由:CV + 生成模型 + 3D 场景理解的前沿融合
2. Matryoshka Gaussian Splatting
- 实现从单一模型可调保真度的场景渲染(Level of Detail),对 3D GS 实际部署意义重大
- ⭐ 推荐理由:工程优化 + 3D 重建实用突破
3. Cubic Discrete Diffusion: Discrete Visual Generation
- 将离散扩散与高维表征 Token 结合,实现与语言模型统一的 Token 预测范式
- ⭐ 推荐理由:多模态 Token 统一生成范式新思路
4. EffectErase: Joint Video Object Removal and Insertion
- 消除视频中动态目标及其视觉影响(阴影、倒影等)并高质量修复
- ⭐ 推荐理由:视频编辑 + CV 实用工程
5. SAMA: Factorized Semantic Anchoring and Motion Alignment
- 解决指令引导视频编辑中语义修改与运动保持的平衡难题
🤖 大模型 / Agent / 优化
6. FinTradeBench: Financial Reasoning Benchmark for LLMs
- 构建金融决策推理基准,需综合公司基本面、异构信号进行推理
- ⭐ 推荐理由:LLM 金融领域应用评估标准
7. Nemotron-Cascade 2: Post-Training LLMs
- 采用 Cascade RL + 多域 On-Policy 蒸馏的后训练方法
- ⭐ 推荐理由:大模型后训练优化方向
8. F2LLM-v2: Multilingual Embeddings(8 sizes, 80M-14B)
- 多语言通用嵌入模型,兼顾包容性、性能与效率
9. DriveTok: 3D Driving Scene Tokenization
- 统一多视角重建与理解的 3D 驾驶场景 Token 化方案
10. Not All Features Are Created Equal (VLA Models)
- 对 Vision-Language-Action 模型进行机制化研究,揭示特征不等价问题
🔥 GitHub AI 热门项目(近一周)
| 项目 | ⭐ Stars | 说明 |
|---|---|---|
| ClawTeam / HKUDS | ⭐ 2,602 | Agent Swarm Intelligence,单命令→全自动化,港大数据挖掘组 |
| wangziqi06/724-office | ⭐ 530 | 自主进化 AI Agent 系统,26工具、3500行纯Python、MCP/三层记忆、自修复 |
| NeoVertex1/nuggets | ⭐ 315 | 首个全息记忆 AI 助手 |
| huggingface/hf-agents | ⭐ 314 | 本地编码 Agent,llama.cpp 驱动 |
| mattprusak/autoresearch-genealogy | ⭐ 856 | AI 辅助族谱研究结构化提示模板 |
⭐ 重点关注:ClawTeam — 多 Agent 协作 Swarm 框架,2600+ Stars,架构设计值得深入研究
🗞️ HackerNews 热帖(3月20-22日)
| 热度 | 标题 | 链接 |
|---|---|---|
| 🔥 116👍 24💬 | Patchwork – 开源框架自动化开发琐事 | github |
| 10👍 | Pomerium Agentic Access Gateway – AI Agent 动态认证 | — |
| 6👍 2💬 | Cheevly – 自然语言 IDE 构建协作 AI Agent | — |
| 5👍 | nanochat C++ 重写(ggml 推理) | github |
| 5👍 2💬 | Claude Sonnet 4.5 免费(靠广告支持) | — |
| 4👍 | Forge – 3MB Rust 二进制协调多 AI 编程 Agent | github |
📋 今日深读推荐
| 优先级 | 内容 | 方向 |
|---|---|---|
| 🌟 | VEGA-3D | CV + 生成模型 + 3D 场景理解 |
| 🌟 | Cubic Discrete Diffusion | 多模态 Token 统一生成范式 |
| 🌟 | ClawTeam | Agent Swarm 协作标杆项目 |
| 💡 | FinTradeBench | LLM 金融推理能力评估 |
| 💡 | 724-office | 自主进化 AI Agent 工程实践 |
⚠️ 说明
- 知乎 / 掘金中文社区目前 API 需登录,暂无法自动抓取内容
- GitHub Trending 直连有时不稳定,备用方案使用 GitHub API 搜索近一周新晋热门项目
- HackerNews 借助 Algolia API 过滤 AI/ML 相关热帖
Generated: 2026-03-22