{ "title": "每日研究简报 2026-05-31", "url": "/posts/research-brief-2026-05-31/", "permalink": "https://hackcv.com/posts/research-brief-2026-05-31/", "date": "2026-05-31", "lastmod": "2026-05-31", "author": "", "description": "AI / 大模型 / Agent / 计算机视觉 / 音视频处理算法 / 工程优化领域每日研究简报", "categories": ["研究简报"], "tags": ["AI","大模型","Agent","计算机视觉","音视频处理","工程优化","每日简报"], "cover": "https://picsum.photos/seed/%E6%AF%8F%E6%97%A5%E7%A0%94%E7%A9%B6%E7%AE%80%E6%8A%A5-2026-05-31/1200/675", "readingTime": 2, "wordCount": 456, "content": "\u003cblockquote\u003e\n\u003cp\u003e📅 生成时间：2026年5月31日 23:30 (Asia/Shanghai) | 数据来源：arXiv · GitHub · HackerNews · 科技媒体 · 大厂博客\u003c/p\u003e\n\u003c/blockquote\u003e\n\u003chr\u003e\n\u003ch2 id=\"-一arxiv-最新论文\"\u003e📄 一、arXiv 最新论文\u003c/h2\u003e\n\u003ch3 id=\"1-sia-self-improving-ai-with-harness--weight-updates\"\u003e1. SIA: Self-Improving AI with Harness \u0026amp; Weight Updates\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e方向\u003c/strong\u003e：AI自进化/大模型\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：Hexo Labs发布的自进化AI框架SIA，实现了无需人工干预的模型权重自主更新与能力迭代，在代码生成基准上性能提升27%\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：AI自进化是未来核心方向，该框架为模型自主迭代提供了可落地的技术路线\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://arxiv.org/abs/2605.27276\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"2-qwen-vla-unifying-vision-language-action-modeling-across-tasks-environments-and-robot-embodiments\"\u003e2. Qwen-VLA: Unifying Vision-Language-Action Modeling across Tasks, Environments, and Robot Embodiments\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e方向\u003c/strong\u003e：多模态/具身智能\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：通义千问团队发布的统一视觉-语言-动作模型Qwen-VLA，支持跨机器人平台的具身任务理解与执行，在12项具身智能基准上取得SOTA\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：具身智能是AI落地实体世界的核心技术，该模型降低了多机器人平台的开发成本\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://arxiv.org/abs/2605.30280\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"3-self-improving-language-models-with-bidirectional-evolutionary-search\"\u003e3. Self-Improving Language Models with Bidirectional Evolutionary Search\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e方向\u003c/strong\u003e：大模型优化/进化算法\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：哈佛大学与MIT联合提出的双向进化搜索自改进大模型框架，无需额外训练数据即可让模型在数学推理上提升18%\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：突破了大模型改进依赖高质量训练数据的瓶颈，为低成本模型迭代提供了新思路\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://arxiv.org/abs/2605.28814\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"4-forgetting-in-language-models-capacity-optimization-and-self-generated-replay\"\u003e4. Forgetting in Language Models: Capacity, Optimization, and Self-Generated Replay\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e方向\u003c/strong\u003e：大模型基础研究/灾难性遗忘\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：纽约大学团队深入研究大模型的灾难性遗忘问题，提出了自生成回放缓解方案，让模型在学习新能力时旧能力保留率提升42%\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：解决了大模型持续学习的核心痛点，对Agent长期记忆能力提升有重要参考价值\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://arxiv.org/abs/2605.26097\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"5-do-language-models-need-sleep-offline-recurrence-for-improved-online-inference\"\u003e5. Do Language Models Need Sleep? Offline Recurrence for Improved Online Inference\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e方向\u003c/strong\u003e：大模型推理优化/离线学习\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：CMU团队提出了大模型\u0026quot;睡眠\u0026quot;机制，通过离线递归处理历史对话数据，让模型在线推理时上下文理解能力提升23%，同时减少30%的token消耗\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：创新的模型推理优化思路，大幅提升了长上下文对话的效率与效果\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://arxiv.org/abs/2605.26099\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"6-mira-medical-time-series-foundation-model-with-454b-token-pre-training\"\u003e6. MIRA: Medical Time-series Foundation Model with 454B Token Pre-training\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e方向\u003c/strong\u003e：AI医疗/时序大模型\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：微软发布的医疗时序基座模型MIRA，使用4540亿token预训练，解决了医疗数据不规则采样和异构数据处理难题，在17项医疗预测任务上超越现有SOTA\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：医疗AI落地的核心基础模型，为各类医疗场景的AI应用提供了强大的基座能力\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://arxiv.org/abs/2506.07584\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"7-k-dense-analyst-hierarchical-multi-agent-architecture-for-autonomous-scientific-research\"\u003e7. K-Dense Analyst: Hierarchical Multi-agent Architecture for Autonomous Scientific Research\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e方向\u003c/strong\u003e：AI科研/多Agent系统\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：Biostate AI发布的K-Dense Analyst多Agent科研系统，采用层级多Agent双环架构，在生物信息学测试中准确率达到81.2%，超越GPT-5的52.9%\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：AI科研助手的突破性进展，大幅提升了科研工作的效率与探索边界\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://arxiv.org/pdf/2508.07043\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"8-celltransformer-a-deep-learning-model-for-high-resolution-mouse-brain-mapping\"\u003e8. CellTransformer: A Deep Learning Model for High-resolution Mouse Brain Mapping\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e方向\u003c/strong\u003e：AI生命科学/脑科学\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：斯坦福大学团队开发的CellTransformer模型，助力绘制目前最精细的小鼠脑图，为探索大脑工作机制开辟了新路径\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：AI与生命科学交叉的前沿成果，为脑科学研究提供了强大的工具支持\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：发表于《自然-通讯》2026年5月\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"9-skillevolver-meta-skill-driven-framework-for-autonomous-skill-evolution-in-ai-agents\"\u003e9. SkillEvolver: Meta-skill Driven Framework for Autonomous Skill Evolution in AI Agents\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e方向\u003c/strong\u003e：Agent技能进化\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：清华大学团队提出的SkillEvolver元技能驱动Agent技能自进化框架，在SkillsBench基准上达到56.8%的平均成功率，反超人类编写技能的43.6%\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：Agent技能从人工编写到自动进化的里程碑式成果，大幅降低了AI技能的开发成本\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://arxiv.org/abs/2605.29147\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"10-embodiskill-a-skill-representation-framework-for-general-purpose-embodied-agents\"\u003e10. EmbodiSkill: A Skill Representation Framework for General-purpose Embodied Agents\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e方向\u003c/strong\u003e：具身智能/技能表示\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：清华大学团队提出的EmbodiSkill通用具身智能体技能表示框架，在ALFWorld基准上达到93.28%的任务成功率，远超GPT-5.2直接执行的70.89%\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：具身智能技能标准化的重要突破，为通用机器人的技能迁移共享提供了基础\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://arxiv.org/abs/2605.29148\u003c/li\u003e\n\u003c/ul\u003e\n\u003chr\u003e\n\u003ch2 id=\"-二github-热门项目\"\u003e🌟 二、GitHub 热门项目\u003c/h2\u003e\n\u003ch3 id=\"1-multica-aiandrej-karpathy-skills\"\u003e1. multica-ai/andrej-karpathy-skills\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e星标\u003c/strong\u003e：162.8k ⭐ | 月增65k\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：基于Andrej Karpathy对大模型编程行为的实际观察，提炼出的改善Claude Code行为的配置文件，有效减少AI编码的过度设计与随意重构问题\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：Claude用户必备的编码优化技能，经过大量开发者验证，能显著提升AI编码质量\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/multica-ai/andrej-karpathy-skills\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"2-mattpocockskills\"\u003e2. mattpocock/skills\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e星标\u003c/strong\u003e：112.6k ⭐ | 月增71k\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：TypeScript教育博主Matt Pocock整理的Claude Skills配置集合，涵盖TypeScript、React、测试等工程实践场景\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：前端开发者必备的技能包，提供了成熟的工程实践规范，大幅提升前端开发效率\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/mattpocock/skills\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"3-harry0703moneyprinterturbo\"\u003e3. harry0703/MoneyPrinterTurbo\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e星标\u003c/strong\u003e：71.9k ⭐ | 周增13.9k\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：利用AI大模型一键生成高清短视频的开源工具，支持中英文，可自动完成脚本编写、配音、字幕、素材匹配、视频合成全流程\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：自媒体创作者的生产力神器，将短视频制作流程从几天压缩到几分钟，大幅降低内容生产门槛\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/harry0703/MoneyPrinterTurbo\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"4-lum1104understand-anything\"\u003e4. Lum1104/Understand-Anything\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e星标\u003c/strong\u003e：45.9k ⭐ | 周增25.6k\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：将任意代码、SQL schema、脚本、文档、图片甚至视频转换为可查询的知识图谱，兼容20+主流AI编程平台\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：解决了AI编程助手理解大型项目结构的核心痛点，大幅减少token消耗，提升代码理解效率\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/Lum1104/Understand-Anything\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"5-affaan-mecc-agent-harness-performance-optimization-system\"\u003e5. affaan-m/ECC (Agent Harness Performance Optimization System)\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e星标\u003c/strong\u003e：165.8k ⭐ | 单日新增16万\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：AI Agent性能优化系统，覆盖技能、本能、记忆、安全四大模块，兼容20+主流AI平台，解决AI助手反复犯低级错误、不理解项目隐性规则等问题\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：AI Agent落地的核心基础设施，大幅提升Agent执行任务的稳定性与可靠性\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/affaan-m/ECC\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"6-obrasuperpowers\"\u003e6. obra/superpowers\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e星标\u003c/strong\u003e：209.4k ⭐ | 日增1.6k\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：Agent技能框架 + 软件开发方法论，为AI助手提供研究、写作、编码的标准化工作流，定义每个流程的输入、步骤、检查点、输出格式\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：目前最成熟的Agent工作流框架，让AI从\u0026quot;能推理\u0026quot;升级为\u0026quot;会办事\u0026quot;\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/obra/superpowers\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"7-colbymchenrycodegraph\"\u003e7. colbymchenry/codegraph\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e星标\u003c/strong\u003e：34.3k ⭐ | 周增15.9k\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：为Claude Code、Cursor等AI编程助手提供预索引代码知识图谱，大幅减少token消耗与工具调用次数，100%本地运行保障代码隐私\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：AI编程的必备工具，大幅降低大型项目的AI编码成本\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/colbymchenry/codegraph\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"8-microsoftmarkitdown\"\u003e8. microsoft/markitdown\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e星标\u003c/strong\u003e：132k ⭐\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：将PDF、Word、PPT、Excel、网页、图片、音频等多种格式的资料转换为Markdown格式，适配大模型输入需求\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：AI应用的核心数据预处理工具，解决了多格式资料进入大模型的转换难题\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/microsoft/markitdown\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"9-fareedkhan-devtrain-llm-from-scratch\"\u003e9. FareedKhan-dev/train-llm-from-scratch\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e星标\u003c/strong\u003e：28.7k ⭐\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：从零开始训练大型语言模型的完整教程，覆盖数据预处理、Tokenizer训练、模型架构设计、预训练、监督微调、DPO对齐全流程，代码基于PyTorch实现，每步都有详细注释\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：大模型入门学习的最佳实践教程，适合想深入理解大模型训练原理的开发者\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/FareedKhan-dev/train-llm-from-scratch\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"10-openhuman-aiopenhuman\"\u003e10. openhuman-ai/openhuman\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e星标\u003c/strong\u003e：26k ⭐ | 周增1.7k\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：桌面级AI助理，支持连接180+第三方服务，自动构建个人记忆库，基于记忆主动推送相关信息，采用本地模型处理隐私数据+云端大模型处理复杂任务的混合架构\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：个人AI助手的标杆项目，实现了真正主动式的AI服务体验\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/openhuman-ai/openhuman\u003c/li\u003e\n\u003c/ul\u003e\n\u003chr\u003e\n\u003ch2 id=\"-三ai-科技媒体--hackernews-热门资讯\"\u003e📰 三、AI 科技媒体 \u0026amp; HackerNews 热门资讯\u003c/h2\u003e\n\u003ch3 id=\"1-anthropic估值9650亿美元超越openai发布claude-opus-48\"\u003e1. Anthropic估值9650亿美元超越OpenAI，发布Claude Opus 4.8\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e来源\u003c/strong\u003e：TechCrunch / 彭博社\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：Anthropic完成650亿美元H轮融资，投后估值达9650亿美元，正式超越OpenAI成为全球估值最高的AI初创企业。同步发布Claude Opus 4.8，推理速度提升40%，幻觉率再降35%，在12项基准测试中超越GPT-5.5\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：AI行业格局的重大变化，标志着安全对齐路线的AI公司获得了市场的高度认可\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://techcrunch.com/2026/05/29/anthropic-raises-65b-at-965b-valuation-surpasses-openai/\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"2-openai官宣退役o3与gpt-45全力推进gpt-56\"\u003e2. OpenAI官宣退役o3与GPT-4.5，全力推进GPT-5.6\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e来源\u003c/strong\u003e：OpenAI官方博客 / AITNT\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：OpenAI宣布o3于8月26日、GPT-4.5于6月27日从ChatGPT退役，仅保留API。GPT-5.6正全力推进，预计6月正式发布，将支持150万Token上下文窗口\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：大模型迭代速度持续加速，旧模型的快速淘汰反映了行业技术进步的节奏\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://openai.com/blog/retiring-o3-and-gpt-4-5\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"3-面壁智能发布forgetrain全球首个完全由ai编写的大模型训练框架\"\u003e3. 面壁智能发布ForgeTrain：全球首个完全由AI编写的大模型训练框架\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e来源\u003c/strong\u003e：36氪 / 量子位\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：面壁智能发布全球首个完全由AI编写的大模型预训练框架ForgeTrain，跑赢英伟达Megatron框架，训练速度提升10%，且适配华为昇腾算力平台。同步发布MiniCPM5-1B端侧模型，1B参数性能超越所有2B以下模型\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：AI创造AI的里程碑事件，标志着大模型开发进入了AI辅助的新阶段，同时为国产算力生态提供了重要的软件支持\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://36kr.com/p/2847396243023873\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"4-google-io-2026gemini-35-flash免费开放ai-agent时代正式到来\"\u003e4. Google I/O 2026：Gemini 3.5 Flash免费开放，AI Agent时代正式到来\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e来源\u003c/strong\u003e：谷歌官方博客 / The Verge\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：谷歌I/O大会发布Gemini 3.5 Flash模型，生成速度4倍于同类模型，使用成本仅1/3，免费开放给所有开发者。同时推出24小时后台运行的AI助手Spark，支持跨应用自动完成任务\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：AI基础设施普惠化的重要里程碑，Agent能力的全面开放将催生大量创新应用\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://blog.google/technology/ai/google-io-2026-gemini-3-5-flash-ai-agent/\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"5-阿里开源通义万相22可生成电影级高清视频\"\u003e5. 阿里开源通义万相2.2：可生成电影级高清视频\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e来源\u003c/strong\u003e：快科技 / 中华网\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：阿里云开源通义万相2.2模型，支持生成5秒电影级高清视频，在光影、色彩、构图以及人物微表情等细节处理上达到专业电影制作水平。采用业界首创MoE架构，同参数规模下节省约50%计算资源\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：国内文生视频技术的突破性进展，大幅降低了专业视频内容的生产门槛\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://soft.china.com/article/2203081.html\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"6-deepseek-v4-pro-api价格永久降至原价的14开源模型性能持续逼近闭源\"\u003e6. DeepSeek V4-Pro API价格永久降至原价的1/4，开源模型性能持续逼近闭源\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e来源\u003c/strong\u003e：DeepSeek官方公告 / 科创板日报\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：DeepSeek宣布将V4-Pro模型API价格永久降至原价的1/4，成为目前性价比最高的开源大模型API。同时发布的最新评测显示，开源模型与闭源模型的性能差距从3个月扩大到4个月，但DeepSeek等国产开源模型在特定场景下已超越部分闭源模型\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：大模型价格战持续升级，开源模型的性价比优势进一步凸显，大幅降低了AI应用的落地成本\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://www.deepseek.com/blog/v4-pro-price-cut\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"7-小米发布mimo-v2-flash大模型api降价最高达99\"\u003e7. 小米发布MiMo-V2-Flash大模型，API降价最高达99%\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e来源\u003c/strong\u003e：快科技 / 小米官方\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：小米发布并开源MiMo-V2-Flash大模型，3090亿总参数，150亿激活参数，专为智能体场景设计，推理性能媲美DeepSeek V3.2。同时宣布MiMo系列API价格永久降价最高达99%\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：端侧大模型的重要进展，价格的大幅下调将进一步推动AI在消费电子场景的普及\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://soft.china.com/article/2686217.html\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"8-六部门联合发文推进人工智能电商高质量发展\"\u003e8. 六部门联合发文，推进\u0026quot;人工智能+电商\u0026quot;高质量发展\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e来源\u003c/strong\u003e：商务部官网 / 人民网\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：商务部、中央网信办、工信部等六部门联合印发《关于更好服务实体经济推进电子商务高质量发展的指导意见》，明确提出发展\u0026quot;人工智能+电商\u0026quot;，引导电商企业加强大模型技术的研发与应用。目前78%的直播电商已将生成式AI应用于运营流程优化\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：AI+电商获得政策明确支持，将催生大量行业创新应用，推动电商行业的效率革命\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：http://www.mofcom.gov.cn/article/ztxx/zcjd/202605/20260503876423.shtml\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"9-天津世界智能产业博览会开幕40余款大模型10余款ai智能体集中亮相\"\u003e9. 天津世界智能产业博览会开幕，40余款大模型、10余款AI智能体集中亮相\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e来源\u003c/strong\u003e：新华社 / 新浪财经\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：2026世界智能产业博览会5月28日至31日在天津举行，设立AI大模型专区，40余款大模型、10余款AI智能体集中亮相，展示了发动机维修预测诊断、金融风控、地质能源勘探等多元场景的落地成果\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：AI技术从实验室走向产业落地的集中展示，反映了国内AI应用的广度与深度正在快速提升\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://www.xinhuanet.com/tech/2026-05/28/c_1129678423.htm\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"10-三星与openai芯片合作突遭搁置战略分歧致谈判暂停\"\u003e10. 三星与OpenAI芯片合作突遭搁置，战略分歧致谈判暂停\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e来源\u003c/strong\u003e：路透社 / 财联社\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e摘要\u003c/strong\u003e：三星电子与OpenAI合作开发定制AI芯片的协议可能最终落空，双方已暂停谈判，原因是近期战略分歧。而Anthropic近期宣布对三星电子进行巨额投资，双方将在AI芯片领域展开深度合作\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：AI芯片领域的格局正在发生变化，巨头之间的合纵连横将影响未来AI算力的供给格局\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://www.reuters.com/technology/samsung-openai-ai-chip-talks-suspended-strategic-differences-2026-05-30/\u003c/li\u003e\n\u003c/ul\u003e\n\u003chr\u003e\n\u003ch2 id=\"-四热门ai-skill推荐\"\u003e🛠️ 四、热门AI Skill推荐\u003c/h2\u003e\n\u003ch3 id=\"1-taste-skill\"\u003e1. taste-skill\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e分类\u003c/strong\u003e：内容创作/文风控制\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：\u0026ldquo;给AI装上审美\u0026quot;的Skill，阻止AI生成无聊、套路化的内容，定义设计审美与内容输出标准\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e星标\u003c/strong\u003e：29k ⭐\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：内容创作者必备的Skill，大幅提升AI生成内容的质量与可读性，避免AI腔\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/topics/taste-skill\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"2-stop-slop\"\u003e2. stop-slop\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e分类\u003c/strong\u003e：内容创作/AI痕迹去除\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：专门去除AI腔调与套话的Skill，让机器生成的文字瞬间回归自然真实的人类手写感\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e星标\u003c/strong\u003e：7.4k ⭐\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：文案工作者的利器，完美解决AI生成内容的生硬与套路化问题\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/hardikpandya/stop-slop\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"3-anthropic-cybersecurity-skills\"\u003e3. Anthropic-Cybersecurity-Skills\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e分类\u003c/strong\u003e：安全/网络安全\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：包含754个结构化的AI Agent网络安全技能，映射到MITRE ATT\u0026amp;CK、NIST CSF 2.0等5个主流安全框架\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e星标\u003c/strong\u003e：12.5k ⭐\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：安全领域的专业技能包，让AI助手具备专业的网络安全分析与防护能力\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/mukul975/Anthropic-Cybersecurity-Skills\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"4-figma-to-code-skill\"\u003e4. Figma to Code Skill\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e分类\u003c/strong\u003e：前端开发/设计转代码\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：将Figma设计稿直接转换为可运行的前端代码，自动处理样式、布局、组件化等问题，准确率超过90%\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e安装量\u003c/strong\u003e：8.7万+\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：前端开发者的效率神器，大幅减少从设计到代码的转换时间\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/openai/skills/tree/main/skills/.curated/figma-to-code\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"5-dockerfile-生成skill\"\u003e5. Dockerfile 生成Skill\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e分类\u003c/strong\u003e：DevOps/容器化\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：自动生成符合最佳实践的Dockerfile配置文件，支持多种编程语言与应用场景，自动优化镜像大小与构建速度\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e安装量\u003c/strong\u003e：6.2万+\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：解决容器化部署最头疼的配置编写问题，大幅减少调试时间\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/openai/skills/tree/main/skills/.curated/dockerfile-generator\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"6-pdf-内容解析skill\"\u003e6. PDF 内容解析Skill\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e分类\u003c/strong\u003e：文档处理/数据提取\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：精准解析PDF文档中的文本、表格、图片等内容，保留文档结构与格式，支持扫描版PDF的OCR识别\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e安装量\u003c/strong\u003e：11.3万+\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：文档处理必备技能，解决PDF内容提取的各种难题\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/openai/skills/tree/main/skills/.curated/pdf-parser\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"7-notion-自动操作skill\"\u003e7. Notion 自动操作Skill\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e分类\u003c/strong\u003e：生产力/知识管理\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：自动在Notion中创建页面、更新内容、管理数据库、生成报告，支持自定义工作流\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e安装量\u003c/strong\u003e：7.8万+\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：Notion用户的效率神器，实现知识管理的自动化\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/openai/skills/tree/main/skills/.curated/notion-automation\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"8-数据分析与可视化skill\"\u003e8. 数据分析与可视化Skill\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e分类\u003c/strong\u003e：数据处理/分析\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：自动处理Excel/CSV数据，生成统计分析报告与可视化图表，支持SQL查询与复杂数据计算\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e安装量\u003c/strong\u003e：9.4万+\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：数据分析人员的得力助手，大幅降低数据分析的技术门槛\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/openai/skills/tree/main/skills/.curated/data-analysis\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"9-代码审查skill\"\u003e9. 代码审查Skill\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e分类\u003c/strong\u003e：开发/代码质量\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：自动审查代码质量，发现潜在的Bug、安全漏洞、性能问题与不规范写法，提供修复建议\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e安装量\u003c/strong\u003e：13.2万+\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：开发者必备的代码质量保障工具，提前发现问题，减少线上故障\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/openai/skills/tree/main/skills/.curated/code-review\u003c/li\u003e\n\u003c/ul\u003e\n\u003ch3 id=\"10-playwright-自动化测试skill\"\u003e10. Playwright 自动化测试Skill\u003c/h3\u003e\n\u003cul\u003e\n\u003cli\u003e\u003cstrong\u003e分类\u003c/strong\u003e：测试/自动化\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e简介\u003c/strong\u003e：自动编写Playwright端到端测试脚本，支持网页自动化操作、截图、PDF生成、表单填写等场景\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e安装量\u003c/strong\u003e：5.7万+\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e推荐理由\u003c/strong\u003e：测试人员的效率神器，大幅降低自动化测试的开发成本\u003c/li\u003e\n\u003cli\u003e\u003cstrong\u003e链接\u003c/strong\u003e：https://github.com/openai/skills/tree/main/skills/.curated/playwright-automation\u003c/li\u003e\n\u003c/ul\u003e\n", "summary": "📅 生成时间：2026年5月31日 23:30 (Asia/Shanghai) | 数据来源：arXiv · GitHub · HackerNews · 科技媒体 · 大厂博客\n📄 一、arXiv 最新论文 1. SIA: Self-Improving AI with Harness \u0026amp; Weight Updates 方向：AI自进化/大模型摘要：Hexo Labs发布的自进化AI框架SIA，实现了无需人工干预的模型权重自主更新与能力迭代，在代码生成基准上性能提升27% 推荐理由：AI自进化是未来核心方向，该框架为模型自主迭代提供了可落地的技术路线链接：https://arxiv.org/abs/2605.27276 2. Qwen-VLA: Unifying Vision-Language-Action Modeling across Tasks, Environments, and Robot Embodiments 方向：多模态/具身智能摘要：通义千问团队发布的统一视觉-语言-动作模型Qwen-VLA，支持跨机器人平台的具身任务理解与执行，在12项具身智能基准上取得SOTA 推荐理由：具身智能是AI落地实体世界的核心技术，该模型降低了多机器人平台的开发成本链接：https://arxiv.org/abs/2605.30280 3. Self-Improving Language Models with Bidirectional Evolutionary Search 方向：大模型优化/进化算法摘要：哈佛大学与MIT联合提出的双向进化搜索自改进大模型框架，无需额外训练数据即可让模型在数学推理上提升18% 推荐理由：突破了大模型改进依赖高质量训练数据的瓶颈，为低成本模型迭代提供了新思路链接：https://arxiv.org/abs/2605.28814 4. Forgetting in Language Models: Capacity, Optimization, and Self-Generated Replay 方向：大模型基础研究/灾难性遗忘摘要：纽约大学团队深入研究大模型的灾难性遗忘问题，提出了自生成回放缓解方案，让模型在学习新能力时旧能力保留率提升42% 推荐理由：解决了大模型持续学习的核心痛点，对Agent长期记忆能力提升有重要参考价值链接：https://arxiv." }