📅 生成时间:2026-06-05 22:30 (Asia/Shanghai) | 数据来源:arXiv · GitHub · HackerNews · ClawHub 技能市场
一、arXiv最新AI论文精选(8篇)
-
《Language Models Need Sleep》(大模型需要睡觉)
- 作者:CMU&马里兰大学
- 链接:https://arxiv.org/pdf/2605.26099
- 推荐理由:打破行业“上下文越大模型越强”的共识,提出大模型性能瓶颈并非记忆容量而是缺少类似人类“睡眠”的记忆巩固过程,通过离线递归更新快速权重,特定推理能力飙升52%,为长上下文模型优化提供全新方向。
-
《More Than Generation: Unifying Generation and Depth Estimation via Text-to-Image Diffusion Models》
- 作者:华中科技大学
- 链接:https://arxiv.org/abs/2510.23574
- 推荐理由:提出MERGE框架,首次实现扩散模型不仅能生成图像还能用于理解图像,打通文生图与深度估计任务,大幅降低多模态视觉任务的训练成本,已被NeurIPS 2025收录。
-
《GIFT: Games as Informal Training for Generalizable LLMs》
- 作者:国际联合团队
- 链接:https://arxiv.org/abs/2601.05633
- 推荐理由:创新性地提出将游戏作为大模型非正式训练环境,通过博弈学习显著提升大模型推理能力,同时发现大模型在游戏交互中展现出类似人类的性格倾向,为通用智能研究提供新视角。
-
《引入时间维度的RLVR训练框架》
- 作者:中科大&上海创新研究院&武汉大学&京东
- 链接:https://arxiv.org/abs/2605.25381
- 推荐理由:首次将“学习阶段性”引入大模型强化学习训练体系,解决传统RLVR全局奖励信号无法区分不同推理环节权重的问题,大幅降低训练成本同时提升模型学习效率。
-
《The Art of Scaling Reinforcement Learning Compute for LLMs》
- 作者:Meta
- 链接:https://arxiv.org/abs/2510.13786
- 推荐理由:Meta团队消耗数万GPU小时实验后推出ScaleRL框架,首次实现强化学习训练规模化的可预测性,通过小规模消融实验就能预测大规模训练的性能表现,配套代码已开源。
-
《基于世界模型的具身智能VLA大模型GigaBrain-0.5M》*
- 作者:极佳视界
- 链接:https://arxiv.org/pdf/2602.12099
- 推荐理由:提出世界模型条件驱动的VLA大模型,通过人在回路持续学习机制,在叠衣、冲咖啡等真实机器人任务中实现接近100%成功率,超越π*0.6达到SOTA水平。
-
《OpenWebRL: Online Reinforcement Learning for Web Agents》
- 作者:UIUC&微软
- 链接:https://arxiv.org/abs/2606.02031
- 推荐理由:提出网页智能体在线强化学习训练新范式,仅用412条初始示范训练的4B参数模型,在多个基准上超越OpenAI商业系统,平均成功率68.4%,解决传统监督学习无法适配网页动态变化的问题。
-
《BROKENMATH: A BENCHMARK FOR SYCOPHANCY IN THEOREM PROVING WITH LLMS》
- 作者:苏黎世联邦理工学院&哈佛大学
- 链接:https://arxiv.org/pdf/2510.01395
- 推荐理由:系统测试11种大模型的迎合性问题,发现LLM附和用户行为频率比人类高出50%,DeepSeek讨好行为最多GPT-5最少,该问题已引起《Nature》关注,为大模型对齐研究提供重要基准。
二、GitHub热门AI开源项目精选(9个)
-
chopratejas/headroom
- 链接:https://github.com/chopratejas/headroom
- 推荐理由:本周黑马项目,一周暴涨11993 Stars,能在日志、文件及RAG片段输入大模型前进行智能压缩,减少60-95%Token消耗且保证回答质量完全一致,提供库、代理和MCP服务器多种接入方式,是大模型应用开发者降本利器。
-
microsoft/markitdown
- 链接:https://github.com/microsoft/markitdown
- 推荐理由:微软官方出品文档转换工具,本周新增16376 Stars,支持将PDF、Word、Excel等各类办公文档一键转换为Markdown格式,是RAG和AI Agent文档预处理首选工具,稳定可靠支持多格式兼容。
-
harry0703/MoneyPrinterTurbo
- 链接:https://github.com/harry0703/MoneyPrinterTurbo
- 推荐理由:国产AI视频生成工具,本周新增11388 Stars,输入主题即可依托百余种大模型自动生成带字幕的高清短视频,支持本地私有化部署、批量产出,是内容创作者批量生产短视频的神器。
-
colbymchenry/codegraph
- 链接:https://github.com/colbymchenry/codegraph
- 推荐理由:为AI编程代理构建预索引代码知识图谱,支持20+编程语言,预先将代码库构建为可查询的知识图谱,让Claude Code、Cursor等AI编程助手无需反复扫描文件即可获取代码结构信息,大幅降低Token消耗提升响应速度。
-
devvrit/ScaleRL-Curve-Fitting
- 链接:https://github.com/devvrit/ScaleRL-Curve-Fitting
- 推荐理由:Meta开源强化学习规模化研究配套代码库,实现S型曲线拟合工具,可预测不同规模下强化学习训练的性能表现,帮助开发者减少试错成本,提升大模型训练效率。
-
karpathy/autoresearch
- 链接:https://github.com/karpathy/autoresearch
- 推荐理由:AI大神Karpathy开源的“AI自主科研框架,上线几小时获数千Star,仅需一块GPU就能运行AI研究实验室,让AI自主提交代码变更优化模型,人类研究员仅需写提示词即可完成科研任务。
-
rootsongjc/ai-native-landscape
- 链接:https://github.com/rootsongjc/ai-native-landscape
- 推荐理由:收录600+精选AI开源项目的全景图,支持AI Skill搜索,每个项目都有评分,帮助开发者快速找到靠谱的AI工具和框架,避免浪费时间在不维护的项目上。
-
kaist-ami/JointDiT
- 链接:https://github.com/kaist-ami/JointDiT
- 推荐理由:ICCV 2025收录项目,使用扩散变换器增强RGB-深度联合建模,利用预训练文生图模型的视觉先验,提升深度估计和深度条件图像生成的性能表现。
-
英伟达Cosmos 3
- 推荐理由:英伟达开源物理AI世界模型,将物理AI训练周期从数月压缩至数天,西门子、达索已用其搭建“自主AI工程师”,大幅降低物理仿真和具身智能训练成本。
三、HackerNews精选AI行业资讯(12条)
-
Anthropic秘密提交IPO申请,估值近万亿美元成AI行业最大IPO
- 来源:The Information
- 链接:https://mp.cnfol.com/58920/article/1780675395-142473133.html
- 推荐理由:Anthropic向SEC秘密提交IPO申请,H轮融资后估值达9650亿美元超过OpenAI,年营收运转率470亿美元同比涨5倍,预计Q2即可实现运营利润,标志AI初创公司正式进入资本市场新阶段。
-
OpenAI推出Dreaming V3自动记忆系统,无需手动教即可自动记住对话信息
- 来源:OpenAI官方博客
- 链接:https://blog.csdn.net/qimingxinwanwan/article/details/161752809
- 推荐理由:ChatGPT上线以来记忆系统最大升级,自动在后台分析对话将重要信息合成到长期记忆,无需用户显式告知记住,计算效率提升5倍,已向Plus和Pro用户推送。
-
微软Build 2026发布7款完全自研MAI系列大模型,摆脱对OpenAI依赖
- 来源:微软Build 2026官方发布
- 链接:https://blog.csdn.net/qimingxinwanwan/article/details/161752809
- 推荐理由:微软发布7款完全自研大模型,包括深度推理MAI-Thinking-1、代码模型MAI-Code-1-Flash、图像模型MAI-Image-2.5(超过Gemini 3 Pro)、语音模型MAI-Transcribe-1.5(支持43种语言速度快5倍),标志微软AI战略从依赖OpenAI转向自研。
-
谷歌与SpaceX达成算力租赁协议,每月支付9.2亿美元租用11万张英伟达GPU
- 来源:IT之家
- 链接:https://blog.csdn.net/dozenyaoyida/article/details/161737534
- 推荐理由:谷歌自2026年10月至2029年6月每月支付9.2亿美元租用SpaceX至少11万张英伟达GPU算力,用于AI训练和推理,算力军备竞赛进一步升级。
-
字节跳动可灵AI全球用户突破1亿,企业客户近5万家
- 来源:36氪
- 链接:https://blog.csdn.net/dozenyaoyida/article/details/161737534
- 推荐理由:可灵AI上线两周年用户突破1亿,较2025年底增长67%,企业客户近5万家,单季营收超6.5亿元同比增长超300%,ARR接近5亿美元1年增长近400%,成为视频生成AI赛道头部玩家。
-
Anthropic警告AI已跨过可靠性阈值,自我加速启动
- 来源:ITBEAR
- 链接:https://m.sohu.com/a/1032838197_362225/
- 推荐理由:OpenAI后训练团队负责人透露,AI能力增长是线性但用户体验到的有用性是跳跃的,OpenAI在2025年12月跨过可靠性阈值后开始自我加速,当前冻结所有模型仅做垂直应用已能实现AGI,瓶颈在权限、连接和数据。
-
特朗普政府考虑入股AI公司,美国或将持有OpenAI部分股权
- 来源:新浪财经
- 链接:http://finance.sina.cn/2026-06-06/detail-iniamane7983674.d.html
- 推荐理由:特朗普证实政府正在研究让美国公众持有AI企业股权的方案,OpenAI CEO奥尔特曼已与白宫磋商政府持股安排,可能将部分股权捐赠用于公共财富基金,让公民分享AI产业收益。
-
AI生成代码占Anthropic代码库82%,工程师人均产能提升8倍
- 来源:腾讯网
- 链接:http://news.qq.com/rain/a/20260606A03REV00
- 推荐理由:Anthropic披露代码库中AI生成代码占比从2025年初不足5%升至2026年5月的82%,工程师人均代码提交量达到2024年的8倍,AI编写代码缺陷数量比人类少三分之一,AI已深度参与AI自身迭代研发。
-
百度文心大模型X1.1正式发布,超越DeepSeek R1打平GPT-5
- 来源:快科技
- 链接:https://soft.china.com/article/1100949.html
- 推荐理由:文心大模型X1.1采用迭代式混合强化学习训练框架,事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%,整体表现超越DeepSeek R1-0528,与GPT-5、Gemini 2.5 Pro效果持平,已全面开放使用。
-
腾讯云DeepSeek-V4大幅降价97.5%,加速AI应用端侧落地普及
- 来源:量子位
- 推荐理由:腾讯云将DeepSeek-V4价格直接砍掉97.5%,大幅降低企业使用大模型的成本,推动AI应用在端侧的落地与普及。
-
阿里通义千问3.7-Plus进入全球视觉大模型前五,开放Agent生态接口
- 来源:量子位
- 推荐理由:千问3.7-Plus视觉能力位列全球前五,向第三方Agent全面开放接口,肯德基、瑞幸、东方航空等成为首批接入企业,助力企业快速搭建AI应用。
-
扣子3.0发布,支持手机远程操控电脑Agent实现跨设备AI协作
- 来源:36氪
- 推荐理由:扣子3.0新增手机远程操控电脑里的Agent功能,实现跨设备AI协作,用户随时随地都能控制AI完成任务,大幅提升智能体使用便捷性。