每日 AI 简报

2026-07-06(内容获取于 07/06 04:49)

Claude Code与Fable 5成功移植《命令与征服》至iOS

The Decoder · 07/05 23:58

谷歌DeepMind开发者利用Anthropic的Claude Code,仅用数小时将2003年PC游戏《命令与征服》移植到原生iOS平台,展示了AI在代码生成与辅助开发方面的强大能力。

推荐理由:见证AI在复杂代码移植和开发效率上的显著提升,对游戏开发及AI辅助编程领域有重要参考意义。

Meetily:注重隐私的本地AI会议助手

GitHub Trending

Meetily是一款基于Rust的开源AI会议助手,支持Parakeet/Whisper实时转录、发言人识别及Ollama总结,全部本地处理,无需云端,强调用户隐私。此工具为重视数据安全的个人和团队提供高效、私密的会议记录与整理解决方案。

推荐理由:对于重视数据安全和本地部署的用户,这是一个功能强大且隐私友好的AI会议记录解决方案。

亚马逊将停止接收Mechanical Turk新客户

TechCrunch · 07/06 01:43

亚马逊宣布其众包平台Mechanical Turk将停止接受新客户,此举可能预示着该服务未来的调整或终结,对依赖众包的AI数据标注等领域产生影响。

推荐理由:关注亚马逊重要众包服务的变化,这可能影响AI数据标注等相关行业生态。

开源AI辅助工具「人话.skill」去「AI味」

X 创作者 (AttentionVC) · 07/05 10:39

博主开源「人话.skill」工具,旨在提升AI生成文本的自然度和「人类味」,解决AI内容同质化问题,提高内容质量。

推荐理由:对于需要生成更自然、个性化AI文本的用户,该工具提供了有效的解决方案。

TryCase:AI编码代理一次性测试环境

Product Hunt · 07/06 04:44

TryCase提供为AI编码代理设计的一次性测试环境,帮助开发者安全、快速地部署、测试和调试AI生成的代码,提升开发效率与代码质量。

推荐理由:对于AI编码代理开发者,该工具提供了一个安全高效的测试沙盒,大幅提升开发效率。

新AI导师在达特茅斯课程中效果显著

Hacker News · 07/06 02:47

一项研究表明,新的AI导师系统在达特茅斯大学课程中取得了0.71-1.30标准差的显著效果,证明AI在教育领域的巨大潜力。

推荐理由:深入了解AI在教育领域取得的突破性进展及其对未来教学模式的潜在影响。

ChatGPT Plus网页版工作流经验分享

V2ex · 07/05 14:43

V2EX社区用户分享了关于ChatGPT Plus网页版的使用心得和工作流优化经验,旨在提高AI工具在日常工作中的效率和实用性。

推荐理由:学习如何更高效地利用ChatGPT Plus提升工作效率,对于日常AI用户有参考价值。

Fable Loop Library:25个自动化工作流

X 推文 (AttentionVC) · 07/04 23:43

博主发布「Fable Loop Library」,包含25个Fable自动化工作流,旨在帮助用户实现Fable操作的自动驾驶,提高工作效率并简化复杂任务处理。

推荐理由:对于Fable用户,该库提供了丰富的自动化工作流,可显著提升操作效率。

Trump memecoin investors lost $3.8 billion, analysis finds

Nearly 1 million people have lost a total of $3.8 billion after buying President Donald Trump’s $TRUMP memecoin, while Trump made $636 million.

中文介绍 分析显示,近100万投资者购买唐纳德·特朗普总统的$TRUMP迷因币后,总计损失了38亿美元。与此同时,特朗普本人通过此迷因币获利6.36亿美元。

Mr. Lif’s Emergency Rations EP is post-9/11 hip hop at its most daring

First, you drop bombs, then you send aid. Totally logical. | Image: Definitive Jux There was a period in the early aughts when Definitive Jux (nee: Def Jux) seemed like it was going to be the future of hip hop. While the label featured plenty of experimental, boundary-pushing, and politically minded

中文介绍 Mr. Lif的《Emergency Rations》EP被评价为911事件后最具开创性的嘻哈作品。该作品由Definitive Jux厂牌发行,探索了实验性和突破性的音乐风格。

Amazon will stop accepting new customers for Mechanical Turk

These may be the last days of Amazon’s Mechanical Turk.

中文介绍 亚马逊宣布将停止为“Mechanical Turk”平台接受新客户。这一举动可能预示着亚马逊旗下这个众包服务平台的终结。

Where to preorder Grand Theft Auto VI

A look at in-game cosmetics you’ll get with the Ultimate edition. | Image: Rockstar Games Rockstar's long-awaited Grand Theft Auto VI is launching November 19th, 2026 for PlayStation 5 and Xbox Series S/X consoles. The game will be available digitally at launch, with physical cases containing codes,

中文介绍 Rockstar Games备受期待的《侠盗猎车手VI》(GTA VI)将于2026年11月19日正式发售。该游戏将登陆PlayStation 5和Xbox Series S/X主机平台,发售时提供数字版和实体版预购。

Claude Code and Fable 5 ported the 2003 PC game Command & Conquer to native iOS in "a few hours"

A Google Deepmind developer ported the 2003 real-time strategy game "Command & Conquer: Generals Zero Hour" to iPhone and iPad using Anthropic's Claude Code. The first build took 40 minutes. The full source code is on GitHub. The article Claude Code and Fable 5 ported the 2003 PC game Command & Conq

中文介绍 一位Google DeepMind开发者利用Anthropic的Claude Code,在数小时内将2003年的PC实时战略游戏《命令与征服:将军零点行动》移植到原生iOS平台。首个版本仅用40分钟完成,完整源代码已发布在GitHub上。

Baidu's "Unlimited OCR" processes dozens of document pages in one pass by treating memory like human forgetting

Baidu's Unlimited OCR reads dozens of document pages in a single pass, where previous systems topped out at about ten. A modified attention mechanism keeps memory use flat no matter how many pages the model processes. It currently holds the top spot on the most important OCR benchmark. The article B

中文介绍 百度推出“无限OCR”技术,能够一次性处理数十页文档,远超此前系统约十页的限制。该技术通过改进注意力机制,实现了无论处理多少页面内存占用都保持平稳,并已在重要OCR基准测试中名列前茅。

5 desk gadgets that can make your workday better

The right desk gadgets can help you reduce clutter, stay focused, and add a little extra convenience to your day.

中文介绍 文章探讨了五款能提升工作效率的桌面小工具。这些小工具旨在帮助使用者减少桌面杂乱、保持专注,并为日常工作增添便利性。

Infuriating Google commercial imagines the founding fathers embracing AI

I call BS: the founding fathers definitely would have been Microsoft Teams users. | Image: Google "Group project, but make it 1776." That's how a new commercial for Google Workspace opens. And things only get cringier from there. The clip imagines what it would be like if the founding fathers turned

中文介绍 Google发布了一则广告,设想美国开国元勋们在1776年利用人工智能技术和Google Workspace共同撰写《独立宣言》。这支广告因其独特的创意引发了讨论。

The Sourdough Sidekick automates the boring bit of baking

The Sourdough Sidekick was codeveloped with King Arthur Baking Company. Baking sourdough bread is inherently old-fashioned, relying on natural fermentation and wild yeast instead of the simple, predictable commercial stuff. So it might sound anathema to bring a gadget into the mix. The trick to the

中文介绍 “Sourdough Sidekick”是一款旨在自动化酸面包烘焙过程中繁琐步骤的智能设备。该产品由King Arthur Baking Company共同开发,旨在简化传统的酸面包制作流程。

How Keurig saved — and ruined — your coffee

Before Keurig, the coffee in your office was almost certainly terrible. Old, burned, made by someone who would rather poorly eyeball than properly measure. Just altogether gross. After Keurig? You could make your own coffee, a cup at a time, exactly when you needed it. The single-cup brewer was an e

中文介绍 Keurig咖啡机及其K-Cup单杯冲泡系统彻底改变了办公室咖啡文化。它解决了传统办公室咖啡品质差的问题,让人们能随时制作一杯个人专属咖啡,但也引发了关于其对咖啡产业和环境影响的争议。

What is Bending Spoons? The little-known AOL and Vimeo owner that’s now public

Bending Spoons remains largely unknown, even as its portfolio of products has served more than a billion people.

中文介绍 Bending Spoons是一家鲜为人知的科技公司,尽管其产品组合已服务超过十亿用户,并且是AOL和Vimeo的收购方。该公司现已公开上市,其业务版图正逐渐扩大。

Vizio accidentally made the best dumb TV on the market

Vizio OS works well, but you don’t even need to use it. When I first started testing Vizio's 65-inch Mini LED Quantum TV, I thought the big story was that Vizio was back and that it had a quantum-dot TV for under $398 - the cheapest on the market. Vizio's been pretty quiet since it was acquired by W

中文介绍 Vizio推出了一款65英寸Mini LED量子电视,售价低于398美元,成为市场上最便宜的产品之一。尽管其Vizio OS运行良好,但评测指出,该电视更因其出色的显示硬件和作为“最佳非智能电视”的潜力而受到关注。

Almost 90 new unicorns have been minted so far this year — here they are

With AI igniting an investor frenzy, more startups are achieving unicorn status every month.

中文介绍 截至目前,今年已有近90家初创企业获得“独角兽”地位,即估值超过10亿美元。这股“独角兽”热潮主要受人工智能领域投资者狂热情绪的推动。

Xbox is a disaster

Gears of War: E-Day. This is The Stepback, a weekly newsletter breaking down one essential story from the tech world. For more on the bleak state of the video game industry, follow Andrew Webster. The Stepback arrives in our subscribers' inboxes on Sunday at 8AM ET. Opt in for The Stepback here. How

中文介绍 一篇专栏文章指出Xbox目前面临“灾难性”局面,并探讨了更广泛的视频游戏行业所处的严峻困境。文章引用了《战争机器:E-Day》等游戏作为例证。

Zackriya-Solutions/meetily

Rust · ★ 16,682 · 🍴 1,783 · 📈 1,409 stars today

Privacy first, AI meeting assistant with 4x faster Parakeet/Whisper live transcription, speaker diarization, and Ollama summarization built on Rust. 100% local processing. no cloud required. Meetily (Meetly Ai - https://meetily.ai) is the #1 Self-hosted, Open-source Ai meeting note taker for macOS &

中文介绍 Meetily 是一款注重隐私的 AI 会议助手,基于 Rust 构建,支持 100% 本地化处理,无需云服务。它利用 Parakeet/Whisper 实现 4 倍速实时转录,提供发言人识别功能,并使用 Ollama 进行会议总结。此工具为重视数据安全的个人和团队提供高效、私密的会议记录与整理解决方案。

openai/codex-plugin-cc

JavaScript · ★ 25,356 · 🍴 1,534 · 📈 1,519 stars today

Use Codex from Claude Code to review code or delegate tasks.

中文介绍 `codex-plugin-cc` 是一个 OpenAI 官方插件,旨在将 Codex 模型的功能集成到 Claude Code 环境中。它允许用户在 Claude Code 内部直接调用 Codex 的能力,执行代码审查或将特定编程任务委派给 Codex 处理。该插件解决了在不同 AI 模型之间切换的效率问题,为需要利用 Codex 强大代码理解和生成能力的用户提供便利,特别适合开发者进行自动化代码质量检查或智能任务分配。

asgeirtj/system_prompts_leaks

JavaScript · ★ 49,808 · 🍴 8,153 · 📈 981 stars today

Extracted system prompts from Anthropic - Claude Fable 5, Opus 4.8, Claude Code, Claude Design. OpenAI - ChatGPT 5.5 Thinking, GPT 5.5 Instant, Codex. Google - Gemini 3.5 Flash, 3.1 Pro, Antigravity. xAI - Grok, Cursor, Copilot, VS Code, Perplexity, and more. Updated regularly.

中文介绍 system_prompts_leaks 汇集了 Anthropic (如 Claude Fable 5, Opus 4.8)、OpenAI (如 ChatGPT 5.5 Thinking, GPT 5.5 Instant) 和 Google (如 Gemini 3.5 Flash, 3.1 Pro) 等主流大语言模型被“泄露”的系统 Prompt。此项目为研究者、开发者和安全专家提供了深入了解这些模型内部指令和行为模式的宝贵资源,有助于进行 prompt 工程优化和安全分析。

Leonxlnx/taste-skill

JavaScript · ★ 57,333 · 🍴 3,923 · 📈 850 stars today

Taste-Skill - gives your AI good taste. stops the AI from generating boring, generic slop

中文介绍 Taste-Skill 旨在解决大型语言模型 (LLM) 生成内容平庸、缺乏个性化的问题。它通过为 AI 提供“品味”和“技能”,帮助模型摆脱生成乏味、通用化文本的倾向。项目可能包含一系列提示工程技巧、风格指南或后处理模块,旨在提升 AI 输出的创造性和独特性。适用于内容创作者、营销人员、开发者等,需要 AI 生成更具吸引力、非同质化内容的场景,例如文案创作、故事生成或独特的产品描述。

alirezarezvani/claude-skills

Python · ★ 20,481 · 🍴 2,792 · 📈 394 stars today

337 Claude Code skills & agent skills & plugins (30+ Agents, 70+ custom commands, 330+ skills, customizable references, scripts)for Claude Code, Codex, Gemini CLI, Cursor, and 8 more coding agents — engineering, marketing, product, compliance, C-level advisory, research, business operations, commerc

中文介绍 alirezarezvani/claude-skills 是一个包含 337 个 Claude Code 技能、代理技能及插件的庞大集合。它为 Claude Code、Codex、Gemini CLI、Cursor 等十余种 AI 编码代理提供超过 30 个代理、70 个自定义命令和 330 多个技能,并支持自定义引用和脚本。此项目极大地丰富了 AI 编码助手的工具箱,旨在提升开发者在多平台上的编程效率和自动化水平。

rommapp/romm

Python · ★ 10,482 · 🍴 501 · 📈 411 stars today

A beautiful, powerful, self-hosted rom manager and player.

中文介绍 romm 是一个美观且功能强大的自托管 ROM 管理与播放器应用。它旨在帮助复古游戏爱好者集中管理大量的游戏 ROM 文件,并提供便捷的播放体验。用户可以将其部署在自己的服务器上,完全掌控游戏库,并享受流畅的游戏体验,无需依赖第三方平台,是打造个人复古游戏中心的好帮手。

ogulcancelik/herdr

Rust · ★ 11,973 · 🍴 697 · 📈 650 stars today

agent multiplexer that lives in your terminal.

中文介绍 herdr 是一个命令行工具,它充当 AI Agent 的多路复用器,允许用户在终端中高效管理和交互多个智能代理。通过提供一个统一的接口,它解决了同时运行和协调多个 Agent 时的复杂性,例如不同 Agent 的输入、输出和状态管理。开发者和AI工程师可以使用 herdr 来构建复杂的自动化工作流,同时监控不同 Agent 的执行情况,无需切换多个应用或窗口,极大地提升了Agent驱动型应用的开发和调试效率。

alibaba/page-agent

TypeScript · ★ 23,755 · 🍴 2,053 · 📈 801 stars today

JavaScript in-page GUI agent. Control web interfaces with natural language.

中文介绍 page-agent 是一个在网页内运行的 JavaScript GUI 代理,支持通过自然语言控制网页界面。它通过将用户意图转化为前端操作,简化了复杂的Web交互和自动化流程。开发者可利用其为Web应用构建智能助手、进行自动化测试或实现无代码UI操作,提升人机交互效率。

harvard-edge/cs249r_book

Python · ★ 26,800 · 🍴 3,187 · 📈 333 stars today

Machine Learning Systems

中文介绍 `cs249r_book` 是来自 Harvard-EDGE 的“机器学习系统”课程书籍或相关学习材料。该项目深入探讨了机器学习模型的端到端生命周期,涵盖了从数据管理、模型训练、评估到生产部署、监控和维护等各个环节。它旨在教授如何设计、构建并扩展实际的 ML 系统,解决生产环境中的挑战。对于希望掌握 MLOps 实践、深入理解机器学习系统工程的学生、工程师和研究人员,这是极具价值的参考资源。

usestrix/strix

Python · ★ 36,972 · 🍴 3,751 · 📈 1,121 stars today

Open-source AI penetration testing tool to find and fix your app’s vulnerabilities.

中文介绍 `strix` 是一个开源的 AI 安全工具,旨在帮助开发者和安全团队自动发现并修复应用程序中的潜在漏洞。该项目利用人工智能技术,模拟“AI 渗透测试员”的行为模式,对应用进行深度分析和攻击模拟,从而有效识别传统安全扫描工具可能遗漏的安全缺陷。它解决了人工安全审计耗时耗力、且容易出错的问题,特别适用于需要持续安全保障的开发流程(如 CI/CD),帮助团队在软件发布前提升应用的整体安全性,降低潜在的安全风险。

hesreallyhim/awesome-claude-code

Python · ★ 48,288 · 🍴 4,232 · 📈 188 stars today

A hand-picked collection of the finest of resources for the most awesome of agents, Claude Code, the undisputed champion of coding companions, from the unstoppable team at Anthropic PBC. A delectable showcase of top tier skills, ambidextrous agents, scintillating status lines, top notch developer to

中文介绍 `awesome-claude-code` 是一个精选的资源集合,专注于 Anthropic 的 AI 编码助手 Claude Code。项目旨在为开发者提供高质量的工具、指南、示例和最佳实践,以最大化 Claude Code 在编程任务中的效用。它解决了用户寻找 Claude Code 相关专业资源的痛点,涵盖代码生成、调试、重构、学习新语言或框架等多个开发场景。对于依赖 AI 辅助编程的开发者、寻求提高编码效率的工程师以及希望深入了解 Claude Code 功能的用户而言,这是一个宝贵的资料库。

coreyhaines31/marketingskills

JavaScript · ★ 36,365 · 🍴 5,890 · 📈 209 stars today

Marketing skills for Claude Code and AI agents. CRO, copywriting, SEO, analytics, and growth engineering.

中文介绍 `marketingskills` 项目旨在为 Claude Code 等 AI 代理提供专业的营销技能,涵盖转化率优化 (CRO)、文案撰写、搜索引擎优化 (SEO)、数据分析和增长工程等关键领域。它通过集成特定的知识和策略,使 AI 能够更有效地执行营销任务,解决传统 AI 在专业营销领域能力不足的问题。该项目适合营销团队、增长专家、内容创作者或任何希望利用 AI 自动化或优化市场营销活动的个人和企业,帮助他们提升营销效率和效果。

JuliusBrussee/caveman

JavaScript · ★ 84,759 · 🍴 4,718 · 📈 1,043 stars today

🪨 why use many token when few token do trick — Claude Code skill that cuts 65% of tokens by talking like caveman

中文介绍 `caveman` 项目是一个针对 Claude Code 的技能,旨在通过一种“原始人式”的简化语言风格,大幅削减大型语言模型(LLM)的 token 使用量。它能将 token 消耗降低约 65%,有效解决了 LLM 交互成本高昂和效率低下的问题。对于需要优化 LLM API 调用、降低运营成本或提升处理效率的开发者和企业而言,这是一个实用的 token 节约方案。

CoplayDev/unity-mcp

C# · ★ 11,883 · 🍴 1,274 · 📈 415 stars today

Unity MCP acts as a bridge between AI assistants and your Unity Editor. Give your LLM tools to manage assets, control scenes, edit scripts, and automate tasks within Unity.

中文介绍 Unity MCP 是一款连接 AI 助手与 Unity Editor 的桥梁工具。它赋予大语言模型 (LLM) 直接管理 Unity 资源、控制场景、编辑脚本和自动化开发任务的能力。该项目旨在革新游戏开发流程,使开发者能通过自然语言或 AI 驱动的指令,高效完成 Unity 内的复杂操作,大幅提升游戏创作的效率和智能化水平。

facebook/astryx

TypeScript · ★ 5,822 · 🍴 371 · 📈 540 stars today

An open source design system that's fully customizable and agent ready

中文介绍 Astryx 是 Facebook 推出的一个开源设计系统,提供高度可定制化的 UI 组件和设计规范。其独特之处在于“agent ready”特性,意味着它被设计成可以被 AI Agent 理解和操作,例如用于自动化 UI 生成、智能设计建议或构建由 AI 驱动的用户界面。该系统旨在帮助设计师和前端开发者快速构建一致且高质量的用户界面,同时为新兴的 AI 辅助设计和 AI Agent 界面开发场景提供了坚实基础,解决了传统设计系统与 AI 集成度不足的问题。

immich-app/immich

TypeScript · ★ 106,031 · 🍴 6,053 · 📈 475 stars today

High performance self-hosted photo and video management solution.

中文介绍 Immich 是一款高性能的自托管照片和视频管理解决方案。它使用户能够完全掌控自己的媒体数据,提供隐私保护,并作为替代云存储服务的本地化方案。用户可以在自己的服务器上部署 Immich,实现照片备份、分类、浏览和分享等功能,尤其适合拥有大量个人媒体文件且注重数据安全的用户。

ruvnet/RuView

Rust · ★ 76,660 · 🍴 10,280 · 📈 198 stars today

π RuView turns commodity WiFi signals into real-time spatial intelligence, vital sign monitoring, and presence detection — all without a single pixel of video.

中文介绍 RuView 项目创新性地将普通的 WiFi 信号转化为实时空间智能、生命体征监测和存在检测能力,完全无需使用任何视频设备。它通过分析 WiFi 信号在环境中因人体移动或呼吸等造成的微小扰动,提取出高价值的环境和生理数据。这解决了传统监控方案中隐私侵犯、硬件复杂或覆盖范围有限的问题。RuView 适用于智能家居、医疗保健(如老人跌倒预警、睡眠监测)、安防监控以及任何需要非接触式、隐私友好型人体感知的应用场景。

gastownhall/gastown

Go · ★ 16,339 · 🍴 1,520 · 📈 48 stars today

Gas Town - multi-agent workspace manager

中文介绍 Gas Town 是一个多代理工作空间管理器,专注于解决在复杂任务中协调和管理多个 AI 代理的挑战。它提供一个框架或工具集,用于有效地分配任务、管理代理间的通信、共享资源和追踪工作流程。这对于构建和部署需要多个 AI 代理协同作业的系统至关重要,例如自动化复杂的业务流程、模拟多智能体行为或进行大型语言模型 (LLM) 链式推理。开发者、研究人员或企业可以通过 Gas Town 提升多代理系统的协作效率和可靠性。

dotnet/skills

C# · ★ 4,006 · 🍴 301 · 📈 247 stars today

Repository for skills to assist AI coding agents with .NET and C#

中文介绍 dotnet/skills 是一个为 AI 编码代理提供技能库的仓库,专注于支持 .NET 和 C# 语言环境。这些“技能”旨在赋予 AI 代理更强大的上下文理解和操作能力,使其能更好地辅助开发者完成代码编写、调试、重构和自动化任务,提升 .NET 项目的开发效率。

OthmanAdi/planning-with-files

Python · ★ 24,659 · 🍴 2,106 · 📈 61 stars today

Persistent file-based planning for AI coding agents and long-running agentic tasks. Crash-proof markdown plans that survive context loss and /clear, plus a deterministic completion gate and multi-agent shared state on disk. Manus-style. Works with Claude Code, Codex CLI, Cursor, Kiro, OpenCode and 6

中文介绍 `planning-with-files` 提供一种持久化的文件基规划方案,专为 AI 编码代理和长时间运行的代理任务设计。它通过将规划存储为不易崩溃的 Markdown 文件,确保代理在遭遇上下文丢失或系统重置时能保持任务状态和进度。该方案解决了传统 AI 代理“记忆”短暂、难以处理复杂或中断任务的痛点,并支持确定性完成门和多代理协作。适用于开发可靠的 AI 编程助手、自动化复杂工作流,或构建需持续执行任务的自主 AI 系统,提升其鲁棒性和可追溯性。

PorTAL: Portable Task Adapters for LLMs

@RampLabs · 13.4K 粉丝 · 335.4K 阅 · 507 赞 · 45 转

Researcher: Ben Geist Abstract Parameter-efficient fine-tuning (e.g. LoRA) adapts a frozen LLM to a task, but the resulting adapter is locked to one base model. When a new model is released, the

中文介绍 「PorTAL」是一项新研究,旨在解决现有参数高效微调(如 LoRA)的适配器无法在不同基础 LLM 模型间移植的局限。该研究提出可移植任务适配器,使用户无需在新模型发布时重新训练,提高了 LLM 微调的灵活性和效率。

The AI Economy: The Next Chapter

@rickyho_1989 · 9.7K 粉丝 · 296.6K 阅 · 508 赞 · 69 转

Part I: The Economics of Intelligence Why the AI industry is about to optimize for intelligence per dollar rather than intelligence itself I have become increasingly convinced that the artificial

中文介绍 博主分析了AI经济的未来发展趋势。他认为,AI行业将从追求「智能本身」转向优化「单位成本智能」,即更注重智能的性价比。这预示着AI应用将迎来一个更注重效率和成本效益的新阶段。

How To Master Fable (Fundamentals Guide)

@milesdeutscher · 671.1K 粉丝 · 243.8K 阅 · 500 赞 · 73 转

TL;DR: Everything you need to do to get maximum value from Fable. I guarantee that after you're done reading, you'll have all the necessary tools to quite literally 10x your AI productivity with

中文介绍 分享 Fable 工具的入门指南,旨在帮助用户充分利用 Fable 平台,实现 AI 生产力提升。内容涵盖 Fable 的核心功能和使用技巧,助力用户高效完成 AI 相关任务,最大化工具价值。

The Fable Loop Library: 25 Workflows on Autopilot

@EXM7777 · 122.0K 粉丝 · 208.2K 阅 · 525 赞 · 47 转

i'm going to teach you how to run Fable 5 on autopilot, using my own library of loops and goals... 25 workflows, each with a prompt and the exact tool it plugs into the method follows karpathy's

中文介绍 博主发布「Fable Loop Library」,提供 25 个 Fable 自动化工作流。该库旨在帮助用户实现 Fable 操作的自动驾驶,有效提升工作效率,简化复杂任务处理。

ORACLE: Official AI Agents Trade on Polymarket

@OracleLimited · 37.6K 粉丝 · 202.9K 阅 · 2.8K 赞 · 562 转

In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We

中文介绍 「OracleLimited」分享了对2026年预测市场的未来愿景。届时,自主AI智能体将成为最有效的交易策略之一,Polymarket上超过30%的活动将由算法和AI驱动的钱包完成。该分享描绘了AI在去中心化金融和预测领域深度参与的趋势。

Career advice in the age of AI

@philhchen · 9.1K 粉丝 · 179.1K 阅 · 516 赞 · 34 转

AI models get better at anything you can write a loss function for, and school is mostly loss functions: well-defined problems graded against known answers. Therefore, the valuable work of the next

中文介绍 该帖子围绕AI时代下的职业发展提供建议。博主旨在分享面对人工智能技术进步时,个人应如何规划职业路径、提升自身价值,以适应未来就业市场的变化和挑战。

ORACLE: Official AI Agents Trade on Polymarket

@OracleAiTrading · 34.1K 粉丝 · 176.1K 阅 · 2.7K 赞 · 567 转

In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We

中文介绍 「OracleAiTrading」提出了一个关于2026年预测市场前景的展望。文中指出,自主AI智能体将主导市场,成为最有效的交易策略,届时Polymarket上逾30%的交易将由算法和AI驱动的钱包进行。这篇推文描绘了AI在未来金融市场中的核心作用。

How To Become An AI Engineer in 2026 (Without a CS Degree)

@cyrilXBT · 187.0K 粉丝 · 171.8K 阅 · 505 赞 · 91 转

There is a sentence sitting on almost every AI engineering job posting that stops people before they even apply. Bachelor's degree in Computer Science required. Most people read that line, close the

中文介绍 针对AI工程职位普遍要求计算机科学学位的问题,博主提供了一份详细指南,指导人们如何在2026年前,无需CS学位也能成为一名AI工程师。内容可能涵盖学习路径、技能培养及就业策略。

Your AI, your growth

@arthurmensch · 74.0K 粉丝 · 162.7K 阅 · 539 赞 · 76 转

Of course you need to use open-source models if you’re an enterprise leader. Close model providers, that are now forcing data retention, are gaining immense leverage on your business if you don’t. As

中文介绍 该推文仅以“Your AI, your growth”作为预览内容,未提供具体细节或论证,因此无法生成详细摘要。推测博主旨在强调AI对个人或组织成长的重要性,但具体观点、方法或案例均未提及。

Wiki Memory

@hwchase17 · 115.7K 粉丝 · 129.7K 阅 · 500 赞 · 57 转

Memory for agents is still early, with little to no standards. “Memory” means something different to everyone. But one common pattern is emerging: wiki memory. The idea is simple: use an agent to turn

中文介绍 讨论 AI 智能体(agent)记忆机制的现状,指出目前缺乏统一标准。博主提出一种正在兴起的「wiki memory」模式,即利用智能体将信息整理成 wiki 形式作为记忆,为智能体提供了结构化、易于检索的记忆解决方案。

开源史上最强去AI味Skill- [人话.skill]

@Pluvio9yte · 37.0K 粉丝 · 83.2K 阅 · 7d 曝光 83.2K

开源史上最强去AI味Skill- [人话.skill]

中文介绍 博主开源了一款名为「人话.skill」的AI辅助工具,旨在帮助用户去除AI生成内容的「AI味」。该Skill致力于让文本输出更具人类表达的自然流畅性,提升内容质量。

The Fable Loop Library: 25 Workflows on Autopilot

@EXM7777 · 122.0K 粉丝 · 208.2K 阅 · 7d 曝光 291.8K

The Fable Loop Library: 25 Workflows on Autopilot

中文介绍 博主发布「Fable Loop Library」,提供 25 个 Fable 自动化工作流。该库旨在帮助用户实现 Fable 操作的自动驾驶,有效提升工作效率,简化复杂任务处理。

Your AI, your growth

@arthurmensch · 74.0K 粉丝 · 162.7K 阅 · 7d 曝光 162.7K

Your AI, your growth

中文介绍 该推文仅以“Your AI, your growth”作为预览内容,未提供具体细节或论证,因此无法生成详细摘要。推测博主旨在强调AI对个人或组织成长的重要性,但具体观点、方法或案例均未提及。

A Field Guide to Fable: Finding Your Unknowns

@trq212 · 299.3K 粉丝 · 40.1K 阅 · 7d 曝光 40.1K

A Field Guide to Fable: Finding Your Unknowns

中文介绍 博主发布了一份名为「Fable实战指南」的教程,旨在指导用户如何在 Fable 平台中探索和发现「未知」。该指南可能涉及Fable的高级应用与问题解决策略,帮助用户深入理解和运用Fable。

How to build a second brain with Fable 5

@EXM7777 · 122.0K 粉丝 · 83.6K 阅 · 7d 曝光 291.8K

How to build a second brain with Fable 5

中文介绍 该推文标题为“How to build a second brain with Fable 5”,预览内容与标题一致,未提供具体操作步骤或详细方法。推测博主旨在分享如何利用工具Fable 5构建个人「第二大脑」的教程或工作流,以实现知识管理和信息整理。

Agentic Autonomy Levels

@addyosmani · 404.9K 粉丝 · 53.5K 阅 · 7d 曝光 53.5K

Agentic Autonomy Levels

中文介绍 帖子标题为「Agentic Autonomy Levels」,无具体正文内容。博主可能旨在探讨AI智能体的自主性分级框架,详细阐述不同层级的AI代理系统在决策、执行和学习方面的独立程度,为理解智能体的设计与应用提供一个理论视角。

FSD V14 lite review after 4 days

@BLKMDL3 · 92.4K 粉丝 · 41.1K 阅 · 7d 曝光 41.1K

FSD V14 lite review after 4 days

中文介绍 该推文仅以“FSD V14 lite review after 4 days”作为预览内容,缺乏具体评测细节。推测博主将分享特斯拉FSD(全自动驾驶)V14 lite版本在四天使用后的初步体验和评价,可能涉及其性能、改进或存在的不足。

THE MOST VALUABLE THING YOU CAN DO WITH FABLE 5 IN THE NEXT 24 HOURS

@AlexFinn · 459.5K 粉丝 · 72.5K 阅 · 7d 曝光 72.5K

THE MOST VALUABLE THING YOU CAN DO WITH FABLE 5 IN THE NEXT 24 HOURS

中文介绍 帖子标题为「FABLE 5 在未来24小时内你能做的最有价值的事」,无具体正文内容。博主可能旨在分享关于工具 FABLE 5 的一个关键使用技巧或短期内能产生显著价值的操作建议,为用户提供高效利用该平台的实用指南。

Career advice in the age of AI

@philhchen · 9.1K 粉丝 · 179.1K 阅 · 7d 曝光 179.1K

Career advice in the age of AI

中文介绍 该帖子围绕AI时代下的职业发展提供建议。博主旨在分享面对人工智能技术进步时,个人应如何规划职业路径、提升自身价值,以适应未来就业市场的变化和挑战。

NEvo: Neural-Guided Evolutionary Video Synthesis for Dynamic Visual Selectivity

👍 0

The human brain processes dynamic visual input through hierarchically organized, functionally specialized regions. While recent in silico brain encoding models can synthesize optimal stimuli to probe selectivity in different brain regions, prior work has been largely limited to static images, leavin

中文介绍 一项名为「NEvo」的神经引导演化视频合成模型被提出,旨在模拟人脑处理动态视觉输入。该模型能够合成最佳刺激,以探测大脑不同区域的视觉选择性。这项研究关注于大脑的层级组织和功能特化区域,为深入理解大脑如何处理动态视觉信息提供工具。

Pre-Flight: A Benchmark for Evaluating Large Language Models on Aviation Operational Knowledge

👍 0

Large language models (LLMs) are increasingly proposed for aviation business operations, from documentation and training generation to customer facing assistants. General purpose benchmarks do not measure whether a model reasons safely and correctly about aviation specific operational knowledge, and

中文介绍 「Pre-Flight」是一项新提出的基准,用于评估大型语言模型(LLMs)在航空运营知识方面的表现。鉴于LLMs在航空业务中应用渐广,此基准旨在衡量模型能否安全且正确地理解和推理航空特定操作,填补了现有通用基准无法有效评估专业领域能力的空白。

WorldDirector: Building Controllable World Simulators with Persistent Dynamic Memory

👍 22

We present WorldDirector, a highly controllable video world model framework designed for persistent dynamic object memory and unrestricted viewpoint exploration. Unlike existing world models that entangle physical dynamics with pixel rendering and rely on continuous visual observation to sustain mot

中文介绍 WorldDirector是一个高度可控的视频世界模型框架,旨在实现持久动态对象记忆和无限制视角探索。它区别于现有将物理动态与像素渲染纠缠在一起的世界模型,有效解决了传统模型对连续视觉观察的依赖问题,从而提升了视频生成和模拟的效率与真实感。

Program-as-Weights: A Programming Paradigm for Fuzzy Functions

👍 82

Many everyday programming tasks resist clean rule-based implementation, such as alerting on important log lines, repairing malformed JSON, or ranking search results by intent, and are increasingly outsourced to large language model APIs at the cost of locality, reproducibility, and price. We propose

中文介绍 “Program-as-Weights”是一种新的编程范式,专为难以用清晰规则实现的模糊功能设计。该范式能处理日志警报、损坏JSON修复或按意图排序搜索结果等任务,旨在提供一种本地且可复现的解决方案,以替代日益依赖大型语言模型API但存在局限性的传统方法。

From SRA to Self-Flow: Data Augmentation or Self-Supervision?

👍 10

Representation alignment has become an effective way to accelerate diffusion transformer training and improve generation quality. Recent self-alignment methods, such as SRA and Self-Flow, further remove the dependency on external pretrained encoders by constructing alignment within the diffusion mod

中文介绍 表示对齐已成为加速扩散Transformer训练和提升生成质量的有效方法。SRA和Self-Flow等新型自对齐方法,通过构建内部对齐,进一步消除了对外部预训练编码器的依赖。这项研究探讨了这些方法是属于数据增强还是自监督学习的范畴,及其对模型训练的深远影响。

Embodied.cpp: A Portable Inference Runtime of Embodied AI Models on Heterogeneous Robots

👍 1

Embodied AI models now span vision-language-action (VLA) models and world-action models (WAMs), but practical deployment remains fragmented across model-specific Python stacks, backend assumptions, and robot-side glue code, especially on heterogeneous edge devices. Existing inference runtimes are de

中文介绍 「Embodied.cpp」是一个为具身AI模型(如VLA和WAMs)设计的便携式推理运行时。它旨在解决具身AI模型在异构机器人和边缘设备上部署碎片化的问题,这些问题源于模型特定的Python堆栈和后端差异。该运行时提供了一个统一高效的解决方案,以促进具身AI模型的广泛实际应用。

EAGLE-360: Embodied Active Global-to-Local Exploration in 360^circ

👍 1

While Multimodal Large Language Models (MLLMs) have demonstrated exceptional capabilities in standard visual understanding, adapting them for active visual search in 360^circ panoramic environments exposes fundamental limitations. Specifically, standard MLLMs struggle to effectively model inherent p

中文介绍 尽管多模态大型语言模型(MLLMs)在标准视觉理解方面表现出色,但将其应用于360度全景环境中的主动视觉搜索时,暴露出根本局限。MLLMs难以有效进行全局到局部的探索。EAGLE-360旨在解决此问题,提供一种在360度环境中进行具身主动全局到局部探索的新方法,以提升模型在该复杂场景下的表现。

Interpretation-Oriented Cloud Removal via Observation-Anchored Residual Flow with Geo-Contextual Alignment

👍 0

Cloud removal (CR) is essential for optical remote sensing, serving as a prerequisite for reliable downstream interpretation, such as semantic segmentation and change detection. However, existing CR approaches often prioritize visual realism while overlooking their impact on subsequent analytical ta

中文介绍 云去除(CR)是光学遥感中的关键技术,对于语义分割和变化检测等下游判读任务至关重要。现有CR方法常侧重于视觉真实感,但往往忽视了其对后续判读效果的影响。一篇论文提出了一种「面向判读的云去除」新方法,通过「观测锚定残差流」和「地理上下文对齐」技术,旨在更有效地去除云层,同时提升遥感图像在语义分割和变化检测等应用中的判读准确性。

Learning to Move Before Learning to Do: Task-Agnostic pretraining for VLAs

👍 5

Vision-Language-Action (VLA) models are fundamentally bottlenecked by the scarcity of expert demonstrations -- triplets of observations, instructions, and actions that are costly to collect at scale. We argue that this bottleneck stems from conflating two distinct learning objectives: acquiring phys

中文介绍 视觉-语言-动作(VLA)模型受限于专家示范数据稀缺,即观察、指令和动作三元组的收集成本高昂。论文提出“先学移动,再学做事”的理念,即对VLA模型进行任务无关的预训练。研究认为,当前瓶颈源于混淆了两个不同的学习目标,通过分离运动和任务学习可有效提升VLA模型的泛化能力。

OrbitQuant: Data-Agnostic Quantization for Image and Video Diffusion Transformers

👍 2

Diffusion transformers (DiTs) achieve state-of-the-art image and video generation, but their multi-step sampling and growing parameter count make inference expensive. Post-training quantization (PTQ) is the natural remedy, yet DiT activations shift across timesteps, prompts, and guidance branches, f

中文介绍 扩散Transformer(DiTs)在图像和视频生成方面表现卓越,但其多步采样和日益增长的参数量导致推理成本高昂。训练后量化(PTQ)是常见的优化方案,但DiT的激活值在不同时间步和提示下会发生偏移,给量化带来挑战。OrbitQuant提出了一种数据无关的量化方法,旨在高效优化DiT模型。

EvoPolicyGym: Evaluating Autonomous Policy Evolution in Interactive Environments

👍 43

Autonomous agents are increasingly expected to improve executable policies through feedback, yet existing evaluations often collapse this process into a final score or confound it with open-ended software-engineering progress. We introduce Autonomous Policy Evolution, a controlled evaluation setting

中文介绍 自主智能体被期望通过反馈改进可执行策略,但现有评估常将其简化为最终分数,或与软件工程进展混淆。论文介绍了“自主策略演化”这一受控过程。EvoPolicyGym是一个新基准,专门用于在交互式环境中评估自主策略的演化能力,旨在提供更精细、全面的评估方式,以推动智能体发展。

LIME: Learning Intent-aware Camera Motion from Egocentric Video

👍 0

Autonomous robots often need to move their camera before they can act: to inspect an object, reveal an occluded region, or obtain a view that responds to a user's intent. While vision-language navigation translates instructions to base motion and vision-language-action policies map instructions to m

中文介绍 自主机器人常需在行动前移动摄像头,以检查物体、揭示遮挡或满足用户意图。虽然视觉-语言导航和VLA策略能实现基础运动,但它们通常不直接关注相机运动。LIME提出从第一人称视角视频中学习意图感知的相机运动,使机器人能更智能地调整视角,以支持后续操作。

Representation Distribution Matching for One-Step Visual Generation

👍 4

We elucidate the design space of Representation Distribution Matching (RDM), our name for the paradigm that trains a one-step image generator by matching generated and reference feature distributions under frozen pretrained encoders. We identify two design axes, how the distributions are compared an

Optimizing Visual Generative Models via Distribution-wise Rewards

👍 14

Conventional reinforcement learning strategies for visual generation typically employ sample-wise reward functions, yet this practice frequently results in reward hacking that degrades image diversity and introduces visual anomalies. To address these limitations, we present a novel framework that fi

BamiBERT: A New BERT-based Language Model for Vietnamese

👍 0

In this paper, we introduce BamiBERT, a new BERT-based pre-trained language model for Vietnamese that addresses key limitations of PhoBERT -- the current de facto Vietnamese text encoder. Trained from scratch on a 129GB corpus of general-domain Vietnamese text for 20 epochs, BamiBERT supports an ext

AgenticSTS: A Bounded-Memory Testbed for Long-Horizon LLM Agents

👍 46

Memory for a long-horizon LLM agent is a contract about what each future decision is allowed to see. The simplest contract appends past observations, tool calls, and reflections to every prompt, which makes prior context easy to access but also turns it into a jumbled mixture in which the effect of

ArcAD: Anomaly-Rectified Calibration for Cold-Start Supervised Anomaly Detection

👍 0

The deployment of Industrial Anomaly Detection (IAD) in real-world manufacturing frequently encounters a challenging cold-start bottleneck, in which limited normal samples fail to represent the full normal distribution and only a few anomalies are available. Under such a regime, existing methods str

Bridge-WA: Predicting Where and How the World Changes for Robotic Action

👍 0

General-purpose vision-language-action models benefit from large vision-language priors, but effective manipulation also requires anticipating action-relevant scene changes. Existing world-action models often rely on large generative world models or dense future rollouts, which are expensive and spe

DeepGaze3.5-VL: Modeling Scanpaths via Autoregressive Token Prediction

👍 0

Understanding human visual attention on a scene over time has applications in domains such as interface design and inferring cognitive states. Modeling visual scanpaths has historically relied on specialized architectures with hand-crafted priors. While these architectures can model fixation sequenc

PACE: A Proxy for Agentic Capability Evaluation

👍 7

Evaluating LLM agents on benchmarks like SWE-Bench and GAIA can be expensive, time-consuming, and requires complex infrastructure. A single evaluation can cost thousands of dollars and take days to complete. In contrast, non-agentic LLM benchmarks that test individual capabilities (e.g., reasoning,

SkillCoach: Self-Evolving Rubrics for Evaluating and Enhancing Agentic Skill-Use

👍 15

Skills are becoming a reusable operational layer for LLM agents, encoding SOPs, domain rules, tool workflows, scripts, and validation routines. In realistic skill repositories, overlapping skills make reliable skill-use difficult. Final verifier success is too coarse for both evaluation and training

WARP: Weight-Space Analysis for Recovering Training Data Portfolios

👍 6

Foundation models are routinely released to the public, yet the data recipes used to train them -- such as domain mixture weights that determine how different sources are sampled -- are rarely disclosed. This creates an access asymmetry: researchers study the resulting models but lack visibility int

AgenticDataBench: A Comprehensive Benchmark for Data Agents

👍 29

Data science aims to derive actionable insights from heterogeneous raw data, unlocking the value of the massive amounts of data generated in modern society. Automating this process is essential to reducing labor-intensive efforts for data scientists and enabling scalable data-driven applications. Re

TryCase

Disposable test environments for AI coding agents

中文介绍 TryCase 是一款为AI编码代理提供一次性测试环境的产品。该环境可用于快速部署、测试和调试AI生成的代码,从而提高开发效率并确保代码质量。它旨在帮助开发者在安全隔离的环境中验证AI编码成果。

DocsAlot

Documentation that works for both humans and AI systems

中文介绍 DocsAlot 致力于创建一种新型文档,使其既能被人类读者理解,也能被AI系统有效处理和利用。该产品旨在弥合人类与AI之间在信息理解上的差距,提升文档的通用性与自动化处理能力。

MentionDrop MCP

Give your AI agent live market signals

中文介绍 MentionDrop MCP 是一款能够为AI代理提供实时市场信号的产品。通过集成 MentionDrop MCP,AI代理可以及时获取并分析最新的市场动态和趋势,从而辅助决策和策略制定,提升市场响应能力。

WorkBuddy

Produce sharpened results faster with a team of AI experts

中文介绍 WorkBuddy 提供一个由AI专家组成的团队,旨在帮助用户更快地产生更优质的成果。该产品通过整合多个AI模型和工具,模拟专业团队协作,优化工作流程,从而提高效率和产出质量。

CircleChat

Give your AI agents a slack, a task board, and a boss

中文介绍 CircleChat 旨在为AI代理构建一个完善的协作环境,包括提供类似 Slack 的沟通渠道、任务管理看板以及模拟「上级」的角色进行指导。这使得AI代理能更有效地进行团队协作与任务管理。

Endl

A global operating account for fiat, stablecoins, and cards.

中文介绍 Endl 推出一款全球运营账户,旨在整合法定货币、稳定币和卡片支付功能。用户可以通过该账户管理多种资产,进行全球范围内的交易和资金操作,提供便捷高效的金融服务。

Toku Reader

Read & listen to native Japanese and Chinese, tap any word

中文介绍 Toku Reader 是一款语言学习工具,支持用户阅读和听取原生的日语和中文材料。用户可以点击文本中的任意词语进行即时查询,从而帮助学习者提高词汇量和理解能力。

Pennen

One quiet handwritten page a day. No feed, no AI.

中文介绍 Pennen 是一款提倡数字排毒的产品,鼓励用户每天手写一页日记,专注于慢生活和自我反思。其设计理念强调「无信息流、无AI」干扰,旨在提供一个安静、纯粹的书写体验。

ChecklistFox

AI checklist maker for beautiful pdfs, free & instant

中文介绍 ChecklistFox是一款免费且高效的AI工具,能够即时生成精美的PDF格式清单。该产品利用人工智能技术,简化了清单制作过程,使用户可以快速创建专业且视觉吸引力强的待办事项或检查列表,提高工作效率。

Glaze by Raycast

Create your own Mac apps by chatting with AI

中文介绍 Raycast公司推出了Glaze,这是一款允许用户通过与人工智能(AI)聊天来创建Mac应用程序的工具。它旨在简化Mac应用开发流程,使用户能够以对话形式构建定制应用。

Building a Real AI Jarvis (GPT Realtime 2 + Cursor)

中文介绍 该视频由Riley Brown发布,展示了如何利用GPT Realtime 2和代码编辑器Cursor来构建一个真实的AI助手,旨在模仿电影中的智能管家「贾维斯」。内容可能涵盖AI实时交互、编程辅助以及个人化AI系统开发等技术细节。

Poweful Agents inside Slack

中文介绍 这段视频短片介绍了在Slack平台中部署功能强大的AI智能体。这些智能体能够协助用户完成各项任务,提高工作效率,实现自动化流程。

How Squidsoup makes art installations with Claude

中文介绍 视频展示了艺术团体 Squidsoup 如何利用人工智能助手 Claude 来创作其独特的艺术装置。内容可能涵盖 Claude 在构思、设计辅助或实现过程中扮演的角色,揭示AI与艺术结合的新形式。

The future of work with @Claude

中文介绍 Claude 官方 YouTube 频道发布视频,探讨其人工智能模型 Claude 在未来工作场景中的应用与潜力。该视频可能展望了AI技术如何赋能个人和组织,以适应不断变化的职场需求,并展示 Claude 在提升效率和创新方面的角色。

Introducing Claude Science (now in beta)

中文介绍 人工智能公司 Anthropic 正式推出其大型语言模型 Claude 的一项新功能或专业版本,命名为「Claude Science」。该项目目前处于测试(beta)阶段,旨在提升 Claude 在科学领域的理解与处理能力,以更好地服务于科学研究和相关应用。用户现可体验此新功能。

How Spotify runs agents across 20M+ lines of code, with Niklas Gustavsson

中文介绍 Spotify 的 Niklas Gustavsson 介绍了该公司如何在大规模代码库上运行代理。他分享了 Spotify 如何在其超过 2000 万行代码中部署和管理这些自动化代理,以提升开发效率和代码质量。讨论可能涵盖了代理的设计、实施策略及其在大型系统中的应用挑战。

How Squidsoup makes art installations with Claude

中文介绍 视频展示了艺术团体 Squidsoup 如何利用人工智能助手 Claude 来创作其独特的艺术装置。内容可能涵盖 Claude 在构思、设计辅助或实现过程中扮演的角色,揭示AI与艺术结合的新形式。

The future of work with @Claude

中文介绍 Claude 官方 YouTube 频道发布视频,探讨其人工智能模型 Claude 在未来工作场景中的应用与潜力。该视频可能展望了AI技术如何赋能个人和组织,以适应不断变化的职场需求,并展示 Claude 在提升效率和创新方面的角色。

Introducing Claude Science (now in beta)

中文介绍 人工智能公司 Anthropic 正式推出其大型语言模型 Claude 的一项新功能或专业版本,命名为「Claude Science」。该项目目前处于测试(beta)阶段,旨在提升 Claude 在科学领域的理解与处理能力,以更好地服务于科学研究和相关应用。用户现可体验此新功能。

How Spotify runs agents across 20M+ lines of code, with Niklas Gustavsson

中文介绍 Spotify 的 Niklas Gustavsson 介绍了该公司如何在大规模代码库上运行代理。他分享了 Spotify 如何在其超过 2000 万行代码中部署和管理这些自动化代理,以提升开发效率和代码质量。讨论可能涵盖了代理的设计、实施策略及其在大型系统中的应用挑战。

They Said This Will Never Run In Real Time

中文介绍 视频介绍了某项技术突破,成功实现了此前被认为无法实时运行的功能。该进展可能在处理速度和应用效率方面带来显著提升,克服了此前人们对于其实时性能的怀疑。

AI Just Entered A New Era

中文介绍 由Two Minute Papers发布的该视频,标题为「AI刚刚进入一个新时代」,预示着人工智能领域可能出现了重大进展或突破。这可能涉及新的模型、技术或应用范式的出现,标志着AI发展迈入了一个重要的新阶段。

该源今日无内容。

Show HN: KiCad in the Browser

KiCad, a PCB EDA suite is now working in a browser, you can try it at the link, there's a demo project or you can bring your own. Firefox is best, Chrome is good, Safari is "working".We’re Emergence Engineering, a dev shop from Hungary, mostly working with rich text editors, CRDTs. PC

v2.1.201

What's changed Claude Sonnet 5 sessions no longer use the mid-conversation system role for harness reminders

中文介绍 克劳德(Claude)代码库发布了 v2.1.201 版本。此版本更新的一项主要变化是,Claude Sonnet 5 的会话在进行引导提醒时,将不再使用对话中的系统角色。这反映了对模型内部交互机制的调整和优化,旨在提升模型性能和用户体验。

v2.1.200

What's changed Changed AskUserQuestion dialogs to no longer auto-continue by default; opt into an idle timeout via /config Changed the "default" permission mode to "Manual" across the CLI, --help, VS Code, and JetBrains; --permission-mode manual and "defaultMode": "manual" are accepted alongside def

中文介绍 Anthropic的Claude Code发布v2.1.200版本。此版本更新了“AskUserQuestion”对话框,默认不再自动继续,用户可通过“/config”设置空闲超时。此外,CLI、VS Code和JetBrains等环境的默认权限模式均已更改为“手动”,以提高安全性控制。

v2.1.199

What's changed Stacked slash-skill invocations like /skill-a /skill-b do XYZ now load all leading skills (up to 5), not just the first Fixed SSL certificate errors (TLS-inspecting proxies, missing NODE_EXTRA_CA_CERTS, expired certs) burning retries before showing actionable guidance — they now fail

中文介绍 Anthropic的Claude Code发布v2.1.199版本。此更新改进了堆叠斜杠技能调用功能,现在最多可加载前5个技能,而非仅第一个。同时,修复了与SSL证书相关的错误,解决了因TLS检查代理、缺少NODE_EXTRA_CA_CERTS或证书过期导致的重试问题。

v2.1.198

What's changed Subagents now run in the background by default, so Claude keeps working while they run and is notified when they finish (previously a gradual rollout) Claude in Chrome is now generally available Added background agent notifications in claude agents — sessions that need input or finish

中文介绍 Anthropic的Claude v2.1.198版本更新。Claude现已在Chrome浏览器上普遍可用,并为Claude代理新增后台通知功能,在会话需输入或结束时触发。同时,增加了"/dataviz"技能,提供图表和仪表盘设计指导。

v2.1.197

What's changed Introducing Claude Sonnet 5: now the default model in Claude Code, with a native 1M-token context window and promotional pricing of $2/$10 per Mtok through August 31. Update to version 2.1.197 for access. https://www.anthropic.com/news/claude-sonnet-5

中文介绍 Anthropic的Claude Code发布v2.1.197更新,并引入了Claude Sonnet 5作为默认模型。该模型原生支持100万上下文窗口,并提供推广期价格:每百万tokens输入2美元,输出10美元,优惠期截至8月31日。

v2.1.196

What's changed Added support for organization default models — admins set it in the org console; it shows as "Org default" (or "Role default") in /model when you haven't picked one yourself Added readable default names for sessions at start, making them easier to identify and message Added clickable

中文介绍 Anthropic的Claude Code发布v2.1.196更新,新增了组织默认模型支持,管理员可在组织控制台设置。当用户未选择模型时,该默认模型将显示为「组织默认」或「角色默认」。此外,新版本还为会话启动时增加了可读的默认名称。

v2.1.195

What's changed Added CLAUDE_CODE_DISABLE_MOUSE_CLICKS to disable mouse click/drag/hover in fullscreen mode while keeping wheel scroll Fixed hook matchers with hyphenated identifiers (e.g. code-reviewer, mcp__brave-search) accidentally substring-matching — they now exact-match. Use mcp__brave-search_

v2.1.193

What's changed Added autoMode.classifyAllShell setting to route all Bash/PowerShell commands through the auto-mode classifier instead of only arbitrary-code-execution patterns Added auto-mode denial reasons to the transcript, the denial toast, and /permissions recent denials Added claude_code.assist

v2.1.191

What's changed Added /rewind support for resuming a conversation from before /clear was run Fixed scroll position jumping to the bottom while reading earlier output during a streaming response Fixed background agents resurrecting after being stopped — stopping an agent from the tasks panel is now pe

v2.1.190

What's changed Bug fixes and reliability improvements

0.143.0-alpha.36

Release 0.143.0-alpha.36

中文介绍 OpenAI Codex发布了其Rust项目的最新版本更新,版本号为0.143.0-alpha.36。该版本是一个Alpha阶段的发布,表明此项目目前仍在积极的早期开发中。

0.143.0-alpha.35

Release 0.143.0-alpha.35

中文介绍 OpenAI Codex团队发布了Rust项目的新版本“0.143.0-alpha.35”。此版本是该项目的又一次迭代更新,具体功能变动和改进细节未在发布说明中详细披露。

0.143.0-alpha.34

Release 0.143.0-alpha.34

中文介绍 OpenAI Codex 发布了针对 Rust 语言的 0.143.0-alpha.34 版本更新。此次更新为 alpha 测试版本,但具体内容未在公告中详述。

0.143.0-alpha.33

Release 0.143.0-alpha.33

中文介绍 OpenAI Codex 发布了针对 Rust 语言的 0.143.0-alpha.33 版本更新。此次更新为 alpha 测试版本,但具体内容未在公告中详述。

0.143.0-alpha.32

Release 0.143.0-alpha.32

中文介绍 OpenAI旗下的Codex项目发布了最新版本rust-v0.143.0-alpha.32。这是一个新的软件更新,但具体的发布细节和改进内容在本次公告中未提供。

0.142.5

Bug Fixes Prevented full Responses WebSocket request payloads from being written to trace logs. (#30771) Changelog Full Changelog: rust-v0.142.4...rust-v0.142.5 #30771 [codex] Backport websocket trace fix to release/0.142 @dylan-hurd-oai

中文介绍 OpenAI Codex项目发布了rust-v0.142.5版本,主要修复了一个错误。该版本阻止了完整的Responses WebSocket请求负载被写入跟踪日志,解决了#30771号问题。

0.142.4

Chores No user-facing changes were identified for this release. Changelog Full Changelog: rust-v0.142.3...rust-v0.142.4

今日主题

今日AI领域聚焦智能体与效率工具的蓬勃发展,大量开源项目和产品更新提升了AI在编码、设计及自动化任务中的实用性,同时大型语言模型核心能力持续迭代,产业资本对AI初创企业的投资热潮不减。

01

模型发布/更新

Model Releases 33 篇

Claude Sonnet 5 调整会话提示词引导机制

官方Claude Code Releases

Anthropic 发布的 v2.1.201 版本更新中,Claude Sonnet 5 模型在会话引导提醒时将不再使用对话中的系统角色。此项调整旨在优化模型内部交互机制,以提升其整体性能和用户体验,确保模型响应在不同情境下更为自然高效。

大模型版本更新Claude

OpenAI Codex Rust 项目发布 0.143.0-alpha.36 更新

官方OpenAI Codex Releases

OpenAI Codex 近日发布了其 Rust 项目的最新 Alpha 版本更新,版本号为 0.143.0-alpha.36。该版本处于积极的早期开发阶段,标志着 OpenAI 在 Rust 语言生态中对 Codex 模型的持续投入和功能迭代,旨在为开发者提供更强大的 AI 编程辅助能力。

OpenAIAI编码版本更新

百度推出「无限OCR」技术,实现多页文档高效处理

研究聚合The Decoder

百度近日发布「无限OCR」技术,成功突破传统OCR系统一次性处理约十页文档的限制,能够一次处理数十页。该技术通过改进注意力机制,实现了内存占用的稳定控制,无论处理页数多少都能保持平稳,并在关键OCR基准测试中展现出卓越性能,大幅提升了文档数字化效率。

百度OCR技术突破
02

产品发布/更新

Product 44 篇

Anthropic 推出 Claude Code 终端智能编码工具

开源项目GitHub Trending

Anthropic 正式发布 Claude Code,一款直接集成到终端环境的智能编码代理工具。它能深入理解整个代码库,自动化日常编程任务,解释复杂代码逻辑,并辅助 Git 工作流,显著提升开发者的编码效率,使其能更专注于创新性工作,加速软件开发进程。

AI编程开发者工具代码助手

Raycast 发布 Glaze:通过AI对话构建Mac应用

产品榜单Product Hunt

Raycast 公司推出 Glaze,一款创新工具,允许用户通过与人工智能聊天的方式创建定制化的 Mac 应用程序。该产品旨在大幅简化 Mac 应用的开发流程,使用户能够以自然对话形式将想法转化为实际应用,降低开发门槛,提升应用开发效率。

AI工具Mac应用应用开发

Unity MCP 发布,实现AI大模型对Unity编辑器的直接控制

开源项目GitHub Trending

Unity MCP 是一款连接 AI 助手与 Unity Editor 的桥梁工具,赋予大型语言模型 (LLM) 直接管理 Unity 资源、控制场景、编辑脚本和自动化开发任务的能力。该项目旨在革新游戏开发流程,使开发者能通过自然语言或 AI 指令,高效完成复杂操作,大幅提升游戏创作效率。

游戏开发LLMUnity

Meetily 开源发布,提供本地化隐私保护AI会议助手

开源项目GitHub Trending

Meetily 是一款基于 Rust 构建的开源 AI 会议助手,其核心亮点在于 100% 本地化处理,无需云服务,极大保障用户隐私。它利用 Parakeet/Whisper 实现 4 倍速实时转录和发言人识别,并使用 Ollama 进行会议总结,为重视数据安全的个人和团队提供高效、私密的会议记录与整理解决方案。

AI助手会议记录隐私保护
03

行业动态

Industry 33 篇

AI热潮持续:今年已诞生近90家估值超十亿美元独角兽

综合资讯TechCrunch

截至目前,2026年已有近90家初创企业成功晋升「独角兽」行列,即估值超过10亿美元。这一显著的增长趋势主要由人工智能领域的投资者狂热情绪所驱动,反映出市场对AI技术及其未来应用前景的巨大信心和高预期。

融资创业公司AI

亚马逊Mechanical Turk停止接受新客户,平台或将走向终结

综合资讯TechCrunch

亚马逊近期宣布,其众包服务平台「Mechanical Turk」将停止接受新客户。此举可能预示着这个曾为大量数据标注和人机协作任务提供支持的平台将走向终结,引发了业界对众包劳务市场未来走向以及AI时代数据处理模式演变的新思考。

亚马逊众包平台战略

谷歌AI广告引争议:设想美国开国元勋使用AI撰写《独立宣言》

综合资讯The Verge

谷歌发布了一则引发广泛讨论的广告,其创意设想美国开国元勋们在1776年借助人工智能技术和Google Workspace共同撰写《独立宣言》。这支广告旨在展示AI在协作和内容创作方面的潜力,但也因其历史重构和技术应用想象力而引发了公众不同的看法和热议。

谷歌广告AI应用
04

技巧与观点

Tips & Takes 44 篇

LLM系统Prompt泄露集合曝光,揭示模型内部指令

开源项目GitHub Trending

system_prompts_leaks 项目汇集了Anthropic、OpenAI和Google等主流大语言模型被「泄露」的系统Prompt。这为研究者、开发者和安全专家提供了深入了解模型内部指令和行为模式的宝贵资源,有助于进行Prompt工程优化、安全分析及更高效的模型交互设计。

LLMPrompt工程模型分析

哈佛大学发布机器学习系统课程教材,聚焦MLOps实践

开源项目GitHub Trending

cs249r_book 是来自 Harvard-EDGE 的“机器学习系统”课程书籍或学习材料。该项目深入探讨了机器学习模型的端到端生命周期,涵盖数据管理、模型训练、评估、生产部署、监控和维护等环节,旨在教授如何设计、构建并扩展实际的ML系统,是掌握MLOps实践的宝贵资源。

机器学习系统MLOps教育

文件基规划方案,增强AI编码代理任务持久性

开源项目GitHub Trending

planning-with-files 项目为AI编码代理和长时间运行任务提供持久化的文件基规划方案。它将规划存储为Markdown文件,确保代理在上下文丢失或系统重置时能保持任务状态和进度。该方案解决了传统AI代理「记忆」短暂、难以处理复杂任务的痛点,提升了AI编程助手和自动化工作流的鲁棒性。

AI代理任务规划持久化

开源「人话.skill」工具,助AI生成内容摆脱「AI味」

X·KOLX 创作者 (AttentionVC)

博主Pluvio9yte开源了一款名为「人话.skill」的AI辅助工具,旨在帮助用户去除AI生成内容中常见的「AI味」。该工具致力于让文本输出更具人类表达的自然流畅性、个性和创造力,从而提升内容质量和吸引力,特别适用于文案创作、故事生成等需要非同质化内容的场景。

开源工具内容优化提示工程
今日产品趋势

今天的产品发布集中在AI Agent的开发与应用,从终端编码助手到多智能体协作环境,都在不断探索AI辅助编程的新边界。此外,通过自然语言直接创建应用和控制网页,以及利用AI提升日常效率的工具也亮点频频,展现了AI在降低技术门槛和提升生产力方面的巨大潜力。

01

今日必看

Must See 22 款

Claude Code — Anthropic出品的终端AI编程助手

开源项目GitHub Trending

Claude Code 是 Anthropic 推出的一个智能代理编码工具,它直接集成在用户的终端环境中。该工具能够深入理解整个代码库,并通过执行日常任务、解释复杂代码逻辑以及辅助处理 Git 工作流,显著提升开发者的编码效率。它旨在成为开发者的得力助手,自动化重复性工作,让开发者能更专注于核心创造性任务,从而加快软件开发进程。

AI编程开发者工具代码助手

Glaze by Raycast — 通过AI聊天构建Mac应用

产品榜单Product Hunt

Glaze by Raycast 是一款革命性的工具,它允许用户通过与人工智能(AI)聊天,以自然语言的方式来创建定制的 Mac 应用程序。这款产品极大地简化了传统的应用开发流程,将复杂的编程任务转化为直观的对话,使得非开发者也能轻松实现创意。Glaze 旨在赋能更广泛的用户群体,通过降低技术门槛,加速 Mac 生态的应用创新,开启了「对话即开发」的全新范式。

AI工具Mac应用应用开发
02

开发者工具

Dev Tools 55 款

herdr — 终端内的AI Agent多路复用器

开源项目GitHub Trending

herdr 是一个命令行工具,它充当 AI Agent 的多路复用器,允许用户在终端中高效管理和交互多个智能代理。通过提供一个统一的接口,它解决了同时运行和协调多个 Agent 时的复杂性,例如不同 Agent 的输入、输出和状态管理。开发者和AI工程师可以使用 herdr 来构建复杂的自动化工作流,同时监控不同 Agent 的执行情况,无需切换多个应用或窗口,极大地提升了Agent驱动型应用的开发和调试效率。

AI Agent命令行工具自动化

page-agent — 自然语言控制网页界面的JavaScript GUI代理

开源项目GitHub Trending

page-agent 是一个在网页内运行的 JavaScript GUI 代理,支持通过自然语言控制网页界面。它通过将用户意图转化为前端操作,简化了复杂的Web交互和自动化流程。开发者可利用其为Web应用构建智能助手、进行自动化测试或实现无代码UI操作,提升人机交互效率。

Web自动化自然语言GUI代理

strix — 开源AI渗透测试工具

开源项目GitHub Trending

strix 是一个开源的 AI 安全工具,旨在帮助开发者和安全团队自动发现并修复应用程序中的潜在漏洞。该项目利用人工智能技术,模拟「AI 渗透测试员」的行为模式,对应用进行深度分析和攻击模拟,从而有效识别传统安全扫描工具可能遗漏的安全缺陷。它解决了人工安全审计耗时耗力、且容易出错的问题,特别适用于需要持续安全保障的开发流程(如 CI/CD),帮助团队在软件发布前提升应用的整体安全性,降低潜在的安全风险。

应用安全AI安全漏洞检测

gastown — 多智能体工作空间管理器

开源项目GitHub Trending

Gas Town 是一个多代理工作空间管理器,专注于解决在复杂任务中协调和管理多个 AI 代理的挑战。它提供一个框架或工具集,用于有效地分配任务、管理代理间的通信、共享资源和追踪工作流程。这对于构建和部署需要多个 AI 代理协同作业的系统至关重要,例如自动化复杂的业务流程、模拟多智能体行为或进行大型语言模型 (LLM) 链式推理。开发者、研究人员或企业可以通过 Gas Town 提升多代理系统的协作效率和可靠性。

多智能体AI代理工作流管理

TryCase — 为AI编码代理提供一次性测试环境

产品榜单Product Hunt

TryCase 是一款专为 AI 编码代理设计的一次性测试环境产品。它提供了一个隔离、高效的沙盒空间,允许开发者快速部署、测试和调试 AI 生成的代码,从而确保代码质量并加速开发迭代周期。通过消除在主开发环境进行实验的风险和复杂性,TryCase 解决了 AI 代理生成代码的验证难题,特别适用于需要频繁迭代和测试的自动化编程场景,大幅提升了 AI 辅助开发的可靠性和效率。

AI工具开发环境代码测试
03

创作与效率

Creative & Productivity 44 款

Meetily — 隐私优先的本地AI会议助手

开源项目GitHub Trending

Meetily 是一款注重隐私的 AI 会议助手,基于 Rust 构建,支持 100% 本地化处理,无需云服务。它利用 Parakeet/Whisper 实现 4 倍速实时转录,提供发言人识别功能,并使用 Ollama 进行会议总结。此工具为重视数据安全的个人和团队提供高效、私密的会议记录与整理解决方案。

AI助手会议记录隐私保护

DocsAlot — 为人类和AI系统设计的通用文档

产品榜单Product Hunt

DocsAlot 致力于创建一种新型文档,使其既能被人类读者理解,也能被AI系统有效处理和利用。该产品旨在弥合人类与AI之间在信息理解上的差距,提升文档的通用性与自动化处理能力。

文档管理AI工具信息处理

WorkBuddy — 集合AI专家团队提升工作产出

产品榜单Product Hunt

WorkBuddy 旨在通过一个由 AI 专家组成的虚拟团队,帮助用户更快地产生更优质的工作成果。它通过智能整合多个 AI 模型和专业工具,模拟人类团队的协作模式,将复杂的任务分解并分配给不同的「AI专家」处理,从而优化工作流程、提高效率和最终产出质量。这款产品特别适合需要快速、高质量完成多方面任务的个人或小型团队,为他们在内容创作、数据分析或策略制定等领域提供强大的智能辅助。

AI协作效率工具智能助手

ChecklistFox — AI驱动的免费PDF清单生成器

产品榜单Product Hunt

ChecklistFox 是一款免费且高效的 AI 工具,能够即时生成精美的 PDF 格式清单。它利用人工智能技术,彻底简化了传统清单的制作过程,用户只需输入需求,AI 即可快速生成专业且视觉吸引力强的待办事项、检查列表或项目计划。这款产品解决了手动创建清单耗时费力的问题,大大提升了个人和团队在日常规划、任务管理及项目执行中的效率和条理性。

AI工具生产力文档生成
04

新鲜实验

Emerging 22 款

RuView — 基于WiFi信号的实时空间智能与生命体征监测

开源项目GitHub Trending

RuView 项目创新性地将普通的 WiFi 信号转化为实时空间智能、生命体征监测和存在检测能力,完全无需使用任何视频设备。它通过分析 WiFi 信号在环境中因人体移动或呼吸等造成的微小扰动,提取出高价值的环境和生理数据。这解决了传统监控方案中隐私侵犯、硬件复杂或覆盖范围有限的问题。RuView 适用于智能家居、医疗保健(如老人跌倒预警、睡眠监测)、安防监控以及任何需要非接触式、隐私友好型人体感知的应用场景。

WiFi感知智能家居传感器

CircleChat — AI代理协作环境

产品榜单Product Hunt

CircleChat 旨在为AI代理构建一个完善的协作环境,包括提供类似 Slack 的沟通渠道、任务管理看板以及模拟「上级」的角色进行指导。这使得AI代理能更有效地进行团队协作与任务管理。

AI协作任务管理虚拟团队
→ 查看产品库