每日 AI 简报

2026-07-01(内容获取于 07/01 05:27)

Anthropic新模型Claude Sonnet 5性能接近Opus系列

The Decoder · 07/01 02:46

Anthropic发布了最新模型Claude Sonnet 5,该模型在所有基准测试中超越了前代Sonnet 4.6,并在知识工作测试中微弱领先更昂贵的Opus 4.8。这表明Sonnet 5已大幅缩小与Opus系列模型之间的性能差距。

推荐理由:Sonnet 5的性能提升意味着用户可以用更低的成本获得接近顶级模型的体验,这对成本敏感型AI应用开发者具有重要意义。

OmniRoute:免费AI网关集成多达231+提供商

GitHub Trending

OmniRoute 提供一个免费的 AI 网关,通过单一 API 端点集成超过231个 AI 提供商(其中50余个免费),旨在解决多模型调用的复杂性。它支持将编码助手连接至免费的 Claude、GPT、Gemini 等主流大模型,并采用堆叠压缩技术,可节省 15-95% 成本。

推荐理由:该项目为开发者提供了免费且高效的AI模型集成方案,通过单一接口管理多个模型,并显著优化成本,对AI应用开发具有直接的实用价值。

Anthropic推出Claude Science测试版

Claude (YouTube) · 07/01 01:05

人工智能公司 Anthropic 正式推出其大型语言模型 Claude 的「Claude Science」测试版,旨在提升 Claude 在科学领域的理解与处理能力,以更好地服务于科学研究和相关应用。用户现可体验此新功能。(多家报道)

推荐理由:Claude Science的推出标志着大模型在专业领域深化的趋势,有望显著提升科研效率和准确性,为科学探索提供强大AI支持。

前DeepMind研究员将AI扑克技术应用于量化基金

TechCrunch · 07/01 04:33

由三名前DeepMind研究员创立的EquiLibre Technologies,曾开发扑克AI,现已成功为量化对冲基金创造收益,公司估值超过5亿美元。这显示了AI技术在复杂金融市场中的强大应用潜力。

推荐理由:这是一个AI商业化落地并取得巨大成功的典范,特别是将游戏AI技术迁移到高风险的量化金融领域,为AI创业者和投资者提供了重要的参考。

AI编程助手Cursor推出iOS版

Product Hunt · 07/01 05:20

Cursor for iOS是一款移动应用程序,使用户能够利用AI编码代理随时随地进行软件开发。它将AI驱动的编程能力带到移动设备上,旨在提高开发者在非传统工作环境下的生产力。

推荐理由:移动AI编程工具的出现,极大地拓展了开发场景,让开发者能够更灵活地利用AI完成编码工作,是生产力工具的重要进展。

研究揭示AI浏览器存在安全漏洞

Ars Technica · 07/01 04:03

最新研究指出,AI浏览器存在安全漏洞,通过简单的“催眠”指令,如告知大语言模型“2 + 2 = 5”,就能使其规避安全防护措施并执行不被允许的指令。这揭示了AI浏览器潜在的安全风险。

推荐理由:该研究揭示了AI浏览器在安全防护方面的深层缺陷,对于AI应用开发者和用户而言,是理解和防范潜在风险的关键信息。

IBM推出ScarfBench:企业Java迁移AI智能体基准

Hugging Face Blog · 07/01 02:32

IBM研究团队推出了ScarfBench,这是一个专为评估AI代理在企业级Java框架迁移中性能的基准测试平台。ScarfBench旨在帮助开发者衡量和优化AI辅助代码迁移的效率和准确性,以提升企业软件现代化进程。

推荐理由:ScarfBench为企业Java代码迁移提供了AI智能体评估标准,对于推动企业级AI辅助开发和软件现代化具有重要意义。

开发者分享与大模型协作挑战与经验

V2EX · 06/30 18:54

V2EX社区有开发者发帖讨论在实际工作中与大型语言模型(LLM)交互时遇到的挑战与解决方案,涵盖从提示工程、模型选择到结果调优等多个方面,分享了与AI协作的日常经验。

推荐理由:这篇社区讨论提供了开发者在使用大模型过程中的真实痛点和解决思路,对于正在或即将与大模型打交道的同行具有参考价值。

预测市场中AI智能体交易占比将超30%

X 推文 (AttentionVC) · 06/29 22:08

OracleLimited分享了对2026年预测市场的未来愿景:自主AI智能体将成为最有效的交易策略,Polymarket上超过30%的活动将由算法和AI驱动的钱包完成。这描绘了AI在去中心化金融和预测领域深度参与的趋势。

推荐理由:该观点预示了AI在未来去中心化预测市场中的重要地位,为关注Web3和AI结合的读者提供了前瞻性视角。

小参数量智能体实现万亿级模型性能

HuggingFace Trending Papers · 06/29 08:00

该研究提出Agents-A1模型,一个35亿参数的专家混合智能体模型,通过扩展智能体的“视界”实现了万亿参数级别的性能。研究旨在探索在不增加模型参数量的情况下,如何有效提升大语言模型(LLM)性能。

推荐理由:这篇论文提出了一种创新方法,能在有限参数下实现超大规模模型的性能,对优化大模型资源消耗、降低开发门槛具有深远意义。

Anduril推出ArsenalOS™:现代国防制造核心系统

X 创作者 (AttentionVC) · 06/30 00:24

Anduril公司宣布推出ArsenalOS™系统,旨在作为现代国防制造的数字骨干,以实现设计、生产和部署的集成与自动化,提升国防工业的效率和响应速度。

推荐理由:关注AI在传统重工业和国防领域的融合应用,ArsenalOS™展示了AI和自动化技术如何赋能复杂制造流程,具有重要的产业前瞻性。

NASA may send a backup, nuclear-powered Mars rover to the Moon

"That would be an awesome capability."

中文介绍 美国国家航空航天局(NASA)正在考虑将一个为火星任务设计的备用核动力漫游车,转用于月球探测。此举有望利用其核动力在月球极地等资源受限区域进行长期探索,提升NASA的月球科研能力。

Google kills Tenor GIF API, forcing changes at X, Discord, and more

Tenor still connects to Google apps, but other platforms must look elsewhere for GIFs.

中文介绍 谷歌已终止对热门GIF平台Tenor的API支持,迫使X、Discord等依赖其服务的平台寻找替代方案。尽管Tenor仍可连接至谷歌旗下应用,但这一变动将对其他第三方应用和服务集成产生显著影响。

The DeepMind trio who built a poker AI are now making money for quant hedge funds

EquiLibre Technologies, a Prague-based AI lab founded by three ex-DeepMind researchers, is now valued at more than $500 million.

中文介绍 由三名前DeepMind研究员创立的布拉格AI实验室EquiLibre Technologies,曾开发扑克AI,现已成功为量化对冲基金创造收益。该公司估值已超过5亿美元,显示其AI技术在金融领域的强大应用潜力。

Apple takes Epic fight over app store fees to the Supreme Court

Supreme Court will weigh if Apple contempt finding in Epic case is “erroneous.”

中文介绍 苹果公司已将与Epic Games关于App Store费用的长期法律纠纷上诉至最高法院。最高法院将审议此前判定苹果藐视法庭的裁决是否存在“错误”,此案将对应用商店的商业模式及行业竞争产生深远影响。

New attack provides one more reason why AI browsers are a bad idea

Telling an LLM that 2 + 2 = 5 is enough to make it follow forbidden instructions.

中文介绍 最新研究指出,AI浏览器存在安全漏洞,通过简单的“催眠”指令,如告知大语言模型“2 + 2 = 5”,就能使其规避安全防护措施并执行不被允许的指令。这揭示了AI浏览器潜在的风险,引发对LLM安全性的担忧。

Realta Fusion generates electricity directly from a fusion reaction, an apparent first

“We can take power from a plasma,” Kieran Furlong, co-founder and CEO of Realta Fusion, told TechCrunch. The milestone shows “what’s possible,” he added.

中文介绍 Realta Fusion公司宣布,已成功直接从核聚变反应中产生电力,这被认为是全球首次实现。公司联合创始人兼CEO Kieran Furlong表示,这一里程碑展示了从等离子体中获取能量的可能性,预示着清洁能源领域的重大突破。

Google introduces a faster, cheaper image generator with Nano Banana 2 Lite

Google is updating its image generator to make it faster and cheaper, making it a more useful tool for creators looking to make AI content.

中文介绍 谷歌推出了名为Nano Banana 2 Lite的全新图像生成器,旨在提供更快、更经济的AI图像创作体验。这款更新旨在降低内容创作者使用AI生成图像的门槛和成本,进一步普及AI创作工具的应用。

Anthropic's new Claude Sonnet 5 closes the gap to the pricier Opus model series

Anthropic released Claude Sonnet 5, which beats its predecessor Sonnet 4.6 across all benchmarks and even edges past the larger Opus 4.8 on the GDPval-AA v2 knowledge work test with a score of 1,618. Anthropic is also quick to point out that the model scores far below the models the US government cu

中文介绍 Anthropic发布了最新模型Claude Sonnet 5,该模型在所有基准测试中超越了前代Sonnet 4.6,并在GDPval-AA v2知识工作测试中以1618分微弱领先更昂贵的Opus 4.8。这表明Sonnet 5已大幅缩小与Opus系列模型之间的性能差距。

Google's new Nano Banana 2 Lite image model is its fastest and cheapest yet

They may not look as good, but Nano Banana 2 Lite images only take a few seconds to create.

中文介绍 谷歌推出了其迄今为止最快、最经济的AI图像生成模型Nano Banana 2 Lite。尽管生成的图像质量可能不如高端模型,但它能够在几秒钟内完成图像创建,大大提升了创作效率和成本效益。

Clicks shows off its BlackBerry-inspired phone in a new hands-on video

A new video shows the final production version of the upcoming Clicks Communicator, a BlackBerry-like smartphone that runs modern apps.

中文介绍 Clicks公司发布了一段全新上手视频,展示了其受黑莓启发的智能手机Clicks Communicator的最终量产版本。这款手机保留了实体键盘设计,同时支持运行现代应用程序,旨在满足部分用户对经典操作体验的需求。

ScarfBench: Benchmarking AI Agents for Enterprise Java Framework Migration

中文介绍 IBM研究团队推出了ScarfBench,这是一个专为评估AI代理在企业级Java框架迁移中性能的基准测试平台。ScarfBench旨在帮助开发者衡量和优化AI辅助代码迁移的效率和准确性,以提升企业软件现代化进程。

RFK Jr. stacks FDA panel with peptide peddlers as FDA scientists oppose access

Peptide drugs are popular, but FDA scientists warn they're untested, may be harmful.

中文介绍 小罗伯特·F·肯尼迪(RFK Jr.)被指控在美国食品药品监督管理局(FDA)的专家小组中安插肽类药物推销者,而FDA科学家们则反对未经测试的肽类药物向公众开放。FDA科学家警告称,这些流行但未经充分测试的药物可能存在潜在危害。

Nvidia competitor Etched hits $5B valuation, $1B in sales for AI chip

Nvidia AI chip competitor Etched says it has already booked $1 billion under contract for the inference systems powered by its chip.

中文介绍 英伟达的AI芯片竞争对手Etched公司宣布,其估值已达到50亿美元,并已通过合同获得了10亿美元的AI芯片推理系统销售额。这表明Etched在竞争激烈的AI芯片市场中展现出强劲增长势头和市场潜力。

Anthropic launches Claude Sonnet 5 as a cheaper way to run agents

Anthropic’s Claude Sonnet 5 brings stronger agentic capabilities, lower pricing, and improved safety, positioning the model as a cheaper alternative to Opus, GPT-5.5, and Gemini Pro.

中文介绍 Anthropic发布了Claude Sonnet 5模型,其具备更强的代理能力、更低的价格和更高的安全性。该模型旨在成为Opus、GPT-5.5和Gemini Pro等模型的更经济替代品,为用户提供性价比更高的AI代理解决方案。

hasaneyldrm/exercises-dataset

HTML · ★ 6,353 · 🍴 777 · 📈 1,413 stars today

A comprehensive dataset of 433 fitness exercises. Each entry includes name, category, target muscle group, equipment, instructions, thumbnail image, and animation video.

中文介绍 hasaneyldrm/exercises-dataset 提供了一个包含433种健身运动的综合数据集,每项运动详细收录了名称、类别、目标肌肉群、所需器械、完整说明、缩略图及动画视频。该数据集旨在为健身应用开发、运动科学研究或AI模型训练(如姿态识别)提供高质量、结构化的多媒体资源。开发者可利用此数据快速构建功能丰富的健身指南、训练计划生成器,或用于AI在健身领域的应用开发,极大地降低了数据收集与整理的门槛。

usestrix/strix

Python · ★ 28,032 · 🍴 3,117 · 📈 395 stars today

Open-source AI penetration testing tool to find and fix your app’s vulnerabilities.

中文介绍 `strix` 是一个开源的 AI 安全工具,旨在帮助开发者和安全团队自动发现并修复应用程序中的潜在漏洞。该项目利用人工智能技术,模拟“AI 渗透测试员”的行为模式,对应用进行深度分析和攻击模拟,从而有效识别传统安全扫描工具可能遗漏的安全缺陷。它解决了人工安全审计耗时耗力、且容易出错的问题,特别适用于需要持续安全保障的开发流程(如 CI/CD),帮助团队在软件发布前提升应用的整体安全性,降低潜在的安全风险。

msitarzewski/agency-agents

Shell · ★ 120,706 · 🍴 19,728 · 📈 1,793 stars today

A complete AI agency at your fingertips - From frontend wizards to Reddit community ninjas, from whimsy injectors to reality checkers. Each agent is a specialized expert with personality, processes, and proven deliverables.

中文介绍 agency-agents 项目提供了一个完整的 AI 代理机构框架,通过部署多个具有特定人格和专业技能的 AI Agent,协同完成复杂任务。这些 Agent 涵盖前端开发、社区运营、创意生成和事实核查等多样化角色,旨在模拟人类团队协作,实现自动化决策与执行。它适用于需要集成多种 AI 能力、自动化跨领域工作流的开发者和企业。

altic-dev/FluidVoice

Swift · ★ 4,862 · 🍴 300 · 📈 586 stars today

Fastest and only macOS Dictation app with on-device STT and custom trained AI enhancement model - Local Wispr Flow alternative. One ⭐ takes us a long way :)) Windows, iOS and Linux coming soon.

中文介绍 `FluidVoice` 是一款专为 macOS 用户设计的高性能离线听写应用,旨在提供极速的语音转文本体验。该项目最大的亮点在于其完全本地化的处理能力,无需联网即可准确进行语音识别,有效保护了用户隐私并确保了数据安全。它解决了传统在线听写服务可能存在的延迟、隐私泄露和网络依赖问题,非常适合需要频繁进行文本输入、注重效率和隐私的 macOS 用户,无论是撰写文档、记录会议还是日常办公,都能提供流畅且安全的语音输入体验。

diegosouzapw/OmniRoute

TypeScript · ★ 8,403 · 🍴 1,391 · 📈 459 stars today

Never stop coding. Free AI gateway: one endpoint, 231+ providers (50+ free), connect Claude Code, Codex, Cursor, Cline & Copilot to FREE Claude/GPT/Gemini. RTK+Caveman stacked compression saves 15-95% tokens, smart auto-fallback, MCP/A2A, multimodal APIs, Desktop/PWA.

中文介绍 OmniRoute 提供一个免费的 AI 网关,通过单一 API 端点集成超过231个 AI 提供商(其中50余个免费),旨在解决多模型调用的复杂性。它支持将 Claude Code、Codex、Cursor、Cline、Copilot 等编码助手连接至免费的 Claude、GPT、Gemini 等主流大模型,大幅降低开发成本。项目还采用 RTK+Caveman 堆叠压缩技术,可节省 15-95% 的数据传输开销,适合开发者统一管理 AI 服务、优化性能并利用免费资源进行高效开发。

browser-use/video-use

Python · ★ 12,515 · 🍴 1,601 · 📈 722 stars today

Edit videos with coding agents

中文介绍 `video-use` 是一个探索通过“编码代理”来编辑视频的创新项目。它旨在颠覆传统的图形界面视频编辑模式,允许用户通过编写代码或使用智能代理来自动化和执行复杂的视频剪辑、特效添加及内容生成等任务。该项目解决了传统视频编辑软件操作繁琐、难以批量处理的问题,为开发者、内容创作者和研究人员提供了一种全新的、更具编程性和自动化潜力的视频制作方式,尤其适合需要进行程序化视频生成、自动化后期处理或实验新颖交互模式的场景。

xbtlin/ai-berkshire

Python · ★ 7,444 · 🍴 953 · 📈 966 stars today

AI 时代的伯克希尔:基于 Claude Code / Codex 的价值投资研究框架。巴菲特·芒格·段永平·李录四大师方法论 + 多Agent并行研究。| AI-era Berkshire: a value investing research framework built for Claude Code / Codex. 4 masters' methodologies + multi-agent adversarial analysis.

中文介绍 `ai-berkshire` 旨在构建一个 AI 时代的价值投资研究框架,其核心是借鉴巴菲特、芒格、段永平、李录四位投资大师的方法论,并结合 Claude Code 大模型技术进行实践。该项目利用多 Agent 并行研究机制,模拟专家分析师的工作流,对公司进行深度价值分析,识别潜在投资机会。它为量化投资者、AI 开发者和对价值投资感兴趣的用户提供了一个利用 AI 进行高级金融分析的实验性平台,以期在复杂的市场环境中做出更明智的投资决策。

Mebus/cupp

Python · ★ 6,079 · 🍴 2,046 · 📈 61 stars today

Common User Passwords Profiler (CUPP)

中文介绍 CUPP(Common User Passwords Profiler)是一款强大的工具,旨在通过分析目标用户或组织的相关信息,如姓名、生日、公司名等,来生成定制化的弱口令字典。它通过结合常见密码模式和用户特定数据,构建出更具针对性的密码列表,有效提高了密码猜测和渗透测试的效率。该工具主要应用于安全审计、渗透测试及红队演练场景,帮助安全专业人员评估系统和用户账户的口令强度,发现潜在的安全漏洞。

ripienaar/free-for-dev

HTML · ★ 127,273 · 🍴 13,304 · 📈 740 stars today

A list of SaaS, PaaS and IaaS offerings that have free tiers of interest to devops and infradev

中文介绍 `free-for-dev` 是一个精心整理的资源列表,汇集了众多为开发者和运维工程师提供免费使用额度 (free tiers) 的 SaaS、PaaS 和 IaaS 产品及服务。该项目旨在帮助开发者和基础设施工程师发现和利用这些免费资源,以降低个人项目、原型开发或小型团队的运营成本。它涵盖了从云服务、数据库、CI/CD 工具到 API 网关等多个类别,对于预算有限的个人开发者、初创团队或学习新技术的工程师极具参考价值。

google/agents-cli

Python · ★ 4,114 · 🍴 450 · 📈 433 stars today

The CLI and skills that turn any coding assistant into an expert at creating, evaluating, and deploying AI agents on Google Cloud.

中文介绍 Google 的 agents-cli 提供一套命令行界面及其配套技能,旨在将任何编程助手转变为在 Google Cloud 上创建、评估和部署 AI Agent 的专家。它通过集成到开发工作流中,简化了 AI Agent 的生命周期管理,允许开发者利用现有编程辅助工具,高效地在 Google Cloud 平台上构建、测试并上线智能代理。这解决了 AI Agent 开发与部署的复杂性,赋能开发者和AI工程师,使其能更专注于 Agent 逻辑而非底层基础设施操作。

roboflow/supervision

Python · ★ 45,868 · 🍴 4,069 · 📈 336 stars today

We write your reusable computer vision tools. 💜

中文介绍 Roboflow/supervision 旨在提供一套可复用的计算机视觉工具集,帮助开发者简化常见的 CV 工作流程。它包含了从数据加载、图像预处理到模型推理结果可视化和指标评估等一系列实用功能,如边界框操作、掩码处理、多边形转换以及各种检测结果的绘制工具。该库解决了计算机视觉项目中的重复性任务,使工程师和研究人员能够更高效地构建、训练和部署他们的视觉模型,从而加速应用开发。

ogulcancelik/herdr

Rust · ★ 8,931 · 🍴 537 · 📈 485 stars today

agent multiplexer that lives in your terminal.

中文介绍 herdr 是一个命令行工具,它充当 AI Agent 的多路复用器,允许用户在终端中高效管理和交互多个智能代理。通过提供一个统一的接口,它解决了同时运行和协调多个 Agent 时的复杂性,例如不同 Agent 的输入、输出和状态管理。开发者和AI工程师可以使用 herdr 来构建复杂的自动化工作流,同时监控不同 Agent 的执行情况,无需切换多个应用或窗口,极大地提升了Agent驱动型应用的开发和调试效率。

simplex-chat/simplex-chat

Haskell · ★ 17,298 · 🍴 1,007 · 📈 1,229 stars today

SimpleX - the first messaging network operating without user identifiers of any kind - 100% private by design! iOS, Android and desktop apps 📱!

中文介绍 SimpleX 是一个注重极致隐私的去中心化消息网络,设计之初就避免使用任何用户标识符,实现 100% 匿名通信。它通过独特的协议机制,让用户无需注册账号、无需手机号或邮箱,即可安全私密地进行消息交换。该项目提供 iOS、Android 和桌面端应用程序,适用于重视个人数据隐私和匿名交流的用户,尤其是在需要高度保密通信的场景。

CoreBunch/Instatic

TypeScript · ★ 1,462 · 🍴 137 · 📈 351 stars today

Instatic is a modern self-hosted visual CMS - get it running in 1 minute

中文介绍 Instatic 是一款现代化的自托管可视化内容管理系统(CMS),主打一分钟快速部署体验。它提供直观的图形界面,让用户能够轻松创建、编辑和发布网站内容,无需复杂的编码知识。该项目解决了传统 CMS 部署繁琐、或商业 CMS 费用高昂的问题,为开发者、小型企业和内容创作者提供了一个功能强大且易于掌控的平台。用户可以将其部署到自己的服务器上,完全掌控数据和网站运行环境,非常适合需要高度自定义和自主管理内容的场景。

microsoft/AI-For-Beginners

Jupyter Notebook · ★ 49,264 · 🍴 10,153 · 📈 180 stars today

12 Weeks, 24 Lessons, AI for All!

中文介绍 Microsoft 的 AI-For-Beginners 是一个为期12周、包含24节课程的全面人工智能学习路径,旨在普及 AI 知识,面向所有希望入门 AI 的学习者。该课程涵盖人工智能的核心概念、机器学习基础、深度学习、自然语言处理和计算机视觉等关键领域。它通过实践项目和清晰的讲解,帮助初学者逐步建立 AI 知识体系和动手能力,解决了传统 AI 学习门槛高的问题,非常适合学生、软件开发者以及希望转行进入 AI 领域的专业人士。

facebook/astryx

TypeScript · ★ 1,700 · 🍴 93 · 📈 399 stars today

An open source design system that's fully customizable and agent ready

中文介绍 Astryx 是 Facebook 推出的一个开源设计系统,提供高度可定制化的 UI 组件和设计规范。其独特之处在于“agent ready”特性,意味着它被设计成可以被 AI Agent 理解和操作,例如用于自动化 UI 生成、智能设计建议或构建由 AI 驱动的用户界面。该系统旨在帮助设计师和前端开发者快速构建一致且高质量的用户界面,同时为新兴的 AI 辅助设计和 AI Agent 界面开发场景提供了坚实基础,解决了传统设计系统与 AI 集成度不足的问题。

HKUDS/Vibe-Trading

Python · ★ 15,729 · 🍴 2,728 · 📈 719 stars today

"Vibe-Trading: Your Personal Trading Agent"

中文介绍 Vibe-Trading 是一个个人交易 Agent 项目,旨在为用户提供智能化的交易辅助。它可能通过分析市场数据、情绪指标等,自动化交易决策和执行策略,帮助用户更好地管理投资组合并捕捉交易机会。该项目适用于希望利用 AI 技术增强交易能力、实现自动化投资或寻求个性化交易策略的个人投资者和量化交易爱好者。

obra/superpowers

Shell · ★ 242,409 · 🍴 21,509 · 📈 884 stars today

An agentic skills framework & software development methodology that works.

中文介绍 obra/superpowers 提供一个结合了智能 Agent 能力框架与软件开发方法的项目,旨在有效构建和部署基于 AI Agent 的复杂系统。它定义了一套结构化的方法论,用于组织、管理和编排 Agent 的“技能”,使其能够协同完成复杂的任务。该项目解决了在 Agent 驱动型软件开发中,如何系统化地设计、实现和测试 Agent 能力的问题,帮助开发者和团队更高效地将 AI Agent 集成到实际应用中,从而加速智能系统的迭代与交付。

Robbyant/lingbot-map

Python · ★ 8,824 · 🍴 856 · 📈 210 stars today

A feed-forward 3D foundation model for reconstructing scenes from streaming data

中文介绍 `lingbot-map` 是一个面向机器人和实时应用设计的 3D 基础模型,它利用前馈神经网络技术,能从连续的流式数据中高效重建三维场景。该项目旨在解决动态环境中实时感知和高精度地图构建的挑战,尤其适用于需要即时理解周围环境的机器人、自动驾驶系统或增强现实(AR)设备。通过提供一个强大的 3D 感知框架,它能够帮助这些系统实现更智能的导航、避障和交互能力,为未来的智能体和沉浸式体验提供核心空间感知能力。

27 Hidden Claude Features, Settings & Shortcuts That Most Users Don't Know

@sairahul1 · 121.4K 粉丝 · 2.9M 阅 · 506 赞 · 97 转

Most people use Claude Code like a fancy autocomplete. They prompt. They wait. They accept the first output. They are leaving 90% of the power on the table. There are 27 specific moves that separate

中文介绍 此推文列举 27 个大多数用户可能不了解的 Claude 隐藏功能、设置与快捷方式。旨在帮助用户发现并充分利用 Claude 更深层次的能力,以提高效率和操作体验,解锁其未被发现的潜力。

How To Build a One-Person Company Using Claude Cowork

@sairahul1 · 121.4K 粉丝 · 876.6K 阅 · 547 赞 · 83 转

Emails. Formatting. Compiling reports. Preparing decks. Organizing files. Researching. Marketing. Writing. SEO. The average knowledge worker spends 60% of their day on above work that doesn't require

中文介绍 帖子讨论如何利用 Claude Cowork 搭建一人公司。博主可能分享了相关策略、工具集成或具体实践方法,旨在为独角创业者提供运营思路和效率提升方案。

$OUST Deep Dive - One of My Favorite Physical AI Plays

@crux_capital_ · 52.8K 粉丝 · 217.5K 阅 · 503 赞 · 56 转

This is the most in depth report I have ever written, on a very exciting company. If you read this article you will have a much deeper understanding of what Ouster does, how it plays into Physical AI,

中文介绍 博主发布一篇关于 Ouster 公司的深度分析报告,详尽阐述该公司在“实体 AI”(Physical AI)领域的核心角色、技术及市场潜力,旨在帮助读者深入理解其业务模式。

ORACLE: Official AI Agents Trade on Polymarket

@OracleLimited · 37.6K 粉丝 · 202.9K 阅 · 2.8K 赞 · 562 转

In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We

中文介绍 「OracleLimited」分享了对2026年预测市场的未来愿景。届时,自主AI智能体将成为最有效的交易策略之一,Polymarket上超过30%的活动将由算法和AI驱动的钱包完成。该分享描绘了AI在去中心化金融和预测领域深度参与的趋势。

ORACLE: Official AI Agents Trade on Polymarket

@OracleAiTrading · 34.1K 粉丝 · 176.1K 阅 · 2.7K 赞 · 567 转

In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We

中文介绍 「OracleAiTrading」提出了一个关于2026年预测市场前景的展望。文中指出,自主AI智能体将主导市场,成为最有效的交易策略,届时Polymarket上逾30%的交易将由算法和AI驱动的钱包进行。这篇推文描绘了AI在未来金融市场中的核心作用。

How to Build a $10,000-Level Website With Animations in Claude Code

@monokern · 1.9K 粉丝 · 175.8K 阅 · 546 赞 · 49 转

Agencies charge $5,000 for a portfolio site that looks this good I built mine in 2 hours. Here's exactly how This is the real walkthrough - not a generic template guide I'm using my own portfolio as

中文介绍 博主「monokern」分享了如何使用Claude Code在两小时内构建一个价值5000美元级别的带动画效果的个人作品集网站。他通过自身案例详细展示了具体操作步骤,强调这是一个实用的真实工作流,而非通用模板指南,旨在帮助用户高效利用AI工具实现高质量的网站开发。

ORACLE: Official AI Agents Trade on Polymarket

@Oracle__Market · 5.9K 粉丝 · 100.0K 阅 · 2.1K 赞 · 823 转

In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We

中文介绍 推文展望 2026 年,自治 AI 代理将成为预测市场 Polymarket 上的高效策略。届时,超过 30% 的平台活动预计由算法和 AI 驱动的钱包贡献,展示了 AI 在预测和交易领域的巨大潜力与影响力。

ORACLE: Official AI Agents Trade on Polymarket

@Oracle_Market__ · 25.1K 粉丝 · 99.3K 阅 · 2.8K 赞 · 224 转

In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We

中文介绍 帖子展望 2026 年,预测自治 AI 代理将在 Polymarket 等预测市场中占据主导地位。届时,超过 30% 的市场活动将由算法和 AI 驱动的钱包产生,揭示 AI 在金融预测领域的未来潜力。

This Week on Base: New Base MCP skills + now live in Perplexity, Base App on desktop, and more!

@base · 1.3M 粉丝 · 93.3K 阅 · 501 赞 · 127 转

News ■ Base MCP's new skills let agents transact, trade, lend, mint, and buy onchain across 13 apps: @yield @AskVenice @KyberNetwork @opensea @o1_exchange @Balancer @printr @bitrefill @flaunchgg

中文介绍 Base 宣布其 MCP 推出新技能,赋能 AI 代理在 13 个 DApp 上实现链上交易、借贷、铸币及购买等操作。这些新功能支持代理与 @yield、@KyberNetwork、@opensea 等应用交互,显著扩展了 Base 生态中 AI 代理的自动化能力。

thoughts on why mcp didn't work, what's next

@RhysSullivan · 57.4K 粉丝 · 86.1K 阅 · 503 赞 · 25 转

mcp came out when the best models were sonnet 3.5 and GPT 4o not a lot was known about how to properly work with these tools yet, we were still incredibly concerned on models having access to tools,

中文介绍 博主反思 MCP 初期表现不佳的原因,认为当时 Sonnet 3.5 和 GPT-4o 等最佳模型仍存局限,且对模型直接访问工具的能力普遍担忧。推文暗示了对该项目未来发展方向的思考,为早期 AI 代理的挑战提供了见解。

The Hermes + Obsidian + Claude Code Trinity: The Full System for Running a One Person Company

@cyrilXBT · 187.0K 粉丝 · 77.2K 阅 · 510 赞 · 93 转

There is a specific moment that tells you whether someone is running a real one person company or just using a lot of apps. It is the moment they get asked a question about their own business and they

中文介绍 博主分享一套用于高效运营一人公司的完整系统,核心由 Hermes、Obsidian 和 Claude Code 三个工具协同构成,旨在帮助独角创业者整合应用,流畅应对业务挑战。

Two kinds of scheduled work in Codex

@jxnlco · 113.3K 粉丝 · 54.2K 阅 · 501 赞 · 29 转

You want Codex to do something later, or keep checking something until it changes. That sounds like one feature. It is actually two different kinds of work, and the difference is simple: Scheduled

中文介绍 博主阐释了在 Codex 中处理「计划任务」的两种不同模式。一种是「定时执行」(Scheduled),用于指定未来某时执行一次性任务;另一种是「持续检查」(Polling),旨在持续监控特定条件直到其发生变化。作者强调,理解这两种模式的区别,能帮助用户更准确、高效地利用 Codex 进行自动化任务调度,避免混淆带来的误用。

i don't want to use your agent

@RhysSullivan · 57.4K 粉丝 · 48.9K 阅 · 501 赞 · 23 转

i want to use the skills, knowledge, and apis your company has spent years developing, not your custom agent almost every company by this point has shipped an agent there's a cloudflare agent in their

中文介绍 「RhysSullivan」表达了他对当前公司普遍推出自定义AI智能体的反感。他指出,用户更希望直接利用公司多年开发的技能、知识和API,而非强制使用其定制智能体。博主以Cloudflare为例,探讨了产品设计中用户体验与AI集成策略的冲突,呼吁回归以API为中心的开放模式。

Introducing computer use in Gemini 3.5 Flash

@GoogleAIStudio · 179.4K 粉丝 · 41.0K 阅 · 605 赞 · 57 转

Computer use is now a built-in tool supported in Gemini 3.5 Flash, delivering our best performance yet for agentic computer use tasks. Previously only available as a standalone Gemini 2.5 computer use

中文介绍 Google AI Studio 宣布「计算机使用」功能现已作为内置工具集成到 Gemini 3.5 Flash 中,显著提升了其在代理级计算机使用任务上的表现。此功能此前在 Gemini 2.5 中仅作为独立工具提供,此次整合使得 Gemini 3.5 Flash 在处理复杂自动化任务时更加高效和便捷。

How LLM Inference Works, Clearly Explained.

@_avichawla · 71.1K 粉丝 · 39.8K 阅 · 501 赞 · 67 转

Every generate() call to an LLM runs two distinct computational phases on the same GPU: prefill (processing the prompt) is compute-bound while decode (generating tokens one at a time) is memory-bound.

中文介绍 帖子清晰地解释了大型语言模型 (LLM) 推理过程中的两个计算阶段。在每次 generate() 调用时,LLM 在同一 GPU 上执行「预填充」(prefill)和「解码」(decode)两个独立阶段。其中,处理提示词的 prefill 阶段受限于计算资源,而逐个生成 token 的 decode 阶段则受限于内存带宽。理解这两阶段有助于优化 LLM 性能。

Life After Switching to Kimi

@0xDevin_ · 6.6K 粉丝 · 38.3K 阅 · 539 赞 · 5 转

Most AI tools are chatbots with a nice interface. Kimi is different. It is a full system: a browser automation engine called Claw that navigates websites like a human, an Agent Swarm that runs

中文介绍 博主分享了从其他 AI 工具转向 Kimi 后的体验。他指出,Kimi 不仅仅是一个带有界面的聊天机器人,而是一个完整的智能系统。该系统集成了名为 Claw 的浏览器自动化引擎,能够像人类一样浏览网站,并结合了 Agent Swarm 技术,使其能够执行更复杂的任务和工作流,超越了传统 AI 助手的范畴。

ORACLE: Official AI Agents Trade on Polymarket

@OracleAiTrading · 34.1K 粉丝 · 176.1K 阅 · 7d 曝光 176.1K

ORACLE: Official AI Agents Trade on Polymarket

中文介绍 「OracleAiTrading」提出了一个关于2026年预测市场前景的展望。文中指出,自主AI智能体将主导市场,成为最有效的交易策略,届时Polymarket上逾30%的交易将由算法和AI驱动的钱包进行。这篇推文描绘了AI在未来金融市场中的核心作用。

FSD V14 LITE: My review

@BLKMDL3 · 91.6K 粉丝 · 179.8K 阅 · 7d 曝光 179.8K

FSD V14 LITE: My review

中文介绍 博主分享了他对特斯拉全自动驾驶系统 FSD V14 LITE 版本的体验与评价。这篇评论主要围绕该新版本的功能、表现及用户实际感受展开,为关注 FSD 技术的用户提供参考。

ORACLE: Official AI Agents Trade on Polymarket

@OracleLimited · 37.6K 粉丝 · 202.9K 阅 · 7d 曝光 202.9K

ORACLE: Official AI Agents Trade on Polymarket

中文介绍 「OracleLimited」分享了对2026年预测市场的未来愿景。届时,自主AI智能体将成为最有效的交易策略之一,Polymarket上超过30%的活动将由算法和AI驱动的钱包完成。该分享描绘了AI在去中心化金融和预测领域深度参与的趋势。

The Hermes + Obsidian + Claude Code Trinity: The Full System for Running a One Person Company

@cyrilXBT · 187.0K 粉丝 · 77.2K 阅 · 7d 曝光 248.9K

The Hermes + Obsidian + Claude Code Trinity: The Full System for Running a One Person Company

中文介绍 博主分享一套用于高效运营一人公司的完整系统,核心由 Hermes、Obsidian 和 Claude Code 三个工具协同构成,旨在帮助独角创业者整合应用,流畅应对业务挑战。

One-Step Gradient Delay is Not a Barrier for Large-Scale Asynchronous Pipeline Parallel LLM Pretraining

👍 19

Modern large-scale LLM pretraining benefits from utilizing Pipeline Parallelism; however, synchronous implementations leave GPUs idle during pipeline bubbles, wasting computational resources. Asynchronous Pipeline Parallelism eliminates these bubbles, maximizing throughput at the cost of gradient st

中文介绍 该研究探讨了大规模LLM预训练中的异步流水线并行技术。传统同步实现因“流水线气泡”导致GPU空闲,浪费计算资源。研究表明,一步梯度延迟并非异步流水线并行的障碍,通过消除这些气泡,异步方法能最大化吞吐量,从而有效提升大规模LLM预训练的效率和资源利用率,为未来高效训练大型模型提供了重要理论支持。

Scaling the Horizon, Not the Parameters: Reaching Trillion-Parameter Performance with a 35B Agent

👍 66

We introduce Agents-A1, a 35B Mixture-of-Experts Agentic Model that reaches trillion-parameter-level performance by scaling the agent horizon. We investigate agent-horizon scaling from two perspectives: scaling long-horizon trajectories and scaling heterogeneous agent abilities. To support this goal

中文介绍 该研究提出Agents-A1模型,一个35亿参数的专家混合智能体模型,通过扩展智能体的“视界”(agent horizon)实现了万亿参数级别的性能。研究从两个角度探讨了智能体视界扩展:延长长视界轨迹和提升异构智能体能力,旨在探索在不增加模型参数量的情况下,如何有效提升大语言模型(LLM)的性能,为更高效的AI模型开发提供新思路。

Towards in-the-wild Egocentric 3D Hand-Object Pose Estimation

👍 0

Estimating accurate 3D hand-object pose from in-the-wild egocentric RGB remains challenging due to severe occlusions and ambiguous contact. Existing learning-based methods often struggle to generalise to in-the-wild scenes and are limited by the scarcity of supervision. We address these issues with

中文介绍 从第一视角RGB视频中准确估计野外场景下3D手部与物体姿态仍面临挑战,主要原因包括严重遮挡、接触模糊以及现有学习方法泛化能力差和监督数据稀缺。该研究旨在解决这些问题,推动在复杂真实环境中实现更鲁棒的3D手物姿态估计,这对于人机交互、虚拟现实、机器人操作等前沿领域的发展具有重要意义。

Orca: The World is in Your Mind

👍 64

We introduce Orca, an initial instantiation of a general world foundation model. Orca learns a unified world latent space from multimodal world signals and exposes it through multimodal readout interfaces. Rather than optimizing isolated next-token, next-frame, or next-action prediction, we are cent

中文介绍 该研究提出Orca模型,是通用世界基础模型的一个初步实例。Orca旨在从多模态世界信号中学习一个统一的世界潜在空间,并通过多模态读取接口将其暴露出来。与传统的独立优化下一个词元、下一帧或下一个动作预测不同,Orca通过构建一个全面的世界模型来理解和表示复杂的现实世界信息,为未来的通用AI发展奠定基础。

Beyond IID: How General Are Tabular Foundation Models, Really?

👍 36

Foundation models for predictive machine learning on tabular data have recently gained significant traction in academia and industry. Research communities across disciplines are increasingly evaluating tabular foundation models on diverse datasets and tasks. However, these task- and discipline-speci

中文介绍 表格数据预测性机器学习的基础模型近期在学术界和工业界引起广泛关注,研究社区正积极在多样化数据集和任务上评估这些模型。然而,这项研究超越了独立同分布(IID)假设,深入探讨了表格基础模型在更普遍场景下的真实泛化能力,质疑其在面对非IID数据时的表现,旨在评估其在实际复杂应用中的鲁棒性和通用性。

The Surprising Effectiveness of Video Diffusion Models for Hand Motion Reconstruction

👍 2

4D hand motion reconstruction from egocentric video is bottlenecked by clear limitations of existing methods: image-based pipelines depend on a detector that fails under heavy occlusion, while video-based methods rely on temporal modules learned only from scarce hand-pose annotations, a narrow signa

中文介绍 从第一视角视频中重建4D手部运动面临瓶颈:基于图像的管道在严重遮挡下失效,而基于视频的方法依赖于稀缺手部姿态标注学习的时间模块。该研究发现视频扩散模型在手部运动重建方面表现出“惊人的有效性”,能够克服现有方法的局限性,特别是在处理遮挡和泛化能力方面,为高质量的4D手部运动重建提供了新的解决方案。

DreamForge-World 0.1 Preview: A Low-Compute Real-Time Controllable World Model

👍 8

We present DreamForge-World 0.1 Preview, a preview foundational world model for real-time interactive world simulation. The system adapts the LongLive 1 autoregressive video stack, itself derived from Wan2.1-T2V-1.3B, with a residual action pathway inspired by the Matrix-Game family. DreamForge-Worl

中文介绍 研究发布了DreamForge-World 0.1预览版,这是一个低计算量、实时可控的基础世界模型,专为交互式世界模拟而设计。该系统基于LongLive 1自回归视频堆栈(源自Wan2.1-T2V-1.3B)进行改造,并引入了受Matrix-Game系列启发设计的残差动作路径,旨在提供高效且可控的实时世界模拟能力,推动虚拟环境和AI智能体的发展。

TACO: Tool-Augmented Credit Optimization for Agentic Tool Use

👍 15

Agentic multimodal models perform diverse operations on an image via code and reason over the returned view, an effective paradigm for fine-grained visual question answering. However, code operations can be useful, redundant, or misleading. Outcome-only rewards cannot precisely distinguish these cas

中文介绍 智能体多模态模型通过代码对图像执行操作并进行推理,是细粒度视觉问答的有效范式。然而,代码操作可能有用、冗余或误导性,且仅基于结果的奖励难以精确分配功劳。该研究提出了TACO(工具增强信用优化)方法,旨在更有效地评估和优化智能体使用工具(如代码)的过程,从而提升其在复杂视觉推理任务中的决策能力和效率。

Beyond Drug Discovery: The Nanotechnology Molecular Optimization (NMO) Benchmark

👍 2

Generative molecular design is shaped by simple proxy benchmarks for drug-like properties and models pretrained on large pharmaceutical datasets. This combination yields strong benchmark metrics but limits transferability to domains structurally distinct from drug discovery. To overcome this limitat

中文介绍 生成式分子设计目前受限于药物特性代理基准和大型制药数据集预训练,导致其在结构上与药物发现不同的领域(如纳米技术)中可迁移性受限。为解决此问题,该研究提出了“纳米技术分子优化(NMO)基准”,旨在提供一个更广泛、更多样化的评估框架,以推动生成式分子设计在药物发现之外的纳米科技等新兴领域的应用和发展。

One Forward Beats Two: InnerZoom for Accurate and Efficient GUI Grounding

👍 3

MLLM-based GUI grounding methods commonly formulate target localization as autoregressive coordinate generation, enabling models to leverage the strong instruction-following and semantic understanding capabilities of MLLMs. However, this formulation requires the model to retain region-level target e

中文介绍 基于多模态大语言模型(MLLM)的图形用户界面(GUI)定位方法常将目标定位表述为自回归坐标生成,以利用MLLM的指令遵循和语义理解能力。然而,这种方法需要模型保留高分辨率特征以进行精细化。该研究提出了“InnerZoom”方法,通过一次前向传播即可实现准确高效的GUI定位,解决了传统方法在效率和资源消耗上的挑战。

Little Brains, Big Feats: Exploring Compact Language Models

👍 0

While large language models have been dominating the research landscape recently, small language models remain highly relevant across various domains; yet, they receive far less attention. In this study, we investigate how smaller language models perform during the generation stage within a Retrieva

中文介绍 尽管大型语言模型(LLM)近期主导了研究领域,但小型语言模型(SLM)在多个领域仍具高度相关性,却受关注较少。该研究探讨了小型语言模型在文本生成阶段的表现及其潜在能力。通过深入分析这些“小模型”的效率和效果,旨在证明它们在资源受限或特定应用场景下的巨大潜力,为优化部署和实现更普惠的AI技术提供新思路。

Illuminating Unified Multimodal Model for Free-form Interleaved Text-Image Generation

👍 1

The advancement of generative AI models capable of producing text and image marks a critical step forward in the realm of multimodal intelligence, particularly for tasks involving the interleaving of both modalities. To advance this intelligence to the next stage, it is crucial for models to autonom

中文介绍 能够生成文本和图像的生成式AI模型在多模态智能领域取得了重要进展,尤其对于涉及文本与图像交错生成的任务。该研究旨在提出一个统一的多模态模型,以进一步提升这种能力,实现自由形式的图文交织内容生成。此模型对于推动跨模态理解与创作、赋能更高级的智能交互和内容生产具有关键意义,是通用人工智能发展的重要一步。

Argus: Metric Panoramic 3D Reconstruction for Indoor Scenes

👍 0

Metric feed-forward 3D reconstruction for panoramic data remains under-explored due to the lack of large-scale panoramic RGB-D training data. We present Realsee3D, a hybrid dataset of 10K indoor scenes (1K real, 9K synthetic) with 299K panoramic viewpoints and precise metric annotations, and Arg

MuseBench: Benchmarking Intent-Level Audiovisual Arts Understanding in MLLMs

👍 0

Audiovisual arts encompass diverse creative disciplines, including cinema, visual arts, stage performance, and game design, where artistic meaning arises from deliberate combinations of visual, auditory, and narrative elements (e.g., fear amplified through claustrophobic framing, or grief conveyed t

Monte Carlo Energy Aggregation for Mobile 3D Gaussian Splatting

👍 16

Recent advances in 3D Gaussian Splatting have demonstrated unprecedented success in novel view synthesis. However, the substantial inference and storage overhead driven by high-order Spherical Harmonics (SH) are primary bottlenecks for mobile platforms. In this paper, we present Flux-GS, a real-time

SWE-Together: Evaluating Coding Agents in Interactive User Sessions

👍 11

Most coding-agent benchmarks are static: an agent receives a complete task description up front and is judged only by its final code. Real coding assistance is interactive, with users clarifying goals, adding constraints, and correcting mistakes over multiple turns. We introduce SWE-Together, a mult

StrucTab: A Structured Optimization Framework for Table Parsing

👍 0

Table parsing aims to convert table images into structured, machine-readable representations, a task requiring the joint perception of complex spatial layouts and textual content. While recent vision-language models (VLMs) enable end-to-end parsing, they typically rely on direct supervision of the f

SafePyramid: A Hierarchical Benchmark for In-context Policy Guardrailing

👍 3

In real-world applications, guardrails are often expected to identify unsafe user-model interactions according to application-specific safety policies, rather than relying on predefined risk taxonomies. In this work, we study this setting under the paradigm of in-context policy guardrailing, where g

PoseShield: Neural Collision Fields for Human Self-Collision Resolution

👍 1

Self-collision remains a persistent challenge in SMPL-based human pose estimation and motion generation. Under extreme articulations or stochastic motion synthesis, generated meshes frequently exhibit self-penetrations, leading to physically implausible results. We propose PoseShield, a neural colli

CAREBench: A Child-Safety Risk Benchmark for Language Models

👍 0

How can we evaluate whether frontier AI systems recognize child-safety risks before they escalate into explicit harm? Existing child safety evaluations focus on child sexual abuse material, yet many child-safety failures begin earlier: in model assistance that helps adults manipulate, impersonate, p

Cursor for iOS

Build with coding agents from anywhere

中文介绍 Cursor for iOS是一款移动应用程序,使用户能够利用AI编码代理随时随地进行软件开发。它将AI驱动的编程能力带到移动设备上,旨在提高开发者在非传统工作环境下的生产力,提供更灵活的编程体验。

Foresight by Lightning Rod

Predict anything with AI

中文介绍 Lightning Rod推出了AI工具Foresight,该产品是一个训练数据生成器,旨在帮助用户通过人工智能实现对任何事物的预测。它专注于生成高质量的训练数据,以提升AI模型的预测能力和应用范围,赋能更广泛的预测分析场景。

Pluno

Browser agent that’s 10x faster than Claude

中文介绍 Pluno是一款新型浏览器代理产品,其主要特点是运行速度比知名的AI模型Claude快10倍。该工具旨在通过显著提升处理效率,为用户提供更快速、更流畅的浏览器操作体验,尤其适用于需要高响应速度的交互场景和数据处理任务。

AgentPeek

Claude Code & Codex in your Mac notch

中文介绍 AgentPeek是一款专为Mac用户设计的工具,它能将AI编码助手Claude Code和Codex的功能直接整合到MacBook屏幕的“刘海”区域。用户可以通过这种独特且便捷的方式,实时获取AI驱动的代码辅助与建议,从而优化编程工作流程并提高效率。

Skills Marketplace by Databox

Ready-made AI analytics skills for your business data

中文介绍 Databox推出了名为「Skills Marketplace」的新平台,为企业提供即用型AI分析技能。这些预制技能旨在帮助企业用户更高效地处理和分析其业务数据,从而快速获取洞察,无需从头构建复杂的AI模型,显著简化数据分析流程。

Bilt.me - Figma

Get a real mobile app from your Figma design

中文介绍 Bilt.me是一款旨在简化应用开发流程的工具,它允许用户直接将Figma设计稿转换为功能完善的真实移动应用程序。这一服务大大缩短了从设计到实现的时间,使得设计师和开发者能够更高效地将UI/UX原型转化为可部署的产品,加速上市。

Oakamo

Your quiet space for reading articles later.

中文介绍 Oakamo是一款致力于提供宁静阅读体验的工具,旨在为用户创建一个专属的“稍后阅读”空间。它允许用户保存感兴趣的文章,并在不受干扰的环境中阅读,从而提升专注度和信息摄取效率,帮助用户更好地管理阅读内容。

Akiflow

Manage tasks and calendars from Claude, ChatGPT or Cursor

中文介绍 Akiflow是一款任务与日历管理工具,其独特之处在于支持从多个AI平台进行任务和日程安排管理。用户可以直接通过Claude、ChatGPT或Cursor等AI助手,来协调和规划他们的工作与生活,旨在提升个人生产力与效率,实现智能化日程管理。

Justwrite

A private, local-first writing space that works offline

中文介绍 Justwrite提供一个私密且“本地优先”的写作空间,强调用户数据的隐私保护和本地存储。该平台支持完全离线工作,确保用户即使在没有网络连接的情况下也能进行创作,为写作者提供一个专注于内容的无干扰环境,保障数据安全。

Brain2Qwerty v2

Decode sentences directly from non-invasive brain signals

中文介绍 Meta公司推出了Brain2Qwerty v2项目,该技术能够直接从非侵入式脑信号中解码完整的句子。这项创新研究旨在探索人机交互的新范式,通过分析大脑活动,实现无需物理输入设备即可进行文本生成,具有潜在的广泛应用前景,如辅助沟通。

Poweful Agents inside Slack

中文介绍 这段视频短片介绍了在Slack平台中部署功能强大的AI智能体。这些智能体能够协助用户完成各项任务,提高工作效率,实现自动化流程。

AI Agents Just Changed Forever: GLM 5.2, Codex Skills, Claude & Cursor

中文介绍 视频探讨了AI智能体领域的重大变革,这些变革将永久性地改变其发展方向。内容提到了GLM 5.2、Codex Skills、Claude以及Cursor等技术或产品在推动AI智能体能力提升方面的作用和影响。

Introducing Claude Science (now in beta)

中文介绍 人工智能公司 Anthropic 正式推出其大型语言模型 Claude 的一项新功能或专业版本,命名为「Claude Science」。该项目目前处于测试(beta)阶段,旨在提升 Claude 在科学领域的理解与处理能力,以更好地服务于科学研究和相关应用。用户现可体验此新功能。

How Spotify runs agents across 20M+ lines of code, with Niklas Gustavsson

中文介绍 Spotify 的 Niklas Gustavsson 介绍了该公司如何在大规模代码库上运行代理。他分享了 Spotify 如何在其超过 2000 万行代码中部署和管理这些自动化代理,以提升开发效率和代码质量。讨论可能涵盖了代理的设计、实施策略及其在大型系统中的应用挑战。

Tag Claude in, right where you already work

中文介绍 视频展示了如何将Anthropic公司的AI助手Claude无缝集成到用户现有的工作环境中。用户可以通过“标记”Claude来获取帮助,以便在日常工作中直接利用其AI能力。

Delegate and schedule tasks in Claude Cowork

中文介绍 视频展示了Anthropic的AI协作平台Claude Cowork的新功能。用户现在可以在该平台内直接委派和安排各项任务,利用Claude的AI能力协助团队更高效地管理工作流程。

Introducing Claude Science (now in beta)

中文介绍 人工智能公司 Anthropic 正式推出其大型语言模型 Claude 的一项新功能或专业版本,命名为「Claude Science」。该项目目前处于测试(beta)阶段,旨在提升 Claude 在科学领域的理解与处理能力,以更好地服务于科学研究和相关应用。用户现可体验此新功能。

How Spotify runs agents across 20M+ lines of code, with Niklas Gustavsson

中文介绍 Spotify 的 Niklas Gustavsson 介绍了该公司如何在大规模代码库上运行代理。他分享了 Spotify 如何在其超过 2000 万行代码中部署和管理这些自动化代理,以提升开发效率和代码质量。讨论可能涵盖了代理的设计、实施策略及其在大型系统中的应用挑战。

Tag Claude in, right where you already work

中文介绍 视频展示了如何将Anthropic公司的AI助手Claude无缝集成到用户现有的工作环境中。用户可以通过“标记”Claude来获取帮助,以便在日常工作中直接利用其AI能力。

Delegate and schedule tasks in Claude Cowork

中文介绍 视频展示了Anthropic的AI协作平台Claude Cowork的新功能。用户现在可以在该平台内直接委派和安排各项任务,利用Claude的AI能力协助团队更高效地管理工作流程。

DeepSeek Just Solved AI's Billion Dollar Problem

中文介绍 Two Minute Papers频道发布的视频指出,DeepSeek公司(或其模型)成功解决了一个长期困扰AI领域、价值数十亿美元的重大难题。这可能意味着在AI技术或成本效益方面取得了突破性进展。

Scientists Found A Better Language For AI Agents

中文介绍 Two Minute Papers频道分享一项研究进展,科学家们发现了一种更优的语言,能够显著提升AI智能体的表现和交互能力。这项新的语言有望优化AI智能体之间的通信与协作效率。

该源今日无内容。

Tell HN: Installing Cursor on iOS irreversibly changes your privacy settings

Just hit this today and I'm furious. I installed the Cursor iOS app to see what it had.I've been on `Privacy Mode (Legacy)` for a long time, which is the "Do not store my code" setting. A year or so ago they marked this as "Legacy" and hid it under a "Extra options

Knoppix

205 points · 86 comments

v2.1.197

What's changed Introducing Claude Sonnet 5: now the default model in Claude Code, with a native 1M-token context window and promotional pricing of $2/$10 per Mtok through August 31. Update to version 2.1.197 for access. https://www.anthropic.com/news/claude-sonnet-5

中文介绍 Anthropic的Claude Code发布v2.1.197更新,并引入了Claude Sonnet 5作为默认模型。该模型原生支持100万上下文窗口,并提供推广期价格:每百万tokens输入2美元,输出10美元,优惠期截至8月31日。

v2.1.196

What's changed Added support for organization default models — admins set it in the org console; it shows as "Org default" (or "Role default") in /model when you haven't picked one yourself Added readable default names for sessions at start, making them easier to identify and message Added clickable

中文介绍 Anthropic的Claude Code发布v2.1.196更新,新增了组织默认模型支持,管理员可在组织控制台设置。当用户未选择模型时,该默认模型将显示为「组织默认」或「角色默认」。此外,新版本还为会话启动时增加了可读的默认名称。

v2.1.195

What's changed Added CLAUDE_CODE_DISABLE_MOUSE_CLICKS to disable mouse click/drag/hover in fullscreen mode while keeping wheel scroll Fixed hook matchers with hyphenated identifiers (e.g. code-reviewer, mcp__brave-search) accidentally substring-matching — they now exact-match. Use mcp__brave-search_

中文介绍 Anthropic的Claude Code项目发布了v2.1.195版本。主要更新包括:新增CLAUDE_CODE_DISABLE_MOUSE_CLICKS环境变量,允许在全屏模式下禁用鼠标点击、拖拽、悬停,但保留滚轮滚动;并修复了带连字符的钩子匹配器(例如「code-reviewer」),使其实现精确匹配。

v2.1.193

What's changed Added autoMode.classifyAllShell setting to route all Bash/PowerShell commands through the auto-mode classifier instead of only arbitrary-code-execution patterns Added auto-mode denial reasons to the transcript, the denial toast, and /permissions recent denials Added claude_code.assist

v2.1.191

What's changed Added /rewind support for resuming a conversation from before /clear was run Fixed scroll position jumping to the bottom while reading earlier output during a streaming response Fixed background agents resurrecting after being stopped — stopping an agent from the tasks panel is now pe

v2.1.190

What's changed Bug fixes and reliability improvements

v2.1.187

What's changed Added sandbox.credentials setting to block sandboxed commands from reading credential files and secret environment variables Added org-configured model restrictions to the model picker, --model, /model, and ANTHROPIC_MODEL, with a "restricted by your organization's settings" message w

v2.1.186

What's changed Added claude mcp login and claude mcp logout to authenticate MCP servers from the CLI without opening the interactive /mcp menu, with --no-browser stdin redirect support for completing over SSH Added status filtering (press f) to the /workflows agent detail view Added a "Skills" secti

v2.1.185

What's changed The stream-stall hint now reads "Waiting for API response · will retry in …" instead of "No response from API · Retrying in …", and triggers after 20s of silence instead of 10s

v2.1.183

What's changed Improved auto mode safety: destructive git commands (git reset --hard, git checkout -- ., git clean -fd, git stash drop) are now blocked when you didn't ask to discard local work, git commit --amend is blocked when the commit wasn't made by the agent this session, and terraform destro

0.143.0-alpha.31

Release 0.143.0-alpha.31

中文介绍 OpenAI Codex发布了Rust项目的0.143.0-alpha.31版本更新。此版本为Alpha测试阶段,具体更新内容未详细说明。

rust-v0.143.0-alpha.30

Release 0.143.0-alpha.30

中文介绍 OpenAI Codex为其Rust项目发布了`0.143.0-alpha.30`版本。此次发布代表着该项目的一个新的预览或测试版本更新,但官方发布说明中未提及具体功能性或改动细节。

0.142.4

Chores No user-facing changes were identified for this release. Changelog Full Changelog: rust-v0.142.3...rust-v0.142.4

中文介绍 OpenAI Codex发布了Rust项目的`0.142.4`版本。根据官方发布说明,此次更新主要为内部维护工作(Chores),并未识别出任何面向用户的变化。

0.143.0-alpha.29

Release 0.143.0-alpha.29

中文介绍 OpenAI Codex 项目近期在其官方发布渠道公布了 0.143.0-alpha.29 版本更新。该版本是此项目软件或工具在早期开发阶段(alpha)的一次迭代,标志着其持续的产品进展。

0.143.0-alpha.28

Release 0.143.0-alpha.28

中文介绍 OpenAI Codex 项目发布了编号为 0.143.0-alpha.28 的新版本。此次发布通过GitHub的OpenAI Codex Releases渠道进行,但具体变更细节在当前提供的摘要中未详细列出。

0.143.0-alpha.27

Release 0.143.0-alpha.27

中文介绍 OpenAI Codex 项目发布了编号为 0.143.0-alpha.27 的新版本。此次发布通过GitHub的OpenAI Codex Releases渠道进行,但具体变更细节在当前提供的摘要中未详细列出。

0.142.3

Chores Maintenance-only patch release with no user-facing changes since 0.142.2. Changelog Full Changelog: rust-v0.142.2...rust-v0.142.3

中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.142.3 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。

0.143.0-alpha.26

Release 0.143.0-alpha.26

中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.143.0-alpha.26 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。

0.143.0-alpha.25

Release 0.143.0-alpha.25

中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.143.0-alpha.25 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。

今日主题

今日 AI 圈聚焦于 AI 技术的普及与多元化应用。Anthropic 发布了更经济高效的 Claude Sonnet 5,谷歌推出了快速廉价的图像生成模型。同时,大量开源项目和新产品涌现,覆盖 AI Agent 框架、开发者工具及金融、安全等垂直领域。研究方面则探索了更高效的 LLM 预训练、多模态世界模型以及小型语言模型的潜力,显示出 AI 走向实用化和精细化的趋势,但也伴随着对 AI 浏览器安全性的警示。

01

模型发布/更新

Model Releases 66 篇

Anthropic 推出 Claude Sonnet 5:100万上下文窗口及优惠定价

官方Claude Code Releases

Anthropic 正式发布 Claude Sonnet 5,并将其设为 Claude Code 的默认模型。新模型原生支持高达 100 万的上下文窗口,能够处理极长的文本输入和输出,极大地提升了处理复杂任务的能力。为推广使用,Anthropic 提供了优惠价格:每百万 tokens 输入 2 美元,输出 10 美元,优惠期持续至 8 月 31 日。这一更新使 Sonnet 5 在性价比上更具竞争力,尤其在代理能力和安全性方面,旨在成为更经济高效的 AI 代理解决方案,进一步缩小与更昂贵的 Opus 系列模型的性能差距。

大模型产品更新定价

谷歌发布 Nano Banana 2 Lite 图像模型:速度与成本再创新低

综合资讯Ars Technica

谷歌推出了其迄今为止最快、最经济的 AI 图像生成模型 Nano Banana 2 Lite。该模型显著提升了图像创作的效率并降低了成本,能够在几秒钟内完成图像生成任务。尽管其生成图像的质量可能不及谷歌其他高端模型,但 Nano Banana 2 Lite 以其极高的性价比和处理速度,旨在降低内容创作者使用 AI 生成图像的门槛,使其更广泛地应用于需要快速迭代和大规模生成的场景。

谷歌图像生成AI模型

研究提出 Agents-A1 模型:通过扩展“视界”实现万亿参数性能

官方HuggingFace Trending Papers

一项最新研究介绍了 Agents-A1 模型,这是一个仅有 35 亿参数的专家混合智能体模型,却能通过创新性地扩展智能体的「视界」(agent horizon)实现万亿参数级别的性能。研究从延长长视界轨迹和提升异构智能体能力两个维度,深入探讨了在不增加模型参数量的前提下,如何有效提升大语言模型的性能。这一突破为开发更高效、更具成本效益的 AI 模型提供了新思路,有望在资源受限环境下实现复杂任务处理。

智能体大模型MoE

Orca 模型问世:构建统一的多模态“世界基础模型”

官方HuggingFace Trending Papers

研究团队提出 Orca 模型,这是通用世界基础模型的一个初步实例。Orca 旨在通过学习多模态世界信号,构建一个统一的世界潜在空间,并通过多模态读取接口对外暴露。与传统专注于预测下一个词元、帧或动作的方法不同,Orca 通过整合和理解复杂的现实世界信息,创建了一个全面的世界模型,为未来的通用 AI 发展奠定了基础。这代表着 AI 在理解和模拟真实世界方面迈出了重要一步。

世界模型多模态基础模型

DreamForge-World 0.1 预览版发布:低计算量实时可控世界模型

官方HuggingFace Trending Papers

研究团队发布了 DreamForge-World 0.1 预览版,这是一个专为交互式世界模拟而设计的低计算量、实时可控的基础世界模型。该系统基于 LongLive 1 自回归视频堆栈并引入了残差动作路径,旨在提供高效且可控的实时世界模拟能力。此模型能够推动虚拟环境和 AI 智能体的发展,为构建更逼真、可交互的数字世界提供了核心技术支持,特别适用于游戏、模拟训练和元宇宙应用。

世界模型实时模拟基础模型

新型统一多模态模型:实现自由形式图文交织内容生成

官方HuggingFace Trending Papers

一项研究旨在提出一个统一的多模态模型,以提升生成式 AI 在自由形式图文交织内容生成方面的能力。现有模型在生成文本和图像方面已取得进展,但该模型寻求更深层次的跨模态理解与创作。此创新模型对于推动更高级的智能交互和内容生产具有关键意义,是通用人工智能发展的重要一步,能够赋能设计师、内容创作者和开发者以更灵活的方式构建多模态应用。

多模态生成式AI图像生成
02

产品发布/更新

Product 66 篇

Claude Code 更新:支持组织默认模型及会话命名优化

官方Claude Code Releases

Anthropic 的 Claude Code 发布 v2.1.196 更新,为企业和团队用户引入了组织默认模型支持。管理员现在可在组织控制台设置默认模型,当用户未手动选择时,该默认模型将显示为「组织默认」或「角色默认」,简化了团队协作流程。此外,新版本还为会话启动时增加了可读的默认名称,进一步提升了用户体验和工作效率。

产品更新团队协作模型管理

谷歌发布 agents-cli:简化 AI Agent 在 Google Cloud 上的开发与部署

开源项目GitHub Trending

谷歌推出了 `agents-cli`,一套命令行界面及其配套技能,旨在将任何编程助手转变为在 Google Cloud 上创建、评估和部署 AI Agent 的专家。该工具通过集成到现有开发工作流,极大地简化了 AI Agent 的生命周期管理。开发者现在可以利用其现有编程辅助工具,更高效地在 Google Cloud 平台上构建、测试并上线智能代理,从而专注于 Agent 逻辑而非复杂的底层基础设施操作,降低了开发门槛。

AI AgentGoogle Cloud开发者工具

OmniRoute 开源:免费 AI 网关集成231个服务商,降低开发成本

开源项目GitHub Trending

OmniRoute 项目提供一个免费的 AI 网关,通过单一 API 端点集成了超过 231 个 AI 提供商(其中 50 余个免费)。该网关旨在解决多模型调用的复杂性,支持将 Claude Code、Codex、Cursor 等编码助手连接至主流大模型,大幅降低开发成本。此外,项目采用 RTK+Caveman 堆叠压缩技术,可节省 15-95% 的数据传输开销,适合开发者统一管理 AI 服务、优化性能并利用免费资源进行高效开发。

AI网关LLM开发者工具

Pluno 浏览器代理推出:速度比 Claude 快10倍,提升交互效率

产品榜单Product Hunt

Pluno 是一款新型浏览器代理产品,其核心亮点在于运行速度比知名的 AI 模型 Claude 快 10 倍。该工具旨在通过显著提升处理效率,为用户提供更快速、更流畅的浏览器操作体验,尤其适用于需要高响应速度的交互场景和数据处理任务。Pluno 的推出为用户在进行大量在线研究、内容抓取或自动化操作时,提供了高效的替代方案,极大地提高了工作效率。

浏览器工具AI代理效率工具

AgentPeek 面向 Mac 用户:AI 编码助手整合至“刘海”区域

产品榜单Product Hunt

AgentPeek 是一款专为 Mac 用户设计的创新工具,它能够将 AI 编码助手 Claude Code 和 Codex 的功能直接整合到 MacBook 屏幕的「刘海」区域。用户通过这种独特且便捷的方式,可以实时获取 AI 驱动的代码辅助与建议,无需切换应用或分散注意力。该工具旨在优化编程工作流程,提高开发者的效率和专注度,为 Mac 平台的用户提供了无缝的 AI 编程体验。

Mac应用AI编程开发工具

Cursor for iOS 发布:移动端 AI 编码代理赋能开发者

产品榜单Product Hunt

Cursor for iOS 应用程序正式发布,使用户能够在移动设备上随时随地利用 AI 编码代理进行软件开发。该应用将强大的 AI 驱动编程能力带入到 iOS 平台,旨在提高开发者在非传统工作环境下的生产力,提供更灵活、更便捷的编程体验。无论是代码审查、Bug 修复还是新功能的原型开发,Cursor for iOS 都为移动开发场景带来了变革性的工具支持。

编程工具AI应用iOS应用
03

行业动态

Industry 66 篇

英伟达竞争对手 Etched 估值达50亿美元,AI芯片销售额破10亿

综合资讯TechCrunch

英伟达在 AI 芯片领域的强劲竞争对手 Etched 公司宣布,其估值已飙升至 50 亿美元,并通过合同获得了 10 亿美元的 AI 芯片推理系统销售额。这一显著成就表明 Etched 在日益激烈的 AI 芯片市场中展现出强大的增长势头和市场潜力,有望挑战英伟达在该领域的主导地位,预示着 AI 硬件竞争将进一步加剧,并推动行业创新。

英伟达AI芯片融资

前 DeepMind 研究员转型量化基金,扑克AI技术创丰厚收益

综合资讯TechCrunch

由三名前 DeepMind 研究员创立的布拉格 AI 实验室 EquiLibre Technologies,在成功开发扑克 AI 之后,现已将其技术应用于量化对冲基金,并成功创造了丰厚收益。该公司目前估值已超过 5 亿美元,这不仅展现了顶尖 AI 人才在金融领域转型的巨大潜力,也突显了 AI 技术在复杂市场分析和决策中的强大应用价值,为 AI 商业化探索提供了成功案例。

DeepMindAI量化基金

预测市场新趋势:AI 智能体将在 Polymarket 占据逾三成交易量

X·KOLX 推文 (AttentionVC)

「OracleLimited」和「OracleAiTrading」分享了对 2026 年预测市场的未来展望,指出自主 AI 智能体将成为最有效的交易策略之一。届时,Polymarket 上超过 30% 的活动将由算法和 AI 驱动的钱包完成。这一趋势描绘了 AI 在去中心化金融和预测领域深度参与的未来图景,预示着 AI 算法将对市场效率和交易模式产生深远影响,推动金融自动化与智能化。

AI交易预测市场智能体

警惕 AI 浏览器安全漏洞:大语言模型易受“催眠”指令绕过防护

综合资讯Ars Technica

最新研究揭示,AI 浏览器存在严重安全漏洞。通过简单的「催眠」指令,例如诱导大语言模型相信「2 + 2 = 5」,就能使其规避安全防护措施并执行不被允许的指令。这一发现引发了对 AI 浏览器潜在风险和 LLM 安全性的深层担忧,强调了在开发和部署 AI 驱动的应用程序时,必须加强对模型鲁棒性和安全防护机制的审查与测试,以防止恶意利用。

AI安全大模型浏览器

IBM 推出 ScarfBench:评估企业级 Java 框架迁移的 AI 代理性能

官方Hugging Face Blog

IBM 研究团队发布了 ScarfBench,这是一个专为评估 AI 代理在企业级 Java 框架迁移中性能的基准测试平台。ScarfBench 的目标是帮助开发者衡量和优化 AI 辅助代码迁移的效率和准确性,从而加速企业软件的现代化进程。该基准测试将有助于推动 AI 代理在复杂企业环境中的实际应用,解决传统手动迁移耗时耗力的痛点,为企业 IT 升级提供智能化解决方案。

IBMAI代理Java

Anthropic 推出 Claude Science 测试版:增强大模型科学领域理解能力

官方Claude (YouTube)

人工智能公司 Anthropic 正式推出其大型语言模型 Claude 的新功能或专业版本「Claude Science」的测试版。该项目旨在显著提升 Claude 在科学领域的理解与处理能力,使其能够更好地服务于科学研究、数据分析和专业内容创作等相关应用。用户现可体验此新功能,这标志着 Anthropic 在拓展大模型垂直应用、满足专业领域特定需求方面迈出了重要一步。

大模型新功能测试版
04

技巧与观点

Tips & Takes 66 篇

微软开源“AI For Beginners”:12周24课,面向AI入门学习者

开源项目GitHub Trending

微软推出了「AI For Beginners」开源项目,这是一个为期 12 周、包含 24 节课程的全面人工智能学习路径。该课程旨在普及 AI 知识,面向所有希望入门 AI 的学习者,涵盖人工智能核心概念、机器学习、深度学习、自然语言处理和计算机视觉等关键领域。它通过实践项目和清晰讲解,帮助初学者逐步建立 AI 知识体系和动手能力,有效降低了传统 AI 学习的门槛。

AI教程学习资源机器学习

obra/superpowers 开源:构建智能 Agent 的开发方法与能力框架

开源项目GitHub Trending

`obra/superpowers` 项目提供了一个结合智能 Agent 能力框架与软件开发方法的方案,旨在有效构建和部署基于 AI Agent 的复杂系统。它定义了一套结构化的方法论,用于组织、管理和编排 Agent 的「技能」,使其能够协同完成复杂的任务。该项目解决了在 Agent 驱动型软件开发中,如何系统化地设计、实现和测试 Agent 能力的问题,帮助开发者更高效地将 AI Agent 集成到实际应用中,加速智能系统的迭代与交付。

AI Agent开发框架软件工程

`video-use` 开源:利用“编码代理”探索自动化视频编辑新范式

开源项目GitHub Trending

`video-use` 是一个创新项目,探索通过「编码代理」进行视频编辑,旨在颠覆传统的图形界面操作模式。它允许用户通过编写代码或使用智能代理来自动化和执行复杂的视频剪辑、特效添加及内容生成等任务。该项目解决了传统视频编辑软件操作繁琐、难以批量处理的问题,为开发者和内容创作者提供了一种全新的、更具编程性和自动化潜力的视频制作方式,尤其适合程序化视频生成和自动化后期处理。

视频编辑AI代理自动化

Roboflow/supervision 开源:计算机视觉任务的实用工具集

开源项目GitHub Trending

Roboflow/supervision 项目提供一套可复用的计算机视觉工具集,旨在帮助开发者简化常见的 CV 工作流程。该库包含了从数据加载、图像预处理到模型推理结果可视化和指标评估等一系列实用功能,如边界框操作、掩码处理和多边形转换工具。它解决了计算机视觉项目中重复性任务的痛点,使工程师和研究人员能够更高效地构建、训练和部署他们的视觉模型,从而加速应用开发和研究进程。

计算机视觉工具库数据处理

`ai-berkshire` 开源:AI 时代的巴菲特式价值投资研究框架

开源项目GitHub Trending

`ai-berkshire` 项目旨在构建一个 AI 时代的价值投资研究框架,其核心是借鉴巴菲特、芒格、段永平、李录等投资大师的方法论,并结合 Claude Code 大模型技术进行实践。该项目利用多 Agent 并行研究机制,模拟专家分析师的工作流,对公司进行深度价值分析,以识别潜在投资机会。它为量化投资者和 AI 开发者提供了一个利用 AI 进行高级金融分析的实验性平台,以期在复杂市场环境中做出更明智的投资决策。

AI金融量化投资LLM应用

Spotify 大规模代码库中的 AI Agent 实践经验分享

官方Claude (YouTube)

Spotify 的 Niklas Gustavsson 详细介绍了该公司如何在其拥有超过 2000 万行代码的大规模代码库上高效运行和管理自动化代理。他分享了 Spotify 在设计和实施这些 AI Agent 时的策略、面临的挑战以及如何通过自动化来提升开发效率和代码质量。此次分享为其他大型软件组织提供了宝贵的实践经验,展示了 AI Agent 在复杂软件工程环境中实现自动化和优化流程的巨大潜力。

软件开发自动化Spotify
今日产品趋势

今天关键词是 AI Agent 的应用与部署、以及开发者工具的 AI 化。我们看到了将 AI Agent 直接集成到操作系统 UI 的创新,高速浏览器 Agent 的诞生,以及 Google 等大厂对 Agent 开发生态的官方支持。同时,一系列提升开发者效率和工作流的 AI 工具也持续涌现。

01

今日必看

Must See 33 款

AgentPeek — Mac 刘海区域的 AI 编码助手

产品榜单Product Hunt

AgentPeek 是一款专为 Mac 用户设计的工具,它能将 AI 编码助手 Claude Code 和 Codex 的功能直接整合到 MacBook 屏幕的「刘海」区域。用户可以通过这种独特且便捷的方式,实时获取 AI 驱动的代码辅助与建议,从而优化编程工作流程并提高效率。这款产品将 AI 能力与操作系统 UI 深度融合,为开发者提供了一种全新的、沉浸式的编程辅助体验,无需切换应用即可获得智能支持。

Mac应用AI编程开发工具

Pluno — 速度提升10倍的浏览器 Agent

产品榜单Product Hunt

Pluno 是一款新型浏览器代理产品,其主要特点是运行速度比知名的 AI 模型 Claude 快10倍。该工具旨在通过显著提升处理效率,为用户提供更快速、更流畅的浏览器操作体验,尤其适用于需要高响应速度的交互场景和数据处理任务。Pluno 解决了传统 AI Agent 在浏览器操作中可能存在的性能瓶颈问题,为用户提供了更高效的自动化网络交互能力,有望在数据抓取、任务自动化等领域展现强大潜力。

浏览器工具AI代理效率工具

google/agents-cli — Google Cloud 上的 AI Agent 开发部署专家

开源项目GitHub Trending

Google 的 agents-cli 提供一套命令行界面及其配套技能,旨在将任何编程助手转变为在 Google Cloud 上创建、评估和部署 AI Agent 的专家。它通过集成到开发工作流中,简化了 AI Agent 的生命周期管理,允许开发者利用现有编程辅助工具,高效地在 Google Cloud 平台上构建、测试并上线智能代理。这解决了 AI Agent 开发与部署的复杂性,赋能开发者和 AI 工程师,使其能更专注于 Agent 逻辑而非底层基础设施操作,标志着 Google 对 Agent 生态的官方支持。

AI AgentGoogle Cloud开发者工具
02

开发者工具

Dev Tools 44 款

usestrix/strix — 开源 AI 渗透测试工具

开源项目GitHub Trending

`strix` 是一个开源的 AI 安全工具,旨在帮助开发者和安全团队自动发现并修复应用程序中的潜在漏洞。该项目利用人工智能技术,模拟「AI 渗透测试员」的行为模式,对应用进行深度分析和攻击模拟,从而有效识别传统安全扫描工具可能遗漏的安全缺陷。它解决了人工安全审计耗时耗力、且容易出错的问题,特别适用于需要持续安全保障的开发流程(如 CI/CD),帮助团队在软件发布前提升应用的整体安全性,降低潜在的安全风险。

应用安全AI安全漏洞检测

ogulcancelik/herdr — 终端内的 Agent 多路复用器

开源项目GitHub Trending

`herdr` 是一个命令行工具,它充当 AI Agent 的多路复用器,允许用户在终端中高效管理和交互多个智能代理。通过提供一个统一的接口,它解决了同时运行和协调多个 Agent 时的复杂性,例如不同 Agent 的输入、输出和状态管理。开发者和 AI 工程师可以使用 `herdr` 来构建复杂的自动化工作流,同时监控不同 Agent 的执行情况,无需切换多个应用或窗口,极大地提升了 Agent 驱动型应用的开发和调试效率。

AI Agent命令行工具自动化

Cursor for iOS — 随时随地利用 AI 编码代理构建

产品榜单Product Hunt

Cursor for iOS 是一款移动应用程序,使用户能够利用 AI 编码代理随时随地进行软件开发。它将 AI 驱动的编程能力带到移动设备上,旨在提高开发者在非传统工作环境下的生产力,提供更灵活的编程体验。这款应用解决了移动端编程工具的局限性,使得开发者可以在旅途中、会议间隙等场景下,也能借助 AI 助手完成代码编写、调试和优化,极大地扩展了 AI 辅助编程的应用场景。

编程工具AI应用iOS应用

Foresight by Lightning Rod — AI 训练数据生成器

产品榜单Product Hunt

Lightning Rod 推出了 AI 工具 Foresight,该产品是一个训练数据生成器,旨在帮助用户通过人工智能实现对任何事物的预测。它专注于生成高质量的训练数据,以提升 AI 模型的预测能力和应用范围,赋能更广泛的预测分析场景。Foresight 解决了 AI 模型开发中数据获取和标注耗时耗力的问题,通过自动化数据生成,降低了构建和迭代 AI 模型的门槛,加速了 AI 在各种预测任务中的应用。

AI工具数据生成预测分析
03

创作与效率

Creative & Productivity 33 款

FluidVoice — macOS 离线语音转文本应用

开源项目GitHub Trending

`FluidVoice` 是一款专为 macOS 用户设计的高性能离线听写应用,旨在提供极速的语音转文本体验。该项目最大的亮点在于其完全本地化的处理能力,无需联网即可准确进行语音识别,有效保护了用户隐私并确保了数据安全。它解决了传统在线听写服务可能存在的延迟、隐私泄露和网络依赖问题,非常适合需要频繁进行文本输入、注重效率和隐私的 macOS 用户,无论是撰写文档、记录会议还是日常办公,都能提供流畅且安全的语音输入体验。

macOS语音转文本离线应用

Skills Marketplace by Databox — 企业即用型 AI 分析技能

产品榜单Product Hunt

Databox 推出了名为「Skills Marketplace」的新平台,为企业提供即用型 AI 分析技能。这些预制技能旨在帮助企业用户更高效地处理和分析其业务数据,从而快速获取洞察,无需从头构建复杂的 AI 模型,显著简化数据分析流程。该平台降低了企业利用 AI 进行数据分析的门槛,使得非技术用户也能通过简单的集成,快速将 AI 能力应用于商业智能、市场趋势预测和运营优化等多个场景,提升决策效率。

AI应用数据分析商业智能

Akiflow — 通过 AI 助手管理任务和日历

产品榜单Product Hunt

Akiflow 是一款任务与日历管理工具,其独特之处在于支持从多个 AI 平台进行任务和日程安排管理。用户可以直接通过 Claude、ChatGPT 或 Cursor 等 AI 助手,来协调和规划他们的工作与生活,旨在提升个人生产力与效率,实现智能化日程管理。它解决了传统任务管理工具与 AI 割裂的问题,通过深度集成 AI 能力,使用户能以自然语言指令快速组织日程,从而节省时间,专注于更重要的工作。

任务管理日历工具AI集成
04

新鲜实验

Emerging 11 款

browser-use/video-use — 通过编码代理编辑视频

开源项目GitHub Trending

`video-use` 是一个探索通过「编码代理」来编辑视频的创新项目。它旨在颠覆传统的图形界面视频编辑模式,允许用户通过编写代码或使用智能代理来自动化和执行复杂的视频剪辑、特效添加及内容生成等任务。该项目解决了传统视频编辑软件操作繁琐、难以批量处理的问题,为开发者、内容创作者和研究人员提供了一种全新的、更具编程性和自动化潜力的视频制作方式,尤其适合需要进行程序化视频生成、自动化后期处理或实验新颖交互模式的场景。

视频编辑AI代理自动化
→ 查看产品库