The Verge · 07/03 21:56
Anthropic 宣布推出「Claude Science」,这是一个整合科学家工具和数据集的AI工作台,旨在将AI技术拓展至药物研发领域,并计划开发自己的药品。此举显示其在AI for Science领域的雄心。
推荐理由:Anthropic 将其AI能力扩展至药物研发,预示着AI在科学探索和产业应用上的深远影响。
The Verge · 07/03 21:56
Anthropic 宣布推出「Claude Science」,这是一个整合科学家工具和数据集的AI工作台,旨在将AI技术拓展至药物研发领域,并计划开发自己的药品。此举显示其在AI for Science领域的雄心。
推荐理由:Anthropic 将其AI能力扩展至药物研发,预示着AI在科学探索和产业应用上的深远影响。
GitHub Trending
`strix` 是一个开源的 AI 安全工具,旨在帮助开发者和安全团队自动发现并修复应用程序中的潜在漏洞。该项目利用人工智能技术,模拟「AI渗透测试员」的行为模式,对应用进行深度分析和攻击模拟,有效识别传统安全扫描工具可能遗漏的安全缺陷,提升应用安全性。
推荐理由:这是一个实用的AI安全工具,能显著提升应用安全防护效率,对开发者和安全团队有直接价值。
The Decoder · 07/04 03:24
微软计划8月合并其消费版和企业版Copilot应用,并精简功能,同时引入新的「AutoPilot」AI智能体。此举标志着微软正积极进军AI超级应用市场,与Anthropic和OpenAI展开竞争。
推荐理由:微软此举显示AI超级应用竞争白热化,将影响用户体验和AI服务格局。
Product Hunt · 07/04 04:48
Raycast 公司发布 Glaze,一款通过与 AI 聊天来创建 Mac 应用程序的工具。它旨在简化 Mac 应用开发流程,使用户能够以对话形式构建定制应用,降低开发门槛。
推荐理由:这款工具展示了AI如何改变应用开发模式,让更多人能实现自己的创意。
Two Minute Papers · 07/04 01:19
一段视频介绍了某项技术取得突破,成功实现了此前被认为无法实时运行的功能。该进展可能在处理速度和应用效率方面带来显著提升,克服了人们对其实时性能的怀疑,预示着重要的技术飞跃。
推荐理由:该视频揭示了某项关键技术突破,对AI和实时计算领域具有潜在影响。
DeepMind Blog · 07/03 22:25
Google DeepMind 和知名电影公司 A24 宣布建立一项开创性的研究合作伙伴关系。虽然具体合作内容和研究方向暂未透露,但此举预示着AI技术与电影制作领域可能产生深度融合,探索新的创作与制作模式。
推荐理由:AI巨头与电影公司的合作,有望开辟AI在创意内容生成和电影制作的新天地。
X 推文 (AttentionVC) · 07/03 05:25
一条X推文提供了AI时代下的职业发展建议,探讨了面对人工智能技术进步时,个人应如何规划职业路径、提升自身价值,以适应未来就业市场的变化和挑战,具有启发意义。
推荐理由:深刻分析AI对就业市场的影响,为个人职业发展提供实用建议。
Claude (YouTube) · 07/03 21:00
视频展示了艺术团体 Squidsoup 如何利用人工智能助手 Claude 创作其独特的艺术装置。内容可能涵盖 Claude 在构思、设计辅助或实现过程中扮演的角色,揭示AI与艺术结合的新形式与可能性。
推荐理由:该案例生动展示了AI工具如何赋能艺术家,探索艺术创作新边界。
X 创作者 (AttentionVC) · 07/03 11:29
一条X推文标题「Agentic Autonomy Levels」,可能旨在探讨AI智能体的自主性分级框架,详细阐述不同层级的AI代理系统在决策、执行和学习方面的独立程度,为理解智能体的设计与应用提供理论视角。
推荐理由:了解AI智能体自主性分级有助于更好地设计和评估AI系统。
V2EX · 07/03 17:29
V2EX 社区有用户发帖讨论市面上许多AI Agent产品,如Qclaw、Workbuddy、Claude等,似乎缺乏开源版本,引发了关于AI Agent开源生态现状和发展方向的关注与讨论。
推荐理由:该讨论反映了当前AI Agent领域对开源解决方案的需求,值得关注行业发展方向。
HuggingFace Trending Papers · 07/02 08:00
「Program-as-Weights」是一种新的编程范式,专为难以用传统规则实现的模糊功能设计,如日志警报或JSON修复。它提供本地且可复现的解决方案,以替代日益依赖LLM API但有局限性的方法。
推荐理由:该论文提出了一种解决模糊功能编程挑战的新思路,可能为未来软件开发带来范式转变。
Microsoft reportedly plans to merge its consumer and enterprise Copilot apps into a single app in August. Rarely used features like Copilot Podcasts are getting cut, and new AI agents called "AutoPilot" will handle tasks in the background for an extra fee. The article Microsoft follows Anthropic and
中文介绍 微软计划在8月合并其消费者和企业版Copilot应用,精简功能并引入名为「AutoPilot」的新AI智能体。这些智能体将以额外收费的方式在后台处理任务,此举表明微软正追随Anthropic和OpenAI的脚步,进军AI超级应用市场。
We’ve compiled an overview of some of the top alternative browsers available today aiming to challenge Chrome and Safari.
中文介绍 随着浏览器竞争加剧,市场正涌现出挑战Chrome和Safari等主流浏览器的替代产品。TechCrunch整理了当前一些热门的替代浏览器,显示“浏览器大战”的焦点已不再是搜索。
The gadget has three buttons, and it changes context based on what app you are looking at. For instance, in meeting apps and sites, it could be toggle mic, toggle video, and bring window to the front.
中文介绍 Dune是一款多功能三键式键盘设备,能根据当前使用的应用程序自动切换功能。例如,在会议应用中,它可以控制麦克风开关、视频开关或将窗口置顶,旨在提升用户在会议及其他场景下的操作便利性。
The Fire HD 8 that launched in 2024 was the last new addition to Amazon's budget-minded tablet lineup, but the company has quietly updated the Fire HD 10 that debuted the year before. In 2023 it was offered with multiple storage configurations that each came with 3GB of RAM, but the 32GB version now
中文介绍 亚马逊悄然更新了2023年发布的Fire HD 10平板电脑,将其RAM从原先的3GB提升至4GB。此举发生在2024年Fire HD 8发布之后,进一步完善了亚马逊面向预算友好型用户的平板产品线。
Anthropic is trying to block Chinese companies like ByteDance and Ant Financial from accessing Claude Code, but they're getting around the restrictions through VPNs and overseas subsidiaries. Alibaba, meanwhile, has banned its own employees from using the tool after hidden code was found that could
中文介绍 Anthropic正试图阻止字节跳动、蚂蚁金服等中国企业访问其AI工具Claude Code,但这些公司通过VPN及海外子公司规避限制。与此同时,阿里巴巴也因发现隐藏代码,禁止其员工使用该工具。这反映了Claude Code在中美两地都面临复杂的管制问题。
Epoch AI reports a sharp rise in security vulnerability reports. In June 2026, 21 organizations reported about 1,500 high-severity and critical CVEs, more than 3.5 times the previous monthly record. The surge lines up with the launch of AI-powered bug-hunting programs. The article Security vulnerabi
中文介绍 Epoch AI报告指出,自AI模型开始用于漏洞检测以来,安全漏洞报告数量激增。2026年6月,21个组织报告了约1500个高危及关键CVE漏洞,是此前月度记录的3.5倍以上。这一显著增长与AI驱动的漏洞搜寻程序的推出时间吻合。
The Chevy Silverado EV is a solid first draft of an EV pickup truck. Here's what could make it better.
中文介绍 雪佛兰(Chevy)推出了其全美产电动皮卡Silverado EV,虽然被认为是该类车型的一个“坚实初稿”,但市场销量并未达到预期。TechCrunch探讨了其销售不佳的原因,并提出了改进建议。
During negotiations on Wednesday, employees voiced frustrations with what they consider an unwillingness among executives to engage meaningfully with the prospect of unionization.
中文介绍 Google DeepMind的工会化谈判进展不顺。在周三的协商中,员工对公司高管未能就工会组建前景进行有意义的沟通表示不满和沮丧,导致谈判开局艰难。
In a study covering seven benchmarks, the UK's AI Security Institute shows that standard AI evaluations systematically underestimate agent capabilities by capping the compute budget. On software engineering tasks, success rates jumped about 25 percent when the token budget was increased tenfold. New
中文介绍 英国AI安全研究所的一项研究发现,现有AI评估基准通过限制计算资源,系统性地低估了AI智能体的实际能力。在涵盖七个基准的测试中,研究显示,当“token”预算增加时,AI智能体在软件工程任务上的成功率提高了约25%。
It's a big year for America. It's the semiquincentennial, otherwise known as America250, and the United States is cohosting the World Cup. But spectators at these events - and the millions of people who live in the cities hosting them - may not realize that they, too, are being watched. From Kansas
中文介绍 2026年是美国半周年庆典(America250)与世界杯联合举办的一年。文章警示,在此期间观看世界杯的观众及主办城市居民可能受到联邦政府通过无人机和摄像头等工具进行大规模监控,引发对隐私侵犯的担忧。
Despite the fact that smartphones have become impressively capable shooters, standalone point-and-shoot cameras are enjoying a renaissance. The tiny Kodak Charmera is still wildly popular, while influencers are scrambling to find aging Canon cameras on eBay. Godox, a company best known for its photo
中文介绍 尽管智能手机拍照功能强大,独立式数码相机正迎来复兴。神牛(Godox)推出了一款纤薄的C100数码相机,其特色是采用透明LCD屏幕作为取景器。这款创新设计旨在满足市场对独特拍摄体验的需求。
Unlike most phones, the T1 still ships with a charger. Trump Mobile seemingly isn’t too worried about e-waste. Where's the Trump phone? We're going to keep talking about it every week. One year on, our phones have finally arrived. 12 months, 16 days, 21 hours, and 54 minutes after I first heard abou
中文介绍 备受关注的“特朗普手机”T1在延迟一年多后终于开始发货。该手机不同于市面上多数产品,仍然附带充电器,似乎并未考虑电子垃圾问题。文章分享了对这款迟到手机的初次体验。
中文介绍 Google DeepMind和电影公司A24宣布建立一项“史无前例”的开创性研究合作伙伴关系。具体合作内容和研究方向暂未透露,但预示着AI技术与电影制作领域可能产生深度融合。
Powerade is appropriate for World Cup athletes, but unless you’re also sweating buckets, water is usually enough. | Photo: Megan Briggs / Getty Images This is Optimizer, a weekly newsletter sent from Verge senior reviewer Victoria Song that dissects and discusses the latest gizmos and potions that s
中文介绍 在热浪期间,保持水分摄入并不复杂。文章指出,除非像世界杯运动员一样大量出汗,大多数人只需饮用白开水即可满足补水需求,运动饮料如Powerade并非必需。这是The Verge每周通讯「Optimizer」中的观点。
At the event "The Briefing: AI for Science" earlier this week, Anthropic announced Claude Science, a new "AI workbench for scientists" that pulls fragmented tools and datasets into one environment, and generates figures and visuals. Anthropic, already dominating the industry with its popular coding
中文介绍 Anthropic在本周「AI For Science」活动中宣布推出「Claude Science」,这是一个旨在整合分散工具和数据集的科学家AI工作台,并能生成图表和可视化内容。此举表明Anthropic正将AI技术拓展至药物研发领域,并计划开发自己的药品。
Python · ★ 34,403 · 🍴 3,531 · 📈 2,804 stars today
Open-source AI penetration testing tool to find and fix your app’s vulnerabilities.
中文介绍 `strix` 是一个开源的 AI 安全工具,旨在帮助开发者和安全团队自动发现并修复应用程序中的潜在漏洞。该项目利用人工智能技术,模拟“AI 渗透测试员”的行为模式,对应用进行深度分析和攻击模拟,从而有效识别传统安全扫描工具可能遗漏的安全缺陷。它解决了人工安全审计耗时耗力、且容易出错的问题,特别适用于需要持续安全保障的开发流程(如 CI/CD),帮助团队在软件发布前提升应用的整体安全性,降低潜在的安全风险。
JavaScript · ★ 23,134 · 🍴 1,400 · 📈 629 stars today
Use Codex from Claude Code to review code or delegate tasks.
中文介绍 `codex-plugin-cc` 是一个 OpenAI 官方插件,旨在将 Codex 模型的功能集成到 Claude Code 环境中。它允许用户在 Claude Code 内部直接调用 Codex 的能力,执行代码审查或将特定编程任务委派给 Codex 处理。该插件解决了在不同 AI 模型之间切换的效率问题,为需要利用 Codex 强大代码理解和生成能力的用户提供便利,特别适合开发者进行自动化代码质量检查或智能任务分配。
JavaScript · ★ 82,811 · 🍴 4,618 · 📈 2,851 stars today
🪨 why use many token when few token do trick — Claude Code skill that cuts 65% of tokens by talking like caveman
中文介绍 `caveman` 项目是一个针对 Claude Code 的技能,旨在通过一种“原始人式”的简化语言风格,大幅削减大型语言模型(LLM)的 token 使用量。它能将 token 消耗降低约 65%,有效解决了 LLM 交互成本高昂和效率低下的问题。对于需要优化 LLM API 调用、降低运营成本或提升处理效率的开发者和企业而言,这是一个实用的 token 节约方案。
Java · ★ 77,313 · 🍴 25,923 · 📈 77 stars today
Free and Open Source, Distributed, RESTful Search Engine
中文介绍 Elasticsearch 是一个免费开源、分布式、RESTful 的搜索引擎,专为实现近实时搜索和数据分析而设计。它能够处理大量结构化和非结构化数据,提供强大的全文搜索、聚合查询和数据可视化能力。广泛应用于日志和指标分析(ELK 栈)、网站搜索、电商产品目录检索以及企业级数据探索等场景,是构建高效数据检索和分析平台的关键组件。
TypeScript · ★ 8,252 · 🍴 2,533 · 📈 129 stars today
Action for checking out a repo
中文介绍 `actions/checkout` 是 GitHub Actions 官方提供的一个核心组件,其主要功能是在 CI/CD 工作流中将指定代码仓库的内容拉取到工作流运行器(runner)的环境中。这是几乎所有需要访问仓库代码进行构建、测试、部署或分析等操作的 GitHub Actions 工作流的首要步骤,确保了后续任务能够基于最新的代码进行操作,是自动化开发流程中不可或缺的基础工具。
TypeScript · ★ 45,449 · 🍴 2,950 · 📈 404 stars today
Chrome DevTools for coding agents
中文介绍 `chrome-devtools-mcp` 是专为“编码代理”(coding agents)设计的 Chrome DevTools 扩展。它将 Chrome DevTools 强大的调试和分析能力引入到 AI 编码代理的开发流程中,帮助开发者监控、理解和优化代理的行为与输出。通过这些工具,开发者可以更有效地调试由 AI 生成或处理的代码,提升编码代理的开发效率和准确性。
Python · ★ 69,171 · 🍴 24,107 · 📈 50 stars today
Ansible is a radically simple IT automation platform that makes your applications and systems easier to deploy and maintain. Automate everything from code deployment to network configuration to cloud management, in a language that approaches plain English, using SSH, with no agents to install on rem
中文介绍 Ansible 是一款极简的 IT 自动化平台,旨在简化应用程序部署、系统配置管理及运维任务。它采用无代理(agentless)架构,通过 SSH 协议连接远程主机,用户仅需编写易读的 YAML 语言 Playbook 即可实现从代码部署、网络配置到云资源管理等各项自动化操作。Ansible 极大提升了运维效率,是 DevOps 和 SRE 团队管理复杂 IT 基础设施的理想选择。
TypeScript · ★ 4,478 · 🍴 264 · 📈 943 stars today
An open source design system that's fully customizable and agent ready
中文介绍 Astryx 是 Facebook 推出的一个开源设计系统,提供高度可定制化的 UI 组件和设计规范。其独特之处在于“agent ready”特性,意味着它被设计成可以被 AI Agent 理解和操作,例如用于自动化 UI 生成、智能设计建议或构建由 AI 驱动的用户界面。该系统旨在帮助设计师和前端开发者快速构建一致且高质量的用户界面,同时为新兴的 AI 辅助设计和 AI Agent 界面开发场景提供了坚实基础,解决了传统设计系统与 AI 集成度不足的问题。
Python · ★ 9,756 · 🍴 471 · 📈 236 stars today
A beautiful, powerful, self-hosted rom manager and player.
中文介绍 romm 是一个美观且功能强大的自托管 ROM 管理与播放器应用。它旨在帮助复古游戏爱好者集中管理大量的游戏 ROM 文件,并提供便捷的播放体验。用户可以将其部署在自己的服务器上,完全掌控游戏库,并享受流畅的游戏体验,无需依赖第三方平台,是打造个人复古游戏中心的好帮手。
Python · ★ 26,101 · 🍴 3,116 · 📈 792 stars today
Machine Learning Systems
中文介绍 `cs249r_book` 是来自 Harvard-EDGE 的“机器学习系统”课程书籍或相关学习材料。该项目深入探讨了机器学习模型的端到端生命周期,涵盖了从数据管理、模型训练、评估到生产部署、监控和维护等各个环节。它旨在教授如何设计、构建并扩展实际的 ML 系统,解决生产环境中的挑战。对于希望掌握 MLOps 实践、深入理解机器学习系统工程的学生、工程师和研究人员,这是极具价值的参考资源。
Python · ★ 101,409 · 🍴 28,247 · 📈 290 stars today
Tensors and Dynamic neural networks in Python with strong GPU acceleration
中文介绍 PyTorch 是一个广泛使用的开源机器学习框架,专注于提供高效灵活的深度学习研究与开发环境。其核心特性包括张量(Tensors)操作,支持在 Python 中构建动态神经网络,并具备强大的 GPU 加速能力,尤其适用于利用 NVIDIA CUDA 进行高性能计算。PyTorch 以其直观的 API 和动态计算图机制,受到研究人员和开发者青睐,广泛应用于计算机视觉、自然语言处理等领域,是构建和训练复杂深度学习模型的首选工具之一。
Java · ★ 5,219 · 🍴 2,901 · 📈 53 stars today
Apache Maven core
中文介绍 Apache Maven 是一个核心的 Java 项目管理和构建自动化工具。它基于项目对象模型(POM),能够标准化项目的构建、报告和文档生成流程。Maven 自动处理项目依赖管理,简化了库的导入和版本控制,从而帮助 Java 开发者高效地管理项目生命周期。它是企业级 Java 项目开发中不可或缺的工具,确保了团队协作和项目构建的一致性。
Python · ★ 76,979 · 🍴 7,628 · 📈 937 stars today
AI coding assistant skill (Claude Code, Codex, OpenCode, Cursor, Gemini CLI, and more). Turn any folder of code, SQL schemas, R scripts, shell scripts, docs, papers, images, or videos into a queryable knowledge graph. App code + database schema + infrastructure in one graph.
中文介绍 Graphify 是一个强大的 AI 编码助手技能,能够整合多种大型语言模型(如 Claude Code, Codex, Gemini CLI)。它的核心功能是将任何文件夹中的代码、SQL 架构、R 脚本、Shell 脚本、文档、论文乃至图像和视频等多元数据,转化为可查询的知识库。这使得开发者、数据分析师和研究人员能够通过自然语言提问,快速理解和检索项目中的复杂信息,显著提升开发和研究效率。
Python · ★ 135,783 · 🍴 21,854 · 📈 245 stars today
Claude Code is an agentic coding tool that lives in your terminal, understands your codebase, and helps you code faster by executing routine tasks, explaining complex code, and handling git workflows - all through natural language commands.
中文介绍 Claude Code 是 Anthropic 推出的一个智能代理编码工具,它直接集成在用户的终端环境中。该工具能够深入理解整个代码库,并通过执行日常任务、解释复杂代码逻辑以及辅助处理 Git 工作流,显著提升开发者的编码效率。它旨在成为开发者的得力助手,自动化重复性工作,让开发者能更专注于核心创造性任务,从而加快软件开发进程。
Rust · ★ 10,668 · 🍴 631 · 📈 513 stars today
agent multiplexer that lives in your terminal.
中文介绍 herdr 是一个命令行工具,它充当 AI Agent 的多路复用器,允许用户在终端中高效管理和交互多个智能代理。通过提供一个统一的接口,它解决了同时运行和协调多个 Agent 时的复杂性,例如不同 Agent 的输入、输出和状态管理。开发者和AI工程师可以使用 herdr 来构建复杂的自动化工作流,同时监控不同 Agent 的执行情况,无需切换多个应用或窗口,极大地提升了Agent驱动型应用的开发和调试效率。
Shell · ★ 245,452 · 🍴 21,753 · 📈 1,205 stars today
An agentic skills framework & software development methodology that works.
中文介绍 obra/superpowers 提供一个结合了智能 Agent 能力框架与软件开发方法的项目,旨在有效构建和部署基于 AI Agent 的复杂系统。它定义了一套结构化的方法论,用于组织、管理和编排 Agent 的“技能”,使其能够协同完成复杂的任务。该项目解决了在 Agent 驱动型软件开发中,如何系统化地设计、实现和测试 Agent 能力的问题,帮助开发者和团队更高效地将 AI Agent 集成到实际应用中,从而加速智能系统的迭代与交付。
Python · ★ 21,947 · 🍴 1,390 · 📈 405 stars today
Specification and documentation for Agent Skills
中文介绍 `agentskills` 项目提供了 AI 代理“技能”的标准化规范和详细文档。它旨在建立一个通用的框架,定义代理技能的结构、描述方式以及如何与其他代理或平台进行集成。这对于促进 AI 代理生态系统的互操作性和模块化开发至关重要。开发者、平台提供商及研究人员可以参考这份规范,设计和构建统一且可复用的代理能力,从而简化复杂 AI 系统的开发流程。
TypeScript · ★ 105,401 · 🍴 12,965 · 📈 145 stars today
The Postgres development platform. Supabase gives you a dedicated Postgres database to build your web, mobile, and AI applications.
中文介绍 Supabase 是一个开源的 Postgres 开发平台,提供一整套后端即服务(BaaS)解决方案。它以强大的 PostgreSQL 数据库为核心,集成了实时订阅、认证、存储、边缘函数等功能,旨在帮助开发者快速构建 Web、移动和 AI 应用。Supabase 简化了后端开发流程,让开发者能够专注于前端和核心业务逻辑,大幅加速产品上市时间。
Rust · ★ 7,139 · 🍴 591 · 📈 86 stars today
Instant, Concurrent, Secure & Lightweight Sandbox for AI Agents.
中文介绍 TencentCloud/CubeSandbox 是一个专为 AI Agent 设计的沙盒环境,提供即时、高并发、安全且轻量级的执行隔离。它解决了 AI Agent 在执行外部代码、调用工具或进行复杂交互时可能带来的安全隐患和资源管理挑战,确保 Agent 能够在受控的环境中安全运行。该沙盒特别适用于 AI Agent 平台、多 Agent 系统开发以及需要对 Agent 行为进行严格隔离和监控的场景,提升了 AI 应用的稳定性和安全性。
Shell · ★ 126,411 · 🍴 20,520 · 📈 1,202 stars today
A complete AI agency at your fingertips - From frontend wizards to Reddit community ninjas, from whimsy injectors to reality checkers. Each agent is a specialized expert with personality, processes, and proven deliverables.
中文介绍 agency-agents 项目提供了一个完整的 AI 代理机构框架,通过部署多个具有特定人格和专业技能的 AI Agent,协同完成复杂任务。这些 Agent 涵盖前端开发、社区运营、创意生成和事实核查等多样化角色,旨在模拟人类团队协作,实现自动化决策与执行。它适用于需要集成多种 AI 能力、自动化跨领域工作流的开发者和企业。
@sairahul1 · 121.4K 粉丝 · 876.6K 阅 · 547 赞 · 83 转
Emails. Formatting. Compiling reports. Preparing decks. Organizing files. Researching. Marketing. Writing. SEO. The average knowledge worker spends 60% of their day on above work that doesn't require
中文介绍 帖子讨论如何利用 Claude Cowork 搭建一人公司。博主可能分享了相关策略、工具集成或具体实践方法,旨在为独角创业者提供运营思路和效率提升方案。
@RampLabs · 13.4K 粉丝 · 335.4K 阅 · 507 赞 · 45 转
Researcher: Ben Geist Abstract Parameter-efficient fine-tuning (e.g. LoRA) adapts a frozen LLM to a task, but the resulting adapter is locked to one base model. When a new model is released, the
中文介绍 「PorTAL」是一项新研究,旨在解决现有参数高效微调(如 LoRA)的适配器无法在不同基础 LLM 模型间移植的局限。该研究提出可移植任务适配器,使用户无需在新模型发布时重新训练,提高了 LLM 微调的灵活性和效率。
@rickyho_1989 · 9.7K 粉丝 · 296.6K 阅 · 508 赞 · 69 转
Part I: The Economics of Intelligence Why the AI industry is about to optimize for intelligence per dollar rather than intelligence itself I have become increasingly convinced that the artificial
中文介绍 博主分析了AI经济的未来发展趋势。他认为,AI行业将从追求「智能本身」转向优化「单位成本智能」,即更注重智能的性价比。这预示着AI应用将迎来一个更注重效率和成本效益的新阶段。
@milesdeutscher · 671.1K 粉丝 · 243.8K 阅 · 500 赞 · 73 转
TL;DR: Everything you need to do to get maximum value from Fable. I guarantee that after you're done reading, you'll have all the necessary tools to quite literally 10x your AI productivity with
中文介绍 分享 Fable 工具的入门指南,旨在帮助用户充分利用 Fable 平台,实现 AI 生产力提升。内容涵盖 Fable 的核心功能和使用技巧,助力用户高效完成 AI 相关任务,最大化工具价值。
@crux_capital_ · 52.8K 粉丝 · 217.5K 阅 · 503 赞 · 56 转
This is the most in depth report I have ever written, on a very exciting company. If you read this article you will have a much deeper understanding of what Ouster does, how it plays into Physical AI,
中文介绍 博主发布一篇关于 Ouster 公司的深度分析报告,详尽阐述该公司在“实体 AI”(Physical AI)领域的核心角色、技术及市场潜力,旨在帮助读者深入理解其业务模式。
@OracleLimited · 37.6K 粉丝 · 202.9K 阅 · 2.8K 赞 · 562 转
In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We
中文介绍 「OracleLimited」分享了对2026年预测市场的未来愿景。届时,自主AI智能体将成为最有效的交易策略之一,Polymarket上超过30%的活动将由算法和AI驱动的钱包完成。该分享描绘了AI在去中心化金融和预测领域深度参与的趋势。
@philhchen · 9.1K 粉丝 · 179.1K 阅 · 516 赞 · 34 转
AI models get better at anything you can write a loss function for, and school is mostly loss functions: well-defined problems graded against known answers. Therefore, the valuable work of the next
中文介绍 该帖子围绕AI时代下的职业发展提供建议。博主旨在分享面对人工智能技术进步时,个人应如何规划职业路径、提升自身价值,以适应未来就业市场的变化和挑战。
@OracleAiTrading · 34.1K 粉丝 · 176.1K 阅 · 2.7K 赞 · 567 转
In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We
中文介绍 「OracleAiTrading」提出了一个关于2026年预测市场前景的展望。文中指出,自主AI智能体将主导市场,成为最有效的交易策略,届时Polymarket上逾30%的交易将由算法和AI驱动的钱包进行。这篇推文描绘了AI在未来金融市场中的核心作用。
@monokern · 1.9K 粉丝 · 175.8K 阅 · 546 赞 · 49 转
Agencies charge $5,000 for a portfolio site that looks this good I built mine in 2 hours. Here's exactly how This is the real walkthrough - not a generic template guide I'm using my own portfolio as
中文介绍 博主「monokern」分享了如何使用Claude Code在两小时内构建一个价值5000美元级别的带动画效果的个人作品集网站。他通过自身案例详细展示了具体操作步骤,强调这是一个实用的真实工作流,而非通用模板指南,旨在帮助用户高效利用AI工具实现高质量的网站开发。
@cyrilXBT · 187.0K 粉丝 · 171.8K 阅 · 505 赞 · 91 转
There is a sentence sitting on almost every AI engineering job posting that stops people before they even apply. Bachelor's degree in Computer Science required. Most people read that line, close the
中文介绍 针对AI工程职位普遍要求计算机科学学位的问题,博主提供了一份详细指南,指导人们如何在2026年前,无需CS学位也能成为一名AI工程师。内容可能涵盖学习路径、技能培养及就业策略。
@hwchase17 · 115.7K 粉丝 · 129.7K 阅 · 500 赞 · 57 转
Memory for agents is still early, with little to no standards. “Memory” means something different to everyone. But one common pattern is emerging: wiki memory. The idea is simple: use an agent to turn
中文介绍 讨论 AI 智能体(agent)记忆机制的现状,指出目前缺乏统一标准。博主提出一种正在兴起的「wiki memory」模式,即利用智能体将信息整理成 wiki 形式作为记忆,为智能体提供了结构化、易于检索的记忆解决方案。
@trq212 · 299.3K 粉丝 · 40.1K 阅 · 7d 曝光 40.1K
A Field Guide to Fable: Finding Your Unknowns
@addyosmani · 404.9K 粉丝 · 53.5K 阅 · 7d 曝光 53.5K
Agentic Autonomy Levels
中文介绍 帖子标题为「Agentic Autonomy Levels」,无具体正文内容。博主可能旨在探讨AI智能体的自主性分级框架,详细阐述不同层级的AI代理系统在决策、执行和学习方面的独立程度,为理解智能体的设计与应用提供一个理论视角。
@BLKMDL3 · 92.4K 粉丝 · 41.1K 阅 · 7d 曝光 41.1K
FSD V14 lite review after 4 days
@AlexFinn · 459.5K 粉丝 · 72.5K 阅 · 7d 曝光 72.5K
THE MOST VALUABLE THING YOU CAN DO WITH FABLE 5 IN THE NEXT 24 HOURS
中文介绍 帖子标题为「FABLE 5 在未来24小时内你能做的最有价值的事」,无具体正文内容。博主可能旨在分享关于工具 FABLE 5 的一个关键使用技巧或短期内能产生显著价值的操作建议,为用户提供高效利用该平台的实用指南。
@philhchen · 9.1K 粉丝 · 179.1K 阅 · 7d 曝光 179.1K
Career advice in the age of AI
中文介绍 该帖子围绕AI时代下的职业发展提供建议。博主旨在分享面对人工智能技术进步时,个人应如何规划职业路径、提升自身价值,以适应未来就业市场的变化和挑战。
@ericzakariasson · 76.4K 粉丝 · 37.9K 阅 · 7d 曝光 37.9K
Fable is back, here's how I use it in Cursor
@chamath · 2.2M 粉丝 · 86.4K 阅 · 7d 曝光 86.4K
The Great Descent
中文介绍 该帖子仅以「The Great Descent」为题,无具体正文内容。博主Chamath常分享对宏观经济、技术趋势及社会变革的见解,因此推测此帖可能探讨某个领域的显著衰退或关键转折,但具体观点与分析细节无法从现有信息中得知。
@0xkozue · 690 粉丝 · 24.9K 阅 · 7d 曝光 24.9K
Your One-Page PyTorch Training Pipeline Cheat Sheet.
@app_sail · 24.8K 粉丝 · 103.3K 阅 · 7d 曝光 103.3K
Claude Code 最新防封号完全指南(2026 年 7 月)
中文介绍 分享 Claude Code 的最新防封号完全指南(2026 年 7 月版),旨在帮助用户有效规避账户被封风险。该指南聚焦于最新的使用策略和注意事项,确保用户能长期、稳定地使用 Claude Code 服务。
@milesdeutscher · 671.1K 粉丝 · 243.8K 阅 · 7d 曝光 243.8K
How To Master Fable (Fundamentals Guide)
中文介绍 分享 Fable 工具的入门指南,旨在帮助用户充分利用 Fable 平台,实现 AI 生产力提升。内容涵盖 Fable 的核心功能和使用技巧,助力用户高效完成 AI 相关任务,最大化工具价值。
@RampLabs · 13.4K 粉丝 · 335.4K 阅 · 7d 曝光 335.4K
PorTAL: Portable Task Adapters for LLMs
中文介绍 「PorTAL」是一项新研究,旨在解决现有参数高效微调(如 LoRA)的适配器无法在不同基础 LLM 模型间移植的局限。该研究提出可移植任务适配器,使用户无需在新模型发布时重新训练,提高了 LLM 微调的灵活性和效率。
@magicsilicon · 10.7K 粉丝 · 80.7K 阅 · 7d 曝光 80.7K
The Incredible Shrinking Transistor
中文介绍 帖子标题为「不可思议的微缩晶体管」,无具体正文内容。博主可能旨在探讨半导体技术的核心发展趋势,即晶体管尺寸不断缩小的过程及其带来的技术挑战与产业影响,强调了摩尔定律在当今时代的持续演进。
@ErikVoorhees · 908.5K 粉丝 · 124.8K 阅 · 7d 曝光 124.8K
Toward Unrestricted Intelligence: Venice Series A
中文介绍 Venice宣布完成A轮融资,其产品旨在提供私密且不受限制的智能服务,以应对言论受限及思想被束缚的担忧。该项目两年前启动,专注于赋能用户掌控自己的数字存在与表达。
@base · 1.4M 粉丝 · 51.0K 阅 · 7d 曝光 51.0K
What Are Agents Paying For?
👍 16
We present WorldDirector, a highly controllable video world model framework designed for persistent dynamic object memory and unrestricted viewpoint exploration. Unlike existing world models that entangle physical dynamics with pixel rendering and rely on continuous visual observation to sustain mot
中文介绍 WorldDirector是一个高度可控的视频世界模型框架,旨在实现持久动态对象记忆和无限制视角探索。它区别于现有将物理动态与像素渲染纠缠在一起的世界模型,有效解决了传统模型对连续视觉观察的依赖问题,从而提升了视频生成和模拟的效率与真实感。
👍 52
Many everyday programming tasks resist clean rule-based implementation, such as alerting on important log lines, repairing malformed JSON, or ranking search results by intent, and are increasingly outsourced to large language model APIs at the cost of locality, reproducibility, and price. We propose
中文介绍 “Program-as-Weights”是一种新的编程范式,专为难以用清晰规则实现的模糊功能设计。该范式能处理日志警报、损坏JSON修复或按意图排序搜索结果等任务,旨在提供一种本地且可复现的解决方案,以替代日益依赖大型语言模型API但存在局限性的传统方法。
👍 10
Representation alignment has become an effective way to accelerate diffusion transformer training and improve generation quality. Recent self-alignment methods, such as SRA and Self-Flow, further remove the dependency on external pretrained encoders by constructing alignment within the diffusion mod
中文介绍 表示对齐已成为加速扩散Transformer训练和提升生成质量的有效方法。SRA和Self-Flow等新型自对齐方法,通过构建内部对齐,进一步消除了对外部预训练编码器的依赖。这项研究探讨了这些方法是属于数据增强还是自监督学习的范畴,及其对模型训练的深远影响。
👍 0
While Multimodal Large Language Models (MLLMs) have demonstrated exceptional capabilities in standard visual understanding, adapting them for active visual search in 360^circ panoramic environments exposes fundamental limitations. Specifically, standard MLLMs struggle to effectively model inherent p
中文介绍 尽管多模态大型语言模型(MLLMs)在标准视觉理解方面表现出色,但将其应用于360度全景环境中的主动视觉搜索时,暴露出根本局限。MLLMs难以有效进行全局到局部的探索。EAGLE-360旨在解决此问题,提供一种在360度环境中进行具身主动全局到局部探索的新方法,以提升模型在该复杂场景下的表现。
👍 4
Vision-Language-Action (VLA) models are fundamentally bottlenecked by the scarcity of expert demonstrations -- triplets of observations, instructions, and actions that are costly to collect at scale. We argue that this bottleneck stems from conflating two distinct learning objectives: acquiring phys
中文介绍 视觉-语言-动作(VLA)模型受限于专家示范数据稀缺,即观察、指令和动作三元组的收集成本高昂。论文提出“先学移动,再学做事”的理念,即对VLA模型进行任务无关的预训练。研究认为,当前瓶颈源于混淆了两个不同的学习目标,通过分离运动和任务学习可有效提升VLA模型的泛化能力。
👍 0
Diffusion transformers (DiTs) achieve state-of-the-art image and video generation, but their multi-step sampling and growing parameter count make inference expensive. Post-training quantization (PTQ) is the natural remedy, yet DiT activations shift across timesteps, prompts, and guidance branches, f
中文介绍 扩散Transformer(DiTs)在图像和视频生成方面表现卓越,但其多步采样和日益增长的参数量导致推理成本高昂。训练后量化(PTQ)是常见的优化方案,但DiT的激活值在不同时间步和提示下会发生偏移,给量化带来挑战。OrbitQuant提出了一种数据无关的量化方法,旨在高效优化DiT模型。
👍 39
Autonomous agents are increasingly expected to improve executable policies through feedback, yet existing evaluations often collapse this process into a final score or confound it with open-ended software-engineering progress. We introduce Autonomous Policy Evolution, a controlled evaluation setting
中文介绍 自主智能体被期望通过反馈改进可执行策略,但现有评估常将其简化为最终分数,或与软件工程进展混淆。论文介绍了“自主策略演化”这一受控过程。EvoPolicyGym是一个新基准,专门用于在交互式环境中评估自主策略的演化能力,旨在提供更精细、全面的评估方式,以推动智能体发展。
👍 0
Autonomous robots often need to move their camera before they can act: to inspect an object, reveal an occluded region, or obtain a view that responds to a user's intent. While vision-language navigation translates instructions to base motion and vision-language-action policies map instructions to m
中文介绍 自主机器人常需在行动前移动摄像头,以检查物体、揭示遮挡或满足用户意图。虽然视觉-语言导航和VLA策略能实现基础运动,但它们通常不直接关注相机运动。LIME提出从第一人称视角视频中学习意图感知的相机运动,使机器人能更智能地调整视角,以支持后续操作。
👍 4
We elucidate the design space of Representation Distribution Matching (RDM), our name for the paradigm that trains a one-step image generator by matching generated and reference feature distributions under frozen pretrained encoders. We identify two design axes, how the distributions are compared an
中文介绍 论文阐述了“表征分布匹配”(RDM)的设计空间,这是一种通过匹配生成图像与参考图像在冻结预训练编码器下的特征分布,来训练一步式图像生成器的新范式。研究识别了两个关键设计轴,旨在优化生成过程,提高图像生成质量和效率,为快速视觉生成提供了新的理论框架和实践指导。
👍 0
Vision-Language-Action (VLA) models have shown remarkable promise in generalized robotic manipulation. However, their spatial generalization remains fragile. We argue that simply increasing the number of viewpoints is insufficient. Models often fall into the trap of Shortcut Learning, latching onto
中文介绍 视觉-语言-动作(VLA)模型在通用机器人操控中展现潜力,但其空间泛化能力仍显脆弱。研究指出,简单增加视角数量不足以解决问题,模型常陷入“捷径学习”困境。论文提出“The Moving Eye”方法,通过混合动态数据收集来增强VLA模型的空间泛化能力,旨在打破捷径学习,提升模型在多样化环境下的表现。
👍 12
Conventional reinforcement learning strategies for visual generation typically employ sample-wise reward functions, yet this practice frequently results in reward hacking that degrades image diversity and introduces visual anomalies. To address these limitations, we present a novel framework that fi
中文介绍 传统的视觉生成强化学习策略,常采用样本级奖励函数,但这容易导致奖励作弊,从而损害图像多样性并引入视觉异常。为解决这些局限性,论文提出了一种新颖方法,通过“分布式奖励”来优化视觉生成模型。该方法旨在提升生成图像的质量和多样性,避免传统方法的缺陷。
👍 9
Vein recognition is a secure biometric technology often constrained by limited annotated data and imaging variations. While data augmentation mitigates this, strategies designed for natural images may disrupt the fine-grained topology and textures essential for identity discrimination. We present AG
中文介绍 静脉识别作为一种安全生物识别技术,受限于标注数据不足和成像变化。数据增强虽能缓解此问题,但为自然图像设计的策略可能破坏静脉识别所需的精细拓扑结构和纹理。AGVBench是一个以可靠性为导向的基准测试,旨在评估静脉识别数据增强方法的有效性,确保其能保留关键识别特征。
👍 7
Vision-Language Models (VLMs) have demonstrated immense promise in Spatio-Temporal Video Grounding (STVG). However, current evaluation protocols are largely confined to zero-shot assessments on general, daily-life benchmarks. This creates a critical disconnect from real-world applications in special
👍 0
In this paper, we introduce BamiBERT, a new BERT-based pre-trained language model for Vietnamese that addresses key limitations of PhoBERT -- the current de facto Vietnamese text encoder. Trained from scratch on a 129GB corpus of general-domain Vietnamese text for 20 epochs, BamiBERT supports an ext
👍 39
Memory for a long-horizon LLM agent is a contract about what each future decision is allowed to see. The simplest contract appends past observations, tool calls, and reflections to every prompt, which makes prior context easy to access but also turns it into a jumbled mixture in which the effect of
👍 0
We present HandsOnWorld, a framework for hand-controlled egocentric video generation that forgoes multi-view and marker-based motion capture, learning instead from unconstrained monocular video. Such generality is bottlenecked by the scarcity of scalable 3D hand annotations: large egocentric corpora
👍 5
Evaluating LLM agents on benchmarks like SWE-Bench and GAIA can be expensive, time-consuming, and requires complex infrastructure. A single evaluation can cost thousands of dollars and take days to complete. In contrast, non-agentic LLM benchmarks that test individual capabilities (e.g., reasoning,
👍 12
Skills are becoming a reusable operational layer for LLM agents, encoding SOPs, domain rules, tool workflows, scripts, and validation routines. In realistic skill repositories, overlapping skills make reliable skill-use difficult. Final verifier success is too coarse for both evaluation and training
👍 0
Vision-Language-Action (VLA) foundation models have recently achieved strong progress in embodied intelligence. To reduce policy-call frequency while preserving temporal coherence, most generative policies adopt an action chunk mechanism, executing multiple future actions in an open-loop manner unde
👍 4
Continual post-training enables foundation models to acquire new knowledge while preserving existing capabilities. Recent work suggests that on-policy learning can mitigate forgetting, with on-policy self-distillation emerging as a particularly attractive approach. In this work, we revisit this opti
👍 3
Foundation models are routinely released to the public, yet the data recipes used to train them -- such as domain mixture weights that determine how different sources are sampled -- are rarely disclosed. This creates an access asymmetry: researchers study the resulting models but lack visibility int
👍 21
Data science aims to derive actionable insights from heterogeneous raw data, unlocking the value of the massive amounts of data generated in modern society. Automating this process is essential to reducing labor-intensive efforts for data scientists and enabling scalable data-driven applications. Re
👍 21
Hardware-agnostic strategies for accelerating text-to-image diffusion, such as timestep distillation and feature caching, can reduce inference time without custom kernels or system-level optimization. Among them, multi-resolution generation strategies have recently received broad attention, attainin
👍 0
Reinforcement learning (RL) has become a central component of post-training large language models (LLMs), yet little is understood about how RL adaptation is distributed across transformer layers. Existing approaches typically update all model parameters uniformly, implicitly assuming that every lay
👍 0
Despite rapid progress in interactive world models (IWMs), existing benchmarks evaluate action following only at trajectory level and ignore memory and interaction physics. We introduce WorldOdysseyBench, an open-world benchmark for long-horizon stability across four dimensions, each with tailored i
👍 0
Existing multi-modal large language models (MLLMs) face significant challenges in processing long video sequences due to strict input token limitations. As a result, current video understanding approaches, especially in egocentric settings characterized by complex dynamics, frequent state changes, a
👍 0
We present eCream-MedCorpus, a new and unique large-scale dataset of clinical notes produced in Emergency Departments of Italian hospitals. The corpus, in its current version, is composed of approximately 4 million clinical notes fully anonymized, covering diverse phases of patient care during the s
👍 0
The inherent complexity of video understanding makes it difficult to determine whether Video-LLM benchmark performance stems from visual perception, linguistic reasoning, or knowledge priors. While many benchmarks have emerged to assess high-level reasoning, shared criteria for evaluating video unde
👍 3
Zero-Shot Compositional Action Recognition (ZS-CAR) requires recognizing novel verb-object combinations composed of previously observed primitives. In this work, we tackle a key failure mode: models predict verbs via object-driven shortcuts (i.e., relying on the labeled object class) rather than tem
👍 1
We propose a scaling law that takes into account model size and training data while explicitly splitting the latter into training steps and batch size (called three-term law). Fitting the proposed law on a large set of training runs, we find that it correctly recovers the scaling of the optimal batc
Create your own Mac apps by chatting with AI
中文介绍 Raycast公司推出了Glaze,这是一款允许用户通过与人工智能(AI)聊天来创建Mac应用程序的工具。它旨在简化Mac应用开发流程,使用户能够以对话形式构建定制应用。
understand software
中文介绍 Archify是一款旨在帮助用户理解软件的工具。其具体功能和实现方式在简述中未详细说明。
A desktop pet that grows as you code with Claude Code
中文介绍 Tamamon是一款桌面宠物应用,它能根据用户使用Claude Code进行编程的活跃度而成长。这款微型桌面宠物旨在为开发者提供一种互动且具有陪伴感的体验。
An AI agent that reproduces GitHub issues for you
中文介绍 Osloq是一款AI智能代理,其主要功能是帮助开发者自动重现GitHub上的问题(issue)。这有助于简化故障排查流程,提高开发团队的工作效率。
One API to scrape, enrich, and extract the internet
中文介绍 Context.dev提供一个统一的API接口,用于抓取、丰富和提取互联网数据。此服务旨在简化数据获取和处理的流程,提高效率。
Talk to your to do list and get what's next
中文介绍 nxt是一款创新应用,允许用户通过语音与其待办事项列表进行交互。它能帮助用户快速了解并确定接下来的任务,从而提升个人效率。
Measure whether a campaign drove the desired outcome
中文介绍 Loops推出的“Goals”功能,旨在帮助企业和营销人员衡量其广告或营销活动是否达到了预期的目标和成果,从而评估活动成效并优化策略。
Voice in, voice out — with GitHub Copilot
中文介绍 Vox是一款结合了语音输入与输出功能的工具,并深度集成了GitHub Copilot。它旨在通过语音交互方式,为开发者提供更便捷、直观的AI编程助手使用体验。
The proactive GTM agent in Slack and Teams
中文介绍 Needle是一款主动式市场推广(GTM)智能体,可集成到Slack和Teams等协作平台,帮助团队进行市场拓展和客户互动。
Convert your TikTok followers into paying customers
中文介绍 Fypro是一款工具,旨在帮助用户有效管理并转化其TikTok平台上的粉丝群体。其核心目标是将潜在用户引导为实际付费客户,提升商业价值。
中文介绍 该视频由Riley Brown发布,展示了如何利用GPT Realtime 2和代码编辑器Cursor来构建一个真实的AI助手,旨在模仿电影中的智能管家「贾维斯」。内容可能涵盖AI实时交互、编程辅助以及个人化AI系统开发等技术细节。
中文介绍 这段视频短片介绍了在Slack平台中部署功能强大的AI智能体。这些智能体能够协助用户完成各项任务,提高工作效率,实现自动化流程。
中文介绍 视频展示了艺术团体 Squidsoup 如何利用人工智能助手 Claude 来创作其独特的艺术装置。内容可能涵盖 Claude 在构思、设计辅助或实现过程中扮演的角色,揭示AI与艺术结合的新形式。
中文介绍 Claude 官方 YouTube 频道发布视频,探讨其人工智能模型 Claude 在未来工作场景中的应用与潜力。该视频可能展望了AI技术如何赋能个人和组织,以适应不断变化的职场需求,并展示 Claude 在提升效率和创新方面的角色。
中文介绍 人工智能公司 Anthropic 正式推出其大型语言模型 Claude 的一项新功能或专业版本,命名为「Claude Science」。该项目目前处于测试(beta)阶段,旨在提升 Claude 在科学领域的理解与处理能力,以更好地服务于科学研究和相关应用。用户现可体验此新功能。
中文介绍 Spotify 的 Niklas Gustavsson 介绍了该公司如何在大规模代码库上运行代理。他分享了 Spotify 如何在其超过 2000 万行代码中部署和管理这些自动化代理,以提升开发效率和代码质量。讨论可能涵盖了代理的设计、实施策略及其在大型系统中的应用挑战。
中文介绍 视频展示了艺术团体 Squidsoup 如何利用人工智能助手 Claude 来创作其独特的艺术装置。内容可能涵盖 Claude 在构思、设计辅助或实现过程中扮演的角色,揭示AI与艺术结合的新形式。
中文介绍 Claude 官方 YouTube 频道发布视频,探讨其人工智能模型 Claude 在未来工作场景中的应用与潜力。该视频可能展望了AI技术如何赋能个人和组织,以适应不断变化的职场需求,并展示 Claude 在提升效率和创新方面的角色。
中文介绍 人工智能公司 Anthropic 正式推出其大型语言模型 Claude 的一项新功能或专业版本,命名为「Claude Science」。该项目目前处于测试(beta)阶段,旨在提升 Claude 在科学领域的理解与处理能力,以更好地服务于科学研究和相关应用。用户现可体验此新功能。
中文介绍 Spotify 的 Niklas Gustavsson 介绍了该公司如何在大规模代码库上运行代理。他分享了 Spotify 如何在其超过 2000 万行代码中部署和管理这些自动化代理,以提升开发效率和代码质量。讨论可能涵盖了代理的设计、实施策略及其在大型系统中的应用挑战。
中文介绍 视频介绍了某项技术突破,成功实现了此前被认为无法实时运行的功能。该进展可能在处理速度和应用效率方面带来显著提升,克服了此前人们对于其实时性能的怀疑。
中文介绍 由Two Minute Papers发布的该视频,标题为「AI刚刚进入一个新时代」,预示着人工智能领域可能出现了重大进展或突破。这可能涉及新的模型、技术或应用范式的出现,标志着AI发展迈入了一个重要的新阶段。
7 回复 · 程序员 节点
16 回复 · 程序员 节点
21 回复 · Apple 节点
12 回复 · 程序员 节点
24 回复 · 程序员 节点
11 回复 · Linux 节点
9 回复 · Apple 节点
34 回复 · Apple 节点
11 回复 · Apple 节点
24 回复 · Python 节点
该源今日无内容。
3 points · 0 comments
9 points · 1 comments
25 points · 1 comments
93 points · 86 comments
76 points · 11 comments
82 points · 37 comments
32 points · 12 comments
87 points · 5 comments
150 points · 54 comments
153 points · 125 comments
138 points · 57 comments
108 points · 144 comments
61 points · 13 comments
190 points · 90 comments
55 points · 41 comments
467 points · 82 comments
132 points · 64 comments
112 points · 43 comments
45 points · 4 comments
223 points · 82 comments
1140 points · 347 comments
I'm a bit annoyed by the feeling that we're kind of stuck when it comes to using LLMs for programming.I use Claude Code and Codex, but I haven't been able to enter flow state like I can when I hand write code.This is kind of ironic to me since AI should be a bicycle for the mind, but
246 points · 68 comments
I'm currently working on Bramble, an open source password manager with P2P cross-device sync. Initially I released the Chrome extension, but recently I also published the Android app and iOS is pending Apple's approval. Besides that, the latest version also includes passkey storage for all
Coding agents don't have long-term memory.But you do have months of full-fidelity agent transcripts stored on your machine.A simple solution that goes a long way: ingest those transcripts and logs into a structured SQLite database, then search them with ranked text match. Everything is fully lo
77 points · 1 comments
deptrust is a CLI that checks package versions for known vulnerabilities across npm, PyPI, crates.io, Go modules, RubyGems, NuGet, Maven, Packagist, pub.dev, CocoaPods, Hex.pm, Hackage, GitHub Actions, and more.It runs locally as a CLI and as an MCP server. It calls public package registry and OSV A
https://www.faa.gov/newsroom/trumps-transportation-secretary...
69 points · 31 comments
136 points · 8 comments
What's changed Changed AskUserQuestion dialogs to no longer auto-continue by default; opt into an idle timeout via /config Changed the "default" permission mode to "Manual" across the CLI, --help, VS Code, and JetBrains; --permission-mode manual and "defaultMode": "manual" are accepted alongside def
中文介绍 Anthropic的Claude Code发布v2.1.200版本。此版本更新了“AskUserQuestion”对话框,默认不再自动继续,用户可通过“/config”设置空闲超时。此外,CLI、VS Code和JetBrains等环境的默认权限模式均已更改为“手动”,以提高安全性控制。
What's changed Stacked slash-skill invocations like /skill-a /skill-b do XYZ now load all leading skills (up to 5), not just the first Fixed SSL certificate errors (TLS-inspecting proxies, missing NODE_EXTRA_CA_CERTS, expired certs) burning retries before showing actionable guidance — they now fail
中文介绍 Anthropic的Claude Code发布v2.1.199版本。此更新改进了堆叠斜杠技能调用功能,现在最多可加载前5个技能,而非仅第一个。同时,修复了与SSL证书相关的错误,解决了因TLS检查代理、缺少NODE_EXTRA_CA_CERTS或证书过期导致的重试问题。
What's changed Subagents now run in the background by default, so Claude keeps working while they run and is notified when they finish (previously a gradual rollout) Claude in Chrome is now generally available Added background agent notifications in claude agents — sessions that need input or finish
中文介绍 Anthropic的Claude v2.1.198版本更新。Claude现已在Chrome浏览器上普遍可用,并为Claude代理新增后台通知功能,在会话需输入或结束时触发。同时,增加了"/dataviz"技能,提供图表和仪表盘设计指导。
What's changed Introducing Claude Sonnet 5: now the default model in Claude Code, with a native 1M-token context window and promotional pricing of $2/$10 per Mtok through August 31. Update to version 2.1.197 for access. https://www.anthropic.com/news/claude-sonnet-5
中文介绍 Anthropic的Claude Code发布v2.1.197更新,并引入了Claude Sonnet 5作为默认模型。该模型原生支持100万上下文窗口,并提供推广期价格:每百万tokens输入2美元,输出10美元,优惠期截至8月31日。
What's changed Added support for organization default models — admins set it in the org console; it shows as "Org default" (or "Role default") in /model when you haven't picked one yourself Added readable default names for sessions at start, making them easier to identify and message Added clickable
中文介绍 Anthropic的Claude Code发布v2.1.196更新,新增了组织默认模型支持,管理员可在组织控制台设置。当用户未选择模型时,该默认模型将显示为「组织默认」或「角色默认」。此外,新版本还为会话启动时增加了可读的默认名称。
What's changed Added CLAUDE_CODE_DISABLE_MOUSE_CLICKS to disable mouse click/drag/hover in fullscreen mode while keeping wheel scroll Fixed hook matchers with hyphenated identifiers (e.g. code-reviewer, mcp__brave-search) accidentally substring-matching — they now exact-match. Use mcp__brave-search_
What's changed Added autoMode.classifyAllShell setting to route all Bash/PowerShell commands through the auto-mode classifier instead of only arbitrary-code-execution patterns Added auto-mode denial reasons to the transcript, the denial toast, and /permissions recent denials Added claude_code.assist
What's changed Added /rewind support for resuming a conversation from before /clear was run Fixed scroll position jumping to the bottom while reading earlier output during a streaming response Fixed background agents resurrecting after being stopped — stopping an agent from the tasks panel is now pe
What's changed Bug fixes and reliability improvements
What's changed Added sandbox.credentials setting to block sandboxed commands from reading credential files and secret environment variables Added org-configured model restrictions to the model picker, --model, /model, and ANTHROPIC_MODEL, with a "restricted by your organization's settings" message w
Release 0.143.0-alpha.35
中文介绍 OpenAI Codex团队发布了Rust项目的新版本“0.143.0-alpha.35”。此版本是该项目的又一次迭代更新,具体功能变动和改进细节未在发布说明中详细披露。
Release 0.143.0-alpha.34
中文介绍 OpenAI Codex 发布了针对 Rust 语言的 0.143.0-alpha.34 版本更新。此次更新为 alpha 测试版本,但具体内容未在公告中详述。
Release 0.143.0-alpha.33
中文介绍 OpenAI Codex 发布了针对 Rust 语言的 0.143.0-alpha.33 版本更新。此次更新为 alpha 测试版本,但具体内容未在公告中详述。
Release 0.143.0-alpha.32
中文介绍 OpenAI旗下的Codex项目发布了最新版本rust-v0.143.0-alpha.32。这是一个新的软件更新,但具体的发布细节和改进内容在本次公告中未提供。
Bug Fixes Prevented full Responses WebSocket request payloads from being written to trace logs. (#30771) Changelog Full Changelog: rust-v0.142.4...rust-v0.142.5 #30771 [codex] Backport websocket trace fix to release/0.142 @dylan-hurd-oai
中文介绍 OpenAI Codex项目发布了rust-v0.142.5版本,主要修复了一个错误。该版本阻止了完整的Responses WebSocket请求负载被写入跟踪日志,解决了#30771号问题。
Release 0.143.0-alpha.31
中文介绍 OpenAI Codex发布了Rust项目的0.143.0-alpha.31版本更新。此版本为Alpha测试阶段,具体更新内容未详细说明。
Release 0.143.0-alpha.30
中文介绍 OpenAI Codex为其Rust项目发布了`0.143.0-alpha.30`版本。此次发布代表着该项目的一个新的预览或测试版本更新,但官方发布说明中未提及具体功能性或改动细节。
Chores No user-facing changes were identified for this release. Changelog Full Changelog: rust-v0.142.3...rust-v0.142.4
Release 0.143.0-alpha.29
Release 0.143.0-alpha.28
今日AI领域呈现多元化发展,从前沿模型研究(如可控世界模型与VLA预训练)到AI安全工具的开源,再到AI Agent产品在编码、设计和办公场景的广泛落地。同时,行业巨头间的AI超级应用竞争加剧,Anthropic进军AI制药,DeepMind与电影公司合作,显示AI正深入渗透各行各业,但AI治理和伦理(如Claude Code的国际管制问题及Agent评估挑战)也日益凸显其重要性。
`strix` 是一个开源的 AI 安全工具,旨在帮助开发者和安全团队自动发现并修复应用程序中的潜在漏洞。该项目利用人工智能技术,模拟「AI 渗透测试员」的行为模式,对应用进行深度分析和攻击模拟,从而有效识别传统安全扫描工具可能遗漏的安全缺陷。它解决了人工安全审计耗时耗力、且容易出错的问题,特别适用于需要持续安全保障的开发流程(如 CI/CD),帮助团队在软件发布前提升应用的整体安全性,降低潜在的安全风险。
WorldDirector是一个高度可控的视频世界模型框架,旨在实现持久动态对象记忆和无限制视角探索。它区别于现有将物理动态与像素渲染纠缠在一起的世界模型,有效解决了传统模型对连续视觉观察的依赖问题,从而提升了视频生成和模拟的效率与真实感。该模型为构建更智能、更逼真的模拟环境提供了新的可能性,对AI训练和虚拟现实应用具有重要意义。
“Program-as-Weights”是一种新的编程范式,专为难以用清晰规则实现的模糊功能设计。该范式能处理日志警报、损坏JSON修复或按意图排序搜索结果等任务,旨在提供一种本地且可复现的解决方案,以替代日益依赖大型语言模型API但存在局限性的传统方法。它为传统编程无法有效解决的复杂、不确定性问题提供了创新思路,提升了系统处理模糊逻辑的能力。
视觉-语言-动作(VLA)模型受限于专家示范数据稀缺,即观察、指令和动作三元组的收集成本高昂。论文提出「先学移动,再学做事」的理念,即对VLA模型进行任务无关的预训练。研究认为,当前瓶颈源于混淆了两个不同的学习目标,通过分离运动和任务学习可有效提升VLA模型的泛化能力。这一方法有望加速通用机器人操控能力的普及与发展。
`codex-plugin-cc` 是一个 OpenAI 官方插件,旨在将 Codex 模型的功能集成到 Claude Code 环境中。它允许用户在 Claude Code 内部直接调用 Codex 的能力,执行代码审查或将特定编程任务委派给 Codex 处理。该插件解决了在不同 AI 模型之间切换的效率问题,为需要利用 Codex 强大代码理解和生成能力的用户提供便利,特别适合开发者进行自动化代码质量检查或智能任务分配。
Anthropic的Claude Code发布v2.1.200和v2.1.198等版本更新。新版将「AskUserQuestion」对话框默认设为不再自动继续,CLI、VS Code和JetBrains等环境的默认权限模式均改为「手动」,以提升安全性控制。此外,Claude现已在Chrome浏览器上普遍可用,并新增了代理后台通知和「/dataviz」技能,提供图表设计指导,显著扩展了其应用场景和用户体验。
Raycast公司推出了Glaze,这是一款允许用户通过与人工智能(AI)聊天来创建Mac应用程序的工具。它旨在简化Mac应用开发流程,使用户能够以对话形式构建定制应用,无需复杂的编码知识。Glaze为非专业开发者提供了一个低门槛的Mac应用开发途径,大幅提升了创意实现效率,有望推动AI辅助下的应用开发普及。
TencentCloud/CubeSandbox 是一个专为 AI Agent 设计的沙盒环境,提供即时、高并发、安全且轻量级的执行隔离。它解决了 AI Agent 在执行外部代码、调用工具或进行复杂交互时可能带来的安全隐患和资源管理挑战,确保 Agent 能够在受控的环境中安全运行。该沙盒特别适用于 AI Agent 平台、多 Agent 系统开发以及需要对 Agent 行为进行严格隔离和监控的场景,提升了 AI 应用的稳定性和安全性。
Google DeepMind和知名电影公司A24宣布建立一项“史无前例”的开创性研究合作伙伴关系。尽管具体合作内容和研究方向暂未透露,但此举预示着AI技术与电影制作领域可能产生深度融合,涵盖剧本创作、视觉特效、剪辑优化乃至沉浸式体验设计等方面。该合作旨在突破传统电影制作的界限,探索AI在艺术创作和文化产业中的创新潜力。
Anthropic在本周「AI For Science」活动中宣布推出「Claude Science」,这是一个旨在整合分散工具和数据集的科学家AI工作台,并能生成图表和可视化内容。此举表明Anthropic正将AI技术拓展至药物研发领域,并计划开发自己的药品。这一战略性布局预示着AI大模型公司在核心技术之外,正积极向高价值垂直应用领域延伸,有望加速新药研发进程。
微软计划在8月合并其消费者和企业版Copilot应用,精简功能并引入名为「AutoPilot」的新AI智能体。这些智能体将以额外收费的方式在后台处理任务,此举表明微软正追随Anthropic和OpenAI的脚步,进军AI超级应用市场。通过提供统一的AI驱动工作流和更高级的自动化能力,微软旨在提升其在个人和企业生产力工具领域的竞争力。
Google DeepMind的工会化谈判进展不顺。在周三的协商中,员工对公司高管未能就工会组建前景进行有意义的沟通表示不满和沮丧,导致谈判开局艰难。这一事件凸显了在快速发展的AI技术公司中,员工权益保障和劳资关系管理面临的挑战。劳资双方需进一步对话,以寻求解决方案,确保公司稳定运营和员工权益。
`cs249r_book` 是来自 Harvard-EDGE 的「机器学习系统」课程书籍或相关学习材料。该项目深入探讨了机器学习模型的端到端生命周期,涵盖了从数据管理、模型训练、评估到生产部署、监控和维护等各个环节。它旨在教授如何设计、构建并扩展实际的 ML 系统,解决生产环境中的挑战。对于希望掌握 MLOps 实践、深入理解机器学习系统工程的学生、工程师和研究人员,这是极具价值的参考资源。
`agentskills` 项目提供了 AI 代理“技能”的标准化规范和详细文档。它旨在建立一个通用的框架,定义代理技能的结构、描述方式以及如何与其他代理或平台进行集成。这对于促进 AI 代理生态系统的互操作性和模块化开发至关重要。开发者、平台提供商及研究人员可以参考这份规范,设计和构建统一且可复用的代理能力,从而简化复杂 AI 系统的开发流程。
该帖子围绕AI时代下的职业发展提供建议。博主旨在分享面对人工智能技术进步时,个人应如何规划职业路径、提升自身价值,以适应未来就业市场的变化和挑战。在AI技术快速演进的背景下,理解自身优势、学习新技能以及拥抱变革成为职业发展的关键。这些建议对于处于职业转型期或希望提升竞争力的个人具有指导意义。
视频展示了艺术团体 Squidsoup 如何利用人工智能助手 Claude 来创作其独特的艺术装置。内容可能涵盖 Claude 在构思、设计辅助或实现过程中扮演的角色,揭示AI与艺术结合的新形式。这种跨界合作突显了AI在激发人类创造力、简化创作流程以及实现前所未有的艺术表现形式方面的巨大潜力,为数字艺术和交互式体验带来了新的可能性。
英国AI安全研究所的一项研究发现,现有AI评估基准通过限制计算资源,系统性地低估了AI智能体的实际能力。在涵盖七个基准的测试中,研究显示,当「token」预算增加时,AI智能体在软件工程任务上的成功率提高了约25%。这一发现挑战了当前AI能力评估的普遍认知,强调了评估方法需要更贴近真实使用场景,以准确衡量智能体的潜力和局限性。
今天的 AI 产品发布聚焦于智能代理(AI Agent)在软件开发领域的深入应用,从代码生成、调试到漏洞测试,AI Agent 正加速渗透开发流程。同时,AI 驱动的低代码/无代码应用开发工具和创新型生产力助手也呈现出蓬勃发展态势,预示着 AI 正全面赋能个人与团队的创作和工作效率。
Claude Code 是 Anthropic 推出的一个智能代理编码工具,它直接集成在用户的终端环境中。该工具能够深入理解整个代码库,并通过执行日常任务、解释复杂代码逻辑以及辅助处理 Git 工作流,显著提升开发者的编码效率。它旨在成为开发者的得力助手,自动化重复性工作,让开发者能更专注于核心创造性任务,从而加快软件开发进程。
Raycast公司推出了Glaze,这是一款允许用户通过与人工智能(AI)聊天来创建Mac应用程序的工具。它旨在简化Mac应用开发流程,降低技术门槛,使用户能够以对话形式描述需求,快速构建定制化的Mac应用。Glaze 的出现预示着低代码/无代码开发与生成式 AI 结合的新趋势,让普通用户也能实现应用开发的创意。
Graphify 是一个强大的 AI 编码助手技能,能够整合多种大型语言模型(如 Claude Code, Codex, Gemini CLI)。它的核心功能是将任何文件夹中的代码、SQL 架构、R 脚本、Shell 脚本、文档、论文乃至图像和视频等多元数据,转化为可查询的知识库。这使得开发者、数据分析师和研究人员能够通过自然语言提问,快速理解和检索项目中的复杂信息,显著提升开发和研究效率。
`strix` 是一个开源的 AI 安全工具,旨在帮助开发者和安全团队自动发现并修复应用程序中的潜在漏洞。该项目利用人工智能技术,模拟「AI 渗透测试员」的行为模式,对应用进行深度分析和攻击模拟,从而有效识别传统安全扫描工具可能遗漏的安全缺陷。它解决了人工安全审计耗时耗力、且容易出错的问题,特别适用于需要持续安全保障的开发流程(如 CI/CD),帮助团队在软件发布前提升应用的整体安全性,降低潜在的安全风险。
`chrome-devtools-mcp` 是专为「编码代理」(coding agents)设计的 Chrome DevTools 扩展。它将 Chrome DevTools 强大的调试和分析能力引入到 AI 编码代理的开发流程中,帮助开发者监控、理解和优化代理的行为与输出。通过这些工具,开发者可以更有效地调试由 AI 生成或处理的代码,提升编码代理的开发效率和准确性,特别是在构建复杂 AI 驱动应用时具有重要价值。
`herdr` 是一个命令行工具,它充当 AI Agent 的多路复用器,允许用户在终端中高效管理和交互多个智能代理。通过提供一个统一的接口,它解决了同时运行和协调多个 Agent 时的复杂性,例如不同 Agent 的输入、输出和状态管理。开发者和 AI 工程师可以使用 `herdr` 来构建复杂的自动化工作流,同时监控不同 Agent 的执行情况,无需切换多个应用或窗口,极大地提升了 Agent 驱动型应用的开发和调试效率。
Osloq 是一款 AI 智能代理,其主要功能是帮助开发者自动重现 GitHub 上的问题(issue)。通过分析 issue 描述、代码上下文和相关日志,Osloq 能够模拟用户操作,生成重现步骤或验证修复,从而大幅简化故障排查流程,提高开发团队的工作效率。这对于开源项目维护者和大型开发团队尤其有用,能够节省大量手动测试和验证的时间。
`nxt` 是一款创新应用,允许用户通过语音与其待办事项列表进行交互。它利用自然语言处理技术,能帮助用户快速了解并确定接下来的任务,例如询问「接下来我该做什么?」或「今天还有哪些重要的事?」。这种免手动输入的设计,特别适合在多任务处理或驾驶等不便使用键盘的场景下,有效提升个人效率,实现更流畅的任务管理体验。
Macro 是一款工作空间应用,旨在将用户的各项工作整合到一个应用中。它打破了不同应用间的壁垒,提供统一的界面来管理文档、任务、会议等内容。其独特之处在于「共享记忆」功能,能够智能关联工作中的信息,方便团队成员快速回顾上下文,避免信息孤岛,从而大幅提高团队协作和个人工作效率,特别适合知识密集型团队。
PixFit 是一款效率工具,能将一个创意素材迅速转换为多种广告格式,以适应不同平台和投放需求。它利用 AI 技术智能裁剪、调整布局和文本,确保素材在各种尺寸和比例下都能保持高质量和品牌一致性,省去了设计师和营销人员大量重复性工作。这大幅提升了广告素材的制作效率,帮助团队更快地迭代和优化广告表现。
Loops 推出的「Goals」功能,旨在帮助企业和营销人员衡量其广告或营销活动是否达到了预期的目标和成果。该工具通过数据分析和可视化,提供清晰的洞察,量化各项营销指标,从而评估活动成效并优化策略。它解决了营销活动效果难以精准追踪的问题,帮助团队更科学地进行决策,提升 ROI,是数据驱动型营销不可或缺的辅助工具。
Tamamon 是一款独特的桌面宠物应用,它能根据用户使用 Claude Code 进行编程的活跃度而成长。这款微型桌面宠物旨在为开发者提供一种互动且具有陪伴感的体验,将编程过程变得更加有趣和富有成就感。它利用 AI 模型对编程行为的感知,让虚拟宠物做出相应反馈,为开发者带来轻松愉悦的伴侣式互动,是探索 AI 情感陪伴和游戏化体验的有趣尝试。
Needle 是一款主动式市场推广(Go-to-Market, GTM)智能体,可集成到 Slack 和 Teams 等协作平台。它通过监测内部沟通和市场动态,智能地为团队提供产品发布、客户互动或销售策略方面的建议,甚至能自动生成营销内容。Needle 旨在让 GTM 团队更高效地响应市场变化,实现自动化协同,是探索 AI Agent 在企业协作与市场策略应用前沿的实验。