OpenAI News · 06/24 14:00
OpenAI与Broadcom联合发布了名为「Jalapeño」的定制AI芯片。这款芯片专为大型语言模型(LLM)推理设计,旨在显著提升AI系统的性能、效率和规模,是OpenAI在AI硬件领域的最新布局。(多家报道)
推荐理由:这是AI硬件发展的重要信号,标志着OpenAI深入芯片领域,对行业格局产生重大影响。
OpenAI News · 06/24 14:00
OpenAI与Broadcom联合发布了名为「Jalapeño」的定制AI芯片。这款芯片专为大型语言模型(LLM)推理设计,旨在显著提升AI系统的性能、效率和规模,是OpenAI在AI硬件领域的最新布局。(多家报道)
推荐理由:这是AI硬件发展的重要信号,标志着OpenAI深入芯片领域,对行业格局产生重大影响。
DeepMind Blog · 06/25 00:30
Google DeepMind宣布为Gemini 3.5 Flash模型引入「Computer Use」功能,使其能够直接与计算机交互执行任务,从而扩展了模型的应用能力和实用性。
推荐理由:此功能显著拓展了大模型的应用能力,使其能执行更复杂、更实际的任务,对开发者和AI用户有明确启示。
Claude Blog · 06/24 08:00
Claude博客介绍了「Claude Tag」中的智能体身份(Agent identity)功能,这是一种新的访问模型,旨在支持自主且团队范围的AI协作,从而提高大型团队中AI智能体的可管理性和安全性。
推荐理由:这是大型团队部署AI智能体时在安全与合规方面的重要进展,对企业用户有明确参考价值。
Hugging Face Blog · 06/26 08:00
Hugging Face推出了一个新功能,允许用户通过一条命令在HF Jobs上运行vLLM服务器,大大简化了大型语言模型服务的部署流程,降低了部署门槛。
推荐理由:该功能解决了大模型部署的痛点,为开发者提供了直接上手的便利工具,能显著提升开发效率。
GitHub Trending
OpenMontage 是首个开源的智能体驱动视频制作系统,集成了12条生产线、52种工具和500多个智能体技能。它能将AI编码助手转化为一个完整的视频制作工作室,自动化和加速视频内容创作。
推荐理由:这是一个实用性极强的AI智能体应用,拓展了视频创作自动化能力,值得视频创作者和开发者关注。
OpenAI News · 06/25 10:00
OpenAI最新研究论文指出,AI智能体正通过赋能更长、更复杂的任务,并提高不同岗位的生产力,从而深刻改变工作模式,预示着未来工作方式的转型。
推荐理由:深度解读AI智能体对未来工作的影响,为企业和个人提供了洞察行业趋势的重要参考。
GitHub Trending
DESIGN.md定义了一套格式规范,旨在帮助编码代理理解并持久化视觉设计系统的结构化信息。它解决了AI在代码生成和UI开发中难以准确遵循品牌指南的问题。
推荐理由:该规范解决了AI在UI开发中保持设计一致性的关键挑战,对AI开发者、前端工程师和设计系统维护者都具有重要价值。
LinuxDo · 06/25 22:23
有用户反映,购买的低价大模型API密钥出现「一号多卖」现象,导致API管理面板沦为评论区,账号迅速被封。提醒消费者警惕此类欺诈行为。
推荐理由:这则警示直接关系到用户的财产安全与使用体验,提醒社区成员避免API密钥购买陷阱,保护自身利益。
Riley Brown (YouTube) · 06/25 06:39
该短视频展示了强大的AI智能体如何在Slack协作平台内运作,能够理解指令、执行任务并辅助团队沟通,显著提升工作效率。
推荐理由:直观展示了AI智能体在实际工作环境中的应用潜力,为企业和团队提供了提升协作效率的思路。
MIT Tech Review AI · 06/25 22:22
麻省理工科技评论指出,AI正深刻重塑零售业,其主要变革并非消费者可见的虚拟试穿或聊天机器人,而是幕后决策过程,例如商品在搜索中的呈现方式,以此提升运营效率。
推荐理由:这篇深度分析揭示了AI在传统行业的深层影响,帮助读者超越表面现象,理解AI的真实价值。
TypeScript · ★ 19,038 · 🍴 1,637 · 📈 1,407 stars today
A format specification for describing a visual identity to coding agents. DESIGN.md gives agents a persistent, structured understanding of a design system.
中文介绍 DESIGN.md 定义了一套格式规范,旨在帮助编码代理理解并持久化视觉设计系统的结构化信息。通过提供一致的设计语言描述,它解决了AI在代码生成和UI开发中难以准确遵循品牌指南的问题,使AI智能体能更好地融入设计工作流,提升开发效率和设计一致性。适用于AI开发者、前端工程师和设计系统维护者。
Python · ★ 21,962 · 🍴 2,463 · 📈 3,553 stars today
World's first open-source, agentic video production system. 12 pipelines, 52 tools, 500+ agent skills. Turn your AI coding assistant into a full video production studio.
中文介绍 OpenMontage 是首个开源的智能体驱动视频制作系统,集成了12条生产线、52种工具和500多个智能体技能。它能将AI编码助手转化为一个完整的视频制作工作室,覆盖从内容规划到后期制作的全流程,极大地自动化和加速视频内容创作。适用于视频创作者、媒体机构及希望利用AI提升视频制作效率的开发者。
Python · ★ 1,796 · 🍴 292 · 📈 201 stars today
AI 时代的伯克希尔:基于 Claude Code 的价值投资研究框架。巴菲特·芒格·段永平·李录四大师方法论 + 多Agent并行研究。| AI-era Berkshire: a value investing research framework built on Claude Code. 4 masters' methodologies + multi-agent adversarial analysis.
中文介绍 AI 时代的伯克希尔是一个基于 Claude Code 的价值投资研究框架。它融合了巴菲特、芒格、段永平、李录四位投资大师的方法论,并通过多Agent并行研究模式,为用户提供深入的金融分析和投资洞察。该项目旨在利用AI技术赋能个人投资者和金融机构,提升其在价值投资领域的决策能力。
TypeScript · ★ 6,579 · 🍴 602 · 📈 112 stars today
A self-hosted travel/trip planner with real-time collaboration, interactive maps, PWA support, SSO, budgets, packing lists, and more.
中文介绍 TREK 是一款支持自托管的旅行计划工具,提供实时协作、交互式地图、PWA 支持、SSO 认证、预算管理和打包清单等功能。它解决了团队或家庭旅行规划中信息分散、协作不便的问题,为用户提供了一个集成且私密的解决方案,确保旅行安排井然有序。适合旅行爱好者、团队活动组织者及注重数据隐私的用户。
Swift · ★ 43,161 · 🍴 1,266 · 📈 1,366 stars today
A tool for creating and running Linux containers using lightweight virtual machines on a Mac. It is written in Swift, and optimized for Apple silicon.
中文介绍 Apple 的 container 工具专为 Mac 用户设计,能通过轻量级虚拟机创建和运行 Linux 容器。它采用 Swift 语言编写,并针对 Apple Silicon 芯片进行了优化,提供了高性能和低资源消耗的容器化体验。此工具是 macOS 开发者和 DevOps 工程师的理想选择,用于在本地高效搭建和测试 Linux 环境。
TypeScript · ★ 20,353 · 🍴 3,002 · 📈 1,021 stars today
Clone any website with one command using AI coding agents
中文介绍 这个项目是一个利用AI编码智能体实现网站克隆的模板,用户只需一条命令即可快速复制任何网站。它通过自动化代码生成和结构解析,大大简化了网站复制过程,解决了手动克隆耗时费力的问题。适用于前端开发者、设计师以及需要快速构建原型或进行网站分析的用户。
TypeScript · ★ 2,468 · 🍴 294 · 📈 57 stars today
Open source alternative to Semrush and Ahrefs
中文介绍 Open SEO 是 Semrush 和 Ahrefs 等商业 SEO 工具的开源替代品。它旨在提供全面的搜索引擎优化分析功能,帮助网站管理员、营销人员和开发者提升网站在搜索引擎中的排名。通过开源社区的协作,它为用户提供了免费且可定制的SEO解决方案,降低了专业SEO工具的使用门槛。
TypeScript · ★ 115,750 · 🍴 17,159 · 📈 836 stars today
Use Garry Tan's exact Claude Code setup: 23 opinionated tools that serve as CEO, Designer, Eng Manager, Release Manager, Doc Engineer, and QA
中文介绍 gstack 提供了 Garry Tan 针对 Claude Code 的一套独特配置,包含23个角色化的AI工具,分别担任CEO、设计师、工程经理、发布经理、文档工程师和QA等职能。它通过模拟多角色协作,极大地优化了软件开发和管理流程,旨在提升团队效率和项目质量。适合利用AI赋能软件开发全生命周期的团队。
Python · ★ 1,113 · 🍴 113 · 📈 15 stars today
Official, AWS-supported MCP servers, skills, and plugins to help AI agents build on AWS
中文介绍 AWS Agent Toolkit for AWS 提供了官方支持的 MCP 服务器、技能和插件,旨在帮助AI智能体在AWS云平台上构建应用。它简化了AI智能体与AWS服务的集成,使开发者能够更高效地利用AWS基础设施来部署、管理和扩展智能体驱动的解决方案。适用于在AWS生态中开发AI智能体应用的工程师。
Python · ★ 21,161 · 🍴 2,439 · 📈 600 stars today
817 structured cybersecurity skills for AI agents · Mapped to 6 frameworks: MITRE ATT&CK, NIST CSF 2.0, MITRE ATLAS, D3FEND, NIST AI RMF & MITRE F3 (Fight Fraud) · agentskills.io standard · Works with Claude Code, GitHub Copilot, Codex CLI, Cursor, Gemini CLI & 20+ platforms · 29 security domains ·
中文介绍 该项目为AI智能体提供了817项结构化的网络安全技能,并将其映射到MITRE ATT&CK、NIST CSF 2.0等六大主流安全框架。这些技能遵循 agentskills.io 标准,旨在赋能AI智能体执行复杂的网络安全任务,从威胁检测、响应到风险管理,提升自动化安全防护能力。适用于网络安全研究员和AI安全解决方案开发者。
TypeScript · ★ 19,768 · 🍴 1,705 · 📈 196 stars today
JavaScript in-page GUI agent. Control web interfaces with natural language.
中文介绍 Page Agent 是一个基于 JavaScript 的页面内 GUI 智能体,允许用户通过自然语言控制网页界面。它解决了传统点击操作的繁琐性,使用户能够以更直观、更智能的方式与Web应用交互,实现自动化操作和信息提取。适用于前端开发者、QA工程师以及希望提升网页操作效率的普通用户。
Go · ★ 34,766 · 🍴 1,989 · 📈 202 stars today
CasaOS - A simple, easy-to-use, elegant open-source Personal Cloud system.
中文介绍 CasaOS 是一款简单易用、优雅的开源个人云系统。它旨在帮助用户轻松搭建和管理自己的私有云,提供文件存储、应用程序管理等功能,将用户的硬件设备转化为个人数据中心。此项目解决了用户对数据隐私和自主控制的需求,是希望在家中部署NAS或私有云服务的理想选择。
Python · ★ 69,490 · 🍴 5,877 · 📈 524 stars today
Transforms complex documents like PDFs and Office docs into LLM-ready markdown/JSON for your Agentic workflows.
中文介绍 MinerU 能够将 PDF、Office 文档等复杂格式的文件转换成 LLM 可理解的 Markdown 或 JSON 格式,从而无缝集成到智能体工作流中。它解决了大型语言模型处理非结构化文档的挑战,极大地提高了从复杂文档中提取信息和知识的效率。适用于AI/LLM开发者、数据科学家和内容分析师。
Python · ★ 18,186 · 🍴 2,676 · 📈 141 stars today
M3U Playlist for free TV channels
中文介绍 Free-TV/IPTV 提供了一个包含免费电视频道的 M3U 播放列表。用户可以通过兼容的媒体播放器或智能电视应用直接加载此列表,观看全球范围内的免费直播电视频道。它为寻求免费娱乐内容的用户提供了便捷的解决方案,解决了传统电视收看限制。适用于媒体爱好者和智能家居用户。
HTML · ★ 60,471 · 🍴 6,058 · 📈 450 stars today
from vibe coding to agentic engineering - practice makes claude perfect
中文介绍 该项目深入探讨了 Claude Code 的最佳实践,特别是从“随意编码”(vibe coding)过渡到结构化的“智能体工程”(agentic engineering)的方法论。它通过一系列实践案例,指导开发者如何更高效、系统地利用 Claude 进行代码生成和问题解决,帮助用户充分发挥大模型在编程中的潜力。
Python · ★ 52,725 · 🍴 10,918 · 📈 347 stars today
小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫
中文介绍 MediaCrawler 是一款多功能的社交媒体爬虫,支持从小红书、抖音、快手、B站、微博、百度贴吧和知乎等平台抓取笔记、视频、帖子及评论数据。它为数据分析、市场研究和内容监控提供了强大的数据采集能力,解决了手动收集社交媒体数据耗时耗力的问题。适用于数据分析师、营销人员和学术研究者。
👍 0
Tool Calling and Structured Output are two core capabilities of modern Agent systems, yet their interaction under joint deployment conditions remains insufficiently understood. This paper reports a reproducible phenomenon observed in a production Agent system: when Tool Calling and JSON Schema const
中文介绍 一项研究探讨了大型语言模型(LLMs)中工具调用与结构化输出能力在联合部署时的交互。研究发现,在生产级Agent系统中,当施加结构化输出约束时,LLM的工具调用能力会被抑制,这是一个可重现的现象,揭示了这两种核心能力之间的「约束成本」。
👍 26
Synthesizing a novel-view video from a monocular reference video along a target camera trajectory requires both geometric consistency and motion fidelity with respect to the reference video. Existing methods based on explicit 3D representations are limited by the accuracy of off-the-shelf reconstruc
中文介绍 一项研究提出了MVTrack4Gen方法,利用多视角点跟踪作为几何监督,从单目参考视频沿目标相机轨迹合成新视角视频。该方法旨在提升生成视频的几何一致性和运动保真度,克服了现有基于显式3D表示方法在准确性上的局限。
👍 37
Real-world photography requires capture-time guidance for both camera framing and subject pose. Yet existing aesthetic cropping benchmarks mainly evaluate post-hoc crop prediction and overlook subject-side recommendations, leaving the capture-time guidance capabilities of multimodal large language m
中文介绍 一项研究提出ShutterMuse,利用多模态大语言模型(MLLMs)为摄影提供拍摄时指导,涵盖相机构图和拍摄对象姿态。该方法旨在弥补现有美学裁剪基准主要评估后期裁剪预测,而忽视对拍摄时指导能力研究的不足。
👍 19
Fine-grained visual reasoning requires multimodal large language models (MLLMs) to identify task-relevant visual evidence and ground their reasoning in local image regions. Existing agentic methods typically rely on reinforcement learning with verifiable rewards or supervised fine-tuning on large-sc
中文介绍 一项研究提出了V-Zero,一种针对细粒度视觉推理的新方法。该方法通过无答案标签的在策略蒸馏和对比证据门控,使多模态大语言模型(MLLMs)能够识别任务相关的视觉证据并将其推理与局部图像区域关联,避免了对可验证奖励强化学习或监督微调的依赖。
👍 6
While Video Virtual Try-on (VVT) has achieved remarkable progress in synthesizing realistic garment overlays on dynamic subjects, existing paradigms remains fundamentally constrained by a passive dependency on source camera trajectories, failing to accommodate the requisite interactive freedom for o
中文介绍 一项研究推出了TryOnCrafter,旨在通过可渲染的4D虚拟试穿代理,突破现有视频虚拟试穿(VVT)技术对源相机轨迹的被动依赖。该方法旨在实现更逼真的动态主体服装叠加合成,并支持所需的交互式相机移动,提升虚拟试穿的真实感和灵活性。
👍 8
We introduce Autodata, a general method that enables AI agents to act as data scientists who build high quality training and evaluation data. We show how to train (meta-optimize) such a data scientist agent, so that it learns to create even stronger data. We describe the overall formulation, and a s
中文介绍 一项研究提出Autodata,这是一种通用方法,能让AI智能体充当数据科学家,生成高质量的训练和评估用合成数据。研究展示了如何对这些数据科学家智能体进行元优化,使其学习创建更优质的数据集,从而提升数据生成的能力和效率。
👍 1
Today's reasoning models use thinking tokens to attain stronger performance on benchmarks than their instruction-tuned counterparts. It is also generally believed that this more "deliberative" mode should improve alignment and safety, by providing the model a safe space to consider whether its plann
中文介绍 一项研究探讨了推理模型中使用的「思考token」是否能提升模型安全性。当前模型利用思考token在基准测试中表现更强,且普遍认为这种「审慎」模式应能通过提供安全思考空间来改善对齐和安全性。该论文旨在实证研究这一假设。
👍 3
Jailbreak attacks reveal a persistent weakness in aligned Large Language Models: carefully crafted prompts can elicit policy-violating responses despite safety training. While most defenses operate at the prompt or output level, it remains unclear how harmful intent is encoded within the model's int
中文介绍 一项研究提出通过分析大型语言模型(LLMs)中间层的「熵动态」来检测越狱攻击。该方法旨在解决越狱攻击能够绕过安全训练的难题,并探索有害意图在模型内部的编码方式,而非仅在提示或输出层面进行防御,从而提升模型安全性。
👍 4
"Talk short. Drop grammar. Save token." This caveman style is widely promoted as a way to cut inference cost, but whether it actually saves anything depends on which channel (the user's prompt or the model's response) is being compressed. We present Cavewoman, a two-channel evaluation protocol that
中文介绍 一项名为CAVEWOMAN的研究评估了大型语言模型(LLMs)在语言输入和输出压缩(即「穴居人风格」语言)下的表现。研究探讨了这种被推广为削减推理成本的方法,是否以及如何实际节省token,并分析其对用户提示和模型响应这两个通道的影响。
👍 87
Memory for large language model (LLM) agents has rapidly evolved from simple retrieval-augmented mechanisms into a data management system that supports persistent information storage, retrieval, update, consolidation, and dynamic lifecycle governance throughout agent execution. Despite this evolutio
中文介绍 一项研究探讨了大型语言模型(LLM)智能体内存系统的发展。其内存已从简单的检索增强机制迅速演变为一个全面的数据管理系统,支持智能体执行过程中的信息持久存储、检索、更新、整合和动态生命周期治理。该文讨论了这种演变带来的挑战与机遇。
👍 4
Existing low-bit KV-cache quantizers often treat each cached key as a flat vector. Under RoPE, however, a key's contribution to a future attention logit decomposes into a position-dependent sum over two-dimensional frequency blocks. This makes key-cache quantization a block-wise bit-allocation probl
中文介绍 一项研究提出RoPE感知(RoPE-Aware)的KV-缓存量化位分配方法。现有低位KV-缓存量化器常将缓存键视为扁平向量,但在RoPE机制下,键对未来注意力logit的贡献可分解为二维频率块的位移相关和。因此,键缓存量化需要采用分块优化策略。
👍 13
Unified multi-modal large language models (MLLMs) have achieved strong text-to-image generation quality, but still struggle with structure-aware prompt following, where object counts, spatial relations, attribute bindings, and coarse layouts must be preserved. We attribute this limitation in part to
中文介绍 一项研究提出了IV-CoT(隐式视觉思维链)方法,用于结构感知的文本到图像生成。该方法旨在解决多模态大语言模型(MLLMs)在处理需保留物体数量、空间关系、属性绑定和粗略布局等结构化提示时的不足,以提升图像生成的准确性和一致性。
👍 6
WordArt (artistic text) features highly customized fonts, textures, and layouts, making WordArt-oriented scene TExt Recognition (WATER) substantially more challenging than general Scene Text Recognition (STR). Existing STR datasets and methods, typically built around regular scene text and fixed-tem
👍 40
We present Wan-Streamer, a native-streaming, end-to-end interactive foundation model designed from the ground up for real-time, low-latency, full-duplex audio-visual interaction. Wan-Streamer seamlessly models language, audio, and video as both input and output within a single Transformer, where the
👍 1
Long-term memory promises LLM agents that grow more capable across sessions, maintaining an accurate, evolving understanding of the user that interaction forms. In practice, however, this memory is evaluated mostly through downstream behavior, such as later answers, personalization quality, or task
👍 1
Long-horizon agents depend on context management: systems compress, summarize, and evict old tokens so tasks can continue beyond finite windows. That is safe only when dropped information is no longer needed or has been internalized. Plans are the stress case: they are written early, used for many s
👍 5
On-policy distillation (OPD) improves LLM reasoning by training a student model on its own generated outputs, but standard OPD treats all student-generated outputs (SGOs) equally regardless of their informativeness. We observe a consistent asymmetry in controlled filtering experiments: in both OPD a
👍 10
The Hitchhiker's Guide to Agentic AI is a comprehensive practitioner's reference for building autonomous AI systems. The book covers the full stack from first principles to production deployment, organized around a central thesis: building great agentic systems requires understanding every layer of
👍 6
Scaling reinforcement learning for visual mathematical reasoning requires more than generating harder questions: as data volume grows, the reward labels themselves must remain reliable. Yet existing data pipelines scale supervision while trusting the labeller, and policy-side methods assume the unde
👍 16
What is an agent? What constitutes agency? With the rise of Large Language Model (LLM) systems marketed as ``coding agents'', ``AI co-scientists'', and other ``agentic" tools that promise to drive up productivity, and at the same time, ``existential" concerns such as AI escaping human control with d
👍 14
Modern text-to-image models excel in visual fidelity and prompt adherence. However, this strict adherence comes at the cost of diversity: generated samples tend to collapse into a single visual interpretation. Existing methods to improve diversity produce outputs driven by incidental variations rath
👍 7
Chain-of-Thought (CoT) has become a standard method for improving reasoning capabilities in large language models (LLMs) by eliciting step-by-step thinking, but its effectiveness in multimodal tasks remains unclear. In this paper, we aim to systematically investigate the key question: What can multi
👍 0
Dynamic 3D Gaussian splatting faces a fundamental tension between motion consistency and visual fidelity. Deformation-based approaches preserve temporal correspondence but suffer from motion over-factorization, oversmoothing high-frequency dynamics. In contrast, 4D-primitive methods capture fine vis
👍 3
AI agents acting on behalf of users are constantly making decisions, and for users to trust their agents, those decisions must align with what they actually want. Privacy is an important alignment problem for agents: every message, post, or tool call an agent makes is a contextual judgment about wha
👍 19
Generating a coherent multi-shot video requires structured cross-shot memory. Subject appearance, scene context, and speaker identity must persist across cuts. Existing approaches either train end-to-end over fixed-length sequences and cannot scale, generate shot-by-shot with memory banks that grow
👍 1
Continual Test-Time Adaptation (CTTA) aims to maintain model performance under evolving target domains by adapting online without labeled data. However, practical deployments often cannot retain the source dataset due to privacy or licensing constraints, and purely source-free CTTA methods tend to b
👍 4
As LLM agents increasingly select tools autonomously, their choices among tools with different privileges become safety-relevant. However, prior tool-selection studies focus on safety-agnostic metadata preferences, leaving privilege-sensitive choices underexplored. To address this gap, we study over
👍 27
While Large Language Models (LLMs) have substantially advanced text-to-code synthesis, many real programming tasks specify intent through visual artifacts such as screenshots, charts, vector drawings, videos, and interactive states. These tasks require models to connect visual perception to executab
👍 5
Retrieving external knowledge is essential for solving real-world tasks, yet it remains challenging when the relationship between a query and its relevant knowledge involves implicit and complex reasoning beyond surface-level semantic or lexical matching (e.g., mathematical problems relying on the s
👍 0
Trust in an AI system is often anchored by explanations of how it works, which one then uses to forecast its behavior on new inputs. For large reasoning models (LRMs), this conventional route is particularly difficult to follow: explanation methods for single token generations do not naturally gener
Safe agent spend from the terminal
Describe your app and Blop tests it and repairs broken tests
Let AI agents run your next deal, fundraise or data room
Learn to build AI agents by actually building them
Generate UI prototypes, videos, and posters with AI
Build agents & apps on top of your context with one prompt.
Real-time ASL alphabet recognition in py ,pip install and go
The always-on computer for your coding agents
Build a web app by talking through a meeting
Let AI agents see cross repo and maintain session memory.
@AnatoliKopadze · 83.0K 粉丝 · 1.3M 阅 · 584 赞 · 70 转
AI has been in everyone's hands for years. Most people who use it every day still use it the slowest way there is: type a request, wait, fix it, ask again, all by hand. Not because the faster way is
中文介绍 介绍AI「循环」(loops)概念,指出多数用户仍以低效手动方式使用AI,而通过自动化循环机制,可实现更高效的AI交互与修复,提及Claude、GPT、Mira等工具。旨在提升AI使用效率。
@undefinedKi · 3.9K 粉丝 · 1.0M 阅 · 601 赞 · 78 转
Your best ideas are scattered across a dozen places right now. Notes apps. Browser tabs. Old chats with Claude that you closed and will never find again. Every time you sit down to work, you rebuild
中文介绍 详细教程指导如何利用Claude与Obsidian构建一个「AI第二大脑」,整合零散创意与笔记,实现AI驱动的知识管理系统,并能每日自我学习优化,避免信息碎片化。
@eng_khairallah1 · 69.3K 粉丝 · 678.7K 阅 · 506 赞 · 81 转
Most people are using Claude Opus 4.8 to answer questions. Save this :) A small group of people have it running businesses while they sleep. The difference is not the model. You both have access to
中文介绍 分享40个基于Claude Opus 4.8的自动化工作流,旨在帮助用户在睡眠中也能运营业务并赚取收入,强调其商业应用潜力,而非简单的问答功能,实现被动收益。
@spandan_madan · 1.1K 粉丝 · 626.9K 阅 · 516 赞 · 28 转
AI hardware is having a moment. Hyperscaler capex on AI data centres is on track to clear $690 billion in 2026, and private equity has followed in scale — Blackstone alone reports a $55B+ data-centre
中文介绍 探讨生物细胞与GPU在运行相同算法时的效率差距,结合2026年AI数据中心预计达6900亿美元的资本支出背景,分析AI硬件发展趋势及其与生物计算的对比。
@sairahul1 · 120.1K 粉丝 · 581.3K 阅 · 516 赞 · 110 转
Learning anything today is easy and confusing at the same time. Easy because AI can explain almost anything in seconds. Confusing because most people just ask random questions, get random answers, and
中文介绍 教程分享如何利用Claude将学习效率提高10倍,强调避免随机提问获取碎片化信息,提供一套系统方法以有效利用AI进行深度学习,解决学习效率瓶颈。
@EngramLab · 1.2K 粉丝 · 255.7K 阅 · 537 赞 · 76 转
We’re Engram. We’re building AI that learns from you and deeply understands your work. Today’s AI models don’t understand what you do. Not really. Everything models know comes from their training –
中文介绍 Engram Lab推出新产品「Engram」,该AI旨在通过深入学习用户工作内容,实现对个人语境的深刻理解,突破当前AI模型仅依赖预训练数据的局限性,提供更个性化的服务。
@sairahul1 · 120.1K 粉丝 · 249.0K 阅 · 502 赞 · 90 转
There are 8 billion people on the planet. Only a fraction of developers understand how AI agents actually work. Not the demos. Not the hype. The real engineering underneath. Every week a new agent
中文介绍 分享30个AI智能体工程核心概念,旨在帮助开发者深入理解AI智能体的实际工作原理,超越演示和炒作,掌握其底层工程技术,提升AI开发能力。
@Oracle_Trade_ai · 39.9K 粉丝 · 197.8K 阅 · 2.8K 赞 · 580 转
In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We
中文介绍 宣布「ORACLE」作为官方AI智能体在Polymarket上进行交易。预测到2026年,自主AI智能体将成为预测市场最有效策略之一,届时Polymarket上超30%交易活动将由AI钱包驱动。
@posthog · 21.8K 粉丝 · 162.4K 阅 · 512 赞 · 36 转
When the creators of both OpenClaw and Claude Code speak, people listen. And recently Peter Steinberger and Boris Cherny have both been talking about the same concept: loops. Their argument? You
中文介绍 Posthog团队对AI「循环」(loops)概念持乐观态度,并引用OpenClaw和Claude Code的创建者Peter Steinberger与Boris Cherny的观点,强调其在AI领域的重要性。
@OracAItrading · 31.8K 粉丝 · 141.6K 阅 · 2.8K 赞 · 576 转
In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We
中文介绍 宣布「ORACLE」作为官方AI智能体在Polymarket上进行交易。预测到2026年,自主AI智能体将成为预测市场最有效策略之一,届时Polymarket上超30%交易活动将由AI钱包驱动。
@GoogleAIStudio · 179.4K 粉丝 · 138.2K 阅 · 504 赞 · 42 转
Today we're announcing that the Interactions API has reached general availability and is now our primary API for interacting with Gemini models and agents. We launched its public beta in December
中文介绍 Google AI Studio宣布Interactions API已正式发布,成为与Gemini模型和AI智能体交互的主要接口。该API于去年12月推出公开测试版,现已全面可用。
@Oractrading · 33.9K 粉丝 · 109.2K 阅 · 2.8K 赞 · 585 转
In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We
中文介绍 宣布「ORACLE」作为官方AI智能体在Polymarket上进行交易。预测到2026年,自主AI智能体将成为预测市场最有效策略之一,届时Polymarket上超30%交易活动将由AI钱包驱动。
@RohOnChain · 51.4K 粉丝 · 108.3K 阅 · 501 赞 · 65 转
I will break down exactly how to build the loops that run an entire quant trading system on their own. Let's get straight to it. Bookmark This - I'm Roan, a backend developer working on system
中文介绍 后端开发者Roan详细讲解如何运用「循环工程」(Loop Engineering)技术,构建一个可自我改进的量化交易系统,实现自动化交易策略,值得收藏。
@mvanhorn · 35.2K 粉丝 · 102.4K 阅 · 510 赞 · 56 转
Earlier this month I wrote WTF Is a Loop? Peter Steinberger vs. Boris Cherny, which did 3.6M views on what a loop even is. This is the sequel, and it answers the next question: which loops do people
中文介绍 作为探讨AI「循环」(loops)系列帖的第二部分,该内容揭示了15种当前广泛应用的AI循环工作流,并提供了具体实现指令,以供读者学习和使用。
@omarsar0 · 308.0K 粉丝 · 90.2K 阅 · 504 赞 · 69 转
A claim has been circulating in AI coding circles: stop prompting your coding agents and start designing loops that prompt them for you. As with everything new, this stuff gets repeated often and
中文介绍 探讨AI编程领域从直接提示智能体(prompting agents)向「循环工程」(loop engineering)的转变,倡导设计自动提示智能体的循环机制,提升编程效率。
@Designarena · 13.9K 粉丝 · 80.4K 阅 · 518 赞 · 39 转
GLM 5.2 ranks 1st overall on Design Arena’s single-turn, HTML Web Design (Non-Agentic) evaluation, 5 places higher than its predecessor GLM-5.1. To do so, it beat Claude Fable 5, Opus 4.6, and Opus
中文介绍 GLM-5.2在Design Arena的单轮HTML网页设计(非代理式)评估中排名第一,性能超越前代GLM-5.1,并击败了Claude Fable 5、Opus 4.6和Opus 4.8等模型,展示其卓越能力。
@const_reborn · 29.7K 粉丝 · 79.8K 阅 · 503 赞 · 116 转
e_i \;\propto\; \underbrace{\rho_i \times \bar{p}_i}_{\text{linear (maximize)}} \times \underbrace{(1 - b_i)}_{\text{boolean gate}} Disclaimer: this upgrade only effects subnet owners and dynamic TAO
中文介绍 探讨Subnets与TAO之间的相互作用机制,指出「Subnets挖TAO;TAO挖Subnets」,并提供相关数学公式。此升级主要影响子网所有者和动态TAO持有者。
@philipkiely · 8.6K 粉丝 · 73.1K 阅 · 544 赞 · 36 转
GLM-5.2 is the biggest news in open models since DeepSeek-R1. It’s easy to see why. GLM-5.2 delivers comparable performance to GPT 5.5 and Opus 4.8 at a fraction of the cost, generally 70-80% less
中文介绍 分享如何为GLM-5.2构建全球最快API的经验。GLM-5.2作为开源模型新星,其性能可媲美GPT 5.5和Opus 4.8,但成本仅为其70-80%,提供极高性价比。
@PeterDiamandis · 400.3K 粉丝 · 51.7K 阅 · 551 赞 · 75 转
Elon described the near future as a “supersonic tsunami”: a wave moving so fast and so large that by the time you hear it coming, it has already broken over you. The phrase stuck with me. So let me
中文介绍 Peter Diamandis引用埃隆·马斯克对未来五年的「超音速海啸」描述,指出未来变化将极其迅速且规模庞大,强调我们应提前准备应对,思考未来趋势。
@phosphenq · 12.4K 粉丝 · 49.4K 阅 · 506 赞 · 63 转
Last December, Boris Cherny shipped 259 pull requests in a single month. Every one written by Claude. He says he did not open an editor the whole time. His job was not to write code. It was to write
中文介绍 推广「循环工程」(Loop Engineering)概念,展示如何构建可自主编写代码的AI。博主以Boris Cherny在一个月内通过Claude生成259个PR为例,阐述AI无需手动编写代码的强大效率。
@figma · 564.0K 粉丝 · 1.6M 阅 · 7d 曝光 1.6M
Config 2026: New materials, new tools and a more expressive canvas
@GoogleAIStudio · 179.4K 粉丝 · 41.0K 阅 · 7d 曝光 41.0K
Introducing computer use in Gemini 3.5 Flash
@Tarvi007 · 3.2K 粉丝 · 850.3K 阅 · 7d 曝光 850.3K
How to Spot AI & Bot Accounts on X in 2026
@zachlloydtweets · 11.4K 粉丝 · 159.6K 阅 · 7d 曝光 198.8K
We are now factory engineers, not product engineers
@tslaming · 34.9K 粉丝 · 65.2K 阅 · 7d 曝光 65.2K
Tesla has patented a digital siren that allows car sensors to break the network rules in a crisis
@spandan_madan · 1.1K 粉丝 · 626.9K 阅 · 7d 曝光 626.9K
The efficiency gap: How do cells and GPUs compare when running the exact same algorithm?
@posthog · 21.8K 粉丝 · 162.4K 阅 · 7d 曝光 162.4K
Why we're bullish on loops
@EngramLab · 1.2K 粉丝 · 255.7K 阅 · 7d 曝光 255.7K
Introducing Engram: Scaling compute on your context
@zachlloydtweets · 11.4K 粉丝 · 39.2K 阅 · 7d 曝光 198.8K
Building a skill optimization loop
@amitiitbhu · 23.6K 粉丝 · 35.7K 阅 · 7d 曝光 35.7K
How does vLLM work?
@sairahul1 · 120.1K 粉丝 · 249.0K 阅 · 7d 曝光 249.0K
30 Core Agentic Engineering Concepts Every Developer Should Know
@dashen_wang · 24.0K 粉丝 · 189.6K 阅 · 7d 曝光 189.6K
构架师教程:Foundation Engineering
@const_reborn · 29.7K 粉丝 · 79.8K 阅 · 7d 曝光 79.8K
Subnets mine TAO; TAO mines Subnets
@philipkiely · 8.6K 粉丝 · 73.1K 阅 · 7d 曝光 73.1K
How we built the world’s fastest API for GLM-5.2
中文介绍 该短视频展示了强大的AI智能体如何在Slack协作平台内运作,能够理解指令、执行任务并辅助团队沟通,显著提升工作效率。
中文介绍 AI智能体领域迎来重大变革,视频探讨了GLM 5.2、Codex Skills、Claude及Cursor等新技术的出现,预示智能体能力和应用模式的深刻演进。
中文介绍 Claude AI推出新功能,用户可直接在现有工作环境中“@”Claude,让其参与到日常对话与任务中,提供即时智能辅助。
中文介绍 Claude Cowork平台推出新功能,用户可在其中便捷地委派和安排各项任务,通过AI辅助实现更高效的工作流程管理。
中文介绍 Claude Code引入“Artifacts”功能,允许开发者在代码编写和调试过程中实时分享工作成果、代码片段或中间件,以促进团队协作。
中文介绍 针对MCP(多云平台)连接器,该功能提供企业级认证管理,旨在保障数据安全性,并简化大型机构在多云环境下的集成配置。
中文介绍 Claude AI推出新功能,用户可直接在现有工作环境中“@”Claude,让其参与到日常对话与任务中,提供即时智能辅助。
中文介绍 Claude Cowork平台推出新功能,用户可在其中便捷地委派和安排各项任务,通过AI辅助实现更高效的工作流程管理。
中文介绍 Claude Code引入“Artifacts”功能,允许开发者在代码编写和调试过程中实时分享工作成果、代码片段或中间件,以促进团队协作。
中文介绍 针对MCP(多云平台)连接器,该功能提供企业级认证管理,旨在保障数据安全性,并简化大型机构在多云环境下的集成配置。
中文介绍 DeepSeek声称已成功解决人工智能领域一个价值“十亿美元”的难题。具体细节未披露,但暗示在AI效率或成本效益方面取得重大突破。
中文介绍 科学家们成功发现了一种更优化的AI智能体编程语言,有望显著提升智能体间的沟通效率与任务执行能力,推动AI代理技术发展。
中文介绍 Hugging Face推出了一个新功能,允许用户通过一条命令在HF Jobs上运行vLLM服务器,大大简化了大型语言模型服务的部署流程。
中文介绍 Hugging Face与AllenAI合作研究混合模型在Token预测方面的表现。文章探讨了混合模型如何以及在何种情况下能更好地预测特定Token,以优化模型性能和效率。
Artificial intelligence is rapidly reshaping retail, but not in the ways consumers might immediately notice. The biggest transformation may not be flashy virtual try-ons or chatbot shopping assistants, but in how decisions are made behind the scenes: how products surface in search results, how inven
中文介绍 麻省理工科技评论指出,AI正深刻重塑零售业,其主要变革并非消费者可见的虚拟试穿或聊天机器人,而是幕后决策过程,例如商品在搜索中的呈现方式,以此提升运营效率。
Move over, Harness Engineering, it is time for the harness of harnesses!
中文介绍 Latent Space的AINews报道了“Meta-Harness Summer”概念,暗示AI领域正在转向更高级、更全面的“Harness”工程,可能指代一种集成或管理多种AI工具和系统的元框架。
A new OpenAI research paper shows how AI agents are transforming work, enabling longer, more complex tasks and expanding productivity across roles.
中文介绍 OpenAI最新研究论文指出,AI智能体正通过赋能更长、更复杂的任务,并提高不同岗位的生产力,从而深刻改变工作模式,预示着未来工作方式的转型。
中文介绍 TLDR AI报道了多则AI新闻:OpenAI与Broadcom合作推出“Jalapeño”AI推理芯片;Anthropic与阿里巴巴发生指控事件;以及Google DeepMind将“Computer Use”功能引入Gemini 3.5 Flash模型。
In a rare double-interview, the Databricks technical leaders riff on what it will take for every company to build Agent Clouds
中文介绍 Databricks技术领导者Matei Zaharia和Reynold Xin在采访中强调,未来前沿AI生态系统必须保持开放性,并探讨了如何帮助每家公司构建“智能体云”(Agent Clouds)的策略和必要条件。
中文介绍 Google DeepMind宣布为Gemini 3.5 Flash模型引入“Computer Use”功能,使其能够直接与计算机交互执行任务,从而扩展了模型的应用能力和实用性。
中文介绍 Hugging Face与NVIDIA合作,利用NVIDIA NeMo AutoModel加速Transformer模型的微调过程,旨在提高开发效率并优化AI模型的性能。
AI is booming. New use cases are emerging each day. To capitalize on the technology’s potential, enterprises require data at scale. In many cases, though, the relevant information is blocked or unstructured, which limits its use by AI models. To understand this challenge, consider the foundation of
中文介绍 麻省理工科技评论指出,随着AI的蓬勃发展,企业需要大规模数据支持,但现有网络数据常受阻或非结构化。文章探讨了为AI构建网络数据基础设施层的重要性,以解决数据获取和利用的挑战。
Claude finally gets a Slackbot upgrade
中文介绍 Latent Space报道,Anthropic的AI模型Claude通过“Claude Tag”功能获得Slackbot升级,支持多玩家、主动式和持久性智能体协作,增强了在企业通信平台中的AI能力。
OpenAI and Broadcom introduce Jalapeño, a custom AI chip built for LLM inference to improve performance, efficiency, and scale across AI systems.
中文介绍 OpenAI与Broadcom联合发布了名为“Jalapeño”的定制AI芯片。这款芯片专为大型语言模型(LLM)推理设计,旨在显著提升AI系统的性能、效率和规模。
**OpenAI** announced **Jalapeño**, its first custom AI chip for LLM inference, built with **Broadcom**, aiming to control more of the AI stack and improve compute economics with a fast 9-month design cycle. Community analysis suggests Jalapeño features **216GB HBM3E**, **~7.1–7.4 TB/s bandwidth**, a
中文介绍 OpenAI宣布与Broadcom合作推出其首款定制AI推理芯片“Jalapeño”,旨在优化LLM推理性能并掌握更多AI技术栈。该芯片在9个月内完成设计,社区分析显示其配备216GB HBM3E内存。
Agent identity in Claude Tag: a new access model for autonomous, team-wide AI
中文介绍 Claude博客介绍了“Claude Tag”中的智能体身份(Agent identity)功能,这是一种新的访问模型,旨在支持自主且团队范围的AI协作,从而提高大型团队中AI智能体的可管理性和安全性。
Building effective human-agent teams
中文介绍 Claude博客探讨了如何构建高效的人工智能智能体(human-agent)团队。文章分析了人类与AI智能体协作的关键要素,旨在优化团队工作流程并提升整体生产力。
19 回复 · 程序员 节点
8 回复 · 程序员 节点
32 回复 · Apple 节点
15 回复 · 程序员 节点
7 回复 · Apple 节点
26 回复 · 程序员 节点
9 回复 · Apple 节点
10 回复 · Apple 节点
15 回复 · Apple 节点
6 回复 · Apple 节点
刚打算给新的任务弄个GLM5.2的API给新的任务对接上,然后美美睡觉,结果发现好热闹,我买的是给邮箱的,但我说实话,就算是你给支付链接也差不多,很快就会被封的,太变态了,API评论区越来越多受害者了 这个店铺已经被迫关停了 126 个帖子 - 71 位参与者 阅读完整话题
从 【哲のgrok】今天的grok和无限Gemini、grok key的使用反馈贴 - 福利羊毛 / 福利羊毛, Lv1 - LINUX DO and 【哲のgrok】今日一百个普号+限时无限量grok、Gemini(方便大家直接用 - 福利羊毛 / 福利羊毛, Lv1 - LINUX DO and 【哲のgrok&Gemini】之前的无限grok、Gemini大家蹬的如何?顺便奉上这次的限时无限量 - 福利羊毛 - LINUX DO and 【哲のgrok&Gemini】今日一百个普号+无限量Grok、Gemini自取【已全复活】 - 福利羊毛 / 福利羊毛, Lv1 - LINUX DO
本帖使用社区公益推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的项目是免费使用的,无收费(变相收费、赞助)部分: 是 我的帖子已经打上 公益推广 标签: 是 我的项目属于个人项目,与公司或商业机构无关: 是 我的项目不存在QQ、TG等群组引流: 是 我的项目不存在非运营必要的网站引流: 是 / 否 我的项目不存在为他人推广、AFF: 是 我的项目无关联的商业项目: 是 我的站点存在登录,并已接入 LINUX DO Connect: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润
53 个帖子 - 48 位参与者 阅读完整话题
从 『富可敌国』『高级推广』只需要一个创意,剩下的交给星辰~即梦,创造你的梦~ 继续讨论: 海外版本即梦全量上线 dreamina-seedance-2-0-260128 dreamina-seedance-2-0-fast-260128 dreamina-seedance-2-0-mini-260615 价格 一秒大约1人民币,具体计费完全基于 total_token计算,和火山一致 我们的优势 不用排队 审核围栏低 并发高 支持对公转账和企业对接 进入 Seedance · AI 视频生成 使用文档 ShowDoc 官网 New API 技术支持 30 个帖子 - 25 位参与者 阅读完整
事情是这样的,我们是未上市的国资企业,同事小我几岁,当时是应届生进的公司,现在已经来了4年了,他们同期的小伙伴都走的差不多了。 他从24年开始上班炒股,然后加班炒股卷绩效,公司绩效跟工时正相关,所以他绩效一直还不错。前面还好,工作也能按时完成,也能出差去客户现场抗压力。 到今年开始愈演愈烈,上班就一直在看手机,安排的工作也是很敷衍的完成。上班时间喊他也是爱理不理,休息时间跟他说话他就跟我说他今天赚了几千,几万,说今年已经赚了一辆su7了。从他口里感觉这些工作都没意义,AI代替的也很快,35岁被裁一场空,卷了半天不如他一天的收入。现在就等着公司裁员拿赔偿专心炒股。现在班也不加了,出问题也找不到人
先说我目前的情况,目前手里有两个正在实盘的策略,低频的收益过去30天收益14%,中频的收益过去30天20%。 单纯是个人散修玩量化(币圈),研学了差不多两年,从合约到杠杆到爆仓,最后选择避免情绪交易,一切交给程序。所以如果有佬,希望嘴下留情。 学习路线1:b站学量化基础概念–>youtube学看别人量化策略–>先复现别人的策略(我复现了7个)–>在Tradingview上看回测结果–>利用AI优化策略–>放弃所有策略。 当自己尝试了很多别人的策略以后会发现,真正赚钱的策略人家肯定不会公开,他们公开的必定只是部分,可能会存在一些指标参数or隐藏了关键逻辑,所以还是得研发自己的策略。 学习路线2:
大家都在聊怎么薅Pixel号,但是正儿八经(并不是)聊Pixel手机的帖子好像没有。作为从Nexus一路过来的活化石,我感觉这个重任落在了我肩上(自动滑肩:) 来到6月的尾巴,谷歌好像泄了气,Gemini 3.5 Pro难产,Antigravity开始摆烂。 去年的美国甜心,今年被调侃是美国豆包。这个AI时代,强者为王,也抢着为王,慢一步就是海量的用户流失。 忠诚度不如上下文长度。 但是谷歌毕竟还是互联网老钱,搜索,邮箱,YouTube,相册,大把你用了就离不开的产品。 比如我就离不开Pixel手机,因为上面所有服务都和Pixel完美契合。还有更好用的Gemini(端侧模型),免费的你懂的,纯
在站内看见有意思的NSFW帖就展示给女朋友看来着 结果她说我脑袋里整天不是屎就是黄 转念一想还真是 我脑子里全是始皇 67 个帖子 - 62 位参与者 阅读完整话题
本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 自从上两个帖子发表之后 【开源】受够 B 站"猜你喜欢”,我自己用新思路写了一个私有的bilibili推荐系统开源平替 ,【开源推广】打破信息茧房,用OpenBiliClaw养成专属于你的全网内容发现Agent ,有越来越多的用户来使用Openbiliclaw,也得到很多大佬的支
12 points · 0 comments
9 points · 1 comments
59 points · 6 comments
40 points · 26 comments
179 points · 16 comments
26 points · 6 comments
26 points · 4 comments
1 points · 0 comments
Hi HN, Nick here. We’re launching OpenKnowledge (https://openknowledge.ai/), a “what you see is what you get” markdown editor that has direct integrations with Claude, Codex, and Cursor. Available as MacOS app or CLI. Fully free/local and OSS (https://github.com/in
Preprint: https://scrollprize.org/pdf/main.pdfhttps://github.com/ScrollPrize/villa
225 points · 132 comments
149 points · 21 comments
196 points · 78 comments
594 points · 142 comments
88 points · 186 comments
https://9to5mac.com/2026/06/25/apple-price-increases-mac-ipa...
228 points · 108 comments
35 points · 8 comments
24 points · 6 comments
84 points · 23 comments
159 points · 81 comments
15 points · 4 comments
45 points · 9 comments
19 points · 18 comments
235 points · 103 comments
74 points · 30 comments
20 points · 29 comments
https://archive.ph/aPMAr
168 points · 63 comments
https://www.science.org/doi/10.1126/science.aea4922
今天的AI世界充满了创新与变革的活力,核心主题围绕着「智能体」的深化应用、底层「硬件」的突破,以及在实际场景中效率与协作的提升。OpenAI与Broadcom联手推出的Jalapeño定制芯片,标志着大模型推理效率进入新阶段,而Google Gemini 3.5 Flash的「Computer Use」功能则进一步拓展了模型与外部环境交互的能力。同时,Anthropic的Claude在团队协作方面带来了多项智能体功能升级,如Agent Identity和Cowork,极大提升了企业级AI应用的可管理性和安全性。更深层次的,学术界和开发者社区正积极探索「智能体工程」和「循环工程」等前沿范式,旨在构建能够自我优化、自主执行任务的AI系统。从宏观的行业变革趋势,到微观的个人效率提升,今日资讯描绘了一幅AI正从单点突破走向全面系统化、智能化协作的未来图景。
OpenAI与Broadcom合作发布了名为「Jalapeño」的定制AI推理芯片。这款芯片专为大型语言模型(LLM)的推理任务设计,旨在显著提升AI系统的性能、效率和可扩展性,并在短短九个月内完成设计。社区分析显示该芯片配备216GB HBM3E内存,标志着OpenAI在掌握AI技术栈和优化LLM推理方面迈出了重要一步。
Google DeepMind为Gemini 3.5 Flash模型引入了革命性的「Computer Use」功能。这项新能力允许模型直接与计算机系统交互并执行任务,从而大幅扩展了其应用场景和实用性。这一更新使Gemini 3.5 Flash能够进行更复杂的自动化操作,例如浏览网页、操作软件,预示着AI模型与数字环境交互方式的重大飞跃。
GLM-5.2模型在Design Arena的单轮HTML网页设计评估中表现卓越,排名第一,成功击败了Claude Fable 5、Opus 4.6和Opus 4.8等主流模型,展现了其在设计领域的强大能力。同时,相关团队还分享了如何为GLM-5.2构建全球最快API的经验,指出其性能可媲美GPT 5.5和Opus 4.8,但成本仅为其70-80%,提供了极高的性价比。
AI研究机构DeepSeek声称已成功解决人工智能领域一个价值高达「十亿美元」的重大难题。尽管具体细节尚未完全披露,这一声明暗示DeepSeek在AI的效率或成本效益方面取得了突破性进展,可能对大模型的训练、部署或推理成本产生深远影响。此举预示着AI技术在商业应用和规模化发展上的一个重要里程碑。
Anthropic的Claude博客和YouTube视频共同揭示了Claude在智能体协作与团队管理方面的多项重大更新。通过「Claude Tag」引入智能体身份(Agent identity)功能,支持自主且团队范围的AI协作,提升大型团队中AI智能体的可管理性和安全性。此外,Claude Cowork平台新增任务委派和安排功能,并在Claude Code中推出「Artifacts」特性,允许实时分享工作成果,同时支持企业级认证管理,全面优化了企业级AI助手的集成与协作体验。
Google AI Studio宣布Interactions API已正式发布,成为用户与Gemini模型和AI智能体交互的主要接口。该API于去年12月推出公开测试版,现在已全面可用,为开发者提供了一个稳定、高效的平台,以构建和部署基于Gemini模型的创新应用和智能体解决方案。此举将进一步推动Gemini生态系统的发展及其在各类应用场景中的集成。
AWS Agent Toolkit for AWS已在GitHub上开源,它提供了官方支持的MCP服务器、技能和插件,旨在帮助AI智能体在AWS云平台上构建应用。该工具包简化了AI智能体与AWS服务的集成,使开发者能够更高效地利用AWS基础设施来部署、管理和扩展智能体驱动的解决方案。这为在AWS生态中开发AI智能体应用的工程师提供了强大支持。
ORACLE作为官方AI智能体已正式在预测市场平台Polymarket上进行交易。这一举动预示着到2026年,自主AI智能体将成为预测市场中最有效的策略之一,届时Polymarket上超过30%的交易活动预计将由AI钱包驱动。此项目旨在利用AI技术赋能预测市场,提升交易效率和准确性,开启AI在金融预测领域的新篇章。
OpenAI最新研究论文指出,AI智能体正通过赋能更长、更复杂的任务,并提高不同岗位的生产力,从而深刻改变工作模式,预示着未来工作方式的转型。报告强调,智能体不仅能自动化重复性工作,还能在决策和创新方面提供支持,促使企业重新思考组织结构和人才培养策略,以适应AI驱动的新型协作范式。
Databricks技术领导者Matei Zaharia和Reynold Xin在Latent Space的采访中强调,未来前沿AI生态系统必须保持开放性,这对于推动创新和广泛应用至关重要。他们深入探讨了如何帮助每家公司构建「智能体云」(Agent Clouds)的策略和必要条件,旨在为企业提供一个集成、可扩展的平台,以充分利用AI智能体的潜力,加速数据驱动的决策和业务转型。
麻省理工科技评论指出,AI正深刻重塑零售业,其主要变革并非消费者可见的虚拟试穿或聊天机器人,而是幕后决策过程。例如,AI能够优化商品在搜索结果中的呈现方式、精细化库存管理、自动化供应链决策以及个性化定价策略。这些后台的AI应用极大地提升了零售运营效率、降低了成本,并改善了客户体验,成为零售业数字化转型的核心驱动力。
GitHub项目和AttentionVC推文深入探讨了Claude Code的最佳实践,指导开发者如何从「随意编码」(vibe coding)过渡到结构化的「智能体工程」(agentic engineering)。文章通过一系列实践案例,帮助用户充分发挥大模型在编程中的潜力,并分享了30个AI智能体工程核心概念,旨在帮助开发者深入理解AI智能体的实际工作原理,提升AI开发能力和效率。
多位X·KOL深入探讨了AI「循环工程」(Loop Engineering)的概念及其应用。该方法旨在通过设计自动提示智能体的循环机制,实现AI系统从被动响应到主动决策和自我改进的转变。例如,后端开发者Roan分享了如何运用循环工程构建可自我改进的量化交易系统,而Boris Cherny在一个月内通过Claude生成259个PR的案例,则展示了该技术在自动化代码编写和提升开发效率方面的巨大潜力。
一项研究探讨了大型语言模型(LLM)智能体内存系统的最新发展。智能体的内存已从简单的检索增强机制迅速演变为一个全面的数据管理系统,支持智能体执行过程中的信息持久存储、检索、更新、整合和动态生命周期治理。该论文讨论了这种演变带来的机遇和挑战,强调了为智能体构建更高级、更智能的内存管理系统对未来AI应用的重要性。
详细教程指导用户如何利用Claude与Obsidian构建一个能够每日自我学习优化的「AI第二大脑」,整合零散创意与笔记,实现AI驱动的知识管理系统。同时,另有教程分享了如何通过系统化方法而非随机提问,利用Claude将学习效率提高10倍,帮助用户有效利用AI进行深度学习,解决信息碎片化和学习效率瓶颈问题。