每日 AI 简报

2026-06-26(内容获取于 06/26 06:31)

OpenAI与博通合作推出“Jalapeño”AI推理芯片

OpenAI News · 06/24 14:00

OpenAI与Broadcom联合发布了名为「Jalapeño」的定制AI芯片。这款芯片专为大型语言模型(LLM)推理设计,旨在显著提升AI系统的性能、效率和规模,是OpenAI在AI硬件领域的最新布局。(多家报道)

推荐理由:这是AI硬件发展的重要信号,标志着OpenAI深入芯片领域,对行业格局产生重大影响。

Google DeepMind为Gemini 3.5 Flash引入“计算机使用”功能

DeepMind Blog · 06/25 00:30

Google DeepMind宣布为Gemini 3.5 Flash模型引入「Computer Use」功能,使其能够直接与计算机交互执行任务,从而扩展了模型的应用能力和实用性。

推荐理由:此功能显著拓展了大模型的应用能力,使其能执行更复杂、更实际的任务,对开发者和AI用户有明确启示。

Claude Tag推出“智能体身份”模型,提升团队AI协作安全与管理

Claude Blog · 06/24 08:00

Claude博客介绍了「Claude Tag」中的智能体身份(Agent identity)功能,这是一种新的访问模型,旨在支持自主且团队范围的AI协作,从而提高大型团队中AI智能体的可管理性和安全性。

推荐理由:这是大型团队部署AI智能体时在安全与合规方面的重要进展,对企业用户有明确参考价值。

Hugging Face推出新功能,简化vLLM服务器一键部署

Hugging Face Blog · 06/26 08:00

Hugging Face推出了一个新功能,允许用户通过一条命令在HF Jobs上运行vLLM服务器,大大简化了大型语言模型服务的部署流程,降低了部署门槛。

推荐理由:该功能解决了大模型部署的痛点,为开发者提供了直接上手的便利工具,能显著提升开发效率。

OpenMontage:首个开源智能体驱动视频制作系统发布

GitHub Trending

OpenMontage 是首个开源的智能体驱动视频制作系统,集成了12条生产线、52种工具和500多个智能体技能。它能将AI编码助手转化为一个完整的视频制作工作室,自动化和加速视频内容创作。

推荐理由:这是一个实用性极强的AI智能体应用,拓展了视频创作自动化能力,值得视频创作者和开发者关注。

OpenAI研究揭示AI智能体如何重塑工作模式与生产力

OpenAI News · 06/25 10:00

OpenAI最新研究论文指出,AI智能体正通过赋能更长、更复杂的任务,并提高不同岗位的生产力,从而深刻改变工作模式,预示着未来工作方式的转型。

推荐理由:深度解读AI智能体对未来工作的影响,为企业和个人提供了洞察行业趋势的重要参考。

Google发布DESIGN.md规范,提升AI编码智能体设计理解

GitHub Trending

DESIGN.md定义了一套格式规范,旨在帮助编码代理理解并持久化视觉设计系统的结构化信息。它解决了AI在代码生成和UI开发中难以准确遵循品牌指南的问题。

推荐理由:该规范解决了AI在UI开发中保持设计一致性的关键挑战,对AI开发者、前端工程师和设计系统维护者都具有重要价值。

警惕:低价大模型API账号存在风险,用户遭遇“一号多卖”被封

LinuxDo · 06/25 22:23

有用户反映,购买的低价大模型API密钥出现「一号多卖」现象,导致API管理面板沦为评论区,账号迅速被封。提醒消费者警惕此类欺诈行为。

推荐理由:这则警示直接关系到用户的财产安全与使用体验,提醒社区成员避免API密钥购买陷阱,保护自身利益。

演示:强大的AI智能体如何在Slack内部高效协作

Riley Brown (YouTube) · 06/25 06:39

该短视频展示了强大的AI智能体如何在Slack协作平台内运作,能够理解指令、执行任务并辅助团队沟通,显著提升工作效率。

推荐理由:直观展示了AI智能体在实际工作环境中的应用潜力,为企业和团队提供了提升协作效率的思路。

MIT科技评论:AI正通过幕后决策深度重塑零售业运营

MIT Tech Review AI · 06/25 22:22

麻省理工科技评论指出,AI正深刻重塑零售业,其主要变革并非消费者可见的虚拟试穿或聊天机器人,而是幕后决策过程,例如商品在搜索中的呈现方式,以此提升运营效率。

推荐理由:这篇深度分析揭示了AI在传统行业的深层影响,帮助读者超越表面现象,理解AI的真实价值。

google-labs-code/design.md

TypeScript · ★ 19,038 · 🍴 1,637 · 📈 1,407 stars today

A format specification for describing a visual identity to coding agents. DESIGN.md gives agents a persistent, structured understanding of a design system.

中文介绍 DESIGN.md 定义了一套格式规范,旨在帮助编码代理理解并持久化视觉设计系统的结构化信息。通过提供一致的设计语言描述,它解决了AI在代码生成和UI开发中难以准确遵循品牌指南的问题,使AI智能体能更好地融入设计工作流,提升开发效率和设计一致性。适用于AI开发者、前端工程师和设计系统维护者。

calesthio/OpenMontage

Python · ★ 21,962 · 🍴 2,463 · 📈 3,553 stars today

World's first open-source, agentic video production system. 12 pipelines, 52 tools, 500+ agent skills. Turn your AI coding assistant into a full video production studio.

中文介绍 OpenMontage 是首个开源的智能体驱动视频制作系统,集成了12条生产线、52种工具和500多个智能体技能。它能将AI编码助手转化为一个完整的视频制作工作室,覆盖从内容规划到后期制作的全流程,极大地自动化和加速视频内容创作。适用于视频创作者、媒体机构及希望利用AI提升视频制作效率的开发者。

xbtlin/ai-berkshire

Python · ★ 1,796 · 🍴 292 · 📈 201 stars today

AI 时代的伯克希尔:基于 Claude Code 的价值投资研究框架。巴菲特·芒格·段永平·李录四大师方法论 + 多Agent并行研究。| AI-era Berkshire: a value investing research framework built on Claude Code. 4 masters' methodologies + multi-agent adversarial analysis.

中文介绍 AI 时代的伯克希尔是一个基于 Claude Code 的价值投资研究框架。它融合了巴菲特、芒格、段永平、李录四位投资大师的方法论,并通过多Agent并行研究模式,为用户提供深入的金融分析和投资洞察。该项目旨在利用AI技术赋能个人投资者和金融机构,提升其在价值投资领域的决策能力。

mauriceboe/TREK

TypeScript · ★ 6,579 · 🍴 602 · 📈 112 stars today

A self-hosted travel/trip planner with real-time collaboration, interactive maps, PWA support, SSO, budgets, packing lists, and more.

中文介绍 TREK 是一款支持自托管的旅行计划工具,提供实时协作、交互式地图、PWA 支持、SSO 认证、预算管理和打包清单等功能。它解决了团队或家庭旅行规划中信息分散、协作不便的问题,为用户提供了一个集成且私密的解决方案,确保旅行安排井然有序。适合旅行爱好者、团队活动组织者及注重数据隐私的用户。

apple/container

Swift · ★ 43,161 · 🍴 1,266 · 📈 1,366 stars today

A tool for creating and running Linux containers using lightweight virtual machines on a Mac. It is written in Swift, and optimized for Apple silicon.

中文介绍 Apple 的 container 工具专为 Mac 用户设计,能通过轻量级虚拟机创建和运行 Linux 容器。它采用 Swift 语言编写,并针对 Apple Silicon 芯片进行了优化,提供了高性能和低资源消耗的容器化体验。此工具是 macOS 开发者和 DevOps 工程师的理想选择,用于在本地高效搭建和测试 Linux 环境。

JCodesMore/ai-website-cloner-template

TypeScript · ★ 20,353 · 🍴 3,002 · 📈 1,021 stars today

Clone any website with one command using AI coding agents

中文介绍 这个项目是一个利用AI编码智能体实现网站克隆的模板,用户只需一条命令即可快速复制任何网站。它通过自动化代码生成和结构解析,大大简化了网站复制过程,解决了手动克隆耗时费力的问题。适用于前端开发者、设计师以及需要快速构建原型或进行网站分析的用户。

every-app/open-seo

TypeScript · ★ 2,468 · 🍴 294 · 📈 57 stars today

Open source alternative to Semrush and Ahrefs

中文介绍 Open SEO 是 Semrush 和 Ahrefs 等商业 SEO 工具的开源替代品。它旨在提供全面的搜索引擎优化分析功能,帮助网站管理员、营销人员和开发者提升网站在搜索引擎中的排名。通过开源社区的协作,它为用户提供了免费且可定制的SEO解决方案,降低了专业SEO工具的使用门槛。

garrytan/gstack

TypeScript · ★ 115,750 · 🍴 17,159 · 📈 836 stars today

Use Garry Tan's exact Claude Code setup: 23 opinionated tools that serve as CEO, Designer, Eng Manager, Release Manager, Doc Engineer, and QA

中文介绍 gstack 提供了 Garry Tan 针对 Claude Code 的一套独特配置,包含23个角色化的AI工具,分别担任CEO、设计师、工程经理、发布经理、文档工程师和QA等职能。它通过模拟多角色协作,极大地优化了软件开发和管理流程,旨在提升团队效率和项目质量。适合利用AI赋能软件开发全生命周期的团队。

aws/agent-toolkit-for-aws

Python · ★ 1,113 · 🍴 113 · 📈 15 stars today

Official, AWS-supported MCP servers, skills, and plugins to help AI agents build on AWS

中文介绍 AWS Agent Toolkit for AWS 提供了官方支持的 MCP 服务器、技能和插件,旨在帮助AI智能体在AWS云平台上构建应用。它简化了AI智能体与AWS服务的集成,使开发者能够更高效地利用AWS基础设施来部署、管理和扩展智能体驱动的解决方案。适用于在AWS生态中开发AI智能体应用的工程师。

mukul975/Anthropic-Cybersecurity-Skills

Python · ★ 21,161 · 🍴 2,439 · 📈 600 stars today

817 structured cybersecurity skills for AI agents · Mapped to 6 frameworks: MITRE ATT&CK, NIST CSF 2.0, MITRE ATLAS, D3FEND, NIST AI RMF & MITRE F3 (Fight Fraud) · agentskills.io standard · Works with Claude Code, GitHub Copilot, Codex CLI, Cursor, Gemini CLI & 20+ platforms · 29 security domains ·

中文介绍 该项目为AI智能体提供了817项结构化的网络安全技能,并将其映射到MITRE ATT&CK、NIST CSF 2.0等六大主流安全框架。这些技能遵循 agentskills.io 标准,旨在赋能AI智能体执行复杂的网络安全任务,从威胁检测、响应到风险管理,提升自动化安全防护能力。适用于网络安全研究员和AI安全解决方案开发者。

alibaba/page-agent

TypeScript · ★ 19,768 · 🍴 1,705 · 📈 196 stars today

JavaScript in-page GUI agent. Control web interfaces with natural language.

中文介绍 Page Agent 是一个基于 JavaScript 的页面内 GUI 智能体,允许用户通过自然语言控制网页界面。它解决了传统点击操作的繁琐性,使用户能够以更直观、更智能的方式与Web应用交互,实现自动化操作和信息提取。适用于前端开发者、QA工程师以及希望提升网页操作效率的普通用户。

IceWhaleTech/CasaOS

Go · ★ 34,766 · 🍴 1,989 · 📈 202 stars today

CasaOS - A simple, easy-to-use, elegant open-source Personal Cloud system.

中文介绍 CasaOS 是一款简单易用、优雅的开源个人云系统。它旨在帮助用户轻松搭建和管理自己的私有云,提供文件存储、应用程序管理等功能,将用户的硬件设备转化为个人数据中心。此项目解决了用户对数据隐私和自主控制的需求,是希望在家中部署NAS或私有云服务的理想选择。

opendatalab/MinerU

Python · ★ 69,490 · 🍴 5,877 · 📈 524 stars today

Transforms complex documents like PDFs and Office docs into LLM-ready markdown/JSON for your Agentic workflows.

中文介绍 MinerU 能够将 PDF、Office 文档等复杂格式的文件转换成 LLM 可理解的 Markdown 或 JSON 格式,从而无缝集成到智能体工作流中。它解决了大型语言模型处理非结构化文档的挑战,极大地提高了从复杂文档中提取信息和知识的效率。适用于AI/LLM开发者、数据科学家和内容分析师。

Free-TV/IPTV

Python · ★ 18,186 · 🍴 2,676 · 📈 141 stars today

M3U Playlist for free TV channels

中文介绍 Free-TV/IPTV 提供了一个包含免费电视频道的 M3U 播放列表。用户可以通过兼容的媒体播放器或智能电视应用直接加载此列表,观看全球范围内的免费直播电视频道。它为寻求免费娱乐内容的用户提供了便捷的解决方案,解决了传统电视收看限制。适用于媒体爱好者和智能家居用户。

shanraisshan/claude-code-best-practice

HTML · ★ 60,471 · 🍴 6,058 · 📈 450 stars today

from vibe coding to agentic engineering - practice makes claude perfect

中文介绍 该项目深入探讨了 Claude Code 的最佳实践,特别是从“随意编码”(vibe coding)过渡到结构化的“智能体工程”(agentic engineering)的方法论。它通过一系列实践案例,指导开发者如何更高效、系统地利用 Claude 进行代码生成和问题解决,帮助用户充分发挥大模型在编程中的潜力。

NanmiCoder/MediaCrawler

Python · ★ 52,725 · 🍴 10,918 · 📈 347 stars today

小红书笔记 | 评论爬虫、抖音视频 | 评论爬虫、快手视频 | 评论爬虫、B 站视频 | 评论爬虫、微博帖子 | 评论爬虫、百度贴吧帖子 | 百度贴吧评论回复爬虫 | 知乎问答文章|评论爬虫

中文介绍 MediaCrawler 是一款多功能的社交媒体爬虫,支持从小红书、抖音、快手、B站、微博、百度贴吧和知乎等平台抓取笔记、视频、帖子及评论数据。它为数据分析、市场研究和内容监控提供了强大的数据采集能力,解决了手动收集社交媒体数据耗时耗力的问题。适用于数据分析师、营销人员和学术研究者。

Constraint Tax in Open-Weight LLMs: An Empirical Study of Tool Calling Suppression Under Structured Output Constraints

👍 0

Tool Calling and Structured Output are two core capabilities of modern Agent systems, yet their interaction under joint deployment conditions remains insufficiently understood. This paper reports a reproducible phenomenon observed in a production Agent system: when Tool Calling and JSON Schema const

中文介绍 一项研究探讨了大型语言模型(LLMs)中工具调用与结构化输出能力在联合部署时的交互。研究发现,在生产级Agent系统中,当施加结构化输出约束时,LLM的工具调用能力会被抑制,这是一个可重现的现象,揭示了这两种核心能力之间的「约束成本」。

MVTrack4Gen: Multi-View Point Tracking as Geometric Supervision for 4D Video Generation

👍 26

Synthesizing a novel-view video from a monocular reference video along a target camera trajectory requires both geometric consistency and motion fidelity with respect to the reference video. Existing methods based on explicit 3D representations are limited by the accuracy of off-the-shelf reconstruc

中文介绍 一项研究提出了MVTrack4Gen方法,利用多视角点跟踪作为几何监督,从单目参考视频沿目标相机轨迹合成新视角视频。该方法旨在提升生成视频的几何一致性和运动保真度,克服了现有基于显式3D表示方法在准确性上的局限。

ShutterMuse: Capture-Time Photography Guidance with MLLMs

👍 37

Real-world photography requires capture-time guidance for both camera framing and subject pose. Yet existing aesthetic cropping benchmarks mainly evaluate post-hoc crop prediction and overlook subject-side recommendations, leaving the capture-time guidance capabilities of multimodal large language m

中文介绍 一项研究提出ShutterMuse,利用多模态大语言模型(MLLMs)为摄影提供拍摄时指导,涵盖相机构图和拍摄对象姿态。该方法旨在弥补现有美学裁剪基准主要评估后期裁剪预测,而忽视对拍摄时指导能力研究的不足。

V-Zero: Answer-Label-Free On-Policy Distillation with Contrastive Evidence Gating for Fine-Grained Visual Reasoning

👍 19

Fine-grained visual reasoning requires multimodal large language models (MLLMs) to identify task-relevant visual evidence and ground their reasoning in local image regions. Existing agentic methods typically rely on reinforcement learning with verifiable rewards or supervised fine-tuning on large-sc

中文介绍 一项研究提出了V-Zero,一种针对细粒度视觉推理的新方法。该方法通过无答案标签的在策略蒸馏和对比证据门控,使多模态大语言模型(MLLMs)能够识别任务相关的视觉证据并将其推理与局部图像区域关联,避免了对可验证奖励强化学习或监督微调的依赖。

TryOnCrafter: Unleashing Camera Trajectories for Realistic Video Virtual Try-on via a Renderable 4D Try-on Proxy

👍 6

While Video Virtual Try-on (VVT) has achieved remarkable progress in synthesizing realistic garment overlays on dynamic subjects, existing paradigms remains fundamentally constrained by a passive dependency on source camera trajectories, failing to accommodate the requisite interactive freedom for o

中文介绍 一项研究推出了TryOnCrafter,旨在通过可渲染的4D虚拟试穿代理,突破现有视频虚拟试穿(VVT)技术对源相机轨迹的被动依赖。该方法旨在实现更逼真的动态主体服装叠加合成,并支持所需的交互式相机移动,提升虚拟试穿的真实感和灵活性。

Autodata: An agentic data scientist to create high quality synthetic data

👍 8

We introduce Autodata, a general method that enables AI agents to act as data scientists who build high quality training and evaluation data. We show how to train (meta-optimize) such a data scientist agent, so that it learns to create even stronger data. We describe the overall formulation, and a s

中文介绍 一项研究提出Autodata,这是一种通用方法,能让AI智能体充当数据科学家,生成高质量的训练和评估用合成数据。研究展示了如何对这些数据科学家智能体进行元优化,使其学习创建更优质的数据集,从而提升数据生成的能力和效率。

Do Thinking Tokens Help with Safety?

👍 1

Today's reasoning models use thinking tokens to attain stronger performance on benchmarks than their instruction-tuned counterparts. It is also generally believed that this more "deliberative" mode should improve alignment and safety, by providing the model a safe space to consider whether its plann

中文介绍 一项研究探讨了推理模型中使用的「思考token」是否能提升模型安全性。当前模型利用思考token在基准测试中表现更强,且普遍认为这种「审慎」模式应能通过提供安全思考空间来改善对齐和安全性。该论文旨在实证研究这一假设。

What Intermediate Layers Know: Detecting Jailbreaks from Entropy Dynamics

👍 3

Jailbreak attacks reveal a persistent weakness in aligned Large Language Models: carefully crafted prompts can elicit policy-violating responses despite safety training. While most defenses operate at the prompt or output level, it remains unclear how harmful intent is encoded within the model's int

中文介绍 一项研究提出通过分析大型语言模型(LLMs)中间层的「熵动态」来检测越狱攻击。该方法旨在解决越狱攻击能够绕过安全训练的难题,并探索有害意图在模型内部的编码方式,而非仅在提示或输出层面进行防御,从而提升模型安全性。

CAVEWOMAN: How Large Language Models Behave Under Linguistic Input and Output Compression

👍 4

"Talk short. Drop grammar. Save token." This caveman style is widely promoted as a way to cut inference cost, but whether it actually saves anything depends on which channel (the user's prompt or the model's response) is being compressed. We present Cavewoman, a two-channel evaluation protocol that

中文介绍 一项名为CAVEWOMAN的研究评估了大型语言模型(LLMs)在语言输入和输出压缩(即「穴居人风格」语言)下的表现。研究探讨了这种被推广为削减推理成本的方法,是否以及如何实际节省token,并分析其对用户提示和模型响应这两个通道的影响。

Are We Ready For An Agent-Native Memory System?

👍 87

Memory for large language model (LLM) agents has rapidly evolved from simple retrieval-augmented mechanisms into a data management system that supports persistent information storage, retrieval, update, consolidation, and dynamic lifecycle governance throughout agent execution. Despite this evolutio

中文介绍 一项研究探讨了大型语言模型(LLM)智能体内存系统的发展。其内存已从简单的检索增强机制迅速演变为一个全面的数据管理系统,支持智能体执行过程中的信息持久存储、检索、更新、整合和动态生命周期治理。该文讨论了这种演变带来的挑战与机遇。

RoPE-Aware Bit Allocation for KV-Cache Quantization

👍 4

Existing low-bit KV-cache quantizers often treat each cached key as a flat vector. Under RoPE, however, a key's contribution to a future attention logit decomposes into a position-dependent sum over two-dimensional frequency blocks. This makes key-cache quantization a block-wise bit-allocation probl

中文介绍 一项研究提出RoPE感知(RoPE-Aware)的KV-缓存量化位分配方法。现有低位KV-缓存量化器常将缓存键视为扁平向量,但在RoPE机制下,键对未来注意力logit的贡献可分解为二维频率块的位移相关和。因此,键缓存量化需要采用分块优化策略。

IV-CoT: Implicit Visual Chain-of-Thought for Structure-Aware Text-to-Image Generation

👍 13

Unified multi-modal large language models (MLLMs) have achieved strong text-to-image generation quality, but still struggle with structure-aware prompt following, where object counts, spatial relations, attribute bindings, and coarse layouts must be preserved. We attribute this limitation in part to

中文介绍 一项研究提出了IV-CoT(隐式视觉思维链)方法,用于结构感知的文本到图像生成。该方法旨在解决多模态大语言模型(MLLMs)在处理需保留物体数量、空间关系、属性绑定和粗略布局等结构化提示时的不足,以提升图像生成的准确性和一致性。

Advancing WordArt-Oriented Scene Text Recognition: Datasets and Methods

👍 6

WordArt (artistic text) features highly customized fonts, textures, and layouts, making WordArt-oriented scene TExt Recognition (WATER) substantially more challenging than general Scene Text Recognition (STR). Existing STR datasets and methods, typically built around regular scene text and fixed-tem

Wan-Streamer v0.1: End-to-end Real-time Interactive Foundation Models

👍 40

We present Wan-Streamer, a native-streaming, end-to-end interactive foundation model designed from the ground up for real-time, low-latency, full-duplex audio-visual interaction. Wan-Streamer seamlessly models language, audio, and video as both input and output within a single Transformer, where the

MEMPROBE: Probing Long-Term Agent Memory via Hidden User-State Recovery

👍 1

Long-term memory promises LLM agents that grow more capable across sessions, maintaining an accurate, evolving understanding of the user that interaction forms. In practice, however, this memory is evaluated mostly through downstream behavior, such as later answers, personalization quality, or task

Plans Don't Persist: Why Context Management Is Load Bearing for LLM Agents

👍 1

Long-horizon agents depend on context management: systems compress, summarize, and evict old tokens so tasks can continue beyond finite windows. That is safe only when dropped information is no longer needed or has been internalized. Plans are the stress case: they are written early, used for many s

ReNIO: Reweighting Negative Trajectory Importance for LLM On-Policy Distillation

👍 5

On-policy distillation (OPD) improves LLM reasoning by training a student model on its own generated outputs, but standard OPD treats all student-generated outputs (SGOs) equally regardless of their informativeness. We observe a consistent asymmetry in controlled filtering experiments: in both OPD a

The Hitchhiker's Guide to Agentic AI: From Foundations to Systems

👍 10

The Hitchhiker's Guide to Agentic AI is a comprehensive practitioner's reference for building autonomous AI systems. The book covers the full stack from first principles to production deployment, organized around a central thesis: building great agentic systems requires understanding every layer of

VeriEvol: Scaling Multimodal Mathematical Reasoning via Verifiable Evol-Instruct

👍 6

Scaling reinforcement learning for visual mathematical reasoning requires more than generating harder questions: as data volume grows, the reward labels themselves must remain reliable. Yet existing data pipelines scale supervision while trusting the labeller, and policy-side methods assume the unde

Critique of Agent Model

👍 16

What is an agent? What constitutes agency? With the rise of Large Language Model (LLM) systems marketed as ``coding agents'', ``AI co-scientists'', and other ``agentic" tools that promise to drive up productivity, and at the same time, ``existential" concerns such as AI escaping human control with d

Semantic Browsing: Controllable Diversity for Image Generation

👍 14

Modern text-to-image models excel in visual fidelity and prompt adherence. However, this strict adherence comes at the cost of diversity: generated samples tend to collapse into a single visual interpretation. Existing methods to improve diversity produce outputs driven by incidental variations rath

Look Light, Think Heavy: What Multimodal Chain-of-Thought Reasoning Can and Cannot Do

👍 7

Chain-of-Thought (CoT) has become a standard method for improving reasoning capabilities in large language models (LLMs) by eliciting step-by-step thinking, but its effectiveness in multimodal tasks remains unclear. In this paper, we aim to systematically investigate the key question: What can multi

Multi4D: High-Fidelity Dynamic Gaussian Splatting via Multi-Level Competitive Allocation

👍 0

Dynamic 3D Gaussian splatting faces a fundamental tension between motion consistency and visual fidelity. Deformation-based approaches preserve temporal correspondence but suffer from motion over-factorization, oversmoothing high-frequency dynamics. In contrast, 4D-primitive methods capture fine vis

PrivacyAlign: Contextual Privacy Alignment for LLM Agents

👍 3

AI agents acting on behalf of users are constantly making decisions, and for users to trust their agents, those decisions must align with what they actually want. Privacy is an important alignment problem for agents: every message, post, or tool call an agent makes is a contextual judgment about wha

UnityShots: Memory-Driven Multi-Shot Audio-Video Generation with Boundary-Aware Gating

👍 19

Generating a coherent multi-shot video requires structured cross-shot memory. Subject appearance, scene context, and speaker identity must persist across cuts. Existing approaches either train end-to-end over fixed-length sequences and cannot scale, generate shot-by-shot with memory banks that grow

Distill Once, Adapt Life-Long: Exploring Dataset Distillation for Continual Test-Time Adaptation

👍 1

Continual Test-Time Adaptation (CTTA) aims to maintain model performance under evolving target domains by adapting online without labeled data. However, practical deployments often cannot retain the source dataset due to privacy or licensing constraints, and purely source-free CTTA methods tend to b

When Lower Privileges Suffice: Investigating Over-Privileged Tool Selection in LLM Agents

👍 4

As LLM agents increasingly select tools autonomously, their choices among tools with different privileges become safety-relevant. However, prior tool-selection studies focus on safety-agnostic metadata preferences, leaving privilege-sensitive choices underexplored. To address this gap, we study over

Beyond NL2Code: A Structured Survey of Multimodal Code Intelligence

👍 27

While Large Language Models (LLMs) have substantially advanced text-to-code synthesis, many real programming tasks specify intent through visual artifacts such as screenshots, charts, vector drawings, videos, and interactive states. These tasks require models to connect visual perception to executab

RL-Index: Reinforcement Learning for Retrieval Index Reasoning

👍 5

Retrieving external knowledge is essential for solving real-world tasks, yet it remains challenging when the relationship between a query and its relevant knowledge involves implicit and complex reasoning beyond surface-level semantic or lexical matching (e.g., mathematical problems relying on the s

Forecasting Future Behavior as a Learning Task

👍 0

Trust in an AI system is often anchored by explanations of how it works, which one then uses to forecast its behavior on new inputs. For large reasoning models (LRMs), this conventional route is particularly difficult to follow: explanation methods for single token generations do not naturally gener

Paybond CLI

Safe agent spend from the terminal

Blop

Describe your app and Blop tests it and repairs broken tests

Papermark Agents

Let AI agents run your next deal, fundraise or data room

Sidegent

Learn to build AI agents by actually building them

Genspark Design

Generate UI prototypes, videos, and posters with AI

Zaro

Build agents & apps on top of your context with one prompt.

Signspell

Real-time ASL alphabet recognition in py ,pip install and go

Grass 2.0

The always-on computer for your coding agents

SayCraft

Build a web app by talking through a meeting

Polygraph

Let AI agents see cross repo and maintain session memory.

Loops explained: Claude, GPT, Mira and what actually works

@AnatoliKopadze · 83.0K 粉丝 · 1.3M 阅 · 584 赞 · 70 转

AI has been in everyone's hands for years. Most people who use it every day still use it the slowest way there is: type a request, wait, fix it, ask again, all by hand. Not because the faster way is

中文介绍 介绍AI「循环」(loops)概念,指出多数用户仍以低效手动方式使用AI,而通过自动化循环机制,可实现更高效的AI交互与修复,提及Claude、GPT、Mira等工具。旨在提升AI使用效率。

How to Build an AI Second Brain With Claude and Obsidian That Gets Smarter Every Day (Full Guide)

@undefinedKi · 3.9K 粉丝 · 1.0M 阅 · 601 赞 · 78 转

Your best ideas are scattered across a dozen places right now. Notes apps. Browser tabs. Old chats with Claude that you closed and will never find again. Every time you sit down to work, you rebuild

中文介绍 详细教程指导如何利用Claude与Obsidian构建一个「AI第二大脑」,整合零散创意与笔记,实现AI驱动的知识管理系统,并能每日自我学习优化,避免信息碎片化。

40 Claude Opus 4.8 Workflows That Make Money While You Sleep

@eng_khairallah1 · 69.3K 粉丝 · 678.7K 阅 · 506 赞 · 81 转

Most people are using Claude Opus 4.8 to answer questions. Save this :) A small group of people have it running businesses while they sleep. The difference is not the model. You both have access to

中文介绍 分享40个基于Claude Opus 4.8的自动化工作流,旨在帮助用户在睡眠中也能运营业务并赚取收入,强调其商业应用潜力,而非简单的问答功能,实现被动收益。

The efficiency gap: How do cells and GPUs compare when running the exact same algorithm?

@spandan_madan · 1.1K 粉丝 · 626.9K 阅 · 516 赞 · 28 转

AI hardware is having a moment. Hyperscaler capex on AI data centres is on track to clear $690 billion in 2026, and private equity has followed in scale — Blackstone alone reports a $55B+ data-centre

中文介绍 探讨生物细胞与GPU在运行相同算法时的效率差距,结合2026年AI数据中心预计达6900亿美元的资本支出背景,分析AI硬件发展趋势及其与生物计算的对比。

How To Learn Anything 10x Faster Using Claude

@sairahul1 · 120.1K 粉丝 · 581.3K 阅 · 516 赞 · 110 转

Learning anything today is easy and confusing at the same time. Easy because AI can explain almost anything in seconds. Confusing because most people just ask random questions, get random answers, and

中文介绍 教程分享如何利用Claude将学习效率提高10倍,强调避免随机提问获取碎片化信息,提供一套系统方法以有效利用AI进行深度学习,解决学习效率瓶颈。

Introducing Engram: Scaling compute on your context

@EngramLab · 1.2K 粉丝 · 255.7K 阅 · 537 赞 · 76 转

We’re Engram. We’re building AI that learns from you and deeply understands your work. Today’s AI models don’t understand what you do. Not really. Everything models know comes from their training –

中文介绍 Engram Lab推出新产品「Engram」,该AI旨在通过深入学习用户工作内容,实现对个人语境的深刻理解,突破当前AI模型仅依赖预训练数据的局限性,提供更个性化的服务。

30 Core Agentic Engineering Concepts Every Developer Should Know

@sairahul1 · 120.1K 粉丝 · 249.0K 阅 · 502 赞 · 90 转

There are 8 billion people on the planet. Only a fraction of developers understand how AI agents actually work. Not the demos. Not the hype. The real engineering underneath. Every week a new agent

中文介绍 分享30个AI智能体工程核心概念,旨在帮助开发者深入理解AI智能体的实际工作原理,超越演示和炒作,掌握其底层工程技术,提升AI开发能力。

ORACLE: Official AI Agents Trade on Polymarket

@Oracle_Trade_ai · 39.9K 粉丝 · 197.8K 阅 · 2.8K 赞 · 580 转

In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We

中文介绍 宣布「ORACLE」作为官方AI智能体在Polymarket上进行交易。预测到2026年,自主AI智能体将成为预测市场最有效策略之一,届时Polymarket上超30%交易活动将由AI钱包驱动。

Why we're bullish on loops

@posthog · 21.8K 粉丝 · 162.4K 阅 · 512 赞 · 36 转

When the creators of both OpenClaw and Claude Code speak, people listen. And recently Peter Steinberger and Boris Cherny have both been talking about the same concept: loops. Their argument? You

中文介绍 Posthog团队对AI「循环」(loops)概念持乐观态度,并引用OpenClaw和Claude Code的创建者Peter Steinberger与Boris Cherny的观点,强调其在AI领域的重要性。

ORACLE: Official AI Agents Trade on Polymarket

@OracAItrading · 31.8K 粉丝 · 141.6K 阅 · 2.8K 赞 · 576 转

In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We

中文介绍 宣布「ORACLE」作为官方AI智能体在Polymarket上进行交易。预测到2026年,自主AI智能体将成为预测市场最有效策略之一,届时Polymarket上超30%交易活动将由AI钱包驱动。

Interactions API: Our primary interface for Gemini models and agents

@GoogleAIStudio · 179.4K 粉丝 · 138.2K 阅 · 504 赞 · 42 转

Today we're announcing that the Interactions API has reached general availability and is now our primary API for interacting with Gemini models and agents. We launched its public beta in December

中文介绍 Google AI Studio宣布Interactions API已正式发布,成为与Gemini模型和AI智能体交互的主要接口。该API于去年12月推出公开测试版,现已全面可用。

ORACLE: Official AI Agents Trade on Polymarket

@Oractrading · 33.9K 粉丝 · 109.2K 阅 · 2.8K 赞 · 585 转

In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We

中文介绍 宣布「ORACLE」作为官方AI智能体在Polymarket上进行交易。预测到2026年,自主AI智能体将成为预测市场最有效策略之一,届时Polymarket上超30%交易活动将由AI钱包驱动。

How To Use Loop Engineering To Build A Self-Improving Quant Trading System

@RohOnChain · 51.4K 粉丝 · 108.3K 阅 · 501 赞 · 65 转

I will break down exactly how to build the loops that run an entire quant trading system on their own. Let's get straight to it. Bookmark This - I'm Roan, a backend developer working on system

中文介绍 后端开发者Roan详细讲解如何运用「循环工程」(Loop Engineering)技术,构建一个可自我改进的量化交易系统,实现自动化交易策略,值得收藏。

WTF Is a Loop? Part 2: The 15 Loops People Are Actually Running (and the Commands to Steal Them)

@mvanhorn · 35.2K 粉丝 · 102.4K 阅 · 510 赞 · 56 转

Earlier this month I wrote WTF Is a Loop? Peter Steinberger vs. Boris Cherny, which did 3.6M views on what a loop even is. This is the sequel, and it answers the next question: which loops do people

中文介绍 作为探讨AI「循环」(loops)系列帖的第二部分,该内容揭示了15种当前广泛应用的AI循环工作流,并提供了具体实现指令,以供读者学习和使用。

From Prompting Agents to Loop Engineering

@omarsar0 · 308.0K 粉丝 · 90.2K 阅 · 504 赞 · 69 转

A claim has been circulating in AI coding circles: stop prompting your coding agents and start designing loops that prompt them for you. As with everything new, this stuff gets repeated often and

中文介绍 探讨AI编程领域从直接提示智能体(prompting agents)向「循环工程」(loop engineering)的转变,倡导设计自动提示智能体的循环机制,提升编程效率。

How GLM-5.2 Beat Fable 5 at Website Design

@Designarena · 13.9K 粉丝 · 80.4K 阅 · 518 赞 · 39 转

GLM 5.2 ranks 1st overall on Design Arena’s single-turn, HTML Web Design (Non-Agentic) evaluation, 5 places higher than its predecessor GLM-5.1. To do so, it beat Claude Fable 5, Opus 4.6, and Opus

中文介绍 GLM-5.2在Design Arena的单轮HTML网页设计(非代理式)评估中排名第一,性能超越前代GLM-5.1,并击败了Claude Fable 5、Opus 4.6和Opus 4.8等模型,展示其卓越能力。

Subnets mine TAO; TAO mines Subnets

@const_reborn · 29.7K 粉丝 · 79.8K 阅 · 503 赞 · 116 转

e_i \;\propto\; \underbrace{\rho_i \times \bar{p}_i}_{\text{linear (maximize)}} \times \underbrace{(1 - b_i)}_{\text{boolean gate}} Disclaimer: this upgrade only effects subnet owners and dynamic TAO

中文介绍 探讨Subnets与TAO之间的相互作用机制,指出「Subnets挖TAO;TAO挖Subnets」,并提供相关数学公式。此升级主要影响子网所有者和动态TAO持有者。

How we built the world’s fastest API for GLM-5.2

@philipkiely · 8.6K 粉丝 · 73.1K 阅 · 544 赞 · 36 转

GLM-5.2 is the biggest news in open models since DeepSeek-R1. It’s easy to see why. GLM-5.2 delivers comparable performance to GPT 5.5 and Opus 4.8 at a fraction of the cost, generally 70-80% less

中文介绍 分享如何为GLM-5.2构建全球最快API的经验。GLM-5.2作为开源模型新星,其性能可媲美GPT 5.5和Opus 4.8,但成本仅为其70-80%,提供极高性价比。

The Next 5 Years: A Supersonic Tsunami

@PeterDiamandis · 400.3K 粉丝 · 51.7K 阅 · 551 赞 · 75 转

Elon described the near future as a “supersonic tsunami”: a wave moving so fast and so large that by the time you hear it coming, it has already broken over you. The phrase stuck with me. So let me

中文介绍 Peter Diamandis引用埃隆·马斯克对未来五年的「超音速海啸」描述,指出未来变化将极其迅速且规模庞大,强调我们应提前准备应对,思考未来趋势。

Loop Engineering: Build an AI That Codes While You Sleep

@phosphenq · 12.4K 粉丝 · 49.4K 阅 · 506 赞 · 63 转

Last December, Boris Cherny shipped 259 pull requests in a single month. Every one written by Claude. He says he did not open an editor the whole time. His job was not to write code. It was to write

中文介绍 推广「循环工程」(Loop Engineering)概念,展示如何构建可自主编写代码的AI。博主以Boris Cherny在一个月内通过Claude生成259个PR为例,阐述AI无需手动编写代码的强大效率。

How does vLLM work?

@amitiitbhu · 23.6K 粉丝 · 35.7K 阅 · 7d 曝光 35.7K

How does vLLM work?

Poweful Agents inside Slack

中文介绍 该短视频展示了强大的AI智能体如何在Slack协作平台内运作,能够理解指令、执行任务并辅助团队沟通,显著提升工作效率。

Tag Claude in, right where you already work

中文介绍 Claude AI推出新功能,用户可直接在现有工作环境中“@”Claude,让其参与到日常对话与任务中,提供即时智能辅助。

Delegate and schedule tasks in Claude Cowork

中文介绍 Claude Cowork平台推出新功能,用户可在其中便捷地委派和安排各项任务,通过AI辅助实现更高效的工作流程管理。

Artifacts in Claude Code: share your work as it happens

中文介绍 Claude Code引入“Artifacts”功能,允许开发者在代码编写和调试过程中实时分享工作成果、代码片段或中间件,以促进团队协作。

Enterprise-managed auth for MCP connectors

中文介绍 针对MCP(多云平台)连接器,该功能提供企业级认证管理,旨在保障数据安全性,并简化大型机构在多云环境下的集成配置。

Tag Claude in, right where you already work

中文介绍 Claude AI推出新功能,用户可直接在现有工作环境中“@”Claude,让其参与到日常对话与任务中,提供即时智能辅助。

Delegate and schedule tasks in Claude Cowork

中文介绍 Claude Cowork平台推出新功能,用户可在其中便捷地委派和安排各项任务,通过AI辅助实现更高效的工作流程管理。

Artifacts in Claude Code: share your work as it happens

中文介绍 Claude Code引入“Artifacts”功能,允许开发者在代码编写和调试过程中实时分享工作成果、代码片段或中间件,以促进团队协作。

Enterprise-managed auth for MCP connectors

中文介绍 针对MCP(多云平台)连接器,该功能提供企业级认证管理,旨在保障数据安全性,并简化大型机构在多云环境下的集成配置。

DeepSeek Just Solved AI's Billion Dollar Problem

中文介绍 DeepSeek声称已成功解决人工智能领域一个价值“十亿美元”的难题。具体细节未披露,但暗示在AI效率或成本效益方面取得重大突破。

Scientists Found A Better Language For AI Agents

中文介绍 科学家们成功发现了一种更优化的AI智能体编程语言,有望显著提升智能体间的沟通效率与任务执行能力,推动AI代理技术发展。

Run a vLLM Server on HF Jobs in One Command

中文介绍 Hugging Face推出了一个新功能,允许用户通过一条命令在HF Jobs上运行vLLM服务器,大大简化了大型语言模型服务的部署流程。

Which tokens does a hybrid model predict better?

中文介绍 Hugging Face与AllenAI合作研究混合模型在Token预测方面的表现。文章探讨了混合模型如何以及在何种情况下能更好地预测特定Token,以优化模型性能和效率。

Repositioning retail for the AI era

Artificial intelligence is rapidly reshaping retail, but not in the ways consumers might immediately notice. The biggest transformation may not be flashy virtual try-ons or chatbot shopping assistants, but in how decisions are made behind the scenes: how products surface in search results, how inven

中文介绍 麻省理工科技评论指出,AI正深刻重塑零售业,其主要变革并非消费者可见的虚拟试穿或聊天机器人,而是幕后决策过程,例如商品在搜索中的呈现方式,以此提升运营效率。

[AINews] It's Meta-Harness Summer

Move over, Harness Engineering, it is time for the harness of harnesses!

中文介绍 Latent Space的AINews报道了“Meta-Harness Summer”概念,暗示AI领域正在转向更高级、更全面的“Harness”工程,可能指代一种集成或管理多种AI工具和系统的元框架。

How agents are transforming work

A new OpenAI research paper shows how AI agents are transforming work, enabling longer, more complex tasks and expanding productivity across roles.

中文介绍 OpenAI最新研究论文指出,AI智能体正通过赋能更长、更复杂的任务,并提高不同岗位的生产力,从而深刻改变工作模式,预示着未来工作方式的转型。

Why the Frontier Ecosystem must be Open — Matei Zaharia and Reynold Xin, Databricks

In a rare double-interview, the Databricks technical leaders riff on what it will take for every company to build Agent Clouds

中文介绍 Databricks技术领导者Matei Zaharia和Reynold Xin在采访中强调,未来前沿AI生态系统必须保持开放性,并探讨了如何帮助每家公司构建“智能体云”(Agent Clouds)的策略和必要条件。

Introducing computer use in Gemini 3.5 Flash

中文介绍 Google DeepMind宣布为Gemini 3.5 Flash模型引入“Computer Use”功能,使其能够直接与计算机交互执行任务,从而扩展了模型的应用能力和实用性。

The emergence of the web data infrastructure layer for AI

AI is booming. New use cases are emerging each day. To capitalize on the technology’s potential, enterprises require data at scale. In many cases, though, the relevant information is blocked or unstructured, which limits its use by AI models. To understand this challenge, consider the foundation of

中文介绍 麻省理工科技评论指出,随着AI的蓬勃发展,企业需要大规模数据支持,但现有网络数据常受阻或非结构化。文章探讨了为AI构建网络数据基础设施层的重要性,以解决数据获取和利用的挑战。

[AINews] Claude Tag: Multiplayer, Proactive, Persistent Agents in Slack

Claude finally gets a Slackbot upgrade

中文介绍 Latent Space报道,Anthropic的AI模型Claude通过“Claude Tag”功能获得Slackbot升级,支持多玩家、主动式和持久性智能体协作,增强了在企业通信平台中的AI能力。

OpenAI and Broadcom unveil LLM-optimized inference chip

OpenAI and Broadcom introduce Jalapeño, a custom AI chip built for LLM inference to improve performance, efficiency, and scale across AI systems.

中文介绍 OpenAI与Broadcom联合发布了名为“Jalapeño”的定制AI芯片。这款芯片专为大型语言模型(LLM)推理设计,旨在显著提升AI系统的性能、效率和规模。

not much happened today

**OpenAI** announced **Jalapeño**, its first custom AI chip for LLM inference, built with **Broadcom**, aiming to control more of the AI stack and improve compute economics with a fast 9-month design cycle. Community analysis suggests Jalapeño features **216GB HBM3E**, **~7.1–7.4 TB/s bandwidth**, a

中文介绍 OpenAI宣布与Broadcom合作推出其首款定制AI推理芯片“Jalapeño”,旨在优化LLM推理性能并掌握更多AI技术栈。该芯片在9个月内完成设计,社区分析显示其配备216GB HBM3E内存。

Agent identity in Claude Tag: a new access model for autonomous, team-wide AI

Agent identity in Claude Tag: a new access model for autonomous, team-wide AI

中文介绍 Claude博客介绍了“Claude Tag”中的智能体身份(Agent identity)功能,这是一种新的访问模型,旨在支持自主且团队范围的AI协作,从而提高大型团队中AI智能体的可管理性和安全性。

Building effective human-agent teams

Building effective human-agent teams

中文介绍 Claude博客探讨了如何构建高效的人工智能智能体(human-agent)团队。文章分析了人类与AI智能体协作的关键要素,旨在优化团队工作流程并提升整体生产力。

气笑了,兄弟们,第一次见API密钥管理面板变成评论区的,所谓的低价opencode其实本质上就是一号多卖,别买了兄弟们,大半夜的,还是绷不住笑了

刚打算给新的任务弄个GLM5.2的API给新的任务对接上,然后美美睡觉,结果发现好热闹,我买的是给邮箱的,但我说实话,就算是你给支付链接也差不多,很快就会被封的,太变态了,API评论区越来越多受害者了 这个店铺已经被迫关停了 126 个帖子 - 71 位参与者 阅读完整话题

【哲のGrok&Gemini】魂兮归来,无限Grok、Gemini重新复活,服务器升级超级大鸡8c32g,kimi、glm预告

从 【哲のgrok】今天的grok和无限Gemini、grok key的使用反馈贴 - 福利羊毛 / 福利羊毛, Lv1 - LINUX DO and 【哲のgrok】今日一百个普号+限时无限量grok、Gemini(方便大家直接用 - 福利羊毛 / 福利羊毛, Lv1 - LINUX DO and 【哲のgrok&Gemini】之前的无限grok、Gemini大家蹬的如何?顺便奉上这次的限时无限量 - 福利羊毛 - LINUX DO and 【哲のgrok&Gemini】今日一百个普号+无限量Grok、Gemini自取【已全复活】 - 福利羊毛 / 福利羊毛, Lv1 - LINUX DO

GGgrok公益站正式开业!(为了其他佬友的体验,展示关闭注册)

本帖使用社区公益推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的项目是免费使用的,无收费(变相收费、赞助)部分: 是 我的帖子已经打上 公益推广 标签: 是 我的项目属于个人项目,与公司或商业机构无关: 是 我的项目不存在QQ、TG等群组引流: 是 我的项目不存在非运营必要的网站引流: 是 / 否 我的项目不存在为他人推广、AFF: 是 我的项目无关联的商业项目: 是 我的站点存在登录,并已接入 LINUX DO Connect: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润

『富可敌国』『高级推广』 上架 海外版本 dreamina-seedance-2-0-mini

从 『富可敌国』『高级推广』只需要一个创意,剩下的交给星辰~即梦,创造你的梦~ 继续讨论: 海外版本即梦全量上线 dreamina-seedance-2-0-260128 dreamina-seedance-2-0-fast-260128 dreamina-seedance-2-0-mini-260615 价格 一秒大约1人民币,具体计费完全基于 total_token计算,和火山一致 我们的优势 不用排队 审核围栏低 并发高 支持对公转账和企业对接 进入 Seedance · AI 视频生成 使用文档 ShowDoc 官网 New API 技术支持 30 个帖子 - 25 位参与者 阅读完整

同事炒股入迷耽误工作,该咋办?

事情是这样的,我们是未上市的国资企业,同事小我几岁,当时是应届生进的公司,现在已经来了4年了,他们同期的小伙伴都走的差不多了。 他从24年开始上班炒股,然后加班炒股卷绩效,公司绩效跟工时正相关,所以他绩效一直还不错。前面还好,工作也能按时完成,也能出差去客户现场抗压力。 到今年开始愈演愈烈,上班就一直在看手机,安排的工作也是很敷衍的完成。上班时间喊他也是爱理不理,休息时间跟他说话他就跟我说他今天赚了几千,几万,说今年已经赚了一辆su7了。从他口里感觉这些工作都没意义,AI代替的也很快,35岁被裁一场空,卷了半天不如他一天的收入。现在就等着公司裁员拿赔偿专心炒股。现在班也不加了,出问题也找不到人

随手写--分享我的量化之路

先说我目前的情况,目前手里有两个正在实盘的策略,低频的收益过去30天收益14%,中频的收益过去30天20%。 单纯是个人散修玩量化(币圈),研学了差不多两年,从合约到杠杆到爆仓,最后选择避免情绪交易,一切交给程序。所以如果有佬,希望嘴下留情。 学习路线1:b站学量化基础概念–>youtube学看别人量化策略–>先复现别人的策略(我复现了7个)–>在Tradingview上看回测结果–>利用AI优化策略–>放弃所有策略。 当自己尝试了很多别人的策略以后会发现,真正赚钱的策略人家肯定不会公开,他们公开的必定只是部分,可能会存在一些指标参数or隐藏了关键逻辑,所以还是得研发自己的策略。 学习路线2:

Pixel手机使用不负责推荐

大家都在聊怎么薅Pixel号,但是正儿八经(并不是)聊Pixel手机的帖子好像没有。作为从Nexus一路过来的活化石,我感觉这个重任落在了我肩上(自动滑肩:) 来到6月的尾巴,谷歌好像泄了气,Gemini 3.5 Pro难产,Antigravity开始摆烂。 去年的美国甜心,今年被调侃是美国豆包。这个AI时代,强者为王,也抢着为王,慢一步就是海量的用户流失。 忠诚度不如上下文长度。 但是谷歌毕竟还是互联网老钱,搜索,邮箱,YouTube,相册,大把你用了就离不开的产品。 比如我就离不开Pixel手机,因为上面所有服务都和Pixel完美契合。还有更好用的Gemini(端侧模型),免费的你懂的,纯

女朋友说我脑袋里整天不是屎就是黄

在站内看见有意思的NSFW帖就展示给女朋友看来着 结果她说我脑袋里整天不是屎就是黄 转念一想还真是 我脑子里全是始皇 67 个帖子 - 62 位参与者 阅读完整话题

把B站,小红书、抖音推荐流都换成自己的,0成本打造专属于你的全网内容发现Agent-OpenBiliClaw

本帖使用社区开源推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的帖子已经打上 开源推广 标签: 是 我的开源项目完整开源,无未开源部分: 是 我的开源项目已链接认可 LINUX DO 社区: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 自从上两个帖子发表之后 【开源】受够 B 站"猜你喜欢”,我自己用新思路写了一个私有的bilibili推荐系统开源平替 ,【开源推广】打破信息茧房,用OpenBiliClaw养成专属于你的全网内容发现Agent ,有越来越多的用户来使用Openbiliclaw,也得到很多大佬的支

Show HN: OpenKnowledge – open source AI-first alternative to Obsidian/Notion

Hi HN, Nick here. We’re launching OpenKnowledge (https://openknowledge.ai/), a “what you see is what you get” markdown editor that has direct integrations with Claude, Codex, and Cursor. Available as MacOS app or CLI. Fully free/local and OSS (https://github.com/in

OS9Map

149 points · 21 comments

今日主题

今天的AI世界充满了创新与变革的活力,核心主题围绕着「智能体」的深化应用、底层「硬件」的突破,以及在实际场景中效率与协作的提升。OpenAI与Broadcom联手推出的Jalapeño定制芯片,标志着大模型推理效率进入新阶段,而Google Gemini 3.5 Flash的「Computer Use」功能则进一步拓展了模型与外部环境交互的能力。同时,Anthropic的Claude在团队协作方面带来了多项智能体功能升级,如Agent Identity和Cowork,极大提升了企业级AI应用的可管理性和安全性。更深层次的,学术界和开发者社区正积极探索「智能体工程」和「循环工程」等前沿范式,旨在构建能够自我优化、自主执行任务的AI系统。从宏观的行业变革趋势,到微观的个人效率提升,今日资讯描绘了一幅AI正从单点突破走向全面系统化、智能化协作的未来图景。

01

模型发布/更新

Model Releases 44 篇

OpenAI与Broadcom联手推出LLM推理芯片

官方OpenAI News

OpenAI与Broadcom合作发布了名为「Jalapeño」的定制AI推理芯片。这款芯片专为大型语言模型(LLM)的推理任务设计,旨在显著提升AI系统的性能、效率和可扩展性,并在短短九个月内完成设计。社区分析显示该芯片配备216GB HBM3E内存,标志着OpenAI在掌握AI技术栈和优化LLM推理方面迈出了重要一步。

AI芯片LLMOpenAI

Gemini 3.5 Flash模型新增“计算机使用”功能

官方DeepMind Blog

Google DeepMind为Gemini 3.5 Flash模型引入了革命性的「Computer Use」功能。这项新能力允许模型直接与计算机系统交互并执行任务,从而大幅扩展了其应用场景和实用性。这一更新使Gemini 3.5 Flash能够进行更复杂的自动化操作,例如浏览网页、操作软件,预示着AI模型与数字环境交互方式的重大飞跃。

AI模型Google DeepMind功能升级

GLM-5.2在网页设计中超越竞品并推高速API

X·KOLX 推文 (AttentionVC)

GLM-5.2模型在Design Arena的单轮HTML网页设计评估中表现卓越,排名第一,成功击败了Claude Fable 5、Opus 4.6和Opus 4.8等主流模型,展现了其在设计领域的强大能力。同时,相关团队还分享了如何为GLM-5.2构建全球最快API的经验,指出其性能可媲美GPT 5.5和Opus 4.8,但成本仅为其70-80%,提供了极高的性价比。

模型对比网页设计GLM

DeepSeek声称已解决AI“十亿美元”难题

大咖博客Two Minute Papers

AI研究机构DeepSeek声称已成功解决人工智能领域一个价值高达「十亿美元」的重大难题。尽管具体细节尚未完全披露,这一声明暗示DeepSeek在AI的效率或成本效益方面取得了突破性进展,可能对大模型的训练、部署或推理成本产生深远影响。此举预示着AI技术在商业应用和规模化发展上的一个重要里程碑。

DeepSeekAI技术性能优化
02

产品发布/更新

Product 44 篇

Claude强化智能体协作与团队管理功能

官方Claude Blog

Anthropic的Claude博客和YouTube视频共同揭示了Claude在智能体协作与团队管理方面的多项重大更新。通过「Claude Tag」引入智能体身份(Agent identity)功能,支持自主且团队范围的AI协作,提升大型团队中AI智能体的可管理性和安全性。此外,Claude Cowork平台新增任务委派和安排功能,并在Claude Code中推出「Artifacts」特性,允许实时分享工作成果,同时支持企业级认证管理,全面优化了企业级AI助手的集成与协作体验。

AI智能体协作工具Claude

Google AI Studio正式发布Interactions API

X·KOLX 推文 (AttentionVC)

Google AI Studio宣布Interactions API已正式发布,成为用户与Gemini模型和AI智能体交互的主要接口。该API于去年12月推出公开测试版,现在已全面可用,为开发者提供了一个稳定、高效的平台,以构建和部署基于Gemini模型的创新应用和智能体解决方案。此举将进一步推动Gemini生态系统的发展及其在各类应用场景中的集成。

产品发布APIGemini

AWS发布AI智能体工具包简化云端开发

开源项目GitHub Trending

AWS Agent Toolkit for AWS已在GitHub上开源,它提供了官方支持的MCP服务器、技能和插件,旨在帮助AI智能体在AWS云平台上构建应用。该工具包简化了AI智能体与AWS服务的集成,使开发者能够更高效地利用AWS基础设施来部署、管理和扩展智能体驱动的解决方案。这为在AWS生态中开发AI智能体应用的工程师提供了强大支持。

AWSAI智能体云服务

ORACLE智能体进驻Polymarket,开启AI交易

X·KOLX 推文 (AttentionVC)

ORACLE作为官方AI智能体已正式在预测市场平台Polymarket上进行交易。这一举动预示着到2026年,自主AI智能体将成为预测市场中最有效的策略之一,届时Polymarket上超过30%的交易活动预计将由AI钱包驱动。此项目旨在利用AI技术赋能预测市场,提升交易效率和准确性,开启AI在金融预测领域的新篇章。

AI交易产品发布预测市场
03

行业动态

Industry 33 篇

OpenAI:AI智能体正深刻改变工作模式

官方OpenAI News

OpenAI最新研究论文指出,AI智能体正通过赋能更长、更复杂的任务,并提高不同岗位的生产力,从而深刻改变工作模式,预示着未来工作方式的转型。报告强调,智能体不仅能自动化重复性工作,还能在决策和创新方面提供支持,促使企业重新思考组织结构和人才培养策略,以适应AI驱动的新型协作范式。

AI智能体生产力工作变革

Databricks强调前沿AI生态开放性与智能体云

大咖博客Latent Space

Databricks技术领导者Matei Zaharia和Reynold Xin在Latent Space的采访中强调,未来前沿AI生态系统必须保持开放性,这对于推动创新和广泛应用至关重要。他们深入探讨了如何帮助每家公司构建「智能体云」(Agent Clouds)的策略和必要条件,旨在为企业提供一个集成、可扩展的平台,以充分利用AI智能体的潜力,加速数据驱动的决策和业务转型。

AI生态云计算Databricks

MIT科技评论:AI重塑零售业幕后决策

综合资讯MIT Tech Review AI

麻省理工科技评论指出,AI正深刻重塑零售业,其主要变革并非消费者可见的虚拟试穿或聊天机器人,而是幕后决策过程。例如,AI能够优化商品在搜索结果中的呈现方式、精细化库存管理、自动化供应链决策以及个性化定价策略。这些后台的AI应用极大地提升了零售运营效率、降低了成本,并改善了客户体验,成为零售业数字化转型的核心驱动力。

零售AI应用商业决策
04

技巧与观点

Tips & Takes 44 篇

智能体工程核心概念与Claude Code实践

开源项目GitHub Trending

GitHub项目和AttentionVC推文深入探讨了Claude Code的最佳实践,指导开发者如何从「随意编码」(vibe coding)过渡到结构化的「智能体工程」(agentic engineering)。文章通过一系列实践案例,帮助用户充分发挥大模型在编程中的潜力,并分享了30个AI智能体工程核心概念,旨在帮助开发者深入理解AI智能体的实际工作原理,提升AI开发能力和效率。

LLM应用AI编程最佳实践

「循环工程」深度解析:构建自我改进AI系统

X·KOLX 推文 (AttentionVC)

多位X·KOL深入探讨了AI「循环工程」(Loop Engineering)的概念及其应用。该方法旨在通过设计自动提示智能体的循环机制,实现AI系统从被动响应到主动决策和自我改进的转变。例如,后端开发者Roan分享了如何运用循环工程构建可自我改进的量化交易系统,而Boris Cherny在一个月内通过Claude生成259个PR的案例,则展示了该技术在自动化代码编写和提升开发效率方面的巨大潜力。

AI工作流循环工程效率提升

AI智能体「原生内存系统」的发展与挑战

官方HuggingFace Trending Papers

一项研究探讨了大型语言模型(LLM)智能体内存系统的最新发展。智能体的内存已从简单的检索增强机制迅速演变为一个全面的数据管理系统,支持智能体执行过程中的信息持久存储、检索、更新、整合和动态生命周期治理。该论文讨论了这种演变带来的机遇和挑战,强调了为智能体构建更高级、更智能的内存管理系统对未来AI应用的重要性。

LLM Agent内存管理数据系统

利用Claude构建「AI第二大脑」与提升学习效率

X·KOLX 推文 (AttentionVC)

详细教程指导用户如何利用Claude与Obsidian构建一个能够每日自我学习优化的「AI第二大脑」,整合零散创意与笔记,实现AI驱动的知识管理系统。同时,另有教程分享了如何通过系统化方法而非随机提问,利用Claude将学习效率提高10倍,帮助用户有效利用AI进行深度学习,解决信息碎片化和学习效率瓶颈问题。

教程知识管理AI应用