Product Hunt · 06/20 08:56
一款名为「Are you in the Weights?」的工具上线,旨在帮助用户查询其个人信息或数据是否已被大型语言模型(LLMs)用于训练。通过该工具,用户可以了解自己的数字足迹是否「永存于」LLM的「大脑」中。
推荐理由:个人隐私与数据安全是LLM时代的热点问题,该工具能帮助用户了解自己的数据是否被用于模型训练,具有很强的实用性和警示意义。
Product Hunt · 06/20 08:56
一款名为「Are you in the Weights?」的工具上线,旨在帮助用户查询其个人信息或数据是否已被大型语言模型(LLMs)用于训练。通过该工具,用户可以了解自己的数字足迹是否「永存于」LLM的「大脑」中。
推荐理由:个人隐私与数据安全是LLM时代的热点问题,该工具能帮助用户了解自己的数据是否被用于模型训练,具有很强的实用性和警示意义。
LinuxDo · 06/20 22:40
社区「九幺」宣布提供免费的Claude大模型访问服务,旨在通过公益推广让更多用户体验到先进AI技术。该项目承诺完全免费,无任何商业收费或引流行为,为用户提供一个纯粹的AI探索平台。
推荐理由:对于国内用户,免费体验顶级大模型Claude的渠道极为稀缺。社区提供的公益服务,极大地降低了用户尝试新技术的门槛。
TLDR AI · 06/19 08:00
本周AI领域多项更新:GPT-5.6模型发布,Anthropic的Claude Code支持Artifacts功能,Perplexity推出「Brain memory」增强AI记忆与理解。这些进展旨在提升AI产品性能和用户体验。
推荐理由:一览当日多个主流AI模型和产品的重要更新,快速掌握行业前沿动态和功能演进方向。
Smol AI News · 06/19 13:44
智谱华章GLM-5.2模型成为领先的开放权重编码模型,在软件工程任务中可媲美Opus 4.8和GPT-5.5。这凸显了开放模型在推动供应商竞争、支持本地部署及保障模型微调权利方面的战略重要性。
推荐理由:GLM-5.2的崛起标志着开放模型在编码领域取得显著进展,为开发者提供了更具竞争力的选择,并可能重塑AI模型市场的格局。
MIT Tech Review AI · 06/19 18:40
迈阿密AI初创公司Subquadratic声称已解决困扰大型语言模型(LLMs)近十年的数学瓶颈。此突破有望推动LLMs发展,但目前细节有限,外界对该说法持观望态度,并存在质疑声音。
推荐理由:如果属实,这项突破将对LLMs的发展产生颠覆性影响。尽管存在不确定性,但其潜在价值值得密切关注。
Two Minute Papers · 06/19 22:06
科学家们在AI代理领域发现一种更高效的「语言」,有望改进代理间的沟通与协作。这项研究旨在优化AI内部交流机制,提升AI系统在复杂任务中的整体表现和理解能力。
推荐理由:这项研究深入探索AI代理的核心交互机制,对未来构建更智能、更高效的AI系统具有重要的理论和实践指导意义。
OpenAI News · 06/19 01:00
OpenAI为ChatGPT Enterprise版推出新的支出控制和使用情况分析工具。这些更新旨在帮助企业客户更有效地管理AI服务成本,并自信扩展AI应用,确保在预算内充分利用ChatGPT的企业级能力。
推荐理由:此举显示OpenAI正积极完善其企业级AI服务,帮助大型组织更负责任地部署和管理AI,对于企业IT决策者有直接参考价值。
Riley Brown (YouTube) · 06/18 10:27
该视频探讨九项核心AI代理技能,旨在帮助个人在AI时代获得竞争优势。内容涵盖AI代理的开发、部署及优化策略,如提示工程、自主决策和多模态交互等,以提升用户在AI领域的专业能力。
推荐理由:对于希望在AI时代保持竞争力的个人而言,视频提供了具体且实用的AI Agent技能学习路径,有助于职业发展。
GitHub Trending
palmier-pro是一款macOS AI视频编辑器,旨在通过AI技术简化视频创作与后期制作。它集成智能剪辑辅助、内容生成等功能,为用户提供高效智能的剪辑体验。
推荐理由:这款专为macOS设计的AI视频编辑器有望通过智能功能简化创作流程,是视频创作者和AI技术爱好者的关注点。
Hacker News
英国内政部启动一项耗资7500万英镑的「警务AI」项目,旨在利用人工智能提升警务效率和公共安全。该计划将探索AI在犯罪预防、调查和管理等方面的应用,预计将对英国执法领域产生深远影响。
推荐理由:英国政府在警务领域投入巨资发展AI,这不仅显示了AI在公共服务领域的巨大潜力,也预示着AI治理和伦理将成为重要议题。
Swift · ★ 3,141 · 🍴 265 · 📈 904 stars today
macOS video editor built for AI
中文介绍 palmier-pro 是一款专为 AI 设计的 macOS 视频编辑器。它旨在利用人工智能技术简化视频创作与后期制作流程,为 macOS 用户提供更智能、高效的剪辑体验。项目通过集成先进的 AI 能力,可能实现自动场景识别、智能剪辑辅助、内容生成等功能,尤其适合需要借助 AI 提高创作效率的视频创作者、媒体编辑以及内容生产者。
Clojure · ★ 51,293 · 🍴 3,295 · 📈 424 stars today
Penpot: The open-source design tool for design and code collaboration
中文介绍 Penpot 是一款开源的设计工具,专注于解决设计与代码之间的协作问题。它提供了一个直观的平台,使 UI/UX 设计师能够创建和迭代界面,同时无缝集成到开发工作流中。Penpot 旨在打破设计与开发之间的壁垒,促进团队成员更高效地进行设计交付和代码实现,是寻求透明、协作设计流程的团队的理想选择。
Python · ★ 6,948 · 🍴 1,145 · 📈 677 stars today
World's first open-source, agentic video production system. 12 pipelines, 52 tools, 500+ agent skills. Turn your AI coding assistant into a full video production studio.
中文介绍 OpenMontage 是全球首个开源的、代理式视频制作系统。它将 AI 编码助手升级为全功能视频制作工作室,拥有 12 条处理管道、52 种工具和 500 多个代理技能。该系统旨在通过 AI 代理自动化视频创作的各个环节,从内容生成到后期编辑,极大地提升视频制作效率。它适合内容创作者、AI 开发者及寻求自动化视频生产的团队。
Rust · ★ 20,254 · 🍴 1,038 · 📈 774 stars today
Turso is an in-process SQL database, compatible with SQLite.
中文介绍 Turso 是一款兼容 SQLite 的 in-process SQL 数据库。它设计用于提供高性能和易于嵌入的数据库解决方案,尤其适用于边缘计算、无服务器(Serverless)环境或需要轻量级、本地数据存储的应用。Turso 能够被直接集成到应用程序中运行,为开发者提供了灵活且高效的数据管理能力,是构建现代分布式应用的有力工具。
C · ★ 9,212 · 🍴 702 · 📈 1,267 stars today
High-performance code intelligence MCP server. Indexes codebases into a persistent knowledge graph — average repo in milliseconds. 158 languages, sub-ms queries, 99% fewer tokens. Single static binary, zero dependencies.
中文介绍 该项目提供一个高性能的代码智能 MCP 服务器,能将代码库快速索引为持久化知识图谱。它支持 158 种编程语言,平均每个仓库在毫秒级完成索引,并能实现亚毫秒级的查询速度,同时将 LLM 处理 token 数量减少 99%。以单一静态二进制文件形式部署,它为开发者、LLM 应用工程师及代码分析师提供了强大的代码理解和智能检索能力。
Python · ★ 24,475 · 🍴 2,320 · 📈 432 stars today
TimesFM (Time Series Foundation Model) is a pretrained time-series foundation model developed by Google Research for time-series forecasting.
中文介绍 TimesFM(Time Series Foundation Model)是 Google Research 开发的预训练时间序列基础模型,专为时间序列预测设计。该模型利用其强大的泛化能力,能够处理各种复杂的时间序列数据,提供高精度的预测结果。TimesFM 旨在降低时间序列预测的门槛,帮助数据科学家和机器学习工程师更高效地解决业务中的预测挑战。
TypeScript · ★ 50,809 · 🍴 7,411 · 📈 140 stars today
The open alternative to Salesforce, designed for AI.
中文介绍 Twenty 是一款开源的 Salesforce 替代品,专为 AI 时代设计。它旨在为企业提供一个功能丰富、高度可定制的客户关系管理(CRM)系统,同时深度整合 AI 能力。Twenty 允许用户拥有数据的完全控制权,降低了专有 CRM 系统的成本和锁定风险,适合中小型企业、寻求定制化解决方案或希望在 CRM 中深度应用 AI 的团队。
TypeScript · ★ 39,271 · 🍴 2,324 · 📈 327 stars today
The open-source, cross-platform API client for GraphQL, REST, WebSockets, SSE and gRPC. With Cloud, Local and Git storage.
中文介绍 Insomnia 是一款开源、跨平台的 API 客户端,支持 GraphQL、REST、WebSockets、SSE 和 gRPC 等多种 API 协议。它为开发者提供了全面的 API 测试和管理工具,支持云端、本地和 Git 存储,便于团队协作和版本控制。Insomnia 旨在简化 API 的开发、调试和测试流程,是后端、前端开发者及 API 测试人员的理想选择。
Rust · ★ 54,446 · 🍴 10,835 · 📈 2,398 stars today
🤱🏻 Turn any webpage into a desktop app with one command.
中文介绍 Pake 是一款便捷工具,允许用户通过一个命令将任何网页转换为桌面应用程序。它旨在为用户提供更原生、无干扰的 Web 应用体验,将常用的在线服务或网站封装成本地应用,告别浏览器标签页的繁杂。Pake 特别适合希望将自己喜爱的 Web 应用集成到桌面环境、提升工作效率的个人用户和开发者。
Python · ★ 41,572 · 🍴 2,850 · 📈 3,786 stars today
Compress tool outputs, logs, files, and RAG chunks before they reach the LLM. 60-95% fewer tokens, same answers. Library, proxy, MCP server.
中文介绍 Headroom 是一款高效的数据压缩工具,用于在工具输出、日志、文件和 RAG chunks 发送到 LLM 之前进行处理。它能将 token 数量减少 60-95%,同时保证答案质量不受影响,显著降低 LLM 使用成本并提升处理效率。该项目提供库、代理和 MCP 服务器多种形式,是 LLM 应用开发者和数据工程师优化成本与性能的实用工具。
TypeScript · ★ 30,960 · 🍴 3,830 · 📈 140 stars today
The open-source AI voice studio. Clone, dictate, create.
中文介绍 Voicebox 是一个开源的 AI 语音工作室,提供语音克隆、语音输入转文本和语音内容创作等功能。它允许用户轻松定制和生成高质量的语音内容,将文本转化为自然的语音,或克隆特定声音。Voicebox 旨在赋能内容创作者、开发者和任何有语音交互需求的用户,简化语音资产的创建和管理。
TypeScript · ★ 23,296 · 🍴 2,738 · 📈 470 stars today
Kilo is the all-in-one agentic engineering platform. Build, ship, and iterate faster with the most popular open source coding agent.
中文介绍 Kilo 是一款一体化的代理式工程平台,旨在帮助开发者利用最流行的开源编码代理,更快地构建、发布和迭代软件。它通过集成 AI 代理,自动化软件开发生命周期的各个环节,从而提升开发效率和代码质量。Kilo 适合寻求提高自动化水平、加速产品上市的开发者、软件工程团队及 DevOps 工程师。
Shell · ★ 138,075 · 🍴 11,978 · 📈 1,360 stars today
Skills for Real Engineers. Straight from my .claude directory.
中文介绍 Skills 集合了针对“真正的工程师”的实用技能,这些技能直接来源于作者与 AI(如 Claude)的交互经验。它可能包含一系列经过精心设计的 AI 提示词、自动化脚本或配置,旨在帮助开发者利用 AI 解决实际工程问题,提升工作效率,例如代码生成、bug 调试、架构设计辅助等。这是一个由实践驱动的 AI 辅助学习与实践资源。
TypeScript · ★ 6,058 · 🍴 340 · 📈 313 stars today
The sandbox agent framework.
中文介绍 Flue 是一个沙盒代理框架,专为 AI 代理的开发、测试和部署提供安全、隔离的环境。它允许开发者在受控的沙盒中运行 AI 代理,有效防止潜在的安全风险和对系统造成的意外影响。Flue 旨在简化 AI 代理的迭代和调试过程,为 AI 代理开发者和研究人员提供一个稳定可靠的实验平台。
★ 14,743 · 🍴 2,354 · 📈 223 stars today
A curated list of Artificial Intelligence (AI) courses, books, video lectures and papers.
中文介绍 Awesome Artificial Intelligence 是一个精心策划的人工智能(AI)资源列表,收录了高质量的 AI 课程、书籍、视频讲座和学术论文。该项目旨在帮助 AI 学习者、研究人员和爱好者快速找到学习和深入理解 AI 领域的权威资料,避免在海量信息中迷失,从而更高效地掌握 AI 知识与技能。
Kotlin · ★ 26,471 · 🍴 3,271 · 📈 130 stars today
短信转发器——监控Android手机短信、来电、APP通知,并根据指定规则转发到其他手机:钉钉群自定义机器人、钉钉企业内机器人、企业微信群机器人、飞书机器人、企业微信应用消息、邮箱、bark、webhook、Telegram机器人、Server酱、PushPlus、手机短信等。包括主动控制服务端与客户端,让你轻松远程发短信、查短信、查通话、查话簿、查电量等。(V3.0 新增)PS.这个APK主要是学习与自用,如有BUG请提ISSUE,同时欢迎大家提PR指正
中文介绍 SmsForwarder 是一款强大的 Android 短信转发器,能够监控手机短信、来电及 APP 通知,并根据自定义规则转发至钉钉、企业微信、飞书、邮箱、Telegram 等多种平台。它还支持远程控制手机,进行短信收发、通话查询、话簿管理及电量查看等操作。该应用为需要多设备信息同步、远程管理手机或企业IT监控的用户提供了高效解决方案。
Rust · ★ 7,375 · 🍴 827 · 📈 108 stars today
Coding Agent Harness
中文介绍 jcode 是一个编码代理 Harness,它为 AI 编码代理的开发、测试和评估提供了一个集成环境或框架。该项目旨在帮助开发者更好地构建、管理和优化他们的自动化编码代理,例如用于代码生成、重构或调试的 AI 工具。jcode 为 AI 代理开发者提供了一套必要的工具和基础设施,以确保代理的稳定性和有效性。
👍 5
Policy-adherent tool-calling agents in customer-service domains must maintain task states across turns while calling tools and obeying domain policies. Task states consist of relevant facts, identifiers, constraints, and conditions observed through user interaction and tool calls. In standard agents
中文介绍 该研究介绍了LedgerAgent,这是一种用于客户服务领域中遵循策略的工具调用代理。该代理通过维护结构化的任务状态,以确保在多轮对话中遵守领域策略并有效调用工具。任务状态包括通过用户交互和工具调用获取的相关事实、标识符、约束和条件,旨在提升智能体在复杂服务场景中的表现和可靠性。
👍 2
FP4 training promises substantial reductions in memory and computation cost for LLM pretraining, yet current FP4 hardware paths and recipes, including NVIDIA Blackwell/Rubin-class systems and AMD MI350-series GPUs, remain centered on E2M1 data elements. In this study, we identify a fundamental limit
中文介绍 该研究重新审视了大型语言模型(LLM)FP4预训练中的“收缩偏差”问题。尽管FP4训练能显著降低内存和计算成本,但当前硬件路径(如NVIDIA Blackwell/Rubin系列和AMD MI350系列GPU)仍主要基于E2M1数据元素。研究深入探讨了收缩偏差的几何起源和系统性影响,并提出了UFP4方案以优化FP4预训练效果,从而提升LLM的训练效率。
👍 37
LiveCodeBench (LCB) has recently become a widely adopted benchmark for evaluating large language models (LLMs) on code-generation tasks. By curating competitive programming problems, constantly adding fresh problems to the set, and filtering them by release dates, LCB provides contamination-aware ev
中文介绍 LiveCodeBench (LCB)已成为评估大型语言模型(LLM)代码生成任务的广泛基准,它通过收集竞争性编程问题、持续更新并按发布日期筛选,确保了评估的时效性和相关性。该论文介绍了Multi-LCB,旨在将LiveCodeBench基准扩展到支持多种编程语言,以更全面地评估LLM在不同语言环境下的代码生成能力,进一步推动代码智能领域的发展。
👍 5
Embodied foundation models are expected to benefit from data scaling like large language models, but face a much tighter data bottleneck. Teleoperated real-robot trajectories remain the dominant pretraining source due to their precise action supervision and embodiment alignment, yet their scalabilit
中文介绍 具身基础模型在数据扩展上面临瓶颈,而遥控真实机器人轨迹因其精确的动作监督和具身对齐,一直是主要的预训练数据来源。该研究提出了HumanScale,发现第一人称视角的人类视频在具身预训练中,其性能可能超越真实机器人数据。这为具身智能的数据收集和模型训练提供了新思路,有望缓解数据稀缺问题,加速模型发展。
👍 26
Advances in radiance fields have enabled photorealistic novel view synthesis. In several domains, large-scale real-world datasets have been developed to support comprehensive benchmarking and to facilitate progress beyond scene-specific reconstruction. However, for distractor-free radiance fields, a
中文介绍 辐射场技术的进步推动了照片级真实感新视角合成的发展。尽管现有领域已开发出大规模真实世界数据集用于基准测试,但在“无干扰”新视角合成方面仍缺乏相关资源。为此,该研究发布了DF3DV-1K,这是一个大规模数据集及基准测试,旨在推动无干扰三维重建和新视角合成技术的发展,克服现有数据瓶颈,促进相关领域的进步。
👍 32
Real-world spatial intelligence requires reasoning over a continuous and evolving 3D world, yet existing VLMs and tool-augmented agents largely remain tied to static, stateless inference from isolated visual observations. We introduce \textsc{S-Agent}, a spatial tool-use agentic paradigm for underst
中文介绍 现实世界的空间智能需要对连续、动态的三维世界进行推理,然而现有视觉语言模型(VLM)和工具增强型智能体多局限于从孤立视觉观察中进行静态、无状态的推理。该研究介绍了S-Agent,这是一个利用空间工具的智能体,旨在通过引入空间工具使用,提升智能体在三维环境中的推理能力,以更好地应对动态复杂的真实世界场景,增强其空间智能。
👍 8
Achieving dexterous robotic manipulation in the real world heavily relies on human supervision and algorithm engineering, which becomes a central bottleneck in the pursuit of general physical intelligence. Although emerging coding agents can generate code to automate algorithm search, their successe
中文介绍 现实世界中灵巧的机器人操作严重依赖人工监督和算法工程,这成为通用物理智能发展的主要瓶颈。本研究提出了ENPIRE,一个能在真实世界中实现机器人策略自主改进的智能体框架。尽管新兴的编码智能体能生成代码以自动化算法选择,但ENPIRE致力于让机器人通过自主学习和迭代,不断优化其操作策略,减少对人类干预的依赖,迈向通用物理智能。
👍 23
Style-content dual-reference generation aims to synthesize an image that preserves the structure and semantics of a content reference while adopting the style of a separate style reference.Despite recent progress, this setting remains challenging because models must balance content fidelity, style a
中文介绍 风格内容双重参考生成旨在合成图像,使其既保留内容参考图的结构和语义,又采纳独立风格参考图的样式。尽管近期有所进展,但模型在平衡内容与风格之间仍面临挑战。该研究提出了FreeStyle方法,通过社区LoRA挖掘实现风格内容双重参考生成的自由控制,有效解决了这一平衡难题,提升了图像生成的可控性和质量。
👍 3
Current AI-driven game development has made substantial progress in asset generation, gameplay design, and web-based game coding, yet project-level code engineering on professional game engines remains largely unexplored due to the absence of large-scale datasets and deterministic evaluation methods
中文介绍 当前AI驱动的游戏开发在资产生成、玩法设计及网页游戏编码方面取得了显著进展,但在专业游戏引擎上的项目级代码工程仍largely未被充分探索,主要原因是缺乏大规模数据集和确定性基准。为此,该研究提出了JAMER,一个针对专业游戏引擎的项目级代码框架数据集和基准,旨在填补这一空白,推动AI在复杂游戏项目代码生成领域的进步。
👍 25
Agent benchmarks are growing fast, but no single benchmark touches more than four or five of the dimensions that deployment exposes. This paper aggregates the largest coordinated deep-dive of one MCP-based industrial-agent benchmark to date: fourteen parallel implementation studies covering new asse
中文介绍 智能体基准测试正迅速增长,但现有单一基准无法涵盖实际部署所暴露的全部维度。本研究超越了静态排行榜,首次大规模汇总了基于MCP(多维能力评估)的工业智能体基准的深入分析,包括14项并行实现研究。论文着重探讨了评估大型语言模型(LLM)智能体的“预测有效性”,旨在提供更全面、贴近实际部署效果的评估方法。
👍 3
Test-time reasoning is increasingly used as a serving-time control knob, but extra reasoning is not uniformly valuable: it can repair failed attempts, waste compute on already-correct answers, or introduce harmful answer changes. We study this as a deployment allocation problem rather than a new-ver
中文介绍 测试时推理日益成为服务时间控制的关键,但额外推理的价值并非一致:它可能修复失败尝试,也可能在已正确答案上浪费计算资源,甚至引入有害的答案变动。该研究将此视为一个部署分配问题,探讨了“再思考”或“更长时间思考”的权衡。论文提出了针对预算感知推理的选择性验证方法,以优化计算资源分配,提升推理效率和准确性。
👍 5
Progress in legal AI increasingly depends on access to authoritative legal text at scale. Yet one of the most consequential layers of American law remains largely absent from existing machine-readable corpora: local ordinances. Local codes govern zoning, housing, business licensing, public health, n
中文介绍 法律人工智能(AI)的发展日益依赖于大规模权威法律文本的获取,然而美国法律体系中一个重要的层面——地方法规——却在现有机器可读语料库中严重缺失。这些地方法规涵盖了分区、住房和商业许可等关键领域。为解决这一数据空白,该研究发布了LOCUS,这是一个针对美国的地方法规语料库,旨在为法律AI的研究和应用提供重要的基础数据支持。
👍 3
Patient contexts span hundreds of heterogeneous documents and thousands of structured data points, yet the document-level metadata that AI systems need for retrieval and triage is absent or incomplete. Standard retrieval-augmented generation fails on this data, mishandling temporal reasoning, cross-
👍 39
Current agentic robot systems can write executable Code-as-Policy programs, observe feedback, and revise behavior across multiple attempts, but they remain largely task-driven: reusable skills are acquired only after explicit instructions. We study Playful Agentic Robot Learning, where an embodied c
👍 8
Multi-step LLM pipelines fail through interactions among retrieval, reasoning, and formatting steps, so prompt-only optimization can miss bottlenecks in the chain. We present FAPO (Fully Autonomous Prompt Optimization), a framework that lets Claude Code optimize an LLM pipeline inside a standardized
👍 106
While 10B-level industrial foundation models have pushed the boundaries of image inpainting, their prohibitive computational costs severely hinder practical deployment. Constructing a highly optimized task-specific specialist offers a promising solution; however, extreme structural compression inevi
👍 3
Precise 3D spatial orchestration in text-to-video generation remains a significant challenge, particularly for multi-object scenes where semantic layout and temporal dynamics are often entangled. While existing depth-conditioned models achieve good structural fidelity, they necessitate dense, frame-
👍 3
Test-time scaling via sequential revision has emerged as a powerful paradigm for enhancing Large Language Model (LLM) reasoning. However, standard post-training methods primarily optimize single-shot objectives, creating a fundamental misalignment with multi-step inference dynamics. While recent wor
👍 3
AI systems deployed in legal workflows hallucinate at rates that aggregate metrics report at ~52%, but this average conceals where errors concentrate and in which direction they run, leaving compliance officers without an actionable signal for trustworthy deployment. We present LegalHalluLens, an au
👍 4
Offline reinforcement learning is typically analyzed under process-level reward supervision, yet many sequential decision datasets record only trajectory-level outcomes. We develop a statistical theory for offline policy optimization from such outcome-level supervision. We first study the canoni
👍 9
As an increasing majority of global video content is consumed on social platforms for interactive social purposes, video generation models built for social worlds are important but largely overlooked by previous studies. In this work, we define the position of social world models and build a prototy
👍 8
Large language models (LLMs) often fail when answering requires identifying a small but decisive piece of evidence within a long or complex context, such as a single line in a tool trace or a subtle detail in an image. We propose ContextRL, a context-aware reinforcement learning (RL) method that imp
👍 1
Large Language Models (LLMs) have significantly advanced the automation of software engineering tasks. One prominent example is code generation, where an LLM produces code in a specified programming language based on a natural language description. Most research in this area has focused on high-reso
👍 5
Recent retrieval-augmented generation (RAG) approaches have demonstrated strong capability in handling complex queries, yet current research overlooks a critical challenge: different retrievers require fundamentally different query formulation strategies for optimal performance. In this work, we pre
👍 9
Visual thinking should not only sound right; it should show its evidence. While recent vision-language models (VLMs) can produce natural-language reasoning traces, these traces often leave the supporting image regions implicit, making them hard to verify and difficult to supervise. We introduce visu
👍 3
Typical video object-centric learning (VOCL) approaches employ slot-based frameworks that rely on reconstruction-driven encoder-decoder architectures, where learning is mediated by two spatial maps: attention maps from the encoder and object maps from the decoder. As these two distinct maps exhibit
👍 66
Dexterous interaction with articulated objects is important for household, assistive, and humanoid manipulation, where multi-finger hands can provide compliant contact patterns beyond parallel-jaw grasping. However, articulated-object manipulation differs from static-object manipulation: the target
👍 4
Creative image editing tools, such as Photoshop's Remove or Generative Fill buttons, are central to everyday customer use and account for a major share of traffic in Photoshop and Lightroom. However, current generative AI models face significant latency challenges, which become even more pronounced
👍 0
Despite growing interest, most evaluations of large language models' (LLMs') personalization abilities have relied on synthetic data. It remains unclear how well current personalization systems work for real users. In this paper, we study the gap in LLM personalization performance when using synthet
👍 2
Scheduling policies in large-scale Automatic Speech Recognition (ASR) serving pipelines play a key role in determining end-to-end (E2E) latency. Yet, widely used serving engines rely on first-come-first-served (FCFS) scheduling, which ignores variability in request duration and leads to head-of-line
Find out if you live forever in the brain of the LLMs
中文介绍 这是一款工具,旨在帮助用户查询其个人信息或数据是否已被大型语言模型(LLMs)用于训练。通过该工具,用户可以了解自己的数字足迹是否“永存于”LLM的“大脑”中。
Visual GitHub management directly from a graphical interface
中文介绍 GitSync for macOS 是一款专为 macOS 系统设计的工具,提供图形化界面,方便用户直观地管理 GitHub 项目,提升开发效率。
Control exactly who can access your company data
中文介绍 Basedash Access Controls 是一款专注于数据安全与权限管理的工具。它能够帮助企业精确控制和管理员工对公司数据的访问权限,确保信息安全。
AI video studio: text & image to video, with real control
中文介绍 Pixlie 是一款人工智能视频工作室工具,支持将文本和图片转换为视频。该工具强调为用户提供对视频生成过程的精细控制,实现创意愿景。
60 second ultrasound-based full-body scanner that beats MRI
中文介绍 Midjourney Scanner 是一款基于超声波技术的全身扫描仪,能够在60秒内完成全身检查。该产品声称其性能优于传统的核磁共振成像(MRI)设备。
a small hosted memory layer for AI agents
中文介绍 pumaDB 是一款为人工智能代理(AI agents)设计的轻量级托管式内存层服务。它提供高效的内存解决方案,以支持AI代理的数据处理需求。
Surf like it's 1999
中文介绍 Reframe 是一款提供独特网络体验的产品,旨在模拟用户在1999年时的网络“冲浪”感受,可能强调复古或简洁的浏览方式。
Work across 20+ apps in Slack with multiplayer collaboration
中文介绍 Slackbot’s MCP Client 是一款增强 Slack 功能的工具,支持用户在 Slack 内部实现跨越20多个应用程序的多人协作工作,提高团队效率。
Preview and share your coding work live as it happens
中文介绍 Claude Code Artifacts 是一款专为开发者设计的工具,允许用户实时预览并分享其正在进行的编码工作。它能提升团队协作效率,便于代码审查。
Automate your entire backlink generation
中文介绍 Blazly Backlinker 是一款专注于自动化反向链接生成的工具。它旨在帮助用户简化并自动化整个反向链接建立过程,从而优化搜索引擎排名。
@satyanadella · 5.9M 粉丝 · 1.9M 阅 · 3.5K 赞 · 541 转
I’ve been thinking a lot about the future of the firm in an AI-driven economy. This transition is different than any previous platform shift. In the past, we used digital systems to enhance human
中文介绍 微软CEO Satya Nadella分享了他对AI驱动经济下企业未来的思考。他认为当前的AI转型与以往的平台变革不同,过去数字系统增强人类能力,而AI带来了更深远的变化。AI时代需要强大的生态系统来确保可持续发展。
@horizon_trade_x · 4.4K 粉丝 · 1.3M 阅 · 507 赞 · 59 转
Your backtest looked flawless. You went live. Two weeks later, the strategy was bleeding. Every quant has lived this. The answer is a loop: generate a strategy, test it, score it, feed the result
中文介绍 针对量化交易策略上线后表现不佳的问题,博主提出「循环工程」框架。该框架通过生成策略、测试、评分并将结果反馈,形成闭环优化。旨在帮助量化交易员构建更稳定的Alpha收益策略,避免回测完美而实盘亏损的困境。
@zodchiii · 22.7K 粉丝 · 1.2M 阅 · 500 赞 · 71 转
Most setups run agents once and hand you whatever comes out. A team that runs in loops keeps going until the work actually passes. Below is the setup in 3 files: the agents, the loop that drives
中文介绍 博主分享了如何构建一个能「循环运行」的Claude Code智能体团队的详细设置。与传统一次性运行的智能体不同,该团队能持续迭代直至任务完成。博文提供了包含智能体定义和循环驱动逻辑的3个文件示例。
@eng_khairallah1 · 67.2K 粉丝 · 1.2M 阅 · 510 赞 · 73 转
You read maybe two hundred articles this year. A few dozen papers. Hundreds of threads. Save this Every second-brain method ever sold to you, Zettelkasten, PARA, the graph view, the daily note,
中文介绍 博主分享了如何使用Obsidian构建一个「自动运行的第二大脑」的完整教程。该系统旨在有效管理大量阅读材料(文章、论文、帖子),并整合Zettelkasten、PARA等多种方法论,以实现知识的自动化整理和连接。
@sairahul1 · 117.4K 粉丝 · 905.5K 阅 · 503 赞 · 102 转
Everyone talks about LLMs. Nobody explains how they actually work under the hood. GPT. Claude. Gemini. Llama. They all come from the same 5-stage pipeline. And once you understand it, you can build
中文介绍 博主揭示了GPT、Claude、Gemini、Llama等所有大型语言模型(LLM)背后通用的「5阶段管道」工作原理。该教程旨在帮助读者理解LLM的底层机制,并能从中学习如何从零开始构建自己的LLM。
@BradGroux · 5.9K 粉丝 · 714.6K 阅 · 1.0K 赞 · 638 转
Most people still use coding agents like fancy autocomplete or a one-shot chat box. That leaves a lot of value on the table. The better pattern is to treat Codex like a durable operating loop:
中文介绍 博主提出了一种最大化利用Codex代码代理价值的方法:将其视为一个「持久运行的操作系统循环」。与简单地作为自动补全或单次聊天工具不同,这种模式能解锁更多价值,提升开发效率和代码质量。
@sairahul1 · 117.4K 粉丝 · 511.9K 阅 · 500 赞 · 84 转
Your AI agent works great for the first 10 steps. Then somewhere around step 15, it starts getting sloppy. Wrong tool calls. Forgetting your original instructions. Low-quality outputs. Most people
中文介绍 博主分享了AI智能体「上下文工程」的完整攻略。针对智能体在长任务中出现工具调用错误、遗忘指令、输出质量下降等问题,该指南提供了提高智能体长期表现和保持输出质量的实用策略。
@lqiao · 95.4K 粉丝 · 501.6K 阅 · 509 赞 · 86 转
Mythos got shut down this week. Whether you agreed with the decision or not is almost beside the point. A company built on top of intelligence it didn't control suddenly found itself exposed to
中文介绍 针对Mythos公司本周被关停事件,博主探讨了「拥有智能」与「租赁智能」的差异。他指出,公司若过度依赖不受自身控制的外部智能(如AI模型API),一旦供应方政策变化,将面临巨大的业务风险。
@Fintech03 · 34.9K 粉丝 · 438.8K 阅 · 501 赞 · 137 转
The critique that Indian IT services (the classic TCS, Infosys, Wipro, HCL cohort) are failing India in the current generative AI race is an incredibly popular talking point. It is easy to look at the
中文介绍 博主反驳了「印度IT服务业在生成式AI竞赛中失败」的观点。他认为,TCS、Infosys等印度IT公司从未旨在开发ChatGPT这类基础模型,其核心业务模式是服务和应用,因此不应以此标准评判其在AI领域的表现。
@mattepstein · 35.6K 粉丝 · 393.3K 阅 · 504 赞 · 26 转
Have you seen any of the launches below on your timeline? (you probably have).. What if I told you they all followed a repeatable viral science that can be 95% automatable with claude. In this
中文介绍 博主揭示了如何利用Claude实现X(Twitter)帖子的「病毒式传播」,并称其95%可自动化。他分享了Mr. Beast的成功框架,旨在帮助用户通过可重复的“病毒式科学”方法,结合Claude生成高互动内容,以提高帖子曝光率。
@djfarrelly · 3.8K 粉丝 · 344.7K 阅 · 501 赞 · 61 转
Everyone's asking "WTF is a loop?" Here's the question nobody's asking: what runs the loop? The AI discourse has converged on loops as a core primitive of agentic systems. Matt Van Horn (@mvanhorn)
中文介绍 针对AI智能体系统中「循环」概念的普及,博主深入探讨了「是什么在驱动循环运行」这一关键问题。他分析了循环作为智能体核心原语的重要性,并指出理解其背后机制对构建高效智能体至关重要。
@mikenevermiss · 10.8K 粉丝 · 261.4K 阅 · 568 赞 · 67 转
stop making prompts. start designing loops. a prompt gets you one response. a loop gets you a system that keeps working after you close the laptop. Boris Cherny, who runs Claude Code at Anthropic, put
中文介绍 博主提倡停止「制作提示词」,转而「设计循环」来使用Claude。他指出,单个提示词只能获得一次性响应,而循环设计能构建一个在你关闭电脑后仍能持续工作的系统。该方法能大幅提升Claude在自动化任务中的效率和持久性。
@AnthonyNAguirre · 4.2K 粉丝 · 232.1K 阅 · 527 赞 · 38 转
I've been getting really bothered lately by something subtle but quite dangerous that I believe is currently going on and promises to get worse: Large numbers of very smart, capable, and important
中文介绍 博主警示了一种正在发生且日益加剧的「极其微妙但危险」的现象。他担忧大量聪明、有能力且重要的人,可能正不知不觉地受到某种影响,呼吁大家关注这种潜在的“洗脑”效应。
@0xMovez · 26.7K 粉丝 · 208.0K 阅 · 504 赞 · 59 转
A free open-source model is running 300 parallel agents across 4,000 coordinated steps from a single prompt, and it scores higher on real research tasks than models you pay 5x more for. Most people
中文介绍 博主展示了一个基于Kimi K2.6的「自改进循环」系统,该系统使用免费开源模型,通过单个提示词驱动300个并行智能体执行4000个协调步骤,并经Opus 4.8验证。其在实际研究任务上的得分甚至超越了成本高出5倍的付费模型。
@athcanft · 19.1K 粉丝 · 205.6K 阅 · 514 赞 · 23 转
I've been mass-producing TikTok slideshows with AI and scheduling them weeks in advance. Zero filming. Zero editing. Zero daily posting grind. This article breaks down the exact system, step-by-step,
中文介绍 博主分享了一种名为「Lazymaxxing」的TikTok幻灯片大规模生产系统。该系统利用AI,每月仅花费2美元即可制作并提前排期600个视频,实现零拍摄、零编辑、零日常发帖的自动化流程。文章详细分解了具体步骤。
@jxnlco · 105.9K 粉丝 · 204.4K 阅 · 504 赞 · 47 转
Update: Computer Use is now Available in the EU/UK ;) Enjoy! There are three ways for Codex to use a computer: Computer Use, the Chrome extension, and the in-app browser. They overlap just enough to
中文介绍 博主介绍了Codex使用计算机的「三种方式」:Computer Use功能、Chrome扩展和应用内浏览器。这些方法各有侧重,但功能上存在部分重叠,能帮助用户根据具体需求选择最佳的Codex交互模式。
@matanSF · 20.2K 粉丝 · 123.1K 阅 · 529 赞 · 60 转
In 2023, we launched Factory with the mission to bring autonomy to software engineering. While others were using models to speed up coding, we set out to deploy autonomous Droids across the
中文介绍 博主介绍了“Factory 2.0”项目,旨在将软件工程带入自动化时代。与仅加速编码的模型不同,Factory通过部署「自主Droids」实现软件工程的全面自治,从代码代理演变为完整的软件工厂。
@jxmnop · 50.7K 粉丝 · 114.1K 阅 · 504 赞 · 57 转
So you want to do AI research? It's true that no one really teaches you how. Not directly, anyway. But it turns out that the way to get started is pretty simple: some combination of (i) reading and
中文介绍 博主分享了「AI研究的艺术」,旨在指导初学者如何开启AI研究之路。他指出,虽然没有直接的教学方法,但入门的关键在于结合大量阅读与实践,逐步建立对AI领域的深刻理解和研究能力。
@EXM7777 · 118.9K 粉丝 · 107.7K 阅 · 509 赞 · 44 转
for a few days, we had something that felt like AGI... Fable 5 showed up, effectively unlimited inside the plans, and the ceiling on what you could build lifted overnight but then Anthropic killed it,
中文介绍 博主回顾了Fable 5短暂出现时带来的「通用人工智能(AGI)」般的体验,它提供了近乎无限的构建能力。然而,Anthropic随后将其功能削弱,博主分享了如何尝试找回Fable曾达到的智能水平的方法。
@OracleMindAI · 21.0K 粉丝 · 105.0K 阅 · 2.8K 赞 · 582 转
In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We
中文介绍 博主预测到2026年,自主AI智能体将成为预测市场最有效的策略之一。他指出,目前Polymarket上已有超过30%的活动来自算法和AI驱动的钱包,ORACLE项目旨在通过官方AI智能体参与Polymarket交易,探索其潜力。
@Designarena · 13.9K 粉丝 · 80.4K 阅 · 7d 曝光 80.4K
How GLM-5.2 Beat Fable 5 at Website Design
@omarsar0 · 308.0K 粉丝 · 90.2K 阅 · 7d 曝光 90.2K
From Prompting Agents to Loop Engineering
@jasonzhou1993 · 30.8K 粉丝 · 48.5K 阅 · 7d 曝光 48.5K
wtf is Loop Engineer & how to setup for real
@ENERGY · 886.0K 粉丝 · 137.3K 阅 · 7d 曝光 137.3K
Department of Energy Celebrates Second Advanced Reactor Achieving Criticality
@SERobinsonJr · 52.2K 粉丝 · 195.2K 阅 · 7d 曝光 195.2K
ELON CHRON: 18th of June, 2026
@djfarrelly · 3.8K 粉丝 · 344.7K 阅 · 7d 曝光 344.7K
The Agent Loop Architecture
@contralabs_ai · 2.9K 粉丝 · 46.6K 阅 · 7d 曝光 46.6K
Introducing Design Crit: We taught AI to judge design like a designer.
@horizon_trade_x · 4.4K 粉丝 · 1.3M 阅 · 7d 曝光 1.3M
How Quants Use Loop Engineering to Build Alpha (Full Framework)
@nifinet · 10.4K 粉丝 · 62.8K 阅 · 7d 曝光 62.8K
How to Build a GTM Team on Claude Code You Can Run Alone
@EXM7777 · 118.9K 粉丝 · 107.7K 阅 · 7d 曝光 107.7K
how to get Fable-level intelligence back:
@Khazix0918 · 52.5K 粉丝 · 87.2K 阅 · 7d 曝光 87.2K
分享10本我觉得AI时代应该必读的好书。
@Just_sharon7 · 44.1K 粉丝 · 32.5K 阅 · 7d 曝光 32.5K
Arcads MCP + Claude Just Changed AI Ad Creation Forever
@soniajoseph_ · 16.9K 粉丝 · 13.9K 阅 · 7d 曝光 13.9K
World Models and Interpretability Are Two Sides of the Same Coin
@anduriltech · 244.8K 粉丝 · 47.6K 阅 · 7d 曝光 136.2K
U.S. Air Force Selects Anduril to Bring Mission Autonomy to CCA
@anduriltech · 244.8K 粉丝 · 88.6K 阅 · 7d 曝光 136.2K
Anduril Wins Production Contract for U.S. Air Force CCA Program
中文介绍 该视频探讨了九项核心人工智能代理(AI Agent)技能,旨在帮助个人在AI时代中获得竞争优势。内容可能涵盖AI代理的开发、部署及优化策略,例如提示工程、自主决策和多模态交互等,以提升用户在相关领域的专业能力。
中文介绍 该视频演示了如何利用Retool平台构建高质量的企业内部工具。它可能介绍了Retool的低代码开发特性,以及如何通过其拖放式界面和集成能力,帮助非技术人员或开发者快速高效地创建满足特定业务需求的应用程序。
中文介绍 该视频探讨了关于SpaceX以600亿美元收购AI代码编辑器Cursor的传闻,并推测此举可能对科技行业,特别是AI编程工具市场产生巨大影响。视频内容主要围绕这一未经证实的消息进行讨论和预测,分析其潜在的战略意义。
中文介绍 Claude Code推出了「Artifacts」功能,使用户能够实时分享其在代码开发过程中的工作成果。此功能旨在促进团队成员间的实时协作与工作进度同步,从而显著提升开发效率,帮助开发者更好地管理和展示项目进展。
中文介绍 Claude发布了针对MCP连接器的企业级认证管理功能。该功能允许企业客户集中管理和控制其连接器的身份验证流程,提供更精细的访问权限配置。通过集中化管理,此举将显著增强企业的数据安全性和合规性,简化IT管理负担。
中文介绍 Claude发布了一期名为「简报:金融服务」的视频内容,可能涵盖了金融服务行业的最新趋势、市场分析、监管变化或Claude在金融领域提供的解决方案。该简报旨在为金融从业者提供关键洞察。
中文介绍 Claude Code推出了「Artifacts」功能,使用户能够实时分享其在代码开发过程中的工作成果。此功能旨在促进团队成员间的实时协作与工作进度同步,从而显著提升开发效率,帮助开发者更好地管理和展示项目进展。
中文介绍 Claude发布了针对MCP连接器的企业级认证管理功能。该功能允许企业客户集中管理和控制其连接器的身份验证流程,提供更精细的访问权限配置。通过集中化管理,此举将显著增强企业的数据安全性和合规性,简化IT管理负担。
中文介绍 Claude发布了一期名为「简报:金融服务」的视频内容,可能涵盖了金融服务行业的最新趋势、市场分析、监管变化或Claude在金融领域提供的解决方案。该简报旨在为金融从业者提供关键洞察。
中文介绍 科学家们在人工智能代理(AI Agents)领域发现了一种新的、更高效的「语言」,可能有助于改进这些代理之间的沟通与协作方式。这项研究旨在通过优化AI的内部交流机制,提升AI系统在处理复杂任务时的整体表现和理解能力。
中文介绍 该视频引用了一项研究,探讨了深入分析Claude人工智能模型内部工作机制的发现。研究结果据称呈现出一些意想不到的或「奇怪」的现象,为理解大型AI模型的内部逻辑、决策过程以及潜在的复杂性提供了新的视角。
中文介绍 英伟达(NVIDIA)据称推出了一款新的免费人工智能工具或模型,该视频将其描述为「送给人类的礼物」。内容可能详细介绍了该AI的特性、应用场景以及它在加速科学研究、创意设计或日常任务处理等方面对各领域潜在的积极影响。
a quiet day lets us promo AIE one last time
中文介绍 AI新闻报道指出,当天AI领域整体新闻较为平静。该媒体借此机会,对一场AI相关活动或产品进行了最后一次宣传推广。
Miami-based AI startup Subquadratic came out of stealth mode last month with a huge claim. It announced that it had solved a mathematical bottleneck that had been holding back large language models for almost a decade. The details were thin, and many people were unconvinced. But Subquadratic has sta
中文介绍 迈阿密AI初创公司 Subquadratic 上月公开表示,已解决困扰大型语言模型(LLMs)近十年的数学瓶颈。该公司声称这一突破将推动LLMs发展,但目前公布的细节有限,外界对此说法仍持观望态度,部分人表示不相信其有效性。
With GLM-5.2 passing everyone's vibe check, the open models story finally becomes a real frontier story.
中文介绍 最新消息显示,GLM-5.2模型获得了广泛认可,通过了社群的“vibe check”,预示着开放模型领域正成为人工智能发展的新前沿。Z.ai 预测 Open Fable 将于12月发布,可能进一步推动开放模型生态。
**GLM-5.2** emerges as a leading open-weight coding model rivaling **Opus 4.8** and **GPT-5.5** in software engineering tasks, emphasizing the strategic importance of open models for provider competition, on-prem deployment, and fine-tuning rights. Experts like **Patrick Toulme** and **Thomas Wolf**
中文介绍 智谱华章的GLM-5.2模型成为领先的开放权重编码模型,在软件工程任务中可与Opus 4.8和GPT-5.5等模型相媲美。这一发展凸显了开放模型在推动供应商竞争、支持本地部署及保障模型微调权利方面的战略重要性。
中文介绍 本周AI领域出现多项更新:GPT-5.6模型发布,Anthropic的Claude Code宣布支持artifacts功能,同时Perplexity推出了名为“Brain memory”的新特性,旨在增强其AI产品的记忆和理解能力,提升用户体验。
中文介绍 Hugging Face 博客文章探讨了“MosaicLeaks”项目,提出一个关于AI研究代理(research agent)能否有效保守秘密的挑战性问题。这暗示了AI研究中,在数据隐私和信息安全方面可能存在潜在风险或漏洞,需要进一步关注和研究。
We talk about how this legendary investor went from humble beginnings in Singapore to leading rounds in Anthropic, Mistral, Black Forest Labs, and Periodic Labs... and the AMP secret master plan!
中文介绍 Latent Space 采访了著名投资者 Anjney Midha,他是 AMP 的创始人。文章回顾了这位投资者从新加坡起步,逐步主导了对Anthropic、Mistral、Black Forest Labs和Periodic Labs等知名AI公司的多轮投资。其中还提及了AMP的“秘密宏伟计划”。
OpenAI introduces new spend controls and usage analytics for ChatGPT Enterprise, helping organizations manage costs and scale AI with confidence.
中文介绍 OpenAI 为 ChatGPT Enterprise 版本推出了新的支出控制功能和使用情况分析工具。这些更新旨在帮助企业客户更有效地管理其AI服务的成本,并能更自信地扩展AI应用,确保在不超出预算的前提下,充分利用ChatGPT的企业级能力。
Learn how GPT-5.5 Instant improves ChatGPT’s health and wellness responses with stronger reasoning, better context, clearer communication, and physician-informed evaluations.
中文介绍 OpenAI 正持续提升ChatGPT的健康智能能力。GPT-5.5 Instant 模型通过增强推理能力、优化上下文理解、实现更清晰的沟通以及引入医生参与评估,显著改善了ChatGPT在健康和保健领域的响应质量,旨在提供更准确、可靠的健康信息。
Researchers used an OpenAI reasoning model to help diagnose rare diseases, identifying 18 new diagnoses in previously unsolved cases.
中文介绍 研究人员利用OpenAI的推理模型,在罕见儿童遗传病诊断方面取得了进展。通过应用该AI模型,在过去未能确诊的病例中成功识别出18个新的诊断,显著提升了医生诊断复杂罕见疾病的能力,为受影响的儿童带来了希望。
**GLM-5.2** from **Zhipu** emerged as a leading open-weight model with innovative **IndexShare** sparse-attention enabling efficient **1M-token inference**, praised as comparable to **GPT-5.5** and **Opus 4.8** but lacking vision support. Other notable open models include **Laguna M.1** by **Poolsid
中文介绍 智谱公司推出了GLM-5.2模型,作为一款领先的开放权重模型,它凭借创新的IndexShare稀疏注意力机制,实现了高效的1M token推理。该模型被赞誉为性能可与GPT-5.5和Opus 4.8相媲美,但目前尚不支持视觉功能。
The only bootstrapped frontier lab announces its second product and second
中文介绍 唯一一家自筹资金的“前沿实验室”Midjourney Medical,宣布推出其第二款产品。该新产品旨在提供一种便捷的器官扫描方式,其使用体验将像日常使用体重秤一样简单。这标志着医疗AI成像领域可能迎来用户友好的新进展。
Centrally manage authorization for MCP connectors
中文介绍 Claude 官方博客宣布,Anthropic 现已支持对 MCP 连接器进行集中式授权管理。这项功能旨在帮助企业客户更高效、安全地控制和分配访问权限,简化多个连接器的管理流程,提升企业级应用的部署和运营效率。
Steering Claude Code: CLAUDE.md files, skills, hooks, rules, subagents and more
中文介绍 Claude 官方博客发布了一篇关于如何“引导”Claude Code 的详细指南。文章介绍了通过 CLAUDE.md 文件、设定技能、使用钩子(hooks)、制定规则以及部署子代理(subagents)等多种方式,来增强和自定义Claude Code的行为与能力,以适应更复杂的编程任务需求。
Claude Code now supports artifacts
中文介绍 Anthropic 宣布其代码助手产品 Claude Code 现已全面支持artifacts功能。这一更新意味着用户可以在Claude Code中更有效地管理和使用生成的文件、代码片段或其他输出结果,从而提升开发效率和项目协作的便捷性。
6 回复 · Apple 节点
9 回复 · 程序员 节点
12 回复 · 程序员 节点
8 回复 · 程序员 节点
36 回复 · 程序员 节点
6 回复 · 程序员 节点
35 回复 · Apple 节点
8 回复 · Apple 节点
60 回复 · Apple 节点
29 回复 · Apple 节点
以下为废话引子: 最近越用 AI 编程,越觉得一件事很有意思: 以前脑子里冒出一个小需求,通常会因为“不会写”“太麻烦”“没人会做”“不值得花钱找人做”,最后就不了了之。 现在,很多原本只存在于脑内的奇怪需求,真的可以被自己一点点搓出来。 所以不是叫大家谈“用 Claude Code / Codex / Cursor / Windsurf 做得怎么样”。 而是: AI 到底把你脑子里哪些原本不可能落地的想法,变成了真正能跑、能用、甚至已经离不开的小东西? 不要求开源。 尤其是这些: 只解决你自己一个琐碎痛点,但现在每天都在用的东西 工作里偷偷替你省掉大量重复劳动的工具 给家人、朋友、同事做的小
本帖使用社区公益推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的项目是免费使用的,无收费(变相收费、赞助)部分: 是 我的帖子已经打上 公益推广 标签: 是 我的项目属于个人项目,与公司或商业机构无关: 是 我的项目不存在QQ、TG等群组引流: 是 我的项目不存在非运营必要的网站引流: 是 我的项目不存在为他人推广、AFF: 是 我的项目无关联的商业项目: 是 我的站点存在登录,并已接入 LINUX DO Connect: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已
伊朗称霍尔木兹海峡已关闭。 这海峡开开关关比我家电灯都勤… 周一打算把科技卖点掉,估计周一晚美股不保 55 个帖子 - 38 位参与者 阅读完整话题
本帖使用社区公益推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的项目是免费使用的,无收费(变相收费、赞助)部分: 是 我的帖子已经打上 公益推广 标签: 是 我的项目属于个人项目,与公司或商业机构无关: 是 我的项目不存在QQ、TG等群组引流: 是 我的项目不存在非运营必要的网站引流: 是 我的项目不存在为他人推广、AFF: 是 我的项目无关联的商业项目: 是 我的站点存在登录,并已接入 LINUX DO Connect: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 / 否 以下为项目介绍正文内容,AI生成、润
本帖使用社区公益推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的项目是免费使用的,无收费(变相收费、赞助)部分: 是 我的帖子已经打上 公益推广 标签: 是 我的项目属于个人项目,与公司或商业机构无关: 是 我的项目不存在QQ、TG等群组引流: 是 我的项目不存在非运营必要的网站引流: 是 我的项目不存在为他人推广、AFF: 是 我的项目无关联的商业项目: 是 我的站点存在登录,并已接入 LINUX DO Connect: 是 我帖子内的项目介绍,AI生成、润色内容部分已截图发出: 是 以上选择我承诺是永久有效的,接受社区和佬友监督: 是 以下为项目介绍正文内容,AI生成、润色内容已
12 个帖子 - 12 位参与者 阅读完整话题
以下为个人观点,基本上全是暴论,不喜勿喷,给孩子留点面子吧 我是从 2024 年读高二的时候了解到 Vibe Coding 的(当时大家还没有叫它 Vibe Coding ),当时 DeepSeek 刚出 R1 ,除了 OpenAI 的 GPT-o1 之外,大家还没来得及用上思维链,也没有那么强的性能,参数量最大的模型的话好像是 R1 的 671B 。 当时 Token 还没有现在那么便宜,而我又是穷鬼高中生,听说这玩意儿可以辅助编程,便心心念念日思夜想,看着 GPT-o1 馋到流口水,根本买不起订阅。 所幸,我一位玩得好的远房表哥在 AWS 悉尼工作,平时喜欢折腾新奇技术,跟他聊天的时候了解
「君の星辰」 「聊天/售后」 47 个帖子 - 25 位参与者 阅读完整话题
28 个帖子 - 25 位参与者 阅读完整话题
服务器迁移完成,上了腾讯和CF的线路,不过流量还是有限,随时拉闸,佬友三思入手 注意:所有模型均不保证可用性,我是业余做做公益,想好再下手,服务器性能也撑不住太多人 兑换:10dc/100刀 月城公益站 - LINUX DO CDK 再次提醒:没有任何可用性保证,随时都可能拉闸,如果有大佬要赞助号或鸡的可以留言,均用于公益站 附上主帖: 【月城公益站】试运营,支持image2生图 福利羊毛 本帖使用社区公益推广,符合推广要求。我申明并遵循社区要求的以下内容: 我的项目是免费使用的,无收费(变相收费、赞助)部分: 是 我的帖子已经打上 公益推广 标签: 是 我的项目属于个人项目,与公司或商业机构
3 points · 0 comments
43 points · 6 comments
I posted my portfolio here about a year ago (https://news.ycombinator.com/item?id=45154609) and while there was a big response, it was very mixed! It'll probably be similar this time, but regardless of your thoughts about the concept, I think I've done a pretty good job crea
28 points · 6 comments
11 points · 3 comments
39 points · 19 comments
255 points · 98 comments
90 points · 37 comments
98 points · 12 comments
76 points · 107 comments
143 points · 47 comments
72 points · 15 comments
I've been building StartupWiki, a free startup database designed to make it easier to discover and research companies.The original motivation was frustration with how difficult it can be to find information on early-stage startups. Most databases need accounts, or subscriptions, ro just feel to
140 points · 40 comments
50 points · 8 comments
39 points · 13 comments
201 points · 111 comments
Anthropic and OpenAI's publicly available models are explicitly guard-railed so that they refuse offensive tasks. And their cyber-focussed models are gated for enterprises. This leaves SMEs and mid market open to major vulnerabilities.AI can be used as both an adversarial and defensive tool in
56 points · 20 comments
115 points · 80 comments
93 points · 35 comments
395 points · 88 comments
277 points · 95 comments
401 points · 105 comments
30 points · 36 comments
473 points · 235 comments
299 points · 137 comments
12 points · 1 comments
46 points · 17 comments
3 points · 0 comments
今日AI领域亮点纷呈,模型技术、产品应用和行业战略齐头并进。智谱华章推出GLM-5.2开放权重模型,以创新机制实现高效推理,展现了与GPT-5.5和Opus 4.8比肩的强大编码能力。Google Research则发布了TimesFM时间序列基础模型,旨在降低预测门槛。与此同时,OpenAI与Anthropic在产品功能上持续迭代,ChatGPT企业版获得更精细的成本控制和使用分析,Claude Code也迎来了备受期待的Artifacts功能,大幅提升协作效率。产业层面,微软CEO萨提亚·纳德拉强调AI时代构建强大生态系统的重要性,而对外部AI智能的过度依赖则被警示为潜在商业风险。此外,多项开源项目和KOL分享的技术洞见,特别是关于AI智能体循环架构与上下文工程的实践指南,为开发者提供了前沿的工具与方法论,共同勾勒出AI技术与应用不断深化、生态系统日益完善的今日图景。
智谱公司推出了GLM-5.2模型,作为一款领先的开放权重模型,它凭借创新的IndexShare稀疏注意力机制,实现了高效的1M token推理。该模型被赞誉为性能可与GPT-5.5和Opus 4.8相媲美,尤其在软件工程任务中表现出色,但目前尚不支持视觉功能。这一发展凸显了开放模型在推动供应商竞争、支持本地部署及保障模型微调权利方面的战略重要性。
TimesFM(Time Series Foundation Model)是 Google Research 开发的预训练时间序列基础模型,专为时间序列预测设计。该模型利用其强大的泛化能力,能够处理各种复杂的时间序列数据,提供高精度的预测结果。TimesFM 旨在降低时间序列预测的门槛,帮助数据科学家和机器学习工程师更高效地解决业务中的预测挑战。
OpenAI 正持续提升ChatGPT的健康智能能力。GPT-5.5 Instant 模型通过增强推理能力、优化上下文理解、实现更清晰的沟通以及引入医生参与评估,显著改善了ChatGPT在健康和保健领域的响应质量,旨在提供更准确、可靠的健康信息。此举有望让ChatGPT在医疗咨询、健康信息普及等领域发挥更大作用。
该研究重新审视了大型语言模型(LLM)FP4预训练中的「收缩偏差」问题。尽管FP4训练能显著降低内存和计算成本,但当前硬件路径(如NVIDIA Blackwell/Rubin系列和AMD MI350系列GPU)仍主要基于E2M1数据元素。研究深入探讨了收缩偏差的几何起源和系统性影响,并提出了UFP4方案以优化FP4预训练效果,从而提升LLM的训练效率。
Anthropic 宣布其代码助手产品 Claude Code 现已全面支持Artifacts功能。这一更新意味着用户可以在Claude Code中更有效地管理和使用生成的文件、代码片段或其他输出结果,从而提升开发效率和项目协作的便捷性。通过此功能,开发者可以实时预览并分享正在进行的工作,简化代码审查和团队协作流程。
OpenAI 为 ChatGPT Enterprise 版本推出了新的支出控制功能和使用情况分析工具。这些更新旨在帮助企业客户更有效地管理其AI服务的成本,并能更自信地扩展AI应用,确保在不超出预算的前提下,充分利用ChatGPT的企业级能力。新功能将提供更细致的成本洞察和管理手段,助力企业AI战略的落地。
Twenty 是一款开源的 Salesforce 替代品,专为 AI 时代设计。它旨在为企业提供一个功能丰富、高度可定制的客户关系管理(CRM)系统,同时深度整合 AI 能力。Twenty 允许用户拥有数据的完全控制权,降低了专有 CRM 系统的成本和锁定风险,适合中小型企业、寻求定制化解决方案或希望在 CRM 中深度应用 AI 的团队。
微软CEO萨提亚·纳德拉分享了他对AI驱动经济下企业未来的思考。他认为当前的AI转型与以往的平台变革不同,过去数字系统增强人类能力,而AI带来了更深远的变化,需要强大的生态系统来确保可持续发展。这强调了协作和开放的重要性,以适应AI带来的范式转变,并呼吁企业积极构建和融入AI生态。
Latent Space 采访了著名投资者 Anjney Midha,他是 AMP 的创始人。文章回顾了这位投资者从新加坡起步,逐步主导了对Anthropic、Mistral、Black Forest Labs和Periodic Labs等知名AI公司的多轮投资。其中还提及了AMP的「秘密宏伟计划」,揭示了AI领域资本流动的方向和幕后推手,预示着未来AI市场的潜在格局。
针对Mythos公司本周被关停事件,博主探讨了「拥有智能」与「租赁智能」的差异。他指出,公司若过度依赖不受自身控制的外部智能(如AI模型API),一旦供应方政策变化,将面临巨大的业务风险。这提醒企业在AI转型中应审慎评估技术依赖性,避免潜在的供应链风险和业务中断。
OpenMontage 是全球首个开源的、代理式视频制作系统。它将 AI 编码助手升级为全功能视频制作工作室,拥有 12 条处理管道、52 种工具和 500 多个代理技能。该系统旨在通过 AI 代理自动化视频创作的各个环节,从内容生成到后期编辑,极大地提升视频制作效率,尤其适合内容创作者和AI开发者,为视频生产带来革命性变革。
博主分享了AI智能体「上下文工程」的完整攻略。针对智能体在长任务中出现工具调用错误、遗忘指令、输出质量下降等问题,该指南提供了提高智能体长期表现和保持输出质量的实用策略。这对于希望构建更稳定、高效AI智能体的开发者来说,是重要的实践参考,能帮助他们优化智能体在复杂场景下的性能。
博主分享了如何构建一个能「循环运行」的Claude Code智能体团队的详细设置。与传统一次性运行的智能体不同,该团队能持续迭代直至任务完成。博文提供了包含智能体定义和循环驱动逻辑的3个文件示例,为用户提供了具体的实现路径,以提升Claude在自动化编程任务中的效率和可靠性,实现更复杂的任务流自动化。