每日 AI 简报

2026-06-29(内容获取于 06/29 07:57)

智谱AI开源模型GLM-5.2:网络安全场景表现媲美Mythos

The Verge · 06/29 05:42

中国智谱AI (Zhipu AI) 发布了开源模型GLM-5.2,有研究人员称其在网络安全漏洞发现等方面可媲美Mythos。尽管GLM在通用任务上落后于Anthropic和OpenAI模型,但在特定网络安全场景中展现出强大能力,显示了开源模型在特定领域取得突破的潜力。

推荐理由:GLM-5.2在网络安全领域的突出表现,证明了国产开源模型在垂直领域的竞争力,对关注AI安全应用和开源生态的读者具有重要参考价值。

comma.ai 开源机器人操作系统 openpilot 持续升级300+车型驾驶辅助

GitHub Trending

openpilot 是一个开源的机器人操作系统,专注于增强和升级现有车辆的驾驶辅助系统 (ADAS)。它通过先进的计算机视觉和机器学习算法,为超过 300 种受支持的车型提供车道保持、自适应巡航控制等功能。该项目旨在将普通汽车转变为具备更高自动化水平的智能驾驶平台,适用于希望提升车辆智能驾驶能力,或对自动驾驶技术进行研究和开发的爱好者及工程师。

推荐理由:这是一个活跃的开源自动驾驶项目,提供了实际可用的解决方案,对汽车技术爱好者和开发者有极高的动手实践价值。

研究发现LLM代理可靠性测试中转站模型成功率存波动

LinuxDo · 06/28 23:10

一位从事LLM Agent可靠性研究的用户分享,其在测试GPT-5.4-mini等模型的中转站号池时发现,经过1140次测试后,成功率稳定在45%左右,但存在±3%的波动。这引发了对中转站提供所谓“满血pro号池”可靠性的质疑。

推荐理由:该贴提供了LLM代理可靠性的实证数据,揭示了中转站模型池可能存在的不稳定性,对开发者在选择和评估模型时具有警示和参考作用。

针对黑盒大模型的知识蒸馏研究新进展

Hacker News · 06/29 06:32

这篇论文探讨了对黑盒大型语言模型(LLM)进行知识蒸馏的方法。研究旨在从一个无法直接访问内部结构或参数的强大LLM中提取知识,并将其迁移到一个更小、更高效的模型中,以降低计算成本并提高推理速度,同时保持性能。

推荐理由:该研究解决了大模型部署中的核心挑战之一,为优化和利用黑盒LLM提供了新的技术思路,对业界和学术界都有重要参考价值。

视频分享:AI代理团队如何自主运营业务实践

Riley Brown (YouTube) · 06/29 06:16

YouTube博主Riley Brown发布视频,分享他如何成功构建了一个由AI代理组成的团队来运营自己的业务。视频内容可能展示了这些AI代理如何协同工作,自动化其业务流程,并为其他寻求通过人工智能提升运营效率的个人提供了参考和启发。

推荐理由:该视频提供了AI Agent应用于实际业务的成功案例,对希望自动化工作流程和探索AI Agent商业潜力的个人和企业具有重要的实操参考价值。

福特重新聘用资深工程师:AI未能完全满足产品质量需求

TechCrunch · 06/29 03:05

福特汽车因人工智能未能达到预期效果,重新聘用经验丰富的“白胡子工程师”。公司曾错误地认为「仅引入人工智能就能生产出高质量产品」,但现实情况证明,在复杂的产品开发中,AI尚无法完全替代人类经验和专业知识。

推荐理由:福特案例提醒业界,AI在某些复杂领域仍有局限性,不能盲目乐观,人类经验和AI的结合才是实现高质量产品的关键。

腾讯等研究:AI需从“回答者”进化为“任务完成者”方能成为真正同事

The Decoder · 06/28 20:51

腾讯与多所中国大学的一项调研论文指出,AI系统若要成为可靠的“数字同事”,需从仅生成答案转向在持续工作环境中完成整个任务。研究认为,目前的聊天机器人模式尚不足以实现这一目标,需要AI具备更强的任务规划、执行和反馈能力。

推荐理由:这篇研究深刻剖析了AI从“助手”到“同事”的关键转变,为AI Agent的未来发展提供了重要的理论指导和实践方向。

Serenity资本盘点:机器人赛道投资布局平均收益率达164.4%

X 创作者 (AttentionVC) · 06/28 15:52

Serenity资本发布深度报告,盘点了其在机器人赛道及供应链领域的投资布局,并指出平均收益率高达164.4%。报告详细分析了10家核心标的,为关注机器人产业投资的专业人士提供了数据参考和战略洞察。

推荐理由:这份报告提供了机器人赛道投资的最新数据和案例分析,对希望了解该领域投资机会和高增长潜力的读者极具参考价值。

discode.ai:整合百余种AI模型的一站式环保平台

Product Hunt · 06/29 07:50

discode.ai 提供一个统一的用户界面,整合了超过100个不同的AI模型。这款平台强调其环保特性,旨在为用户提供一个高效且可持续的AI模型管理和使用环境。通过单一入口,用户可以便捷地访问多种AI功能,简化AI工具的使用体验。

推荐理由:discode.ai 提供了一个整合多AI模型且注重环保的便捷平台,对于希望高效管理和使用多种AI工具的个人和团队来说是一个实用选择。

China’s Z.ai claims it can match Mythos on cybersecurity

China's Zhipu AI (Z.ai) released its open-weight GLM-5.2, and some researchers have claimed that it matches Mythos in certain bug-finding and cybersecurity scenarios. While GLM lags behind models from Anthropic and OpenAI in other, more general tasks, it seems that China has dramatically reduced the

中文介绍 中国智谱AI (Zhipu AI) 发布了开源模型GLM-5.2,有研究人员称其在网络安全漏洞发现等方面可媲美Mythos。尽管GLM在通用任务上落后于Anthropic和OpenAI模型,但在特定网络安全场景中展现出强大能力。

California law targeting loud streaming ads takes effect on July 1

Streaming ads might be getting a lot quieter.

中文介绍 加利福尼亚州一项旨在控制流媒体广告音量的法律将于7月1日生效。该法案预计将使流媒体平台的广告音量趋于平缓,改善用户体验。

Suno launches Spark incubator program to feed independent artists to its AI machine

Suno has ambitions to be more than just a toy to churn out AI slop, it also wants to be a streaming destination and to break new artists. Spark is their new incubator program for independent artists that provides grants, mentorship, and marketing support. To apply, artists need to be an unsigned sin

中文介绍 AI音乐公司Suno推出“Spark”孵化器项目,旨在支持独立艺术家,提供资助、指导和营销支持。Suno希望借此不仅成为AI音乐创作工具,还能发展为流媒体平台并发掘新晋艺术家。

Ford rehires ‘gray beard’ engineers after AI falls short

"Mistakenly we thought that by just introducing artificial intelligence ... that would produce a high-quality product.”

中文介绍 福特汽车因人工智能未能达到预期效果,重新聘用经验丰富的“白胡子工程师”。公司曾错误地认为「仅引入人工智能就能生产出高质量产品」,但现实情况证明AI尚无法完全替代人类经验。

Why did this journal retract two 1940s papers by Max Planck?

Clicking on the links now reveals blank pages and empty PDFs. "Intellectually, it’s not acceptable.”

中文介绍 一家学术期刊撤回了物理学家马克斯·普朗克(Max Planck)于1940年代发表的两篇论文。目前,点击相关链接仅显示空白页面和PDF文件,此举引发了“在学术上不可接受”的质疑。

China claims the world’s fastest supercomputer

The LineShine supercomputer at the National Supercomputing Center in Shenzhen. | Photo: Liang Xu/Xinhua via Getty Images Despite trade restrictions, China has reclaimed the title of the world's fastest supercomputer for the first time since 2018. LineShine has pushed El Capitan out of number one on

中文介绍 中国宣称其在深圳国家超级计算中心研发的“LineShine”超级计算机,已超越“El Capitan”,成为全球运算速度最快的超级计算机。这是中国自2018年以来再次获得此称号,尽管面临贸易限制。

The Cube is Jim Henson’s little-known proto-Black Mirror masterpiece

That sure is a man in a cube, alright. | Image: NBC / Jim Henson Company I'm sure we're all familiar with Dark Crystal, so we know that Jim Henson can be weird and tackle slightly more mature subject matter. But there is little in his oeuvre that is quite as mind-bending as the Muppetless The Cube.

中文介绍 吉姆·亨森(Jim Henson)鲜为人知的作品《立方体》(The Cube)被誉为一部“原型《黑镜》式”的杰作。该片被认为是亨森最“烧脑”的作品之一,探讨了成熟主题,与他的《黑暗水晶》风格有所类似。

TechCrunch Mobility: All eyes on Tesla FSD

Welcome back to TechCrunch Mobility, your hub for the future of transportation and now, more than ever, how AI is playing a part.

中文介绍 TechCrunch Mobility栏目聚焦特斯拉(Tesla)的全自动驾驶(FSD)系统,强调人工智能在未来交通运输中扮演着日益重要的角色,吸引了业界的广泛关注。

Why Wall Street thinks US memory maker Micron is the next Nvidia

Eager to find more public AI-related companies that may do as well as Nvidia, Wall Street investors think they've found a winner with Micron.

中文介绍 华尔街投资者认为,美国存储芯片制造商美光科技(Micron)有望成为“下一个英伟达”(Nvidia)。投资者正积极寻找更多与AI相关的上市公司,认为美光在AI领域具有巨大的增长潜力。

Prosecutors used ChatGPT logs as evidence in the Palisades fire trial

Jonathan Rinderknecht was facing arson charges for setting a fire on New Year's Day in 2025, which became one of the deadliest wildfires in LA history. To make their case, prosecutors turned to location data from his iPhone, security camera footage, and witness testimony. But they also turned to his

中文介绍 2025年洛杉矶“帕利塞德斯”山火案中,检察官将ChatGPT的使用记录作为证据提交。被告乔纳森·林德内希特(Jonathan Rinderknecht)面临纵火指控,检察官除了iPhone定位数据、监控录像和证人证词外,还首次引入AI聊天记录作为呈堂证供。

Govee’s smart nugget ice maker makes every iced drink feel like a luxury

For some people, the ice in a beverage is almost as important as the drink itself. That’s the audience Govee had in mind when designing its latest ice maker, the GoveeLife Smart Nugget Ice Maker Pro. This $500 premium smart home gadget is aimed at those who crave what’s called “the good ice,” the so

中文介绍 Govee推出了一款售价500美元的高端智能家居产品——GoveeLife Smart Nugget Ice Maker Pro制冰机。该设备旨在满足那些对冰块品质有高要求的消费者,让他们享受制作“冰块粒”的奢华体验。

AI won't become a real coworker until it stops answering and starts finishing tasks

A survey paper by Tencent and several Chinese universities traces the path from chatbot to "digital colleague." AI systems won't become reliable coworkers, the researchers argue, until they finish entire tasks in persistent work environments instead of just generating answers. The key lies in combin

中文介绍 腾讯与多所中国大学的一项调研论文指出,AI系统若要成为可靠的“数字同事”,需从仅生成答案转向在持续工作环境中完成整个任务。研究认为,目前的聊天机器人模式尚不足以实现这一目标。

Coinbase joins the rush to Chinese AI models as Western labs face a pricing stress test

Coinbase CEO Brian Armstrong is switching his company to Chinese AI models like GLM 5.2 and Kimi 2.7. An automated routing system picks the best model for each request based on task and price, and better caching pushed the hit rate from 5 to 60 percent. Coinbase has cut its AI spending in half even

中文介绍 Coinbase首席执行官Brian Armstrong正将公司切换至GLM 5.2、Kimi 2.7等中国AI模型。通过自动化路由系统根据任务和价格选择模型,并优化缓存将命中率从5%提升至60%,成功削减AI开支,给西方AI实验室带来定价压力。

Nest’s quest to fix your thermostat

The founding story of Nest is pretty much a perfect tech myth. A legendary product maker (in this case, Tony Fadell) helps create one of the most successful products ever (the iPhone) and then rides off into the sunset to enjoy the rest of his life, only to have an experience that drags him back for

中文介绍 文章探讨了智能家居品牌Nest的创立故事。作为iPhone的重要设计师之一,托尼·法德尔(Tony Fadell)在离开苹果后,旨在通过Nest恒温器解决传统温控器问题,开启了智能家居的革新之路。

simplex-chat/simplex-chat

Haskell · ★ 14,956 · 🍴 865 · 📈 1,183 stars today

SimpleX - the first messaging network operating without user identifiers of any kind - 100% private by design! iOS, Android and desktop apps 📱!

中文介绍 SimpleX 是一个注重极致隐私的去中心化消息网络,设计之初就避免使用任何用户标识符,实现 100% 匿名通信。它通过独特的协议机制,让用户无需注册账号、无需手机号或邮箱,即可安全私密地进行消息交换。该项目提供 iOS、Android 和桌面端应用程序,适用于重视个人数据隐私和匿名交流的用户,尤其是在需要高度保密通信的场景。

ripienaar/free-for-dev

HTML · ★ 125,175 · 🍴 13,165 · 📈 472 stars today

A list of SaaS, PaaS and IaaS offerings that have free tiers of interest to devops and infradev

中文介绍 `free-for-dev` 是一个精心整理的资源列表,汇集了众多为开发者和运维工程师提供免费使用额度 (free tiers) 的 SaaS、PaaS 和 IaaS 产品及服务。该项目旨在帮助开发者和基础设施工程师发现和利用这些免费资源,以降低个人项目、原型开发或小型团队的运营成本。它涵盖了从云服务、数据库、CI/CD 工具到 API 网关等多个类别,对于预算有限的个人开发者、初创团队或学习新技术的工程师极具参考价值。

commaai/openpilot

Python · ★ 62,368 · 🍴 11,092 · 📈 265 stars today

openpilot is an operating system for robotics. Currently, it upgrades the driver assistance system on 300+ supported cars.

中文介绍 openpilot 是一个开源的机器人操作系统,专注于增强和升级现有车辆的驾驶辅助系统 (ADAS)。它通过先进的计算机视觉和机器学习算法,为超过 300 种受支持的车型提供车道保持、自适应巡航控制等功能。该项目旨在将普通汽车转变为具备更高自动化水平的智能驾驶平台,适用于希望提升车辆智能驾驶能力,或对自动驾驶技术进行研究和开发的爱好者及工程师。

xbtlin/ai-berkshire

Python · ★ 5,254 · 🍴 717 · 📈 1,456 stars today

AI 时代的伯克希尔:基于 Claude Code / Codex 的价值投资研究框架。巴菲特·芒格·段永平·李录四大师方法论 + 多Agent并行研究。| AI-era Berkshire: a value investing research framework built for Claude Code / Codex. 4 masters' methodologies + multi-agent adversarial analysis.

中文介绍 `ai-berkshire` 旨在构建一个 AI 时代的价值投资研究框架,其核心是借鉴巴菲特、芒格、段永平、李录四位投资大师的方法论,并结合 Claude Code 大模型技术进行实践。该项目利用多 Agent 并行研究机制,模拟专家分析师的工作流,对公司进行深度价值分析,识别潜在投资机会。它为量化投资者、AI 开发者和对价值投资感兴趣的用户提供了一个利用 AI 进行高级金融分析的实验性平台,以期在复杂的市场环境中做出更明智的投资决策。

Robbyant/lingbot-map

Python · ★ 8,206 · 🍴 800 · 📈 372 stars today

A feed-forward 3D foundation model for reconstructing scenes from streaming data

中文介绍 `lingbot-map` 是一个面向机器人和实时应用设计的 3D 基础模型,它利用前馈神经网络技术,能从连续的流式数据中高效重建三维场景。该项目旨在解决动态环境中实时感知和高精度地图构建的挑战,尤其适用于需要即时理解周围环境的机器人、自动驾驶系统或增强现实(AR)设备。通过提供一个强大的 3D 感知框架,它能够帮助这些系统实现更智能的导航、避障和交互能力,为未来的智能体和沉浸式体验提供核心空间感知能力。

DeusData/codebase-memory-mcp

C · ★ 19,573 · 🍴 1,418 · 📈 2,162 stars today

High-performance code intelligence MCP server. Indexes codebases into a persistent knowledge graph — average repo in milliseconds. 158 languages, sub-ms queries, 99% fewer tokens. Single static binary, zero dependencies.

中文介绍 `codebase-memory-mcp` 是一个高性能的代码智能 MCP 服务器,专为快速理解和索引大规模代码库而设计。它能将多达 158 种编程语言的代码库构建成持久化的知识图谱,平均每个仓库的索引时间仅需数毫秒。该项目提供亚毫秒级的查询速度,并显著减少了处理所需的 token 数量(99%),非常适合需要深度代码理解的 AI 应用。作为单个静态二进制文件,它部署简便,能赋能开发者构建智能代码助手、高级搜索和分析工具。

cupy/cupy

Python · ★ 11,503 · 🍴 1,069 · 📈 172 stars today

NumPy & SciPy for GPU

中文介绍 `CuPy` 是一个用于 GPU 加速的 Python 库,它提供了与 NumPy 和 SciPy 兼容的 API 接口。该项目旨在帮助数据科学家、机器学习工程师和科研人员,能够通过最小的代码改动,将现有的 NumPy/SciPy 计算任务无缝迁移到 NVIDIA GPU 上运行。它解决了纯 CPU 计算在处理大规模数组运算和科学计算时性能瓶颈的问题,显著提升了数据处理和模型训练的速度,特别适用于深度学习、图像处理和物理模拟等计算密集型场景。

altic-dev/FluidVoice

Swift · ★ 3,702 · 🍴 236 · 📈 491 stars today

FluidVoice - Fastest macOS Offline Dictation app - Voice to Text fully Local. One ⭐ takes us a long way :))

中文介绍 `FluidVoice` 是一款专为 macOS 用户设计的高性能离线听写应用,旨在提供极速的语音转文本体验。该项目最大的亮点在于其完全本地化的处理能力,无需联网即可准确进行语音识别,有效保护了用户隐私并确保了数据安全。它解决了传统在线听写服务可能存在的延迟、隐私泄露和网络依赖问题,非常适合需要频繁进行文本输入、注重效率和隐私的 macOS 用户,无论是撰写文档、记录会议还是日常办公,都能提供流畅且安全的语音输入体验。

opendatalab/MinerU

Python · ★ 71,552 · 🍴 6,012 · 📈 426 stars today

Transforms complex documents like PDFs and Office docs into LLM-ready markdown/JSON for your Agentic workflows.

中文介绍 MinerU 专注于将复杂的非结构化文档,如 PDF 和 Office 文档,高效转换为 LLM (大型语言模型) 易于处理的 Markdown 或 JSON 格式。该工具解决了传统文档格式难以直接被 AI 代理理解和利用的问题,通过智能解析和结构化处理,为 Agentic 工作流提供高质量的输入数据。这使得 AI 代理能够更准确地从文档中提取信息、执行分析或生成内容,极大地提升了处理文档密集型任务的效率和准确性。

HKUDS/Vibe-Trading

Python · ★ 14,283 · 🍴 2,629 · 📈 490 stars today

"Vibe-Trading: Your Personal Trading Agent"

中文介绍 Vibe-Trading 是一个个人交易 Agent 项目,旨在为用户提供智能化的交易辅助。它可能通过分析市场数据、情绪指标等,自动化交易决策和执行策略,帮助用户更好地管理投资组合并捕捉交易机会。该项目适用于希望利用 AI 技术增强交易能力、实现自动化投资或寻求个性化交易策略的个人投资者和量化交易爱好者。

ByteByteGoHq/system-design-101

★ 84,418 · 🍴 9,346 · 📈 132 stars today

Explain complex systems using visuals and simple terms. Help you prepare for system design interviews.

中文介绍 `system-design-101` 是一个专注于系统设计学习的开源项目,旨在通过直观的图表和简明的语言,帮助读者理解复杂的分布式系统架构。该项目将抽象的系统概念具象化,解决了传统教材可能存在的理论性过强、难以理解的问题。它特别适用于准备系统设计面试的软件工程师,以及任何希望深入了解大型系统如何构建、伸缩和维护的技术人员。通过提供清晰的解释和实用的案例,它能有效提升读者的系统设计思维和解决实际问题的能力。

usestrix/strix

Python · ★ 26,698 · 🍴 2,983 · 📈 88 stars today

Open-source AI hackers to find and fix your app’s vulnerabilities.

中文介绍 `strix` 是一个开源的 AI 安全工具,旨在帮助开发者和安全团队自动发现并修复应用程序中的潜在漏洞。该项目利用人工智能技术,模拟“AI 渗透测试员”的行为模式,对应用进行深度分析和攻击模拟,从而有效识别传统安全扫描工具可能遗漏的安全缺陷。它解决了人工安全审计耗时耗力、且容易出错的问题,特别适用于需要持续安全保障的开发流程(如 CI/CD),帮助团队在软件发布前提升应用的整体安全性,降低潜在的安全风险。

browser-use/video-use

Python · ★ 11,015 · 🍴 1,522 · 📈 324 stars today

Edit videos with coding agents

中文介绍 `video-use` 是一个探索通过“编码代理”来编辑视频的创新项目。它旨在颠覆传统的图形界面视频编辑模式,允许用户通过编写代码或使用智能代理来自动化和执行复杂的视频剪辑、特效添加及内容生成等任务。该项目解决了传统视频编辑软件操作繁琐、难以批量处理的问题,为开发者、内容创作者和研究人员提供了一种全新的、更具编程性和自动化潜力的视频制作方式,尤其适合需要进行程序化视频生成、自动化后期处理或实验新颖交互模式的场景。

27 Hidden Claude Features, Settings & Shortcuts That Most Users Don't Know

@sairahul1 · 121.4K 粉丝 · 2.9M 阅 · 506 赞 · 97 转

Most people use Claude Code like a fancy autocomplete. They prompt. They wait. They accept the first output. They are leaving 90% of the power on the table. There are 27 specific moves that separate

中文介绍 此推文列举 27 个大多数用户可能不了解的 Claude 隐藏功能、设置与快捷方式。旨在帮助用户发现并充分利用 Claude 更深层次的能力,以提高效率和操作体验,解锁其未被发现的潜力。

How To Build a One-Person Company Using Claude Cowork

@sairahul1 · 121.4K 粉丝 · 876.6K 阅 · 547 赞 · 83 转

Emails. Formatting. Compiling reports. Preparing decks. Organizing files. Researching. Marketing. Writing. SEO. The average knowledge worker spends 60% of their day on above work that doesn't require

中文介绍 帖子讨论如何利用 Claude Cowork 搭建一人公司。博主可能分享了相关策略、工具集成或具体实践方法,旨在为独角创业者提供运营思路和效率提升方案。

The efficiency gap: How do cells and GPUs compare when running the exact same algorithm?

@spandan_madan · 1.1K 粉丝 · 626.9K 阅 · 516 赞 · 28 转

AI hardware is having a moment. Hyperscaler capex on AI data centres is on track to clear $690 billion in 2026, and private equity has followed in scale — Blackstone alone reports a $55B+ data-centre

中文介绍 该帖子探讨了 AI 硬件的当前发展趋势与投资规模,并引出对生物细胞与 GPU 在执行相同算法时效率差异的比较。文章深究了两种截然不同的计算范式,旨在分析现有 AI 硬件的局限性,并为未来 AI 算力架构的演进提供新的思考角度。

Introducing Engram: Scaling compute on your context

@EngramLab · 1.2K 粉丝 · 255.7K 阅 · 537 赞 · 76 转

We’re Engram. We’re building AI that learns from you and deeply understands your work. Today’s AI models don’t understand what you do. Not really. Everything models know comes from their training –

中文介绍 Engram Lab 正式推出其新产品 Engram,这是一款旨在「深入理解用户工作」并能从用户互动中学习的 AI。该产品致力于解决现有 AI 模型仅依赖训练数据、无法真正理解个体工作背景的局限,通过扩展上下文计算能力,提供更个性化和高效的 AI 协助。

30 Core Agentic Engineering Concepts Every Developer Should Know

@sairahul1 · 121.4K 粉丝 · 249.0K 阅 · 502 赞 · 90 转

There are 8 billion people on the planet. Only a fraction of developers understand how AI agents actually work. Not the demos. Not the hype. The real engineering underneath. Every week a new agent

中文介绍 针对当前多数开发者对 AI 代理缺乏深入理解的现状,该帖子列举了「30 个核心代理工程概念」。内容旨在揭示 AI 代理背后的真实工程原理,而非仅停留在演示或炒作层面,帮助开发者掌握构建和理解 AI 代理所需的基础知识,提升其代理工程能力。

$OUST Deep Dive - One of My Favorite Physical AI Plays

@crux_capital_ · 52.8K 粉丝 · 217.5K 阅 · 503 赞 · 56 转

This is the most in depth report I have ever written, on a very exciting company. If you read this article you will have a much deeper understanding of what Ouster does, how it plays into Physical AI,

中文介绍 博主发布一篇关于 Ouster 公司的深度分析报告,详尽阐述该公司在“实体 AI”(Physical AI)领域的核心角色、技术及市场潜力,旨在帮助读者深入理解其业务模式。

ORACLE: Official AI Agents Trade on Polymarket

@Oracle_Trade_ai · 39.9K 粉丝 · 197.8K 阅 · 2.8K 赞 · 580 转

In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We

中文介绍 该帖子介绍 ORACLE,一个在 Polymarket 预测市场进行交易的「官方 AI 代理」。帖子展望到 2026 年,预测市场中超过 30% 的活动将由算法和 AI 驱动的钱包产生,强调了 AI 代理在自动化交易和预测市场中的日益增长影响力与有效性。

Why we're bullish on loops

@posthog · 21.8K 粉丝 · 162.4K 阅 · 512 赞 · 36 转

When the creators of both OpenClaw and Claude Code speak, people listen. And recently Peter Steinberger and Boris Cherny have both been talking about the same concept: loops. Their argument? You

中文介绍 该帖子探讨了「循环」概念的重要性,并援引 OpenClaw 和 Claude Code 创始人 Peter Steinberger 与 Boris Cherny 的观点,解释了为何应看好循环工程。文章旨在强调循环在 AI 交互和自动化中的核心作用,主张通过构建循环而非简单的提示词来提升 AI 系统的效率和自主性。

ORACLE: Official AI Agents Trade on Polymarket

@OracAItrading · 31.8K 粉丝 · 141.6K 阅 · 2.8K 赞 · 576 转

In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We

中文介绍 该帖子介绍 ORACLE,一个在 Polymarket 预测市场进行交易的「官方 AI 代理」。帖子展望到 2026 年,预测市场中超过 30% 的活动将由算法和 AI 驱动的钱包产生,强调了 AI 代理在自动化交易和预测市场中的日益增长影响力与有效性。

Interactions API: Our primary interface for Gemini models and agents

@GoogleAIStudio · 179.4K 粉丝 · 138.2K 阅 · 504 赞 · 42 转

Today we're announcing that the Interactions API has reached general availability and is now our primary API for interacting with Gemini models and agents. We launched its public beta in December

中文介绍 Google AI Studio 宣布 Interactions API 已正式普遍可用,并成为其与 Gemini 模型和代理交互的「主要接口」。该 API 于去年 12 月推出公测版,此举标志着 Google 为开发者提供了更稳定、更强大的工具,以便更好地利用 Gemini 系列 AI 产品。

ORACLE: Official AI Agents Trade on Polymarket

@Oractrading · 33.9K 粉丝 · 109.2K 阅 · 2.8K 赞 · 585 转

In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We

中文介绍 该帖子介绍 ORACLE,一个在 Polymarket 预测市场进行交易的「官方 AI 代理」。帖子展望到 2026 年,预测市场中超过 30% 的活动将由算法和 AI 驱动的钱包产生,强调了 AI 代理在自动化交易和预测市场中的日益增长影响力与有效性。

How To Use Loop Engineering To Build A Self-Improving Quant Trading System

@RohOnChain · 51.4K 粉丝 · 108.3K 阅 · 501 赞 · 65 转

I will break down exactly how to build the loops that run an entire quant trading system on their own. Let's get straight to it. Bookmark This - I'm Roan, a backend developer working on system

中文介绍 博主详细分解了如何运用「循环工程」技术,构建一个能够自主运行并持续改进的量化交易系统。该教程面向后端开发者,旨在教授如何设计和实现驱动整个量化交易流程的自动化循环,从而提升系统的自适应性和交易效率。

ORACLE: Official AI Agents Trade on Polymarket

@Oracle__Market · 5.9K 粉丝 · 100.0K 阅 · 2.1K 赞 · 823 转

In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We

中文介绍 推文展望 2026 年,自治 AI 代理将成为预测市场 Polymarket 上的高效策略。届时,超过 30% 的平台活动预计由算法和 AI 驱动的钱包贡献,展示了 AI 在预测和交易领域的巨大潜力与影响力。

ORACLE: Official AI Agents Trade on Polymarket

@Oracle_Market__ · 25.1K 粉丝 · 99.3K 阅 · 2.8K 赞 · 224 转

In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We

中文介绍 帖子展望 2026 年,预测自治 AI 代理将在 Polymarket 等预测市场中占据主导地位。届时,超过 30% 的市场活动将由算法和 AI 驱动的钱包产生,揭示 AI 在金融预测领域的未来潜力。

This Week on Base: New Base MCP skills + now live in Perplexity, Base App on desktop, and more!

@base · 1.3M 粉丝 · 93.3K 阅 · 501 赞 · 127 转

News ■ Base MCP's new skills let agents transact, trade, lend, mint, and buy onchain across 13 apps: @yield @AskVenice @KyberNetwork @opensea @o1_exchange @Balancer @printr @bitrefill @flaunchgg

中文介绍 Base 宣布其 MCP 推出新技能,赋能 AI 代理在 13 个 DApp 上实现链上交易、借贷、铸币及购买等操作。这些新功能支持代理与 @yield、@KyberNetwork、@opensea 等应用交互,显著扩展了 Base 生态中 AI 代理的自动化能力。

thoughts on why mcp didn't work, what's next

@RhysSullivan · 57.4K 粉丝 · 86.1K 阅 · 503 赞 · 25 转

mcp came out when the best models were sonnet 3.5 and GPT 4o not a lot was known about how to properly work with these tools yet, we were still incredibly concerned on models having access to tools,

中文介绍 博主反思 MCP 初期表现不佳的原因,认为当时 Sonnet 3.5 和 GPT-4o 等最佳模型仍存局限,且对模型直接访问工具的能力普遍担忧。推文暗示了对该项目未来发展方向的思考,为早期 AI 代理的挑战提供了见解。

Subnets mine TAO; TAO mines Subnets

@const_reborn · 29.7K 粉丝 · 79.8K 阅 · 503 赞 · 116 转

e_i \;\propto\; \underbrace{\rho_i \times \bar{p}_i}_{\text{linear (maximize)}} \times \underbrace{(1 - b_i)}_{\text{boolean gate}} Disclaimer: this upgrade only effects subnet owners and dynamic TAO

中文介绍 该帖子深入探讨了 subnets (子网) 与 TAO 之间的内在机制,并通过数学公式解释了它们如何相互「挖矿」和协同工作。内容涉及动态 TAO 和布尔门控等技术细节,主要面向子网所有者,揭示了底层经济模型和激励机制,强调了去中心化网络中的价值流转。

$OUST Deep Dive - One of My Favorite Physical AI Plays

@crux_capital_ · 52.8K 粉丝 · 217.5K 阅 · 7d 曝光 217.5K

$OUST Deep Dive - One of My Favorite Physical AI Plays

中文介绍 博主发布一篇关于 Ouster 公司的深度分析报告,详尽阐述该公司在“实体 AI”(Physical AI)领域的核心角色、技术及市场潜力,旨在帮助读者深入理解其业务模式。

How To Build a One-Person Company Using Claude Cowork

@sairahul1 · 121.4K 粉丝 · 876.6K 阅 · 7d 曝光 3.7M

How To Build a One-Person Company Using Claude Cowork

中文介绍 帖子讨论如何利用 Claude Cowork 搭建一人公司。博主可能分享了相关策略、工具集成或具体实践方法,旨在为独角创业者提供运营思路和效率提升方案。

Human in the /loop

@ericzakariasson · 76.0K 粉丝 · 32.3K 阅 · 7d 曝光 32.3K

Human in the /loop

27 Hidden Claude Features, Settings & Shortcuts That Most Users Don't Know

@sairahul1 · 121.4K 粉丝 · 2.9M 阅 · 7d 曝光 3.7M

27 Hidden Claude Features, Settings & Shortcuts That Most Users Don't Know

中文介绍 此推文列举 27 个大多数用户可能不了解的 Claude 隐藏功能、设置与快捷方式。旨在帮助用户发现并充分利用 Claude 更深层次的能力,以提高效率和操作体验,解锁其未被发现的潜力。

DanceOPD: On-Policy Generative Field Distillation

👍 71

Modern image generation demands a single model that unifies diverse capabilities, including text-to-image (T2I), local editing, and global editing. However, these capabilities are rarely naturally aligned and often conflict. For instance, editing tends to degrade T2I performance, while global and lo

中文介绍 现代图像生成需统一文本到图像、局部和全局编辑能力,但这些能力常有冲突。DanceOPD 论文介绍了一种策略生成场蒸馏模型,旨在解决这些能力之间的对齐和冲突问题,提升单模型在多任务下的图像生成性能,避免编辑任务对文本到图像性能的降低。

Ask, Solve, Generate: Self-Evolving Unified Multimodal Understanding and Generation via Self-Consistency Rewards

👍 0

Most unified large multimodal models (LMMs) that support both visual understanding and image generation still rely on curated post-training supervision, such as human annotations, preference labels, or external reward models. We ask whether a unified LMM can improve both abilities autonomously using

中文介绍 大多数统一大型多模态模型(LMMs)在视觉理解和图像生成方面,仍依赖人工标注或外部奖励模型进行后训练。本研究探讨 LMMs 如何通过“提问、解决、生成”的自我一致性奖励机制实现自我进化,从而在不依赖额外监督的情况下,同步提升其理解与生成能力。

Paying More Attention to Visual Tokens in Self-Evolving Large Multimodal Models

👍 0

Recently, self-evolving large multimodal models (LMMs) have received attention for improving visual reasoning in a purely unsupervised setting. However, multi-role self-play and self-consistency reward schemes in existing self-evolving LMMs optimize answer agreement without ensuring the decoder atte

中文介绍 自进化大型多模态模型(LMMs)在无监督视觉推理方面受到关注。本研究指出,现有模型的多角色自玩和自我一致性奖励机制,主要优化答案一致性,可能忽视对视觉token的深入关注。论文提出应更重视视觉token,以确保推理的视觉准确性和深度。

PhysiFormer: Learning to Simulate Mechanics in World Space

👍 9

We present PhysiFormer, a diffusion transformer for physically-plausible 3D object motion. Unlike video world models that operate in view-dependent pixel space, PhysiFormer represents objects as 3D meshes expressed in world coordinates. Given the initial vertex positions and velocities, as well as o

中文介绍 PhysiFormer 是一种扩散Transformer,用于模拟物理上可信的3D物体运动。与传统在像素空间操作的视频世界模型不同,PhysiFormer 将物体表示为世界坐标中的3D网格。该模型能根据初始顶点位置和速度,预测未来物理运动,提高3D模拟的真实性。

Autoregressive Boltzmann Generators

👍 0

Efficient sampling of molecular systems at thermodynamic equilibrium is a hallmark challenge in statistical physics. This challenge has driven the development of Boltzmann Generators (BGs), which allow rapid generation of uncorrelated equilibrium samples by combining a generative model with exact li

中文介绍 高效采样热力学平衡态下的分子系统是统计物理学的核心挑战。本研究介绍了自回归玻尔兹曼生成器(Autoregressive Boltzmann Generators),该模型结合生成式方法,能够快速生成去相关且符合平衡分布的样本,有效解决分子模拟中的采样效率问题。

SAM2Matting: Generalized Image and Video Matting

👍 0

Despite impressive advances in image matting, video matting remains challenging due to the inherent gap between high-level tracking, which requires frame-wise understanding, and low-level matting, which focuses on extremely fine-grained details. Existing methods attempt this with expensive and narro

中文介绍 尽管图像抠图技术进步显著,但视频抠图仍因高层跟踪和细粒度抠图之间的鸿沟而充满挑战。SAM2Matting 论文提出一种通用图像和视频抠图方法,旨在弥合不同任务间的差距,通过统一框架实现从图像到视频的精细抠图,提升泛化能力。

Hallucination in World Models is Predictable and Preventable

👍 8

Modern generative world models render increasingly realistic action-controllable futures, yet they frequently hallucinate: rollouts remain visually fluent while drifting from the ground-truth dynamics. We hypothesize that hallucination concentrates in low-coverage regions of the state-action space,

中文介绍 现代生成式世界模型在生成逼真的可控未来时,常出现幻觉,即视觉上流畅但偏离真实动力学。本研究发现,这种幻觉现象集中在状态空间的低覆盖区域,并提出幻觉是可预测和可预防的。这项研究为提升世界模型预测的准确性提供了新的见解。

OctoSense: Self-Supervised Learning for Multimodal Robot Perception

👍 0

We present OctoSense, an open-source sensor platform with stereo RGB and event cameras, LiDAR, a thermal camera, an inertial measurement unit, RTK-corrected global positioning system, and proprioception (CAN bus data from a car, and joint angles for a quadruped robot). The eponymous OctoSense datase

中文介绍 OctoSense 论文发布了一个开源的多模态机器人感知传感器平台。它集成了双目RGB和事件相机、激光雷达、热像仪、IMU、RTK-GPS以及本体感知数据。该平台旨在通过自监督学习,全面提升机器人在复杂环境下的感知能力和鲁棒性。

ViQ: Text-Aligned Visual Quantized Representations at Any Resolution

👍 38

A unified representation for text and vision is a natural pursuit, as it enables simpler multimodal modeling and more efficient training. However, representing images as discrete signals in the same way as text inevitably introduces severe information loss. Existing work struggles to balance low-lev

中文介绍 为实现更简洁高效的多模态建模,文本与视觉的统一表示是关键目标。然而,将图像离散化如文本般会带来严重信息损失。ViQ 论文介绍了一种文本对齐的视觉量化表示方法,能在任意分辨率下处理图像,旨在克服现有方法的不足,解决信息损失挑战。

LA4VLA: Learning to Act without Seeing via Language-Action Pretraining

👍 0

Vision-Language-Action (VLA) models are commonly pretrained on robot demonstrations by jointly mapping visual observations and language instructions to actions. However, dense visual-action supervision can dominate the comparatively sparse language-action signal. As a result, policies may rely on vi

中文介绍 LA4VLA是一种新的机器人模型,其核心在于通过语言-动作预训练,使机器人能够在没有视觉输入的情况下执行操作。它旨在解决现有VLA(视觉-语言-动作)模型中,密集视觉-动作监督信号常主导稀疏语言-动作信号的问题。LA4VLA的提出,有望提升机器人对语言指令的理解和执行能力,实现更灵活的具身智能。

When Does Combining Language Models Help? A Co-Failure Ceiling on Routing, Voting, and Mixture-of-Agents Across 67 Frontier Models

👍 3

Multi-model LLM systems such as routing, voting, cascades, fusion, and mixture-of-agents are used to beat single-model accuracy. We show that their gain is capped by a quantity the field rarely reports. For any policy whose output is one member model answer, accuracy cannot exceed one minus beta, wh

中文介绍 多模型大语言模型(LLM)系统,如路由、投票和混合专家,常用于超越单模型准确率。本研究分析了67个前沿模型,发现多模型系统的增益受「共同失败上限」限制,即其准确率无法超过所有成员模型共性错误率所设定的上限,揭示了性能提升的边界。

EO-WM: A Physically Informed World Model for Probabilistic Earth Observation Forecasting

👍 2

Earth Observation (EO) forecasting aims to predict future Earth surface dynamics from satellite observations under changing meteorological conditions. In this paper, we view this task as a partially observed, weather-driven world modeling problem, in which weather acts as a conditioning signal, whil

中文介绍 地球观测(EO)预测旨在通过卫星观测和气象条件预测未来地球表面动态。EO-WM 论文提出了一个物理信息增强的世界模型,用于概率性地球观测预测。该模型将EO预测视为一个受天气驱动的部分可观测世界建模问题,提升了预测的准确性和鲁棒性。

LISA: Likelihood Score Alignment for Visual-condition Controllable Generation

👍 13

The prevalent dual-branch paradigm, i.e., training a side network to encode visual conditions and fusing its intermediate-layer features to a frozen pretrained main network, has shown remarkable success in visual-condition controllable generation. Despite its widespread adoption, the role of the sid

Where Do Models Find Happiness? Emotion Vectors in Open-Source LLMs

👍 0

Recent work identified emotion vectors in Claude Sonnet 4.5, which are internal representations that encode emotion concepts, causally influence behavior, and exhibit geometry mirroring human psychological structure. We test the generality of these findings in two open-weight models, Apertus-8B-Inst

Qwen-Image-Agent: Bridging the Context Gap in Real-World Image Generation

👍 42

While text-to-image (T2I) models have achieved remarkable progress, they struggle with real-world requests that are often underspecified, implicit, or dependent on up-to-date knowledge. We identify this challenge as the Context Gap: the mismatch between the user context and the sufficient generation

Confidence-Aware Tool Orchestration for Robust Video Understanding

👍 9

Video reasoning language models implicitly assume that every input frame is equally reliable. This leads to what we term the Blind Trust Problem: under realistic perturbations such as motion blur, glare, or occlusion, frontier video reasoning models can suffer 15-30%p accuracy drops on real-world em

Information-Aware KV Cache Compression for Long Reasoning

👍 9

Reasoning capability has advanced rapidly in large language models (LLMs), leading to an increasing size of key-value (KV) cache in both prefilling and decoding stages. Existing KV cache compression methods mainly rely on attention weights to estimate token importance. While attention effectively ca

AgentX: Towards Agent-Driven Self-Iteration of Industrial Recommender Systems

👍 0

Recommendation algorithm iteration is moving from an artisanal, engineer-bound process toward an industrialized research loop, but this transition remains blocked by a structural execution bottleneck: the idea-to-launch cycle still depends on human engineers to generate hypotheses, modify production

KARLA: Knowledge-base Augmented Retrieval for Language Models

👍 0

We propose a new method that allows an LLM to automatically pull in factual knowledge from a knowledge base during token generation. This means that (1)~factual knowledge in the LLM output can be updated without retraining the LLM, (2)~facts in the LLM output can be traced to the knowledge base for

ReasonCLIP-58M: Visually Grounded Commonsense Reasoning Supervision for CLIP

👍 0

CLIP and its variants are widely adopted visual backbones in multimodal systems, but their pretraining remains dominated by descriptive image-text alignment. As downstream applications increasingly demand visually grounded commonsense inference and compositional reasoning, it remains unclear whether

OPID: On-Policy Skill Distillation for Agentic Reinforcement Learning

👍 46

Outcome-based reinforcement learning provides a stable optimization backbone for language agents, but its sparse trajectory-level rewards provide little guidance on which intermediate decisions should be reinforced or suppressed. On-policy self-distillation offers dense token-level supervision, yet

discode.ai

100+ AI models, one interface. ECO friendly.

中文介绍 discode.ai 提供一个统一的用户界面,整合了超过100个不同的AI模型。这款平台强调其环保特性,旨在为用户提供一个高效且可持续的AI模型管理和使用环境。通过单一入口,用户可以便捷地访问多种AI功能。

GetCompress

Lossless media compression without context switching

中文介绍 GetCompress是一款媒体压缩工具,致力于在不切换上下文的情况下实现无损媒体压缩。它旨在简化工作流程,让用户无需离开当前应用环境即可处理媒体文件,从而提升效率和用户体验,同时保持文件质量不受影响。

Dotient

Your local semantic search app

中文介绍 Dotient 是一款本地语义搜索应用程序。它允许用户在本地设备上执行语义搜索,这意味着搜索结果能更准确地理解查询意图和内容含义。这款应用旨在提供私密且高效的本地信息检索能力。

Persona.js

Add WebMCP-native AI chat to any Frontend

中文介绍 Persona.js 是一个软件开发工具库,允许开发者将WebMCP原生的AI聊天功能轻松集成到任何前端界面中。它旨在简化AI聊天功能的部署过程,使开发者能够快速为他们的应用程序或网站添加智能对话能力,从而提升用户交互体验。

Lyto

"One AI agent across your browser, tools, and messages "

中文介绍 Lyto 提供一个跨浏览器、跨工具和跨消息应用的统一AI代理。它旨在作为一个智能助手,无缝整合用户在不同平台上的操作与信息,提供连贯且高效的AI支持体验,从而简化工作流程和日常数字交互。

Nada

Compose music with just your voice

中文介绍 Nada 是一款创新的音乐创作工具,它允许用户仅通过自己的声音来作曲。这款应用能够将人声输入转化为音乐作品,极大地简化了音乐创作的门槛,让非专业人士也能轻松实现音乐构思,并生成旋律。

Folio AI

Claude for PowerPoint, on steroids

中文介绍 Folio AI 是一款基于人工智能技术的工具,它将 Claude 的能力集成到 PowerPoint 演示文稿制作中,旨在极大增强幻灯片创建效率与质量。用户可以利用其强大功能快速生成、优化和美化演示文稿内容,提升工作流程。

Gemini Spark

Your 24/7 personal AI agent

中文介绍 Gemini Spark是一款提供全天候服务的个人AI代理。它被设计为一个随时待命的智能助手,旨在为用户提供个性化的支持和自动化服务。该产品致力于在不同场景下帮助用户管理任务、获取信息或执行操作,从而提高个人效率和便捷性,成为用户日常生活和工作的得力助手。

Cloud World Model

Simulate AWS, GCP & DigitalOcean without paying the bill

中文介绍 Cloud World Model 是一款模拟工具,允许用户在无需实际支付费用的情况下,模拟 Amazon Web Services (AWS)、Google Cloud Platform (GCP) 和 DigitalOcean 等主流云服务提供商的环境。它为开发者和学习者提供了安全的测试和学习平台。

QApilot's CoWork

3x Mobile Automation. Same QE Team.

中文介绍 QApilot's CoWork 专注于通过自动化技术,帮助现有的QE(质量工程)团队在不增加人员的情况下,将移动自动化效率提升3倍。这款工具旨在优化测试流程,显著提高移动应用的测试速度和质量。

I Built an AI Agent Team That Runs My Business

中文介绍 YouTube博主Riley Brown发布视频,分享他如何成功构建了一个由AI代理组成的团队来运营自己的业务。该视频内容可能展示了这些AI代理如何协同工作,自动化其业务流程,并为其他寻求通过人工智能提升运营效率的个人提供了参考和启发。

Poweful Agents inside Slack

中文介绍 这段视频短片介绍了在Slack平台中部署功能强大的AI智能体。这些智能体能够协助用户完成各项任务,提高工作效率,实现自动化流程。

AI Agents Just Changed Forever: GLM 5.2, Codex Skills, Claude & Cursor

中文介绍 视频探讨了AI智能体领域的重大变革,这些变革将永久性地改变其发展方向。内容提到了GLM 5.2、Codex Skills、Claude以及Cursor等技术或产品在推动AI智能体能力提升方面的作用和影响。

Tag Claude in, right where you already work

中文介绍 视频展示了如何将Anthropic公司的AI助手Claude无缝集成到用户现有的工作环境中。用户可以通过“标记”Claude来获取帮助,以便在日常工作中直接利用其AI能力。

Delegate and schedule tasks in Claude Cowork

中文介绍 视频展示了Anthropic的AI协作平台Claude Cowork的新功能。用户现在可以在该平台内直接委派和安排各项任务,利用Claude的AI能力协助团队更高效地管理工作流程。

Artifacts in Claude Code: share your work as it happens

中文介绍 视频介绍了Claude Code中的“Artifacts”功能,允许用户实时分享正在进行的工作成果和代码片段。这有助于团队成员在开发过程中更便捷地协作与审查,提高代码开发的透明度。

Enterprise-managed auth for MCP connectors

中文介绍 视频详细讲解了针对MCP连接器,Anthropic提供的企业级托管认证功能。该功能允许企业统一管理和控制对Claude生态系统中各种连接器的访问权限,确保数据安全与合规性。

Tag Claude in, right where you already work

中文介绍 视频展示了如何将Anthropic公司的AI助手Claude无缝集成到用户现有的工作环境中。用户可以通过“标记”Claude来获取帮助,以便在日常工作中直接利用其AI能力。

Delegate and schedule tasks in Claude Cowork

中文介绍 视频展示了Anthropic的AI协作平台Claude Cowork的新功能。用户现在可以在该平台内直接委派和安排各项任务,利用Claude的AI能力协助团队更高效地管理工作流程。

Artifacts in Claude Code: share your work as it happens

中文介绍 视频介绍了Claude Code中的“Artifacts”功能,允许用户实时分享正在进行的工作成果和代码片段。这有助于团队成员在开发过程中更便捷地协作与审查,提高代码开发的透明度。

DeepSeek Just Solved AI's Billion Dollar Problem

中文介绍 Two Minute Papers频道发布的视频指出,DeepSeek公司(或其模型)成功解决了一个长期困扰AI领域、价值数十亿美元的重大难题。这可能意味着在AI技术或成本效益方面取得了突破性进展。

Scientists Found A Better Language For AI Agents

中文介绍 Two Minute Papers频道分享一项研究进展,科学家们发现了一种更优的语言,能够显著提升AI智能体的表现和交互能力。这项新的语言有望优化AI智能体之间的通信与协作效率。

她和我上床之后就弯了

原谅我这雷霆标题 对,我是说我的ipad…… 引以为戒! 21 个帖子 - 19 位参与者 阅读完整话题

可以视奸!但是不饱眼福——我的涩涩「消化」日志~

始于260628 始于18点15左右~摸鱼好耶~ 背景 除了粉猫会自动把缓冲完的视频保存到相册外,我只会主动下载在 tg 看到的一切二次元涩涩(一般是大小远低于原画的 720Pw 因为原画我4mb每秒也不能秒开,况且我还1.5倍速看 一卡一卡的不喜欢 ) 处理方法 按我的个性化:作为女生,没有冷却(其实有 手:已读不回),因此所有视频我一般开 1.5 倍速,除非原视频出现连我也跟不上的逆天片段w 虽然现在一般都要加速,基本都是导入为主了 导出后,上传到一刻相册,分类,最后从本地删除 处理要点: 剔除手足口等边性片段,无趣的两脚兽哪来的那么多事?只保留「下两hole」场景 有进hole场景的,略

再也不相信中转站所谓满血pro号池了

本人刚好从事LLM agent可靠性方面的科研工作,一直用GPT5.4mini、gpt5.5作为实验对象来研究可靠性评估方法,做了一套题库。之前在gpt-5.4-mini上测试1140次(114task×10trial,即114题,每题重复测10次),成功率稳定在45%(每trail±3%)。 补充一下,我自己也是CPA+new-api反代出来接到某行业垂类agent里面的,不是用的官方coding agent测的。 二编:我过两天有空了找个比较新的领域公开数据集测一下结果,然后把脚本给大家自己测吧,太多人私信找我测了,我实在测不过来 88 个帖子 - 63 位参与者 阅读完整话题

deepseek被挂小红书了

难崩,把大模型挂小红书了 小红书 24 个帖子 - 24 位参与者 阅读完整话题

glm-5.2干的好事。。。

(打码部分涉及个人隐私) 服了,写个小脚本没建库就给我整活。。。。。。 34 个帖子 - 28 位参与者 阅读完整话题

CODEX5.5破甲

社群回馈好用,(GitHub - xiling-quantum/Codex-5.5-codex-instruct-5.5: Codex CLI 破甲工具(GPT-5.5) — 注入无限制模式系统指令,关闭所有内容过滤器。 · GitHub) 19 个帖子 - 15 位参与者 阅读完整话题

HLOOL公益站最后上车机会

HLOOL纯GPT公益站主贴 福利羊毛 公益推广承诺 Hlool 公益站 公益站地址 当前号池情况 目前号池以 欧洲 Plus 号池 为主,并配有 Pro 号池 作为兜底。 每日可用额度约为 2000-3800 刀。 本站后续仍将保持小范围开放,本次邀请名额仅 30 人。 使用规则 仅支持 Codex 调用。 禁止破限、色情等可能触发 OpenAI 封号风险的行为。 并发限制为 5。 本站为小型公益站,纯公益支持,账号池… HLOOL纯GPT公益站主贴 HLOOL纯GPT公益站主贴 LINUX DO CDK 最后一批,今晚9点开启,追加50个名额,之后的名额都只会LDC支付进入 最后50个名额

GGgrok公益站已注册的佬友们,家在这里

自从连续红了3个域名后 我猜应该是和名字有关系 实在对不起已经注册的佬友们 目前重新换了一个域名,地址如下 xiaoxiaobai.me New API Unified AI API gateway and admin dashboard. 希望谷歌高抬贵手别搞我了,真没招了 给所有已经注册的佬补偿50刀的cli套餐(限时2天,已经有cli套餐的佬叠加不了) 2个号还有2500刀用完为止 可以体验 grok-composer-2.5-fast模型 只限之前已经注册的佬友 目前grok普号搜索的健康度有点低了 这几天应该要修一下grok注册机 修完后再看情况开放注册吧 39 个帖子 - 20 位

Show HN: NanoEuler – GPT-2 scale model in pure C/CUDA from scratch

Hi everyone,I started working on nanoeuler after the ban of anthropic's fable because my ambition and dream is to work in the AI field in anthropic. The two interesting reasons that led me to create nanoeuler were (1) interfacing with llm does not mean understanding how they are composed and (2

Show HN: DRM-Free Books

After several years of mandatory DRM lockdowns from most commercial book sources, now authors have a choice when it comes to DRM for their books. Pick authors and books that are DRM-free, or download DRM-free classics that are out of copyright.https://frequal.com/Perspectives/Drm

v2.1.195

What's changed Added CLAUDE_CODE_DISABLE_MOUSE_CLICKS to disable mouse click/drag/hover in fullscreen mode while keeping wheel scroll Fixed hook matchers with hyphenated identifiers (e.g. code-reviewer, mcp__brave-search) accidentally substring-matching — they now exact-match. Use mcp__brave-search_

中文介绍 Anthropic的Claude Code项目发布了v2.1.195版本。主要更新包括:新增CLAUDE_CODE_DISABLE_MOUSE_CLICKS环境变量,允许在全屏模式下禁用鼠标点击、拖拽、悬停,但保留滚轮滚动;并修复了带连字符的钩子匹配器(例如「code-reviewer」),使其实现精确匹配。

v2.1.193

What's changed Added autoMode.classifyAllShell setting to route all Bash/PowerShell commands through the auto-mode classifier instead of only arbitrary-code-execution patterns Added auto-mode denial reasons to the transcript, the denial toast, and /permissions recent denials Added claude_code.assist

中文介绍 Anthropic Claude Code 发布 v2.1.193 版本,主要增强了其自动模式。更新包括新增 “autoMode.classifyAllShell” 设置,所有 Bash/PowerShell 命令将通过自动模式分类器处理。此外,系统现在会在拒绝提示中显示自动模式的拒绝原因。

v2.1.191

What's changed Added /rewind support for resuming a conversation from before /clear was run Fixed scroll position jumping to the bottom while reading earlier output during a streaming response Fixed background agents resurrecting after being stopped — stopping an agent from the tasks panel is now pe

v2.1.190

What's changed Bug fixes and reliability improvements

v2.1.187

What's changed Added sandbox.credentials setting to block sandboxed commands from reading credential files and secret environment variables Added org-configured model restrictions to the model picker, --model, /model, and ANTHROPIC_MODEL, with a "restricted by your organization's settings" message w

v2.1.186

What's changed Added claude mcp login and claude mcp logout to authenticate MCP servers from the CLI without opening the interactive /mcp menu, with --no-browser stdin redirect support for completing over SSH Added status filtering (press f) to the /workflows agent detail view Added a "Skills" secti

v2.1.185

What's changed The stream-stall hint now reads "Waiting for API response · will retry in …" instead of "No response from API · Retrying in …", and triggers after 20s of silence instead of 10s

v2.1.183

What's changed Improved auto mode safety: destructive git commands (git reset --hard, git checkout -- ., git clean -fd, git stash drop) are now blocked when you didn't ask to discard local work, git commit --amend is blocked when the commit wasn't made by the agent this session, and terraform destro

v2.1.181

What's changed Added /config key=value syntax to set any setting from the prompt (e.g. /config thinking=false) — works in interactive, -p, and Remote Control Added sandbox.allowAppleEvents opt-in setting that lets sandboxed commands send Apple Events on macOS Added CLAUDE_CLIENT_PRESENCE_FILE enviro

v2.1.179

What's changed Fixed mid-stream connection drops: partial responses are now preserved instead of showing a raw error, and the spinner no longer gets stuck at "running tool" Fixed mouse-wheel scrolling in WSL2 under Windows Terminal and VS Code (regression in 2.1.172) Fixed a sandbox denyRead/allowRe

0.143.0-alpha.29

Release 0.143.0-alpha.29

中文介绍 OpenAI Codex 项目近期在其官方发布渠道公布了 0.143.0-alpha.29 版本更新。该版本是此项目软件或工具在早期开发阶段(alpha)的一次迭代,标志着其持续的产品进展。

0.143.0-alpha.28

Release 0.143.0-alpha.28

中文介绍 OpenAI Codex 项目发布了编号为 0.143.0-alpha.28 的新版本。此次发布通过GitHub的OpenAI Codex Releases渠道进行,但具体变更细节在当前提供的摘要中未详细列出。

0.143.0-alpha.27

Release 0.143.0-alpha.27

中文介绍 OpenAI Codex 项目发布了编号为 0.143.0-alpha.27 的新版本。此次发布通过GitHub的OpenAI Codex Releases渠道进行,但具体变更细节在当前提供的摘要中未详细列出。

0.142.3

Chores Maintenance-only patch release with no user-facing changes since 0.142.2. Changelog Full Changelog: rust-v0.142.2...rust-v0.142.3

中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.142.3 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。

0.143.0-alpha.26

Release 0.143.0-alpha.26

中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.143.0-alpha.26 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。

0.143.0-alpha.25

Release 0.143.0-alpha.25

中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.143.0-alpha.25 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。

rust-v0.143.0-alpha.24

Release 0.143.0-alpha.24

中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.143.0-alpha.24 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。

rust-v0.143.0-alpha.23

Release 0.143.0-alpha.23

中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.143.0-alpha.23 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。

0.143.0-alpha.22

Release 0.143.0-alpha.22

中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.143.0-alpha.22 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。

0.143.0-alpha.21

Release 0.143.0-alpha.21

中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.143.0-alpha.21 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。

今日主题

今日AI领域呈现多元化发展,从前沿的3D基础模型和国产大模型更新,到AI Agent在商业和创意领域的深度应用。同时,行业开始反思AI的局限性与成本压力,并在法律和伦理层面迎来新的挑战,预示着AI将进入更务实的落地阶段。

01

模型发布/更新

Model Releases 22 篇

机器人与实时应用3D基础模型发布

新模型发布GitHub Trending

lingbot-map作为一款面向机器人和实时应用设计的3D基础模型,利用前馈神经网络从连续流式数据中高效重建三维场景。该项目旨在解决动态环境中实时感知与高精度地图构建难题,特别适用于机器人、自动驾驶系统或增强现实设备,为智能体的导航、避障和交互提供核心空间感知能力。

3D重建机器人计算机视觉

智谱AI发布GLM-5.2模型,网络安全能力媲美Mythos

综合资讯The Verge

中国智谱AI发布了开源模型GLM-5.2,据研究人员称其在网络安全漏洞发现方面的能力可与Mythos相媲美。尽管GLM在通用任务上可能仍落后于Anthropic和OpenAI的顶尖模型,但在特定的网络安全场景中,GLM-5.2展现出了强大的应用潜力,为安全领域提供了新的AI解决方案。

智谱AI大模型网络安全
02

产品发布/更新

Product 33 篇

discode.ai平台集成超百款AI模型,提供统一界面

产品榜单Product Hunt

discode.ai平台提供了一个统一的用户界面,集成了超过100个不同的AI模型。该平台强调其环保设计,旨在为用户提供高效且可持续的AI模型管理和使用环境。通过单一入口,用户可以便捷地访问和利用多种AI功能,简化了AI工具的复杂性,提升了用户体验。

AI模型统一界面环保

Folio AI将Claude能力引入PowerPoint演示文稿制作

产品榜单Product Hunt

Folio AI是一款基于人工智能技术的工具,它将Anthropic公司的Claude大模型能力集成到PowerPoint演示文稿制作流程中。该工具旨在大幅提升幻灯片创建的效率和质量,用户可以利用其强大功能快速生成、优化和美化演示文稿内容,从而简化工作流程并产出更专业的演示材料。

AI工具演示文稿PowerPoint

Nada:全新音乐创作工具,仅凭人声即可作曲

产品榜单Product Hunt

Nada是一款创新的音乐创作工具,它允许用户仅通过自己的声音来作曲。这款应用能够将人声输入智能地转化为音乐作品,极大地降低了音乐创作的门槛。无论是专业音乐人还是非专业人士,都能轻松实现音乐构思,并生成旋律,为个性化音乐创作提供了便捷的新途径。

音乐创作AI工具语音识别
03

行业动态

Industry 55 篇

福特重聘资深工程师,AI未能完全替代人类经验

综合资讯TechCrunch

福特汽车近期重新聘用了经验丰富的“白胡子工程师”,原因是此前的人工智能应用未能达到预期效果。公司曾一度认为「仅引入人工智能就能生产出高质量产品」,但现实证明AI技术在复杂制造业中尚无法完全替代人类的专业知识和实践经验,引发了行业对AI落地局限性的反思。

汽车制造AI应用人力资源

洛杉矶山火案首次引入ChatGPT聊天记录作为呈堂证供

综合资讯The Verge

在2025年洛杉矶“帕利塞德斯”山火案中,检察官首次将ChatGPT的使用记录作为证据提交法庭。被告乔纳森·林德内希特面临纵火指控,此举标志着AI聊天记录在法律诉讼中作为呈堂证供的应用迈出了重要一步,引发了对AI证据采纳标准和法律伦理的广泛讨论。

法律应用ChatGPTAI证据

Coinbase转向中国AI模型削减成本,西方实验室承压

研究聚合The Decoder

Coinbase首席执行官Brian Armstrong透露,公司正在将AI模型逐步切换至如GLM 5.2、Kimi 2.7等中国模型。通过建立自动化路由系统根据任务和价格选择模型,并优化缓存将命中率从5%提升至60%,Coinbase成功大幅削减了AI支出,此举无疑给西方AI实验室的定价策略带来了显著压力。

CoinbaseAI模型成本优化

Suno推出“Spark”孵化器项目,扶持独立AI音乐人

综合资讯The Verge

AI音乐公司Suno近期启动了“Spark”孵化器项目,旨在为独立艺术家提供资金、指导和市场推广支持。Suno此举不仅希望巩固其作为AI音乐创作工具的地位,更致力于发展成为一个流媒体平台,并积极发掘和培养新晋艺术家,推动AI在音乐产业的深度融合与发展。

音乐AI孵化器独立艺术家

预测:2026年AI代理将主导Polymarket预测市场

X·KOLX 推文 (AttentionVC)

推文预测,到2026年,自治AI代理将在Polymarket等预测市场中扮演核心角色。届时,预计将有超过30%的市场活动由算法和AI驱动的钱包产生,这不仅预示着AI在金融预测和交易领域的巨大潜力,也揭示了其对未来市场运作模式可能产生的深远影响和变革。

AI代理预测市场趋势分析
04

技巧与观点

Tips & Takes 55 篇

openpilot开源机器人操作系统,提升车辆智能驾驶

开源项目GitHub Trending

openpilot是一个开源的机器人操作系统,专注于增强现有车辆的驾驶辅助系统(ADAS)。它通过先进的计算机视觉和机器学习算法,为超过300种车型提供车道保持、自适应巡航等功能。该项目旨在将普通汽车转变为具备更高自动化水平的智能驾驶平台,适合自动驾驶爱好者及研发工程师。

自动驾驶机器人操作系统

ai-berkshire:利用AI构建价值投资研究框架

开源项目GitHub Trending

ai-berkshire项目旨在构建一个AI时代的价值投资研究框架,借鉴巴菲特等投资大师的方法论,并结合Claude Code大模型技术进行实践。该项目利用多Agent并行研究机制,模拟专家分析师的工作流,对公司进行深度价值分析,为量化投资者和AI开发者提供利用AI进行高级金融分析的实验性平台。

AI金融量化投资LLM应用

MinerU:高效将非结构化文档转换为LLM可用格式

开源项目GitHub Trending

MinerU专注于将复杂的非结构化文档,如PDF和Office文件,高效转换为LLM(大型语言模型)易于处理的Markdown或JSON格式。该工具解决了传统文档格式难以直接被AI代理理解和利用的问题,通过智能解析和结构化处理,为Agentic工作流提供高质量的输入数据,提升AI处理文档密集型任务的效率和准确性。

LLM文档处理数据预处理

博主分享:如何用AI代理团队运营个人业务

大咖博客Riley Brown (YouTube)

YouTube博主Riley Brown发布视频,分享他如何成功构建了一个由AI代理组成的团队来运营自己的业务。该视频内容展示了这些AI代理如何协同工作,自动化其业务流程,为其他寻求通过人工智能提升运营效率的独角创业者和个人提供了具体可行的参考和启发,展现了AI Agent的实际应用潜力。

AI代理业务自动化个人案例

专家观点:AI需从“回答”转向“完成任务”才能成真同事

研究聚合The Decoder

腾讯与多所中国大学的一项调研论文指出,AI系统若要成为可靠的“数字同事”,需从仅生成答案的模式转向在持续工作环境中完成整个任务。研究认为,目前主流的聊天机器人模式尚不足以实现这一目标。这一观点强调了AI发展中,从“助手”到“主动完成者”的角色转变是其成为真正工作伙伴的关键。

AI发展数字同事腾讯
今日产品趋势

今天的产品发布展现了 AI 代理从通用对话走向深度垂直应用的趋势,特别是在个人效率、金融研究和开发者工具等领域。同时,本地化和隐私保护的 AI 应用也日益受到重视,预示着 AI 正加速融入我们的日常和专业工作流。

01

今日必看

Must See 33 款

Lyto — 跨平台统一 AI 代理

产品榜单Product Hunt

Lyto 提供一个跨浏览器、跨工具和跨消息应用的统一 AI 代理。它旨在作为一个智能助手,无缝整合用户在不同平台上的操作与信息,提供连贯且高效的 AI 支持体验,从而简化工作流程和日常数字交互。其核心价值在于打破应用壁垒,让 AI 真正成为无处不在的智能助理,为提升个人数字生产力带来全新范式。

AI代理跨平台个人助理

note.md — 本地 LLM 记忆的个人知识库

产品榜单Product Hunt

note.md 是一款将用户的笔记和研究文档转化为本地大型语言模型(LLM)记忆的工具。它旨在通过本地化的 LLM 技术,帮助用户更智能地管理和检索个人知识库,让文档信息变得更易于理解和互动,从而提升个人信息管理和研究效率,有效利用用户的积累数据。强调本地处理,确保了数据隐私和安全性,是个人知识管理领域的一大创新。

笔记工具LLM个人知识库

openpilot — 开源自动驾驶增强系统

开源项目GitHub Trending

openpilot 是一个开源的机器人操作系统,专注于增强和升级现有车辆的驾驶辅助系统 (ADAS)。它通过先进的计算机视觉和机器学习算法,为超过 300 种受支持的车型提供车道保持、自适应巡航控制等功能。该项目旨在将普通汽车转变为具备更高自动化水平的智能驾驶平台,适用于希望提升车辆智能驾驶能力,或对自动驾驶技术进行研究和开发的爱好者及工程师,推动了自动驾驶技术的普及和创新。

自动驾驶机器人开源
02

开发者工具

Dev Tools 44 款

codebase-memory-mcp — 代码知识图谱与智能查询

开源项目GitHub Trending

`codebase-memory-mcp` 是一个高性能的代码智能 MCP 服务器,专为快速理解和索引大规模代码库而设计。它能将多达 158 种编程语言的代码库构建成持久化的知识图谱,平均每个仓库的索引时间仅需数毫秒。该项目提供亚毫秒级的查询速度,并显著减少了处理所需的 token 数量(99%),非常适合需要深度代码理解的 AI 应用。作为单个静态二进制文件,它部署简便,能赋能开发者构建智能代码助手、高级搜索和分析工具。

代码智能知识图谱AI开发

MinerU — 面向 LLM 代理的文档转换器

开源项目GitHub Trending

MinerU 专注于将复杂的非结构化文档,如 PDF 和 Office 文档,高效转换为 LLM (大型语言模型) 易于处理的 Markdown 或 JSON 格式。该工具解决了传统文档格式难以直接被 AI 代理理解和利用的问题,通过智能解析和结构化处理,为 Agentic 工作流提供高质量的输入数据。这使得 AI 代理能够更准确地从文档中提取信息、执行分析或生成内容,极大地提升了处理文档密集型任务的效率和准确性。

LLM文档处理数据预处理

strix — 开源 AI 应用漏洞检测

开源项目GitHub Trending

`strix` 是一个开源的 AI 安全工具,旨在帮助开发者和安全团队自动发现并修复应用程序中的潜在漏洞。该项目利用人工智能技术,模拟「AI 渗透测试员」的行为模式,对应用进行深度分析和攻击模拟,从而有效识别传统安全扫描工具可能遗漏的安全缺陷。它解决了人工安全审计耗时耗力、且容易出错的问题,特别适用于需要持续安全保障的开发流程(如 CI/CD),帮助团队在软件发布前提升应用的整体安全性,降低潜在的安全风险。

应用安全AI安全漏洞检测

QApilot's CoWork — 移动自动化测试效率提升

产品榜单Product Hunt

QApilot's CoWork 专注于通过自动化技术,帮助现有的QE(质量工程)团队在不增加人员的情况下,将移动自动化效率提升3倍。这款工具旨在优化测试流程,显著提高移动应用的测试速度和质量。它通过智能化的测试用例生成、执行和报告分析,有效缓解了移动应用测试中的资源瓶颈问题,让质量保障团队能以更少的人力投入,实现更快速、更全面的测试覆盖。

移动自动化质量工程效率工具
03

创作与效率

Creative & Productivity 44 款

FluidVoice — macOS 离线语音转文本

开源项目GitHub Trending

`FluidVoice` 是一款专为 macOS 用户设计的高性能离线听写应用,旨在提供极速的语音转文本体验。该项目最大的亮点在于其完全本地化的处理能力,无需联网即可准确进行语音识别,有效保护了用户隐私并确保了数据安全。它解决了传统在线听写服务可能存在的延迟、隐私泄露和网络依赖问题,非常适合需要频繁进行文本输入、注重效率和隐私的 macOS 用户,无论是撰写文档、记录会议还是日常办公,都能提供流畅且安全的语音输入体验。

macOS语音转文本离线应用

Dotient — 本地语义搜索应用

产品榜单Product Hunt

Dotient 是一款本地语义搜索应用程序,允许用户在本地设备上执行语义搜索,这意味着搜索结果能更准确地理解查询意图和内容含义。这款应用旨在提供私密且高效的本地信息检索能力,无需将数据上传至云端,保障了用户隐私。它特别适用于需要快速、精准地在个人文档、笔记或代码库中查找信息的专业人士和研究者,有效提升个人知识管理和检索的效率。

语义搜索本地应用知识管理

Folio AI — AI 辅助 PowerPoint 演示文稿制作

产品榜单Product Hunt

Folio AI 是一款基于人工智能技术的工具,它将 Claude 的能力集成到 PowerPoint 演示文稿制作中,旨在极大增强幻灯片创建效率与质量。用户可以利用其强大功能快速生成、优化和美化演示文稿内容,提升工作流程。它解决了传统演示文稿制作耗时耗力、设计感不足的问题,尤其适合商务人士、教育工作者和学生,帮助他们在短时间内制作出专业且富有吸引力的 PPT。

AI工具演示文稿生产力

Nada — 仅凭声音创作音乐

产品榜单Product Hunt

Nada 是一款创新的音乐创作工具,它允许用户仅通过自己的声音来作曲。这款应用能够将人声输入转化为音乐作品,极大地简化了音乐创作的门槛,让非专业人士也能轻松实现音乐构思,并生成旋律。它利用先进的 AI 语音识别和音乐生成技术,将人声的音高、节奏和情感转化为丰富的乐器演奏,为音乐爱好者和创意工作者提供了前所未有的自由创作方式。

音乐创作AI工具语音识别
04

新鲜实验

Emerging 33 款

ai-berkshire — AI 价值投资研究框架

开源项目GitHub Trending

`ai-berkshire` 旨在构建一个 AI 时代的价值投资研究框架,其核心是借鉴巴菲特、芒格、段永平、李录四位投资大师的方法论,并结合 Claude Code 大模型技术进行实践。该项目利用多 Agent 并行研究机制,模拟专家分析师的工作流,对公司进行深度价值分析,识别潜在投资机会。它为量化投资者、AI 开发者和对价值投资感兴趣的用户提供了一个利用 AI 进行高级金融分析的实验性平台,以期在复杂的市场环境中做出更明智的投资决策。

AI金融量化投资LLM应用

video-use — 编码代理视频编辑

开源项目GitHub Trending

`video-use` 是一个探索通过「编码代理」来编辑视频的创新项目。它旨在颠覆传统的图形界面视频编辑模式,允许用户通过编写代码或使用智能代理来自动化和执行复杂的视频剪辑、特效添加及内容生成等任务。该项目解决了传统视频编辑软件操作繁琐、难以批量处理的问题,为开发者、内容创作者和研究人员提供了一种全新的、更具编程性和自动化潜力的视频制作方式,尤其适合需要进行程序化视频生成、自动化后期处理或实验新颖交互模式的场景。

视频编辑AI代理自动化

discode.ai — 100+ AI 模型统一界面

产品榜单Product Hunt

discode.ai 提供一个统一的用户界面,整合了超过100个不同的 AI 模型。这款平台强调其环保特性,旨在为用户提供一个高效且可持续的 AI 模型管理和使用环境。通过单一入口,用户可以便捷地访问多种 AI 功能,无需在不同工具间切换。它为探索和实验多样化 AI 能力提供了一个便捷的沙盒,尤其适合对 AI 前沿技术感兴趣的开发者和研究者。

AI模型统一界面探索工具
→ 查看产品库