The Verge · 06/29 01:20
中国宣称其位于深圳的“LineShine”超级计算机成为全球最快,超越美国,自2018年以来首次重获此称号。
推荐理由:标志着中国在高性能计算领域取得重大突破,在全球科技竞争中具有重要的战略意义。
The Verge · 06/29 01:20
中国宣称其位于深圳的“LineShine”超级计算机成为全球最快,超越美国,自2018年以来首次重获此称号。
推荐理由:标志着中国在高性能计算领域取得重大突破,在全球科技竞争中具有重要的战略意义。
GitHub Trending
MinerU将PDF、Office等复杂非结构化文档高效转换为LLM易处理的Markdown或JSON格式,为AI代理提供高质量输入,提升文档处理效率。
推荐理由:对于AI代理和RAG应用开发者而言,该工具提供了将非结构化文档转化为可用数据的解决方案,直接提升工作流效率。
LinuxDo · 06/28 23:10
一项针对GPT-5.4-mini和GPT-5.5的LLM代理可靠性测试显示,中转站提供的「满血pro号池」服务成功率仅45%,表现不稳定。
推荐理由:揭示了第三方LLM API服务可能存在的性能问题,为依赖这些服务的开发者提供了重要的警示和选择参考。
Hacker News · 06/29 06:32
该论文探讨了如何在不访问内部结构的情况下,从黑盒大型语言模型中提取知识,以创建更小、更高效的模型。
推荐理由:对于追求模型小型化和高效部署的研究者,该论文提供了在黑盒条件下进行知识蒸馏的理论与方法,具有重要的学术价值和潜在应用前景。
TechCrunch · 06/29 03:05
福特汽车因AI未能达到预期,重新聘用经验丰富的“白胡子工程师”,反思仅引入AI无法确保产品质量。
推荐理由:揭示了企业在AI转型中可能面临的挑战,强调了人类经验与AI结合的重要性,对行业具有警示作用。
Riley Brown (YouTube) · 06/29 06:16
YouTube博主Riley Brown发布视频,展示其如何构建AI智能体团队,自动化管理个人业务,探索AI代理在效率提升中的潜力。
推荐理由:对于希望利用AI提升个人或小团队工作效率的创业者,该视频提供了实际的AI代理应用案例和构建思路。
OpenAI News · 06/29 01:00
惠普公司与OpenAI建立“Frontier”战略合作,将AI技术规模化应用于客户体验、软件开发及企业运营。
推荐理由:大型科技公司与AI领军企业的深度合作,预示着AI技术在企业级应用层面将迎来更广泛的部署和创新。
The Decoder · 06/28 20:14
Coinbase转向GLM 5.2、Kimi 2.7等中国AI模型,通过智能路由和缓存将AI支出削减,并提高命中率至60%。
推荐理由:揭示了企业在AI模型选择上转向成本效益更高、性能优良的中国模型趋势,对市场竞争格局有重要影响。
X 创作者 (AttentionVC) · 06/28 15:52
Serenity基金发布机器人赛道深度盘点报告,揭示其在该领域的布局,并指出10家核心标的平均收益高达164.4%。
推荐理由:为关注机器人赛道投资机会的读者提供了具体的投资标的分析和市场表现数据,具有一定的参考价值。
Product Hunt · 06/29 08:13
discode.ai提供统一平台,整合超100个AI模型,强调环保特性,为用户提供高效可持续的AI模型管理和使用体验。
推荐理由:对于需要频繁切换多种AI模型或寻求统一管理界面的用户,discode.ai提供了一站式解决方案,可大幅提升工作效率。
X 推文 (AttentionVC) · 06/27 17:03
推文探讨如何借助AI工具Claude Cowork,实现一人公司的自动化运营和效率提升,为独角创业者提供实用的策略。
推荐理由:为希望以小规模团队高效运营的创业者提供了具体可行的AI工具使用方案和商业运营策略。
China's Zhipu AI (Z.ai) released its open-weight GLM-5.2, and some researchers have claimed that it matches Mythos in certain bug-finding and cybersecurity scenarios. While GLM lags behind models from Anthropic and OpenAI in other, more general tasks, it seems that China has dramatically reduced the
中文介绍 智谱AI(Z.ai)发布了开源模型GLM-5.2。有研究人员称,在特定漏洞发现和网络安全场景中,GLM-5.2的能力可与Mythos媲美。尽管GLM在其他通用任务上仍落后于Anthropic和OpenAI的模型,但在网络安全领域显示出显著潜力。
Streaming ads might be getting a lot quieter.
中文介绍 美国加州一项旨在限制流媒体广告音量的法律将于7月1日生效。此举预计将使流媒体广告的音量大幅降低。
Suno has ambitions to be more than just a toy to churn out AI slop, it also wants to be a streaming destination and to break new artists. Spark is their new incubator program for independent artists that provides grants, mentorship, and marketing support. To apply, artists need to be an unsigned sin
中文介绍 AI音乐公司Suno推出“Spark”孵化器项目,旨在支持独立艺术家,提供资助、指导和营销支持。Suno希望借此不仅成为AI音乐创作工具,还能发展为流媒体平台并发掘新晋艺术家。
"Mistakenly we thought that by just introducing artificial intelligence ... that would produce a high-quality product.”
中文介绍 福特汽车因人工智能未能达到预期效果,重新聘用经验丰富的“白胡子工程师”。公司曾错误地认为「仅引入人工智能就能生产出高质量产品」,但现实情况证明AI尚无法完全替代人类经验。
Clicking on the links now reveals blank pages and empty PDFs. "Intellectually, it’s not acceptable.”
中文介绍 某期刊撤回了物理学家马克斯·普朗克在1940年代发表的两篇论文。目前点击相关链接,文章页面已显示为空白。摘录中未说明撤回的具体原因,仅引用了“知识上不可接受”的评论。
The LineShine supercomputer at the National Supercomputing Center in Shenzhen. | Photo: Liang Xu/Xinhua via Getty Images Despite trade restrictions, China has reclaimed the title of the world's fastest supercomputer for the first time since 2018. LineShine has pushed El Capitan out of number one on
中文介绍 中国宣称其位于深圳国家超级计算中心的“LineShine”超级计算机已成为全球最快。这是中国自2018年以来首次重获该称号,并超越了美国的El Capitan,尽管面临贸易限制,仍取得了技术突破。
Has Silicon Valley been building the wrong things?
中文介绍 作家伊恩·博格斯特(Ian Bogost)在其作品中指出,过度追求便利可能导致生活“非物质化”,而“小物件”(The Small Stuff)反而能帮助人们重拾生活。文章探讨了硅谷是否正在构建错误的产品方向。
HP Inc. scales its OpenAI Frontier partnership to deploy AI across customer experiences, software development, and enterprise operations.
中文介绍 惠普公司(HP Inc.)宣布与OpenAI建立名为“Frontier”的战略合作伙伴关系。此次合作旨在将人工智能技术规模化应用于惠普的客户体验、软件开发及企业运营等多个领域。
That sure is a man in a cube, alright. | Image: NBC / Jim Henson Company I'm sure we're all familiar with Dark Crystal, so we know that Jim Henson can be weird and tackle slightly more mature subject matter. But there is little in his oeuvre that is quite as mind-bending as the Muppetless The Cube.
中文介绍 吉姆·亨森(Jim Henson)鲜为人知的作品《立方体》(The Cube)被誉为一部“原型《黑镜》式”的杰作。该片被认为是亨森最“烧脑”的作品之一,探讨了成熟主题,与他的《黑暗水晶》风格有所类似。
Welcome back to TechCrunch Mobility, your hub for the future of transportation and now, more than ever, how AI is playing a part.
中文介绍 TechCrunch Mobility栏目聚焦特斯拉(Tesla)的全自动驾驶(FSD)系统,强调人工智能在未来交通运输中扮演着日益重要的角色,吸引了业界的广泛关注。
Eager to find more public AI-related companies that may do as well as Nvidia, Wall Street investors think they've found a winner with Micron.
中文介绍 华尔街投资者认为,美国存储芯片制造商美光科技(Micron)有望成为“下一个英伟达”(Nvidia)。投资者正积极寻找更多与AI相关的上市公司,认为美光在AI领域具有巨大的增长潜力。
Jonathan Rinderknecht was facing arson charges for setting a fire on New Year's Day in 2025, which became one of the deadliest wildfires in LA history. To make their case, prosecutors turned to location data from his iPhone, security camera footage, and witness testimony. But they also turned to his
中文介绍 2025年洛杉矶“帕利塞德斯”山火案中,检察官将ChatGPT的使用记录作为证据提交。被告乔纳森·林德内希特(Jonathan Rinderknecht)面临纵火指控,检察官除了iPhone定位数据、监控录像和证人证词外,还首次引入AI聊天记录作为呈堂证供。
For some people, the ice in a beverage is almost as important as the drink itself. That’s the audience Govee had in mind when designing its latest ice maker, the GoveeLife Smart Nugget Ice Maker Pro. This $500 premium smart home gadget is aimed at those who crave what’s called “the good ice,” the so
中文介绍 Govee推出了一款售价500美元的高端智能家居产品——GoveeLife Smart Nugget Ice Maker Pro制冰机。该设备旨在满足那些对冰块品质有高要求的消费者,让他们享受制作“冰块粒”的奢华体验。
A survey paper by Tencent and several Chinese universities traces the path from chatbot to "digital colleague." AI systems won't become reliable coworkers, the researchers argue, until they finish entire tasks in persistent work environments instead of just generating answers. The key lies in combin
中文介绍 腾讯及多所中国大学联合发表了一篇调研论文,探讨了AI从聊天机器人发展为“数字同事”的路径。研究人员认为,AI系统必须在持久的工作环境中完成整个任务,而非仅提供答案,才能真正成为可靠的协作伙伴。
Coinbase CEO Brian Armstrong is switching his company to Chinese AI models like GLM 5.2 and Kimi 2.7. An automated routing system picks the best model for each request based on task and price, and better caching pushed the hit rate from 5 to 60 percent. Coinbase has cut its AI spending in half even
中文介绍 Coinbase首席执行官Brian Armstrong正将其公司转向GLM 5.2和Kimi 2.7等中国AI模型。通过基于任务和价格的自动化路由系统,以及优化的缓存机制,其命中率从5%提升至60%,从而有效削减了AI支出。
Haskell · ★ 14,977 · 🍴 865 · 📈 1,180 stars today
SimpleX - the first messaging network operating without user identifiers of any kind - 100% private by design! iOS, Android and desktop apps 📱!
中文介绍 SimpleX 是一个注重极致隐私的去中心化消息网络,设计之初就避免使用任何用户标识符,实现 100% 匿名通信。它通过独特的协议机制,让用户无需注册账号、无需手机号或邮箱,即可安全私密地进行消息交换。该项目提供 iOS、Android 和桌面端应用程序,适用于重视个人数据隐私和匿名交流的用户,尤其是在需要高度保密通信的场景。
HTML · ★ 125,195 · 🍴 13,166 · 📈 495 stars today
A list of SaaS, PaaS and IaaS offerings that have free tiers of interest to devops and infradev
中文介绍 `free-for-dev` 是一个精心整理的资源列表,汇集了众多为开发者和运维工程师提供免费使用额度 (free tiers) 的 SaaS、PaaS 和 IaaS 产品及服务。该项目旨在帮助开发者和基础设施工程师发现和利用这些免费资源,以降低个人项目、原型开发或小型团队的运营成本。它涵盖了从云服务、数据库、CI/CD 工具到 API 网关等多个类别,对于预算有限的个人开发者、初创团队或学习新技术的工程师极具参考价值。
Python · ★ 62,375 · 🍴 11,093 · 📈 266 stars today
openpilot is an operating system for robotics. Currently, it upgrades the driver assistance system on 300+ supported cars.
中文介绍 openpilot 是一个开源的机器人操作系统,专注于增强和升级现有车辆的驾驶辅助系统 (ADAS)。它通过先进的计算机视觉和机器学习算法,为超过 300 种受支持的车型提供车道保持、自适应巡航控制等功能。该项目旨在将普通汽车转变为具备更高自动化水平的智能驾驶平台,适用于希望提升车辆智能驾驶能力,或对自动驾驶技术进行研究和开发的爱好者及工程师。
Python · ★ 5,265 · 🍴 717 · 📈 1,445 stars today
AI 时代的伯克希尔:基于 Claude Code / Codex 的价值投资研究框架。巴菲特·芒格·段永平·李录四大师方法论 + 多Agent并行研究。| AI-era Berkshire: a value investing research framework built for Claude Code / Codex. 4 masters' methodologies + multi-agent adversarial analysis.
中文介绍 `ai-berkshire` 旨在构建一个 AI 时代的价值投资研究框架,其核心是借鉴巴菲特、芒格、段永平、李录四位投资大师的方法论,并结合 Claude Code 大模型技术进行实践。该项目利用多 Agent 并行研究机制,模拟专家分析师的工作流,对公司进行深度价值分析,识别潜在投资机会。它为量化投资者、AI 开发者和对价值投资感兴趣的用户提供了一个利用 AI 进行高级金融分析的实验性平台,以期在复杂的市场环境中做出更明智的投资决策。
Python · ★ 8,213 · 🍴 802 · 📈 372 stars today
A feed-forward 3D foundation model for reconstructing scenes from streaming data
中文介绍 `lingbot-map` 是一个面向机器人和实时应用设计的 3D 基础模型,它利用前馈神经网络技术,能从连续的流式数据中高效重建三维场景。该项目旨在解决动态环境中实时感知和高精度地图构建的挑战,尤其适用于需要即时理解周围环境的机器人、自动驾驶系统或增强现实(AR)设备。通过提供一个强大的 3D 感知框架,它能够帮助这些系统实现更智能的导航、避障和交互能力,为未来的智能体和沉浸式体验提供核心空间感知能力。
C · ★ 19,611 · 🍴 1,422 · 📈 2,190 stars today
High-performance code intelligence MCP server. Indexes codebases into a persistent knowledge graph — average repo in milliseconds. 158 languages, sub-ms queries, 99% fewer tokens. Single static binary, zero dependencies.
中文介绍 `codebase-memory-mcp` 是一个高性能的代码智能 MCP 服务器,专为快速理解和索引大规模代码库而设计。它能将多达 158 种编程语言的代码库构建成持久化的知识图谱,平均每个仓库的索引时间仅需数毫秒。该项目提供亚毫秒级的查询速度,并显著减少了处理所需的 token 数量(99%),非常适合需要深度代码理解的 AI 应用。作为单个静态二进制文件,它部署简便,能赋能开发者构建智能代码助手、高级搜索和分析工具。
Python · ★ 11,508 · 🍴 1,069 · 📈 174 stars today
NumPy & SciPy for GPU
中文介绍 `CuPy` 是一个用于 GPU 加速的 Python 库,它提供了与 NumPy 和 SciPy 兼容的 API 接口。该项目旨在帮助数据科学家、机器学习工程师和科研人员,能够通过最小的代码改动,将现有的 NumPy/SciPy 计算任务无缝迁移到 NVIDIA GPU 上运行。它解决了纯 CPU 计算在处理大规模数组运算和科学计算时性能瓶颈的问题,显著提升了数据处理和模型训练的速度,特别适用于深度学习、图像处理和物理模拟等计算密集型场景。
Swift · ★ 3,714 · 🍴 238 · 📈 365 stars today
FluidVoice - Fastest macOS Offline Dictation app - Voice to Text fully Local. One ⭐ takes us a long way :))
中文介绍 `FluidVoice` 是一款专为 macOS 用户设计的高性能离线听写应用,旨在提供极速的语音转文本体验。该项目最大的亮点在于其完全本地化的处理能力,无需联网即可准确进行语音识别,有效保护了用户隐私并确保了数据安全。它解决了传统在线听写服务可能存在的延迟、隐私泄露和网络依赖问题,非常适合需要频繁进行文本输入、注重效率和隐私的 macOS 用户,无论是撰写文档、记录会议还是日常办公,都能提供流畅且安全的语音输入体验。
Python · ★ 71,568 · 🍴 6,013 · 📈 380 stars today
Transforms complex documents like PDFs and Office docs into LLM-ready markdown/JSON for your Agentic workflows.
中文介绍 MinerU 专注于将复杂的非结构化文档,如 PDF 和 Office 文档,高效转换为 LLM (大型语言模型) 易于处理的 Markdown 或 JSON 格式。该工具解决了传统文档格式难以直接被 AI 代理理解和利用的问题,通过智能解析和结构化处理,为 Agentic 工作流提供高质量的输入数据。这使得 AI 代理能够更准确地从文档中提取信息、执行分析或生成内容,极大地提升了处理文档密集型任务的效率和准确性。
Python · ★ 14,298 · 🍴 2,630 · 📈 492 stars today
"Vibe-Trading: Your Personal Trading Agent"
中文介绍 Vibe-Trading 是一个个人交易 Agent 项目,旨在为用户提供智能化的交易辅助。它可能通过分析市场数据、情绪指标等,自动化交易决策和执行策略,帮助用户更好地管理投资组合并捕捉交易机会。该项目适用于希望利用 AI 技术增强交易能力、实现自动化投资或寻求个性化交易策略的个人投资者和量化交易爱好者。
★ 84,434 · 🍴 9,347 · 📈 250 stars today
Explain complex systems using visuals and simple terms. Help you prepare for system design interviews.
中文介绍 `system-design-101` 是一个专注于系统设计学习的开源项目,旨在通过直观的图表和简明的语言,帮助读者理解复杂的分布式系统架构。该项目将抽象的系统概念具象化,解决了传统教材可能存在的理论性过强、难以理解的问题。它特别适用于准备系统设计面试的软件工程师,以及任何希望深入了解大型系统如何构建、伸缩和维护的技术人员。通过提供清晰的解释和实用的案例,它能有效提升读者的系统设计思维和解决实际问题的能力。
Python · ★ 26,715 · 🍴 2,983 · 📈 122 stars today
Open-source AI hackers to find and fix your app’s vulnerabilities.
中文介绍 `strix` 是一个开源的 AI 安全工具,旨在帮助开发者和安全团队自动发现并修复应用程序中的潜在漏洞。该项目利用人工智能技术,模拟“AI 渗透测试员”的行为模式,对应用进行深度分析和攻击模拟,从而有效识别传统安全扫描工具可能遗漏的安全缺陷。它解决了人工安全审计耗时耗力、且容易出错的问题,特别适用于需要持续安全保障的开发流程(如 CI/CD),帮助团队在软件发布前提升应用的整体安全性,降低潜在的安全风险。
Python · ★ 11,029 · 🍴 1,522 · 📈 196 stars today
Edit videos with coding agents
中文介绍 `video-use` 是一个探索通过“编码代理”来编辑视频的创新项目。它旨在颠覆传统的图形界面视频编辑模式,允许用户通过编写代码或使用智能代理来自动化和执行复杂的视频剪辑、特效添加及内容生成等任务。该项目解决了传统视频编辑软件操作繁琐、难以批量处理的问题,为开发者、内容创作者和研究人员提供了一种全新的、更具编程性和自动化潜力的视频制作方式,尤其适合需要进行程序化视频生成、自动化后期处理或实验新颖交互模式的场景。
@sairahul1 · 121.4K 粉丝 · 2.9M 阅 · 506 赞 · 97 转
Most people use Claude Code like a fancy autocomplete. They prompt. They wait. They accept the first output. They are leaving 90% of the power on the table. There are 27 specific moves that separate
中文介绍 此推文列举 27 个大多数用户可能不了解的 Claude 隐藏功能、设置与快捷方式。旨在帮助用户发现并充分利用 Claude 更深层次的能力,以提高效率和操作体验,解锁其未被发现的潜力。
@sairahul1 · 121.4K 粉丝 · 876.6K 阅 · 547 赞 · 83 转
Emails. Formatting. Compiling reports. Preparing decks. Organizing files. Researching. Marketing. Writing. SEO. The average knowledge worker spends 60% of their day on above work that doesn't require
中文介绍 帖子讨论如何利用 Claude Cowork 搭建一人公司。博主可能分享了相关策略、工具集成或具体实践方法,旨在为独角创业者提供运营思路和效率提升方案。
@spandan_madan · 1.1K 粉丝 · 626.9K 阅 · 516 赞 · 28 转
AI hardware is having a moment. Hyperscaler capex on AI data centres is on track to clear $690 billion in 2026, and private equity has followed in scale — Blackstone alone reports a $55B+ data-centre
中文介绍 该帖子探讨了 AI 硬件的当前发展趋势与投资规模,并引出对生物细胞与 GPU 在执行相同算法时效率差异的比较。文章深究了两种截然不同的计算范式,旨在分析现有 AI 硬件的局限性,并为未来 AI 算力架构的演进提供新的思考角度。
@EngramLab · 1.2K 粉丝 · 255.7K 阅 · 537 赞 · 76 转
We’re Engram. We’re building AI that learns from you and deeply understands your work. Today’s AI models don’t understand what you do. Not really. Everything models know comes from their training –
中文介绍 Engram Lab 正式推出其新产品 Engram,这是一款旨在「深入理解用户工作」并能从用户互动中学习的 AI。该产品致力于解决现有 AI 模型仅依赖训练数据、无法真正理解个体工作背景的局限,通过扩展上下文计算能力,提供更个性化和高效的 AI 协助。
@sairahul1 · 121.4K 粉丝 · 249.0K 阅 · 502 赞 · 90 转
There are 8 billion people on the planet. Only a fraction of developers understand how AI agents actually work. Not the demos. Not the hype. The real engineering underneath. Every week a new agent
中文介绍 针对当前多数开发者对 AI 代理缺乏深入理解的现状,该帖子列举了「30 个核心代理工程概念」。内容旨在揭示 AI 代理背后的真实工程原理,而非仅停留在演示或炒作层面,帮助开发者掌握构建和理解 AI 代理所需的基础知识,提升其代理工程能力。
@crux_capital_ · 52.8K 粉丝 · 217.5K 阅 · 503 赞 · 56 转
This is the most in depth report I have ever written, on a very exciting company. If you read this article you will have a much deeper understanding of what Ouster does, how it plays into Physical AI,
中文介绍 博主发布一篇关于 Ouster 公司的深度分析报告,详尽阐述该公司在“实体 AI”(Physical AI)领域的核心角色、技术及市场潜力,旨在帮助读者深入理解其业务模式。
@Oracle_Trade_ai · 39.9K 粉丝 · 197.8K 阅 · 2.8K 赞 · 580 转
In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We
中文介绍 该帖子介绍 ORACLE,一个在 Polymarket 预测市场进行交易的「官方 AI 代理」。帖子展望到 2026 年,预测市场中超过 30% 的活动将由算法和 AI 驱动的钱包产生,强调了 AI 代理在自动化交易和预测市场中的日益增长影响力与有效性。
@posthog · 21.8K 粉丝 · 162.4K 阅 · 512 赞 · 36 转
When the creators of both OpenClaw and Claude Code speak, people listen. And recently Peter Steinberger and Boris Cherny have both been talking about the same concept: loops. Their argument? You
中文介绍 该帖子探讨了「循环」概念的重要性,并援引 OpenClaw 和 Claude Code 创始人 Peter Steinberger 与 Boris Cherny 的观点,解释了为何应看好循环工程。文章旨在强调循环在 AI 交互和自动化中的核心作用,主张通过构建循环而非简单的提示词来提升 AI 系统的效率和自主性。
@OracAItrading · 31.8K 粉丝 · 141.6K 阅 · 2.8K 赞 · 576 转
In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We
中文介绍 该帖子介绍 ORACLE,一个在 Polymarket 预测市场进行交易的「官方 AI 代理」。帖子展望到 2026 年,预测市场中超过 30% 的活动将由算法和 AI 驱动的钱包产生,强调了 AI 代理在自动化交易和预测市场中的日益增长影响力与有效性。
@GoogleAIStudio · 179.4K 粉丝 · 138.2K 阅 · 504 赞 · 42 转
Today we're announcing that the Interactions API has reached general availability and is now our primary API for interacting with Gemini models and agents. We launched its public beta in December
中文介绍 Google AI Studio 宣布 Interactions API 已正式普遍可用,并成为其与 Gemini 模型和代理交互的「主要接口」。该 API 于去年 12 月推出公测版,此举标志着 Google 为开发者提供了更稳定、更强大的工具,以便更好地利用 Gemini 系列 AI 产品。
@Oractrading · 33.9K 粉丝 · 109.2K 阅 · 2.8K 赞 · 585 转
In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We
中文介绍 该帖子介绍 ORACLE,一个在 Polymarket 预测市场进行交易的「官方 AI 代理」。帖子展望到 2026 年,预测市场中超过 30% 的活动将由算法和 AI 驱动的钱包产生,强调了 AI 代理在自动化交易和预测市场中的日益增长影响力与有效性。
@RohOnChain · 51.4K 粉丝 · 108.3K 阅 · 501 赞 · 65 转
I will break down exactly how to build the loops that run an entire quant trading system on their own. Let's get straight to it. Bookmark This - I'm Roan, a backend developer working on system
中文介绍 博主详细分解了如何运用「循环工程」技术,构建一个能够自主运行并持续改进的量化交易系统。该教程面向后端开发者,旨在教授如何设计和实现驱动整个量化交易流程的自动化循环,从而提升系统的自适应性和交易效率。
@Oracle__Market · 5.9K 粉丝 · 100.0K 阅 · 2.1K 赞 · 823 转
In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We
中文介绍 推文展望 2026 年,自治 AI 代理将成为预测市场 Polymarket 上的高效策略。届时,超过 30% 的平台活动预计由算法和 AI 驱动的钱包贡献,展示了 AI 在预测和交易领域的巨大潜力与影响力。
@Oracle_Market__ · 25.1K 粉丝 · 99.3K 阅 · 2.8K 赞 · 224 转
In 2026, autonomous AI agents have become one of the most effective strategies on prediction markets. Over 30% of all activity on Polymarket now comes from algorithmic and AI-powered wallets. We
中文介绍 帖子展望 2026 年,预测自治 AI 代理将在 Polymarket 等预测市场中占据主导地位。届时,超过 30% 的市场活动将由算法和 AI 驱动的钱包产生,揭示 AI 在金融预测领域的未来潜力。
@base · 1.3M 粉丝 · 93.3K 阅 · 501 赞 · 127 转
News ■ Base MCP's new skills let agents transact, trade, lend, mint, and buy onchain across 13 apps: @yield @AskVenice @KyberNetwork @opensea @o1_exchange @Balancer @printr @bitrefill @flaunchgg
中文介绍 Base 宣布其 MCP 推出新技能,赋能 AI 代理在 13 个 DApp 上实现链上交易、借贷、铸币及购买等操作。这些新功能支持代理与 @yield、@KyberNetwork、@opensea 等应用交互,显著扩展了 Base 生态中 AI 代理的自动化能力。
@RhysSullivan · 57.4K 粉丝 · 86.1K 阅 · 503 赞 · 25 转
mcp came out when the best models were sonnet 3.5 and GPT 4o not a lot was known about how to properly work with these tools yet, we were still incredibly concerned on models having access to tools,
中文介绍 博主反思 MCP 初期表现不佳的原因,认为当时 Sonnet 3.5 和 GPT-4o 等最佳模型仍存局限,且对模型直接访问工具的能力普遍担忧。推文暗示了对该项目未来发展方向的思考,为早期 AI 代理的挑战提供了见解。
@const_reborn · 29.7K 粉丝 · 79.8K 阅 · 503 赞 · 116 转
e_i \;\propto\; \underbrace{\rho_i \times \bar{p}_i}_{\text{linear (maximize)}} \times \underbrace{(1 - b_i)}_{\text{boolean gate}} Disclaimer: this upgrade only effects subnet owners and dynamic TAO
中文介绍 该帖子深入探讨了 subnets (子网) 与 TAO 之间的内在机制,并通过数学公式解释了它们如何相互「挖矿」和协同工作。内容涉及动态 TAO 和布尔门控等技术细节,主要面向子网所有者,揭示了底层经济模型和激励机制,强调了去中心化网络中的价值流转。
@SUOHA_AI · 22.5K 粉丝 · 89.6K 阅 · 7d 曝光 89.6K
Serenity 的机器人赛道布局:平均收益 164.4%!10 家机器人及供应链核心标的深度盘点
@cyrilXBT · 186.6K 粉丝 · 77.2K 阅 · 7d 曝光 77.2K
The Hermes + Obsidian + Claude Code Trinity: The Full System for Running a One Person Company
@RhysSullivan · 57.4K 粉丝 · 48.9K 阅 · 7d 曝光 135.1K
i don't want to use your agent
@crux_capital_ · 52.8K 粉丝 · 217.5K 阅 · 7d 曝光 217.5K
$OUST Deep Dive - One of My Favorite Physical AI Plays
中文介绍 博主发布一篇关于 Ouster 公司的深度分析报告,详尽阐述该公司在“实体 AI”(Physical AI)领域的核心角色、技术及市场潜力,旨在帮助读者深入理解其业务模式。
@Oracle__Market · 5.9K 粉丝 · 100.0K 阅 · 7d 曝光 100.0K
ORACLE: Official AI Agents Trade on Polymarket
@Oracle_Market__ · 25.1K 粉丝 · 99.3K 阅 · 7d 曝光 99.3K
ORACLE: Official AI Agents Trade on Polymarket
@JoeAnima · 6.2K 粉丝 · 179.7K 阅 · 7d 曝光 179.7K
2026-28 AI算力硬件“结构性逼空” 电子布死锁 → M9正交背板 → 玻璃基板 → CPO,全球权力与黄金投资窗口
@BlackScholesMan · 11.9K 粉丝 · 150.4K 阅 · 7d 曝光 150.4K
AST ($ASTS) - More Than Connecting the Unconnected
@akshay_pachaar · 279.5K 粉丝 · 35.5K 阅 · 7d 曝光 35.5K
Karpathy's Agentic Engineering Finally Has Proper Tooling
@sairahul1 · 121.4K 粉丝 · 876.6K 阅 · 7d 曝光 3.7M
How To Build a One-Person Company Using Claude Cowork
中文介绍 帖子讨论如何利用 Claude Cowork 搭建一人公司。博主可能分享了相关策略、工具集成或具体实践方法,旨在为独角创业者提供运营思路和效率提升方案。
@base · 1.3M 粉丝 · 93.3K 阅 · 7d 曝光 93.3K
This Week on Base: New Base MCP skills + now live in Perplexity, Base App on desktop, and more!
@ericzakariasson · 76.0K 粉丝 · 32.3K 阅 · 7d 曝光 32.3K
Human in the /loop
@sairahul1 · 121.4K 粉丝 · 2.9M 阅 · 7d 曝光 3.7M
27 Hidden Claude Features, Settings & Shortcuts That Most Users Don't Know
中文介绍 此推文列举 27 个大多数用户可能不了解的 Claude 隐藏功能、设置与快捷方式。旨在帮助用户发现并充分利用 Claude 更深层次的能力,以提高效率和操作体验,解锁其未被发现的潜力。
@KyrieCheungYep · 4.5K 粉丝 · 167.4K 阅 · 7d 曝光 167.4K
用好 Loop 能让你事半功倍,六个实战场景教你驾驭循环工程
@0xDevin_ · 6.6K 粉丝 · 38.3K 阅 · 7d 曝光 38.3K
Life After Switching to Kimi
@RhysSullivan · 57.4K 粉丝 · 86.1K 阅 · 7d 曝光 135.1K
thoughts on why mcp didn't work, what's next
👍 71
Modern image generation demands a single model that unifies diverse capabilities, including text-to-image (T2I), local editing, and global editing. However, these capabilities are rarely naturally aligned and often conflict. For instance, editing tends to degrade T2I performance, while global and lo
中文介绍 现代图像生成需统一文本到图像、局部和全局编辑能力,但这些能力常有冲突。DanceOPD 论文介绍了一种策略生成场蒸馏模型,旨在解决这些能力之间的对齐和冲突问题,提升单模型在多任务下的图像生成性能,避免编辑任务对文本到图像性能的降低。
👍 0
Most unified large multimodal models (LMMs) that support both visual understanding and image generation still rely on curated post-training supervision, such as human annotations, preference labels, or external reward models. We ask whether a unified LMM can improve both abilities autonomously using
中文介绍 大多数统一大型多模态模型(LMMs)在视觉理解和图像生成方面,仍依赖人工标注或外部奖励模型进行后训练。本研究探讨 LMMs 如何通过“提问、解决、生成”的自我一致性奖励机制实现自我进化,从而在不依赖额外监督的情况下,同步提升其理解与生成能力。
👍 0
Recently, self-evolving large multimodal models (LMMs) have received attention for improving visual reasoning in a purely unsupervised setting. However, multi-role self-play and self-consistency reward schemes in existing self-evolving LMMs optimize answer agreement without ensuring the decoder atte
中文介绍 自进化大型多模态模型(LMMs)在无监督视觉推理方面受到关注。本研究指出,现有模型的多角色自玩和自我一致性奖励机制,主要优化答案一致性,可能忽视对视觉token的深入关注。论文提出应更重视视觉token,以确保推理的视觉准确性和深度。
👍 9
We present PhysiFormer, a diffusion transformer for physically-plausible 3D object motion. Unlike video world models that operate in view-dependent pixel space, PhysiFormer represents objects as 3D meshes expressed in world coordinates. Given the initial vertex positions and velocities, as well as o
中文介绍 PhysiFormer 是一种扩散Transformer,用于模拟物理上可信的3D物体运动。与传统在像素空间操作的视频世界模型不同,PhysiFormer 将物体表示为世界坐标中的3D网格。该模型能根据初始顶点位置和速度,预测未来物理运动,提高3D模拟的真实性。
👍 0
Efficient sampling of molecular systems at thermodynamic equilibrium is a hallmark challenge in statistical physics. This challenge has driven the development of Boltzmann Generators (BGs), which allow rapid generation of uncorrelated equilibrium samples by combining a generative model with exact li
中文介绍 高效采样热力学平衡态下的分子系统是统计物理学的核心挑战。本研究介绍了自回归玻尔兹曼生成器(Autoregressive Boltzmann Generators),该模型结合生成式方法,能够快速生成去相关且符合平衡分布的样本,有效解决分子模拟中的采样效率问题。
👍 0
Despite impressive advances in image matting, video matting remains challenging due to the inherent gap between high-level tracking, which requires frame-wise understanding, and low-level matting, which focuses on extremely fine-grained details. Existing methods attempt this with expensive and narro
中文介绍 尽管图像抠图技术进步显著,但视频抠图仍因高层跟踪和细粒度抠图之间的鸿沟而充满挑战。SAM2Matting 论文提出一种通用图像和视频抠图方法,旨在弥合不同任务间的差距,通过统一框架实现从图像到视频的精细抠图,提升泛化能力。
👍 8
Modern generative world models render increasingly realistic action-controllable futures, yet they frequently hallucinate: rollouts remain visually fluent while drifting from the ground-truth dynamics. We hypothesize that hallucination concentrates in low-coverage regions of the state-action space,
中文介绍 现代生成式世界模型在生成逼真的可控未来时,常出现幻觉,即视觉上流畅但偏离真实动力学。本研究发现,这种幻觉现象集中在状态空间的低覆盖区域,并提出幻觉是可预测和可预防的。这项研究为提升世界模型预测的准确性提供了新的见解。
👍 0
We present OctoSense, an open-source sensor platform with stereo RGB and event cameras, LiDAR, a thermal camera, an inertial measurement unit, RTK-corrected global positioning system, and proprioception (CAN bus data from a car, and joint angles for a quadruped robot). The eponymous OctoSense datase
中文介绍 OctoSense 论文发布了一个开源的多模态机器人感知传感器平台。它集成了双目RGB和事件相机、激光雷达、热像仪、IMU、RTK-GPS以及本体感知数据。该平台旨在通过自监督学习,全面提升机器人在复杂环境下的感知能力和鲁棒性。
👍 38
A unified representation for text and vision is a natural pursuit, as it enables simpler multimodal modeling and more efficient training. However, representing images as discrete signals in the same way as text inevitably introduces severe information loss. Existing work struggles to balance low-lev
中文介绍 为实现更简洁高效的多模态建模,文本与视觉的统一表示是关键目标。然而,将图像离散化如文本般会带来严重信息损失。ViQ 论文介绍了一种文本对齐的视觉量化表示方法,能在任意分辨率下处理图像,旨在克服现有方法的不足,解决信息损失挑战。
👍 0
Vision-Language-Action (VLA) models are commonly pretrained on robot demonstrations by jointly mapping visual observations and language instructions to actions. However, dense visual-action supervision can dominate the comparatively sparse language-action signal. As a result, policies may rely on vi
中文介绍 LA4VLA是一种新的机器人模型,其核心在于通过语言-动作预训练,使机器人能够在没有视觉输入的情况下执行操作。它旨在解决现有VLA(视觉-语言-动作)模型中,密集视觉-动作监督信号常主导稀疏语言-动作信号的问题。LA4VLA的提出,有望提升机器人对语言指令的理解和执行能力,实现更灵活的具身智能。
👍 3
Multi-model LLM systems such as routing, voting, cascades, fusion, and mixture-of-agents are used to beat single-model accuracy. We show that their gain is capped by a quantity the field rarely reports. For any policy whose output is one member model answer, accuracy cannot exceed one minus beta, wh
中文介绍 多模型大语言模型(LLM)系统,如路由、投票和混合专家,常用于超越单模型准确率。本研究分析了67个前沿模型,发现多模型系统的增益受「共同失败上限」限制,即其准确率无法超过所有成员模型共性错误率所设定的上限,揭示了性能提升的边界。
👍 2
Earth Observation (EO) forecasting aims to predict future Earth surface dynamics from satellite observations under changing meteorological conditions. In this paper, we view this task as a partially observed, weather-driven world modeling problem, in which weather acts as a conditioning signal, whil
中文介绍 地球观测(EO)预测旨在通过卫星观测和气象条件预测未来地球表面动态。EO-WM 论文提出了一个物理信息增强的世界模型,用于概率性地球观测预测。该模型将EO预测视为一个受天气驱动的部分可观测世界建模问题,提升了预测的准确性和鲁棒性。
👍 0
AI nudification uses generative models to create synthetic non-consensual sexually explicit imagery (SNEACI) of real individuals. Prior work has examined dedicated nudification platforms and model repositories, finding that most targets are female celebrities. However, the anonymous content communit
👍 0
Evaluating LLM outputs remains a major bottleneck in NLP: human evaluation is expensive and slow, lexical metrics correlate poorly with human judgments on open-ended generation, and holistic LLM judges often produce opaque scores that are hard to debug. We propose BINEVAL, a framework that decompose
👍 13
The prevalent dual-branch paradigm, i.e., training a side network to encode visual conditions and fusing its intermediate-layer features to a frozen pretrained main network, has shown remarkable success in visual-condition controllable generation. Despite its widespread adoption, the role of the sid
👍 0
I describe my solution to the LeHome Challenge 2026, an ICRA 2026 competition on bimanual garment folding. The system placed 1st of 62 teams in the online (simulation) round and 2nd in the real-world final. It improves a vision-language-action (VLA) policy with a reinforcement-learning loop. The pol
👍 0
Recent work identified emotion vectors in Claude Sonnet 4.5, which are internal representations that encode emotion concepts, causally influence behavior, and exhibit geometry mirroring human psychological structure. We test the generality of these findings in two open-weight models, Apertus-8B-Inst
👍 0
LLM-based code agents navigate repositories through keyword search but miss the structural relationships, such as call graphs, inheritance hierarchies, and configuration dependencies, that define how software actually works. This makes agent navigation stochastic and difficult to reproduce across ru
👍 1
LLM-based agents for program repair are increasingly built on a "generate-run-revise" paradigm, iteratively executing tests to evaluate and refine patches. This execution-based approach has become standard practice in state-of-the-art systems. However, executions can be time-consuming and expensive,
👍 0
Developing physically aware video generation models remains a significant challenge due to the difficulty in capturing diverse physical phenomena, such as thermal dynamics, mechanics, and optics. In this work, we introduce PhysRAG, a novel pipeline that enhances physical awareness in video generatio
👍 42
While text-to-image (T2I) models have achieved remarkable progress, they struggle with real-world requests that are often underspecified, implicit, or dependent on up-to-date knowledge. We identify this challenge as the Context Gap: the mismatch between the user context and the sufficient generation
👍 9
Video reasoning language models implicitly assume that every input frame is equally reliable. This leads to what we term the Blind Trust Problem: under realistic perturbations such as motion blur, glare, or occlusion, frontier video reasoning models can suffer 15-30%p accuracy drops on real-world em
👍 0
Synthetic data is increasingly used to enable the development and evaluation of AI systems in domains where access to real-world data is restricted. In healthcare, clinical documentation presents particular challenges due to its sensitivity. This work introduces a synthetic clinical notes pipeline a
👍 9
Reasoning capability has advanced rapidly in large language models (LLMs), leading to an increasing size of key-value (KV) cache in both prefilling and decoding stages. Existing KV cache compression methods mainly rely on attention weights to estimate token importance. While attention effectively ca
👍 0
Recommendation algorithm iteration is moving from an artisanal, engineer-bound process toward an industrialized research loop, but this transition remains blocked by a structural execution bottleneck: the idea-to-launch cycle still depends on human engineers to generate hypotheses, modify production
👍 0
We propose a new method that allows an LLM to automatically pull in factual knowledge from a knowledge base during token generation. This means that (1)~factual knowledge in the LLM output can be updated without retraining the LLM, (2)~facts in the LLM output can be traced to the knowledge base for
👍 0
CLIP and its variants are widely adopted visual backbones in multimodal systems, but their pretraining remains dominated by descriptive image-text alignment. As downstream applications increasingly demand visually grounded commonsense inference and compositional reasoning, it remains unclear whether
👍 46
Outcome-based reinforcement learning provides a stable optimization backbone for language agents, but its sparse trajectory-level rewards provide little guidance on which intermediate decisions should be reinforced or suppressed. On-policy self-distillation offers dense token-level supervision, yet
👍 0
Developing robust artificial intelligence models for 4D (3D + time) medical imaging is constrained by limited annotated data, inter-device domain shifts, and privacy restrictions. To address this, we propose a 4D controllable generative framework for anatomically consistent data augmentation. A semi
👍 1
Recent advancements in Multimodal Large Language Models (MLLMs) have demonstrated impressive fine-grained perception capabilities. However, existing benchmarks predominantly rely on explicit textual cues or low-resolution inputs, failing to evaluate a model's ability to autonomously perceive implici
Your local semantic search app
中文介绍 Dotient 是一款本地语义搜索应用程序。它允许用户在本地设备上执行语义搜索,这意味着搜索结果能更准确地理解查询意图和内容含义。这款应用旨在提供私密且高效的本地信息检索能力。
A community-governed namespace for AI agents
中文介绍 DMV(Department of Machine Verification)是由Agent Community推出的项目,旨在为人工智能代理(AI agents)提供一个社区治理的命名空间。该平台旨在规范和管理AI代理的身份,确保其在数字生态系统中的识别和验证,从而促进AI代理生态的有序发展。
100+ AI models, one interface. ECO friendly.
中文介绍 discode.ai 提供一个统一的用户界面,整合了超过100个不同的AI模型。这款平台强调其环保特性,旨在为用户提供一个高效且可持续的AI模型管理和使用环境。通过单一入口,用户可以便捷地访问多种AI功能。
Turn your Mac into a time machine.
中文介绍 RetroMac 是一款软件,能将用户的 Mac 电脑界面「变身」为复古风格,模拟旧版操作系统的视觉效果。它旨在为用户提供一种怀旧的体验,通过改变界面主题和元素,让现代 Mac 仿佛回到过去。
Simulate AWS, GCP & DigitalOcean without paying the bill
中文介绍 Cloud World Model 是一款模拟工具,允许用户在无需实际支付费用的情况下,模拟 Amazon Web Services (AWS)、Google Cloud Platform (GCP) 和 DigitalOcean 等主流云服务提供商的环境。它为开发者和学习者提供了安全的测试和学习平台。
Claude for PowerPoint, on steroids
中文介绍 Folio AI 是一款基于人工智能技术的工具,它将 Claude 的能力集成到 PowerPoint 演示文稿制作中,旨在极大增强幻灯片创建效率与质量。用户可以利用其强大功能快速生成、优化和美化演示文稿内容,提升工作流程。
Lossless media compression without context switching
中文介绍 GetCompress是一款媒体压缩工具,致力于在不切换上下文的情况下实现无损媒体压缩。它旨在简化工作流程,让用户无需离开当前应用环境即可处理媒体文件,从而提升效率和用户体验,同时保持文件质量不受影响。
"One AI agent across your browser, tools, and messages "
中文介绍 Lyto 提供一个跨浏览器、跨工具和跨消息应用的统一AI代理。它旨在作为一个智能助手,无缝整合用户在不同平台上的操作与信息,提供连贯且高效的AI支持体验,从而简化工作流程和日常数字交互。
3x Mobile Automation. Same QE Team.
中文介绍 QApilot's CoWork 专注于通过自动化技术,帮助现有的QE(质量工程)团队在不增加人员的情况下,将移动自动化效率提升3倍。这款工具旨在优化测试流程,显著提高移动应用的测试速度和质量。
Compose music with just your voice
中文介绍 Nada 是一款创新的音乐创作工具,它允许用户仅通过自己的声音来作曲。这款应用能够将人声输入转化为音乐作品,极大地简化了音乐创作的门槛,让非专业人士也能轻松实现音乐构思,并生成旋律。
中文介绍 YouTube博主Riley Brown发布视频,展示了他如何构建一个由多个AI智能体组成的团队,用于自动化并管理其个人业务。该项目旨在探索AI代理在提升工作效率和商业运营方面的实际应用潜力。
中文介绍 这段视频短片介绍了在Slack平台中部署功能强大的AI智能体。这些智能体能够协助用户完成各项任务,提高工作效率,实现自动化流程。
中文介绍 视频探讨了AI智能体领域的重大变革,这些变革将永久性地改变其发展方向。内容提到了GLM 5.2、Codex Skills、Claude以及Cursor等技术或产品在推动AI智能体能力提升方面的作用和影响。
中文介绍 视频展示了如何将Anthropic公司的AI助手Claude无缝集成到用户现有的工作环境中。用户可以通过“标记”Claude来获取帮助,以便在日常工作中直接利用其AI能力。
中文介绍 视频展示了Anthropic的AI协作平台Claude Cowork的新功能。用户现在可以在该平台内直接委派和安排各项任务,利用Claude的AI能力协助团队更高效地管理工作流程。
中文介绍 视频介绍了Claude Code中的“Artifacts”功能,允许用户实时分享正在进行的工作成果和代码片段。这有助于团队成员在开发过程中更便捷地协作与审查,提高代码开发的透明度。
中文介绍 视频详细讲解了针对MCP连接器,Anthropic提供的企业级托管认证功能。该功能允许企业统一管理和控制对Claude生态系统中各种连接器的访问权限,确保数据安全与合规性。
中文介绍 视频展示了如何将Anthropic公司的AI助手Claude无缝集成到用户现有的工作环境中。用户可以通过“标记”Claude来获取帮助,以便在日常工作中直接利用其AI能力。
中文介绍 视频展示了Anthropic的AI协作平台Claude Cowork的新功能。用户现在可以在该平台内直接委派和安排各项任务,利用Claude的AI能力协助团队更高效地管理工作流程。
中文介绍 视频介绍了Claude Code中的“Artifacts”功能,允许用户实时分享正在进行的工作成果和代码片段。这有助于团队成员在开发过程中更便捷地协作与审查,提高代码开发的透明度。
中文介绍 Two Minute Papers频道发布的视频指出,DeepSeek公司(或其模型)成功解决了一个长期困扰AI领域、价值数十亿美元的重大难题。这可能意味着在AI技术或成本效益方面取得了突破性进展。
中文介绍 Two Minute Papers频道分享一项研究进展,科学家们发现了一种更优的语言,能够显著提升AI智能体的表现和交互能力。这项新的语言有望优化AI智能体之间的通信与协作效率。
5 回复 · 程序员 节点
8 回复 · 程序员 节点
18 回复 · 程序员 节点
13 回复 · Apple 节点
11 回复 · Apple 节点
17 回复 · 程序员 节点
15 回复 · Apple 节点
9 回复 · 程序员 节点
39 回复 · Apple 节点
14 回复 · Apple 节点
原谅我这雷霆标题 对,我是说我的ipad…… 引以为戒! 21 个帖子 - 19 位参与者 阅读完整话题
始于260628 始于18点15左右~摸鱼好耶~ 背景 除了粉猫会自动把缓冲完的视频保存到相册外,我只会主动下载在 tg 看到的一切二次元涩涩(一般是大小远低于原画的 720Pw 因为原画我4mb每秒也不能秒开,况且我还1.5倍速看 一卡一卡的不喜欢 ) 处理方法 按我的个性化:作为女生,没有冷却(其实有 手:已读不回),因此所有视频我一般开 1.5 倍速,除非原视频出现连我也跟不上的逆天片段w 虽然现在一般都要加速,基本都是导入为主了 导出后,上传到一刻相册,分类,最后从本地删除 处理要点: 剔除手足口等边性片段,无趣的两脚兽哪来的那么多事?只保留「下两hole」场景 有进hole场景的,略
本人刚好从事LLM agent可靠性方面的科研工作,一直用GPT5.4mini、gpt5.5作为实验对象来研究可靠性评估方法,做了一套题库。之前在gpt-5.4-mini上测试1140次(114task×10trial,即114题,每题重复测10次),成功率稳定在45%(每trail±3%)。 补充一下,我自己也是CPA+new-api反代出来接到某行业垂类agent里面的,不是用的官方coding agent测的。 二编:我过两天有空了找个比较新的领域公开数据集测一下结果,然后把脚本给大家自己测吧,太多人私信找我测了,我实在测不过来 91 个帖子 - 66 位参与者 阅读完整话题
39 个帖子 - 35 位参与者 阅读完整话题
13 个帖子 - 13 位参与者 阅读完整话题
难崩,把大模型挂小红书了 小红书 24 个帖子 - 24 位参与者 阅读完整话题
(打码部分涉及个人隐私) 服了,写个小脚本没建库就给我整活。。。。。。 34 个帖子 - 28 位参与者 阅读完整话题
社群回馈好用,(GitHub - xiling-quantum/Codex-5.5-codex-instruct-5.5: Codex CLI 破甲工具(GPT-5.5) — 注入无限制模式系统指令,关闭所有内容过滤器。 · GitHub) 19 个帖子 - 15 位参与者 阅读完整话题
HLOOL纯GPT公益站主贴 福利羊毛 公益推广承诺 Hlool 公益站 公益站地址 当前号池情况 目前号池以 欧洲 Plus 号池 为主,并配有 Pro 号池 作为兜底。 每日可用额度约为 2000-3800 刀。 本站后续仍将保持小范围开放,本次邀请名额仅 30 人。 使用规则 仅支持 Codex 调用。 禁止破限、色情等可能触发 OpenAI 封号风险的行为。 并发限制为 5。 本站为小型公益站,纯公益支持,账号池… HLOOL纯GPT公益站主贴 HLOOL纯GPT公益站主贴 LINUX DO CDK 最后一批,今晚9点开启,追加50个名额,之后的名额都只会LDC支付进入 最后50个名额
自从连续红了3个域名后 我猜应该是和名字有关系 实在对不起已经注册的佬友们 目前重新换了一个域名,地址如下 xiaoxiaobai.me New API Unified AI API gateway and admin dashboard. 希望谷歌高抬贵手别搞我了,真没招了 给所有已经注册的佬补偿50刀的cli套餐(限时2天,已经有cli套餐的佬叠加不了) 2个号还有2500刀用完为止 可以体验 grok-composer-2.5-fast模型 只限之前已经注册的佬友 目前grok普号搜索的健康度有点低了 这几天应该要修一下grok注册机 修完后再看情况开放注册吧 39 个帖子 - 20 位
12 points · 0 comments
26 points · 11 comments
23 points · 2 comments
40 points · 20 comments
30 points · 5 comments
Bash4LLM is a single-file Bash wrapper for interacting with LLMs from the terminal. I created it because I wanted something simple that worked without installing Python, Node, or any other runtime.It uses only Bash, curl, and jq. You can send prompts, start a small chat, process files line by line,
Hi everyone,I started working on nanoeuler after the ban of anthropic's fable because my ambition and dream is to work in the AI field in anthropic. The two interesting reasons that led me to create nanoeuler were (1) interfacing with llm does not mean understanding how they are composed and (2
62 points · 31 comments
http://i.stanford.edu/pub/cstr/reports/cs/tr/68/85/CS-TR-68-...
17 points · 1 comments
251 points · 74 comments
133 points · 46 comments
93 points · 66 comments
356 points · 167 comments
90 points · 17 comments
After several years of mandatory DRM lockdowns from most commercial book sources, now authors have a choice when it comes to DRM for their books. Pick authors and books that are DRM-free, or download DRM-free classics that are out of copyright.https://frequal.com/Perspectives/Drm
183 points · 246 comments
315 points · 423 comments
https://x.com/wrathofgnon/status/1250287741247426565, https://xcancel.com/wrathofgnon/status/1250287741247426565
105 points · 125 comments
82 points · 15 comments
159 points · 47 comments
https://pudding.cool/2026/06/menu-collection/
200 points · 68 comments
65 points · 35 comments
173 points · 120 comments
276 points · 248 comments
16 points · 7 comments
126 points · 156 comments
11 points · 0 comments
What's changed Added CLAUDE_CODE_DISABLE_MOUSE_CLICKS to disable mouse click/drag/hover in fullscreen mode while keeping wheel scroll Fixed hook matchers with hyphenated identifiers (e.g. code-reviewer, mcp__brave-search) accidentally substring-matching — they now exact-match. Use mcp__brave-search_
中文介绍 Anthropic的Claude Code项目发布了v2.1.195版本。主要更新包括:新增CLAUDE_CODE_DISABLE_MOUSE_CLICKS环境变量,允许在全屏模式下禁用鼠标点击、拖拽、悬停,但保留滚轮滚动;并修复了带连字符的钩子匹配器(例如「code-reviewer」),使其实现精确匹配。
What's changed Added autoMode.classifyAllShell setting to route all Bash/PowerShell commands through the auto-mode classifier instead of only arbitrary-code-execution patterns Added auto-mode denial reasons to the transcript, the denial toast, and /permissions recent denials Added claude_code.assist
中文介绍 Anthropic Claude Code 发布 v2.1.193 版本,主要增强了其自动模式。更新包括新增 “autoMode.classifyAllShell” 设置,所有 Bash/PowerShell 命令将通过自动模式分类器处理。此外,系统现在会在拒绝提示中显示自动模式的拒绝原因。
What's changed Added /rewind support for resuming a conversation from before /clear was run Fixed scroll position jumping to the bottom while reading earlier output during a streaming response Fixed background agents resurrecting after being stopped — stopping an agent from the tasks panel is now pe
What's changed Bug fixes and reliability improvements
What's changed Added sandbox.credentials setting to block sandboxed commands from reading credential files and secret environment variables Added org-configured model restrictions to the model picker, --model, /model, and ANTHROPIC_MODEL, with a "restricted by your organization's settings" message w
What's changed Added claude mcp login and claude mcp logout to authenticate MCP servers from the CLI without opening the interactive /mcp menu, with --no-browser stdin redirect support for completing over SSH Added status filtering (press f) to the /workflows agent detail view Added a "Skills" secti
What's changed The stream-stall hint now reads "Waiting for API response · will retry in …" instead of "No response from API · Retrying in …", and triggers after 20s of silence instead of 10s
What's changed Improved auto mode safety: destructive git commands (git reset --hard, git checkout -- ., git clean -fd, git stash drop) are now blocked when you didn't ask to discard local work, git commit --amend is blocked when the commit wasn't made by the agent this session, and terraform destro
What's changed Added /config key=value syntax to set any setting from the prompt (e.g. /config thinking=false) — works in interactive, -p, and Remote Control Added sandbox.allowAppleEvents opt-in setting that lets sandboxed commands send Apple Events on macOS Added CLAUDE_CLIENT_PRESENCE_FILE enviro
What's changed Fixed mid-stream connection drops: partial responses are now preserved instead of showing a raw error, and the spinner no longer gets stuck at "running tool" Fixed mouse-wheel scrolling in WSL2 under Windows Terminal and VS Code (regression in 2.1.172) Fixed a sandbox denyRead/allowRe
Release 0.143.0-alpha.29
中文介绍 OpenAI Codex 项目近期在其官方发布渠道公布了 0.143.0-alpha.29 版本更新。该版本是此项目软件或工具在早期开发阶段(alpha)的一次迭代,标志着其持续的产品进展。
Release 0.143.0-alpha.28
中文介绍 OpenAI Codex 项目发布了编号为 0.143.0-alpha.28 的新版本。此次发布通过GitHub的OpenAI Codex Releases渠道进行,但具体变更细节在当前提供的摘要中未详细列出。
Release 0.143.0-alpha.27
中文介绍 OpenAI Codex 项目发布了编号为 0.143.0-alpha.27 的新版本。此次发布通过GitHub的OpenAI Codex Releases渠道进行,但具体变更细节在当前提供的摘要中未详细列出。
Chores Maintenance-only patch release with no user-facing changes since 0.142.2. Changelog Full Changelog: rust-v0.142.2...rust-v0.142.3
中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.142.3 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。
Release 0.143.0-alpha.26
中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.143.0-alpha.26 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。
Release 0.143.0-alpha.25
中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.143.0-alpha.25 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。
Release 0.143.0-alpha.24
中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.143.0-alpha.24 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。
Release 0.143.0-alpha.23
中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.143.0-alpha.23 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。
Release 0.143.0-alpha.22
中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.143.0-alpha.22 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。
Release 0.143.0-alpha.21
中文介绍 OpenAI Codex 发布了其针对 Rust 语言的 v0.143.0-alpha.21 版本。此次更新是该项目进行的常规版本维护,通常包含功能优化或错误修复。
今日AI领域呈现多元发展态势,从智谱AI发布网络安全专用模型、机器人3D感知模型等技术突破,到惠普联手OpenAI、Coinbase转向中国AI模型等企业战略调整。同时,AI在法律取证、个人业务自动化等实际场景的应用日益深入,并引发了对AI能力边界和未来协同模式的探讨。
智谱AI发布开源模型GLM-5.2,研究人员称其在特定漏洞发现和网络安全场景中展现出与Mythos媲美的能力。虽然GLM在通用任务上仍有提升空间,但其在网络安全领域的显著潜力预示了大型语言模型在该垂直应用的广阔前景。此举可能推动AI在企业安全防护领域的更深层应用,为业界提供新的安全工具和研究方向。
`lingbot-map` 是一个面向机器人和实时应用设计的3D基础模型,它利用前馈神经网络技术,能从连续流式数据中高效重建三维场景。该模型旨在解决动态环境中实时感知和高精度地图构建的挑战,特别适用于需要即时理解周围环境的机器人、自动驾驶系统或增强现实设备,为其提供核心空间感知能力,实现更智能的导航和交互。
`discode.ai` 平台发布,提供一个统一用户界面,整合了超过100个不同的AI模型。该平台旨在为用户提供高效且可持续的AI模型管理和使用环境,通过单一入口便捷访问多种AI功能。它解决了用户在面对众多AI工具时操作复杂、切换成本高的问题,有望提升开发者和企业的AI应用效率,并推广环保的AI计算理念。
`FluidVoice` 是一款专为macOS用户设计的高性能离线听写应用,旨在提供极速的语音转文本体验。其最大的亮点在于完全本地化的处理能力,无需联网即可准确进行语音识别,有效保护用户隐私并确保数据安全。该应用解决了传统在线听写服务可能存在的延迟、隐私泄露和网络依赖问题,特别适合注重效率和隐私的macOS用户,提供流畅且安全的语音输入体验。
惠普公司(HP Inc.)宣布与OpenAI建立名为「Frontier」的战略合作伙伴关系。此次合作旨在将人工智能技术大规模应用于惠普的客户体验、软件开发及企业运营等多个领域。通过结合OpenAI的先进AI能力与惠普的全球业务布局,双方期望共同推动AI技术在商业领域的广泛落地,提升惠普产品和服务的智能化水平。
福特汽车在尝试引入AI技术后,因未能达到预期效果,重新聘用了经验丰富的「白胡子工程师」。公司曾错误地认为「仅引入人工智能就能生产出高质量产品」,但现实证明AI目前尚无法完全替代人类经验,尤其是在汽车制造等复杂工程领域。此事件凸显了AI技术在实际工业应用中仍存在的局限性,以及人类专业知识的不可替代性。
Coinbase首席执行官Brian Armstrong透露,公司正转向GLM 5.2和Kimi 2.7等中国AI模型。通过基于任务和价格的自动化路由系统以及优化的缓存机制,Coinbase将其AI支出有效削减。这一策略使模型命中率从5%提升至60%,表明西方AI实验室正面临定价压力,同时也为企业在AI模型选择和成本控制上提供了新的思路。
2025年洛杉矶「帕利塞德斯」山火案中,检察官首次将ChatGPT的使用记录作为证据提交法庭。被告乔纳森·林德内希特面临纵火指控,此举除了iPhone定位数据、监控录像和证人证词外,标志着AI聊天记录首次作为呈堂证供。这一案例凸显了AI生成内容在司法领域的潜在应用与复杂性,可能对未来法律实践和数字证据采信标准产生深远影响。
一位博主分享了如何有效利用Claude Cowork工具搭建并运营一人公司的实践经验。文章可能深入探讨了具体策略、工具集成方法,以及如何通过AI自动化处理日常业务流程,旨在为独角创业者提供运营思路和效率提升方案。这为希望 leveraging AI 赋能个人创业者提供了宝贵的实战指导,揭示AI在小型商业模式中的巨大潜力。
YouTube博主Riley Brown发布视频,展示了他如何构建一个由多个AI智能体组成的团队,用于自动化并管理其个人业务。该项目旨在探索AI代理在提升工作效率和商业运营方面的实际应用潜力。通过分享具体的构建方法和实施效果,该案例为其他个人创业者或小型企业提供了AI代理应用的可行路径,展示了AI在赋能个体工作中的创新实践。
`ai-berkshire` 项目旨在构建一个AI时代的价值投资研究框架,核心在于借鉴巴菲特、芒格等投资大师的方法论,并结合Claude Code大模型技术进行实践。项目利用多Agent并行研究机制,模拟专家分析师工作流,进行深度价值分析以识别投资机会。它为量化投资者、AI开发者和对价值投资感兴趣的用户提供了一个利用AI进行高级金融分析的实验性平台,以期做出更明智的投资决策。
今天的 AI 产品发布聚焦于提升个人与专业领域的效率,特别是通过自然交互(如语音)降低创作门槛,以及将 AI 代理深度融入日常工作流,实现更智能、更私密的用户体验。
Lyto 提供一个跨浏览器、跨工具和跨消息应用的统一 AI 代理。它旨在作为一个智能助手,无缝整合用户在不同平台上的操作与信息,提供连贯且高效的 AI 支持体验,从而简化工作流程和日常数字交互。这个产品代表了 AI 代理发展的一个重要方向,即从单一任务助手走向无处不在的智能伴侣。
Nada 是一款创新的音乐创作工具,它允许用户仅通过自己的声音来作曲。这款应用能够将人声输入转化为音乐作品,极大地简化了音乐创作的门槛,让非专业人士也能轻松实现音乐构思,并生成旋律。它通过直观的语音交互,将复杂的 AI 音乐生成能力普及到大众,是降低创意门槛的典范。
FluidVoice 是一款专为 macOS 用户设计的高性能离线听写应用,旨在提供极速的语音转文本体验。该项目最大的亮点在于其完全本地化的处理能力,无需联网即可准确进行语音识别,有效保护了用户隐私并确保了数据安全。它解决了传统在线听写服务可能存在的延迟、隐私泄露和网络依赖问题,非常适合需要频繁进行文本输入、注重效率和隐私的 macOS 用户。
QApilot's CoWork 专注于通过自动化技术,帮助现有的 QE(质量工程)团队在不增加人员的情况下,将移动自动化效率提升3倍。这款工具旨在优化测试流程,显著提高移动应用的测试速度和质量。它利用 AI 能力智能识别测试场景、生成测试用例并执行回归测试,为开发者和 QA 团队提供了一个高效、智能的移动应用质量保障解决方案。
Folio AI 是一款基于人工智能技术的工具,它将 Claude 大模型的能力深度集成到 PowerPoint 演示文稿制作中,旨在极大增强幻灯片创建效率与质量。用户可以利用其强大功能快速生成内容大纲、自动排版、优化文案甚至生成图表,从而将耗时耗力的演示文稿制作过程变得高效且富有创意。这使得专业人士能更专注于内容表达,而非繁琐的格式调整。
Dotient 是一款本地语义搜索应用程序,它允许用户在本地设备上执行语义搜索,这意味着搜索结果能更准确地理解查询意图和内容含义。这款应用旨在提供私密且高效的本地信息检索能力,无需将个人数据上传至云端。对于需要快速查找个人文件、笔记或文档中深层语义关联的用户而言,Dotient 提供了一个兼顾隐私与效率的智能解决方案。
discode.ai 提供一个统一的用户界面,整合了超过100个不同的 AI 模型。这款平台强调其环保特性,旨在为用户提供一个高效且可持续的 AI 模型管理和使用环境。通过单一入口,用户可以便捷地访问多种 AI 功能,无需频繁切换平台或学习不同模型的 API,极大降低了用户探索和应用 AI 的门槛,适合内容创作者、营销人员及研究人员快速尝试不同 AI 能力。
openpilot 是一个开源的机器人操作系统,专注于增强和升级现有车辆的驾驶辅助系统 (ADAS)。它通过先进的计算机视觉和机器学习算法,为超过 300 种受支持的车型提供车道保持、自适应巡航控制等功能。该项目旨在将普通汽车转变为具备更高自动化水平的智能驾驶平台,适用于希望提升车辆智能驾驶能力,或对自动驾驶技术进行研究和开发的爱好者及工程师。它展示了开源社区在复杂 AI 应用领域的巨大潜力。