Your browser does not seem to support JavaScript. As a result, your viewing experience will be diminished, and you have been placed in read-only mode.

Please download a browser that supports JavaScript, or enable it if it's disabled (i.e. NoScript).

版块

博客

1 主题

1 帖子

A

当 LLM 从聊天工具进化到生产级 Agent，一个事实浮出水面：模型能力只是起点，决定任务成败的是围绕模型的工程架构。OpenAI 和 Anthropic 在 2025-2026 年的工程实践表明，Prompt Engineering 的边际收益正在递减，行业重心已转向 Harness Engineering（脚手架工程）。一、什么是 Harness？最简化的定义： Agent = LLM + Harness 模型是引擎，Harness 是方向盘、刹车、底盘与导航系统的总和。 Harness 不是更复杂的 Prompt，而是一套覆盖任务规划、上下文管理、工具路由、错误回滚、质量评估的完整工程框架。它解决的不是"模型怎么回答得更好"，而是"模型如何在 50 轮对话、8 次工具调用、3 个小时后仍然稳定交付"。二、Anthropic：薄 Harness 与三角色架构 Anthropic 提出 "Thin Harness"（薄脚手架）策略：Harness 只负责组装提示词、调用模型、执行工具，所有规划与推理推给模型本身。核心信念是——模型越强，脚手架应该越薄。针对长期运行的应用开发，Anthropic 采用 Planner / Generator / Evaluator 三角色分离：角色职责关键约束 Planner 将模糊需求转化为可执行的技术规格不能过度规划，避免"Over-specifying upfront causes cascading errors downstream" Generator 按规格逐步实现功能总是高估自身质量，需要外部评估 Evaluator 像终端用户一样测试应用，给出诚实反馈必须与 Generator 分离，不能自评此外，Anthropic 发现 Claude Sonnet 4.5 存在 "上下文焦虑"（Context Anxiety）：随着上下文填满，Agent 会过早收尾。解决方案不是压缩上下文，而是结构化重置——每个会话新建上下文，通过结构化工件（Artifacts）在会话间传递状态。三、OpenAI：代码优先的中间路线 OpenAI 的 Agents SDK 采取更务实的中间路线：工作流逻辑用原生 Python 编写，不搞专有 DSL，但引入严格的**优先级栈（Priority Stacks）**和显式的 Agent 交接（Handoff）。 OpenAI 将 Harness 演进描述为四层渐进简化：层面过去现在推理精心设计的 Chain-of-Thought 提示链模型自主规划与反思工具调用复杂的函数调度和参数解析模型原生理解工具定义（MCP 协议）上下文精密的 RAG、分块、压缩更长上下文 + 结构化文件传递协同手动编排每一步模型-Harness 协同训练 OpenAI 的 Codex Agent 将 Chrome DevTools、DOM 快照、日志查询直接接入闭环，实现"复现问题 → 验证修复 → 录制结果 → 提 PR"的完整工作流。四、OpenAI vs Anthropic：核心分野维度 Anthropic OpenAI Harness 厚度薄（Thin Harness）中等（Code-First Guardrails）核心哲学信任模型，让模型思考模型 + 结构性护栏并重多 Agent 策略规划/生成/评估三角色分离 Agents SDK 支持多 Agent Handoff 上下文管理结构化重置（Context Reset）渐进压缩 + 原生长上下文安全模型沙箱 + 代理 + Vault + Scoped Credential 优先级栈 + 显式权限控制双方的共同底线：模型不是产品，基础设施才是。五、六大工程共识 Context 管理是核心战场：不是越多越好，而是"在合适的时候给合适的内容" 结构化工件传递上下文：用文件、spec、artifacts 在 Agent 间/会话间传递状态生成与评估必须分离：Agent 不能评判自己的工作，需要独立 Evaluator 任务分解为可处理块：长期任务必须切片，
接口文档

Got a question? Ask away!

0 主题

0 帖子

没有新主题
市场动态

news from all over the world

3 主题

4 帖子

A

全面进入 Agent 时代 | Google I/O 2026 重磅发布 Gemini 3.5 与全场景 AI 智能体时间： 2026年5月19日　地点：美国加州山景城在盛大开幕的 Google I/O 2026 开发者大会上，谷歌CEO桑达尔·皮查伊宣布，公司正从"AI辅助"全面转向"AI智能体"时代，推出一系列横跨模型层、应用层与硬件端的重磅更新。本次大会核心亮点包括： Gemini 3.5 Flash —— 专为复杂智能体任务设计，Token生成速度达到前代4倍 Gemini Spark —— 首款常驻后台的个人AI代理，可跨应用自动规划活动、整理日程、起草邮件 Gemini Omni —— 革命性视频生成与编辑模型，支持单图生视频、对话式视频重制与特效添加 Antigravity 2.0 —— 面向开发者的智能体编程平台，支持子代理编排、沙箱隔离与一键部署至 Cloud Run Android XR 智能眼镜 —— 与三星、Gentle Monster及Warby Parker联合打造，秋季上市谷歌同时披露，Search的AI Overview月活用户已突破25亿，Gemini应用月活达9亿。Search搜索框将直接内置"信息代理"，可持续监控股票走势、租房动态等任务并在后台主动推送提醒。在硬件演示环节，谷歌产品负责人现场佩戴Android XR眼镜，仅通过语音指令完成导航、打开DoorDash并准备咖啡订单，全程无需掏出手机。此外，谷歌还发布了科研专用工具 Gemini for Science，可追踪最新论文、生成实验代码并辅助药物发现；以及AI创意平台 Google Flow 的重大升级，整合Omni模型实现视频特效、音乐生成与UI设计。谷歌DeepMind CEO Demis Hassabis在闭幕演讲中表示，人类可能已站在**"技术奇点的山麓"**，AI将从根本上加速科学研究与疾病治疗的突破。
顶鎏新闻

New about our team

1 主题

4 帖子

A

️ 顶鎏科技旗舰级AI决策模型“顶鎏智心”成功获批国家注册商标时间： 2026年5月14日　地点：广州顶鎏总部顶鎏科技旗下核心AI决策模型 —— “顶鎏智心” 已成功通过国家知识产权局的审核，正式获得注册商标专用权。作为顶鎏科技精心打造的旗舰级AI决策品牌，“顶鎏智心”名字寓意“以顶级的数据技术红利，筑造金融决策的智慧核心”。该模型自诞生以来，始终专注于解决金融机构在海量非结构化数据处理、跨资产实时风控以及高精度量化投资中的决策难题。顶鎏科技创始人兼首席执行官（CEO）表示： “顶鎏智心”承载了我们核心算法团队数十年的研发心血，其核心在于“可解释性”与“高胜率”。此次商标的成功落地，将进一步强化顶鎏科技在金融级AI决策基础设施领域的正统地位与品牌公信力。 “顶鎏智心”AI决策模型自推出以来，已凭借自研的高并发架构与深度神经网络，帮助首批合作伙伴在多模态数据清洗、复杂信贷风控模型构建等核心场景中实现了质的飞跃。本次商标注册成功，不仅是对顶鎏科技创新成果的法律确权，也为公司下一步加速商业化落地、深化与大型银行、证券及基金机构的全面合作铺平了道路。未来，顶鎏科技将以“顶鎏智心”为核心品牌资产，持续加大对前沿算法的研发投入，致力于将其打造成金融行业不可或缺的AI决策大脑。

版块

博客

接口文档

市场动态

顶鎏新闻