在近期LangChain Interrupt节目中,LangChain创始人Harrison Chase与人工智能领域的领军人物吴恩达展开了一场深度对话,揭示了智能体(Agent)当前被过度营销的现状,并为AI应用落地提供了极具价值的批判性观点和实践建议。吴恩达强调,与其纠结于智能体的定义,不如关注其能解决的实际问题。
智能体概念的回归与实践:从二元对立到连续光谱
吴恩达指出,当前“智能体”一词因营销过度而失去了精确含义。他回忆起一年半前,他和Harrison都在努力推广智能体技术,但到去年夏天,“agentic”一词却被营销人员滥用,导致概念模糊,甚至引发了关于“是否真正自主”的哲学争论。
吴恩达提倡一个更实用的框架:将智能体视为一个连续光谱,不同系统具有不同程度的自主性。这意味着开发者无需执着于系统是否“配得上”智能体称号,而应专注于提升其智能化水平和实用性。这一思维转变将焦点从无意义的概念争论转移到实际构建,旨在推动社区专注于开发真正有用的智能化系统。
智能体应用现状:被低估的线性工作流
令人意外的是,吴恩达观察到目前大多数成功的智能体应用都是相对简单的线性工作流,而非复杂的自主决策系统。虽然他的团队在处理最复杂问题时会使用LangGraph等复杂工具,但他发现商业机会更多地存在于线性工作流中。
他举例说明了典型的商业流程,如员工查看表单、网络搜索、数据库查询、信息复制粘贴等,这些看似复杂的业务流程,实际上可以分解为一系列顺序执行的微任务。“在商业流程中,实际上有很多相当线性的工作流,或者说是线性的但带有非常小的规则和偶尔的分支,”吴恩达解释道。这些分支通常表示工作流程的失败或需要人工干预的情况。
然而,吴恩达也指出了关键挑战:企业难以将现有业务流程转化为智能化工作流。这包括:
目前,将业务流程智能化的技能仍然稀缺,导致大量简单的线性工作流程仍未被开发。
智能体开发者面临的技能差距与“乐高积木”工具生态
吴恩达坦言,智能体开发者面临的技能挑战尚无明确的“好答案”,反映出该领域的快速发展和最佳实践的未完全形成。他强调了以下几个核心技能:
吴恩达用“乐高积木”比喻各种AI工具(如RAG、聊天机器人框架、内存系统、评估工具、护栏机制等),强调工具的多样性对于开发者至关重要。掌握越多样化的工具,就能越快地组装出有用的系统。但他提醒,由于大语言模型上下文长度的增加,一年半前的许多RAG最佳实践可能已不再适用,开发者需要持续更新知识库以适应快速变化的技术。
被低估的关键技术:评估系统与语音应用
当被问及哪些技术被低估时,吴恩达再次提到了评估系统,尽管这是一个热门话题,但实际执行却严重不足。他提出了截然不同的评估构建哲学:“我把评估系统看作是我要快速组装的东西,大概20分钟内完成,而且质量不会太好。”他的做法是:当遇到特定的性能问题时,针对这个特定问题快速编写简单评估,可能只有5个输入示例,用简单的LLM评判者检查特定问题,然后增量式改进。
另一个被低估的领域是语音技术栈。吴恩达观察到,大型企业对语音应用表现出极大兴趣,但开发者社区的关注度却相对较低。语音交互的心理学优势是关键:文本输入框对许多用户来说是令人生畏的,且存在“退格键问题”,导致用户回应较慢。相比之下,语音交互具有时间不可逆性,用户更容易表达想法,从而降低了使用摩擦。然而,语音应用面临独特的技术挑战,最关键的是延迟要求:“如果有人说了什么,你真的希望在一秒内回应,理想情况下少于500毫秒。”吴恩达分享了构建虚拟形象时开发的“预回应”技术来掩盖延迟的成功经验。
MCP协议现状与多智能体系统的局限性
吴恩达和Harrison还深入分析了备受关注的MCP(模型上下文协议)。吴恩达透露,他们与Anthropic联合发布了MCP短期课程,旨在解决“网上很多关于MCP的内容相当令人困惑”的问题。MCP试图通过标准化接口来解决数据集成的复杂性,其核心理念是:“当你有N个模型和M个数据源时,这不应该是N乘以M的工作量,应该是N加M。”
然而,吴恩达也坦诚指出了MCP目前面临的挑战:“感觉有点像狂野西部,你在网上找到的很多MCP服务器都不工作。”认证系统不稳定,协议本身仍处于早期阶段,需要更分层的发现机制来管理复杂性。
对于多智能体系统,吴恩达的评估更加务实:“大多数人,包括我,我们甚至很难让我们的代码正常工作。让我的智能体与其他人的智能体协作,感觉像是需要两个奇迹的要求。”他区分了两种场景:同一团队内的多智能体系统通常可行,但跨团队的智能体协作仍然过于早期,比MCP更加早期。
“Vibe Coding”的误解与AI时代编程的本质
吴恩达对“vibe coding”这个术语表达了强烈不满,认为其误导了人们对AI辅助编程本质的理解。“不幸的是,它被称为vibe coding,因为这误导了很多人认为只需要凭感觉——接受这个,拒绝那个,”他解释道。他强调,这仍是一项深度智力活动,甚至会让人筋疲力尽。
更重要的是,吴恩达强烈反对一些人建议不要学习编程的观点,认为这是“一些最糟糕的职业建议”。他预测,AI编程辅助将导致更多人学习编程:“未来最重要的技能之一是能够准确告诉计算机你想要什么,让它为你执行。”理解计算机工作原理的价值在AI时代不仅没有降低,反而更加重要。他以自身为例,通过AI辅助编程,现在能编写更多自己不熟悉的JavaScript和TypeScript代码。
AI创业的核心成功要素:速度与深度技术知识
基于AI Fund多年的经验,吴恩达总结了AI创业的两个核心成功预测因子:
基于这两个要素,AI Fund特别偏好与深度技术人员合作,因为他们有良好的直觉,能快速判断技术路径可行性,避免在错误方向上浪费时间,从而实现快两倍的速度优势。吴恩达最后平衡地表示:“很多商业方面的知识非常重要,但通常更容易搞清楚。”
吴恩达的见解为当前狂热的AI智能体发展注入了一剂清醒剂,提醒我们回归技术本质,关注实际问题解决,并在快速变化的技术浪潮中,持续提升自身的深度技术能力。