两年前,ChatGPT 的推出堪称人工智能研究的分水岭,不仅重新定义了面向消费者的 AI,也激发了各类企业探索 GPT 或类似模型如何在各自的业务场景中发挥作用。转眼到了 2024 年,如今语言模型生态系统蓬勃发展,无论是敏捷的初创企业还是大型企业,都在结合诸如检索增强生成(RAG)等方法,用于内部协作助手和知识搜索系统。
AI 的应用场景呈指数级增长,与之匹配的企业级生成式 AI 项目投资也在迅速增加。毕竟,这项技术每年预计为全球经济贡献 2.6 至 4.4 万亿美元。不过,当前的生成式 AI 还只是第一波浪潮。
下一阶段:迈向“代理系统”
最近几个月,许多初创公司和大企业(如 Salesforce 和 SAP)开始迈向“代理系统”的新阶段。这些代理不仅能够基于内部知识(通过 RAG)回答关键业务问题,还能作为自主的任务导向型实体,根据指令或情境决策、制定详细的行动计划,并在数字环境中灵活执行任务,比如使用在线工具、API 等。
这种转变标志着 AI 从单纯的自动化向高度自主化发展的重大飞跃。企业可以轻松部署虚拟助手军团来处理各种任务,例如订票或跨数据库数据迁移,大幅节省时间。根据 Gartner 的预测,到 2028 年,企业软件应用中将有 33% 集成 AI 代理(目前不足 1%),而这些代理将自主做出约 15% 的日常业务决策。
但问题来了:既然 AI 代理前景如此广阔,企业如何将其融入技术栈,同时保证高精准度?毕竟,没有企业愿意看到 AI 系统因无法理解业务细节而犯错。
数据策略:AI 成功的核心
对此,Google Cloud 数据分析副总裁 Gerrit Kazmaier 强调,关键在于构建完善的数据策略。他表示:“数据管道必须从‘存储和处理数据的系统’演进为‘创造知识和理解的系统’。这意味着要从单纯收集数据转向精心策划、丰富和组织数据,以支持大型语言模型(LLM)成为值得信赖的智能业务伙伴。”
为 AI 代理构建数据管道
过去,企业主要依赖结构化数据(表格形式)进行分析决策,但这只占了实际数据的 10%。剩下的 90% 数据存储在各种孤岛中,以 PDF、视频等非结构化形式存在,被称为“暗数据”。AI 的兴起使这些未开发的数据瞬间成为宝贵资源,为生成式 AI 应用(如聊天机器人和搜索系统)提供动力。
如今,大多数企业都配备了至少一个数据平台,整合了结构化和非结构化数据,用于支持下游应用。LLM 驱动的 AI 代理的出现,则为这一生态系统增添了新的应用场景。
企业无需从头搭建数据栈,只需围绕关键要素进行调整,以确保开发的代理理解业务行业的细微差别、数据集之间的复杂关系以及操作中的语义语言。
Kazmaier 建议,数据、AI 模型和它们提供的价值(代理)应被视为同一价值链的一部分,需要整体构建。他指出:“实现这一目标的理想方式是采用统一平台,将文本、图像、音频和视频等所有数据集中到一个地方,并利用动态知识图谱创建语义层,捕捉相关的业务指标和逻辑。”
语义层:AI 智能化的关键
一个强大的语义层对于构建智能 AI 代理至关重要。Kazmaier 将其比作字典和词典的结合,帮助代理理解数据背后的含义和关系。他解释道:“将语义层直接嵌入数据云,例如使用 LookML 和 BigQuery,这将彻底改变游戏规则。”
虽然企业可以手动生成业务语义层,但 Kazmaier 指出,AI 能够显著加速这一过程。通过结合企业使用数据的方式和上下文信号,动态知识图谱可以形成一个实时演进的知识网络,为新一代 AI 驱动的应用提供动力。
超越语义:从观察中学习
然而,训练代理掌握语义层只是开始。AI 代理还需了解数字环境中的实际运作方式,包括那些未被文档化或记录的数据。Hercules AI 联合创始人兼 CTO Gevorg Karapetyan 在 WCIT 2024 上表示,他们通过上下文微调(结合客户数据和合成数据),以及动态条件下的强化学习,让代理适应真实世界的复杂场景。
他说:“代理在历史数据的基础上进一步优化,以便应对动态条件,而不是理想化的环境。”
数据质量、治理与安全的重要性
构建强大的 AI 系统不意味着忽视传统最佳实践。平台必须支持实时数据处理,确保数据质量,并实施严格的访问控制和治理政策,以保证 AI 系统的合规性和可靠性。
Databricks AI 副总裁 Naveen Rao 强调:“数据治理、访问控制和质量在 AI 时代更加重要。任何 AI 系统都必须确保只有正确的人能访问正确的数据和功能,否则将带来灾难性的后果。”
Google Cloud 则通过智能数据代理简化数据管道中的繁琐工作,确保数据的一致性和高质量,为生成式 AI 的潜力赋能。
企业创新的下一波浪潮
AI 代理的崛起正在重塑企业的自动化与智能化运营模式。然而,其成功的关键仍然在于一个精心架构的数据栈。只有优先整合语义层,并关注数据质量、可访问性、治理和安全的组织,才能充分释放 AI 代理的潜力,引领企业创新的下一波浪潮。
预计到 2030 年,AI 代理市场将增长近 45%,从 2024 年的 51 亿美元激增至 471 亿美元。这场变革,才刚刚开始。