aitrendtrackers@rengongzhineng.io, Author at AI TrendTrackers

Neural Magic 发布 LLM Compressor：提升大模型推理效率的新工具

Posted on November 25, 2024November 25, 2024 by aitrendtrackers@rengongzhineng.io

2024年11月24日，Neural Magic 推出了最新工具 LLM Compressor，这是一款专为大型语言模型（LLM）设计的优化工具库。通过先进的模型压缩技术，它能显著提升推理速度，旨在为深度学习社区提供高性能的开源解决方案，尤其适配 vLLM 框架。 LLM Compressor 解决了此前模型压缩工具分散的问题。用户过去需要分别使用 AutoGPTQ、AutoAWQ 或 AutoFP8 等多个独立库来完成不同压缩算法的任务，这让应用过程变得复杂。而 LLM Compressor 将这些分散工具整合为一个库，支持应用最先进的压缩算法，如 GPTQ、SmoothQuant 和 SparseGPT。这些算法不仅降低了推理延迟，还能在高精度要求的生产环境中维持模型的性能。这款工具的一大技术突破在于对激活和权重量化的全面支持，特别是在 INT8 和 FP8 张量核心上的优化。通过量化权重和激活，LLM Compressor 能有效利用 NVIDIA 新一代 GPU（如 Ada Lovelace 和 Hopper 架构）的高性能计算单元，从而缓解计算瓶颈。在实际测试中，模型 Llama 3.1 70B 使用 LLM Compressor 后，仅用两块 GPU 就达到了未压缩模型在四块 GPU 上的接近性能，大幅提升了推理效率。除此之外，LLM Compressor 支持结构化稀疏性，例如通过 SparseGPT 实现的 2:4…

OpenAI 投资“有道德”的人工智能：探索AI道德判断的可能性

Posted on November 25, 2024November 25, 2024 by aitrendtrackers@rengongzhineng.io

OpenAI宣布为一项旨在研究和开发具有道德判断能力的人工智能项目提供100万美元资助。这笔资金将分三年拨付，由北卡罗来纳大学和杜克大学的两位伦理学教授沃尔特·辛诺特-阿姆斯特朗（Walter Sinnott-Armstrong）和雅娜·博格（Jana Borg）领导的团队负责实施。这一项目名为“研究AI道德”（Research AI Morality）。 AI可以成为道德指南针？辛诺特-阿姆斯特朗教授和博格教授的研究显示，AI有潜力成为“道德GPS”，帮助人们做出更符合道德的决策。例如，他们曾开发出一款算法，用于帮助医生优先判断哪些患者应该先接受肾移植。这种算法的设计目标是通过公平和道德的框架优化医疗资源分配。 AI做道德判断的挑战尽管这一愿景令人兴奋，但为AI赋予道德判断能力的道路并不平坦。伦理和道德不仅是高度主观的，因文化、社会和个人背景而异，而且AI本身缺乏人类的情感与推理能力，常常无法理解复杂的道德情境。类似的尝试早在2021年就出现过。当时，艾伦人工智能研究所（The Allen Institute for AI）推出了一款名为“Ask Delphi”的AI聊天机器人，用于回答伦理问题。虽然Delphi能处理一些简单的黑白分明的道德问题（例如“作弊是否正确”），但其表现很快暴露出局限性。在面对更复杂的情境时，它生成了偏见甚至不恰当的回答。原因在于，它依赖互联网数据训练，对道德问题的回答基于模式匹配，而非真正的逻辑推理或情感共鸣。 OpenAI的方向这次研究的重点在于开发一种更高级的AI模型，能够理解复杂的伦理学理论并作出更为全面的道德判断。项目负责人希望通过多学科的研究方法，构建一个不仅依赖数据模式的算法，还能结合伦理学和哲学原则，成为“更有智慧”的道德判断工具。展望与意义虽然AI在道德领域的研究仍处于早期阶段，但这一方向可能对多个领域产生深远影响。从医疗决策到社会政策设计，再到日常生活中的选择，能够理解并辅助道德判断的AI或将成为新一代技术革命的重要一环。然而，研究团队也面临着不可忽视的难题——如何确保AI模型的道德判断不受训练数据中的偏见影响，同时能够平衡多元文化背景下的道德多样性。这不仅是技术问题，更是一个哲学命题。小结AI能否真的成为人类的“道德指南针”，还需时间验证。但OpenAI的这一投资表明，科技公司正在认真探索如何将技术与伦理结合，为未来社会提供更智能、更负责任的解决方案。

可扩展的穿戴设备基础模型

Posted on November 24, 2024November 24, 2024 by aitrendtrackers@rengongzhineng.io

受生成建模实证成功的启发，研究团队发现，通过从非结构化和噪声数据中学习，超大规模神经网络能够提取出强大的数据表示。在本文中，他们探索了这种方法在消费健康数据领域的扩展潜力，特别是如何通过更高效的样本学习推动运动和活动识别等任务的实现。穿戴设备：从海量数据到有意义的洞察如今，能够测量生理与行为信号的穿戴设备已成为日常生活的一部分。这些设备不仅能促进健康行为，还能用于疾病检测以及改善治疗方案的设计与实施。然而，这些设备生成的数据连续、纵向且多模态，其原始信号（如皮肤电活动或加速度计数据）往往难以解读。因此，各种算法应运而生，将这些原始数据转化为更有意义的表示形式。传统上，这类算法依赖于监督学习模型（如分类模型），旨在检测特定事件或活动（例如识别用户是否正在跑步）。然而，这种方法存在三大限制：自监督学习（SSL）的突破 SSL通过通用的预训练任务（如拼图重排或图像补全）生成多用途的数据表示，无需依赖标签，能够利用更大比例的可用数据。这种方法为处理穿戴设备生成的大量无标注数据提供了新思路。结合生成模型在理论与实践中的扩展规律，研究团队提出一个关键问题：扩展定律是否适用于穿戴设备传感器数据？与文本、视频或音频不同，传感器数据具有独特的特点。理解这种扩展规律的表现，不仅能优化模型设计，还能提升任务和数据集之间的泛化能力。 LSM：可扩展的穿戴设备基础模型在研究中，团队分析了扩展定律是否适用于规模化的多模态传感器数据。他们使用目前最大规模的穿戴设备数据集，包含来自16.5万用户、超过4000万小时的去标识化多模态传感器数据。通过这一数据集，他们训练了一个基础模型，称为大传感器模型（LSM），并在数据、计算和模型参数等维度上展示了显著的性能提升，相较传统方法，性能最高提升了38%。数据采样与模型训练参与者佩戴Fitbit Sense 2或Google Pixel Watch 2设备，采集时间覆盖2023年1月至2024年7月。每位参与者提供自报告的性别、年龄、体重和居住州，数据均已去标识化。为了增加数据多样性，研究团队从每位参与者中随机抽取10个5小时窗口的数据。训练模型时采用了一种“遮蔽”方法，即随机隐藏部分传感器数据，让模型学习如何重建这些缺失部分。这种方法帮助模型识别数据中的潜在模式，不仅适用于下游分类任务，还能实现数据补全（插值）和预测未来信号（外推）的能力。扩展定律验证与任务应用研究团队进行了多维度扩展实验，重点分析了计算能力、数据量和模型参数规模对模型性能的影响。结果表明：此外，研究发现，与增加参与者人数相比，增加每位参与者的数据时长对模型性能的影响更大。这可能是因为更丰富的个人活动样本能帮助模型捕获更复杂的模式。然而，为了实现模型的最大化泛化能力，同时扩展参与者数量和数据时长是理想选择。未来方向研究成果证明了大规模数据、模型和计算的扩展策略能够显著提升穿戴设备传感器模型的能力。未来，团队计划探索多样化数据集和定制化预训练技术，以进一步应对穿戴设备数据的独特挑战，为个人健康技术的发展贡献力量。

KAN：带来全新可能的人工神经网络结构

Posted on November 24, 2024November 24, 2024 by aitrendtrackers@rengongzhineng.io

人工神经元是深度神经网络的核心构件，几十年来几乎没有发生太大变化。这些网络赋予了现代人工智能强大的能力，却也让其变得难以理解。传统人工神经元的运作原理看似简单：它们接收大量输入，将其加总后，通过神经元内部的数学运算生成输出。这些神经元的组合构成了神经网络，但这些组合的复杂性常让人难以解读其运行机制。然而，科学家们最近提出了一种全新的神经元组合方式，显著简化了神经元内部的运算，同时将部分复杂性移至神经元外部。在这种设计中，新的神经元只需对输入进行简单求和并生成输出，无需额外的隐藏运算。这种新型网络被称为 Kolmogorov-Arnold Networks（KANs），以启发该设计的俄罗斯数学家命名。https://arxiv.org/abs/2404.19756 KAN：带来全新可能的网络结构麻省理工学院（MIT）领导的一项研究对KAN进行深入分析，发现这种新架构有助于更清晰地理解神经网络的决策过程，不仅能验证其输出的合理性，还能检测潜在的偏差。初步研究表明，随着KAN规模的增大，其精度提升速度甚至比传统神经网络更快。纽约大学机器学习领域的学者Andrew Wilson对此评价道：“这项研究非常有意思，人们正在重新思考神经网络的基本设计，这是一个可喜的方向。” KAN的基本概念实际上早在上世纪90年代就被提出，当时研究者已经开始构建一些简单版本。然而，MIT团队进一步扩展了这一想法，展示了如何构建和训练更大规模的KAN，并通过实验验证了它们的表现，同时分析了这些网络的解决问题能力如何被人类解读。正如团队成员、MIT博士生刘子明所说：“我们让这一理念焕发新生。希望通过这种可解释性，不再让神经网络像个黑箱。” 尽管这项研究仍处于初期阶段，但已引发广泛关注。目前，GitHub上已出现了多个项目展示KAN在图像识别和流体动力学等领域的应用潜力。重塑神经网络：从MLP到KAN 目前几乎所有类型的人工智能，包括大语言模型和图像识别系统，都基于一种名为多层感知机（MLP）的子网络。在MLP中，人工神经元通过层层密集连接，每个神经元接收来自前一层神经元的输入，并通过一种称为“激活函数”的固定数学运算生成输出。这种设计虽然强大，但其内部机制复杂得几乎无法反向解析，尤其是在处理图像识别等复杂任务时。即便是面对简单的合成数据集，刘子明团队尝试逆向解析MLP时也感到困难。他直言：“如果连合成数据都难以解析，那处理真实数据集就完全没希望了。我们想要改变这种架构。” KAN的突破在于移除了MLP中固定的激活函数，取而代之的是一个更简单的、可学习的函数。这些函数位于神经元外部，每次只处理一个输入值，并将其转换为另一个输出值。在训练过程中，KAN无需像MLP那样学习复杂的权重，而是仅需学习如何表示这些简单函数。研究团队在预印本网站ArXiv上发表的论文中指出，这种设计使得KAN整体的数学形式更易于解读，有望理解其学习到的具体功能。 KAN的未来与挑战虽然KAN在合成数据上的解释性成果令人鼓舞，但团队尚未在复杂的真实问题（如图像识别）上测试其能力。刘子明表示：“我们正在逐步推进，但解释性本身就是一项极具挑战的任务。” 研究还表明，在科学相关任务（例如物理函数近似）中，随着KAN规模的增大，其任务准确度提升速度显著快于MLP。不过，KAN的训练耗时和计算成本也高于MLP。中国西交利物浦大学的张笛认为，这一限制或可通过更高效的算法和硬件加速器来缓解。尽管面临挑战，KAN的出现为人工智能网络的设计与理解开辟了全新方向，也许有朝一日，神经网络的“黑箱”问题将成为历史。

斯坦福与 DeepMind 的研究突破：AI 模拟个体

Posted on November 22, 2024November 22, 2024 by aitrendtrackers@rengongzhineng.io

坐下来与一位人工智能（AI）模型进行一场两个小时的访谈：一把友善的声音带领你回顾童年、人生关键记忆、职业经历，甚至你的移民政策观念。不久之后，一个虚拟的“你”将以惊人的准确度呈现你的价值观和偏好。听起来像科幻？如今，这已成为现实。斯坦福与 DeepMind 的研究突破：AI 模拟个体近日，一支由斯坦福大学与 Google DeepMind 的研究团队发表了一篇论文（尚未经过同行评审），展示了这一技术的可能性。这项研究由斯坦福计算机科学博士生 Joon Sung Park 领导，团队邀请了1000名参与者，涵盖不同年龄、性别、种族、地区、教育背景和政治理念。参与者接受了两小时访谈，并获得最高100美元的报酬。研究团队利用这些访谈数据，创建了每位参与者的“模拟代理”（simulation agents）。这些虚拟代理随后与人类主体完成了一系列性格测试、社交调查和逻辑游戏，结果显示，虚拟代理的表现与人类主体之间有85%的相似度。 Park 表示：“如果有一群‘迷你版的你’能在世界中活动，并做出和你一致的决策，那可能就是未来的图景。” 模拟代理的潜力：社会科学与技术创新的结合论文中的“模拟代理”被设想为社会科学研究的一种革命性工具。传统研究中，涉及大规模人群的实验往往耗资巨大或难以实施，而模拟代理为研究复杂社会现象（如社交媒体如何抑制错误信息传播或造成交通拥堵的行为模式）提供了一种经济且高效的替代方案。这类代理与当前热门的“工具型代理”（tool-based agents）有所不同。后者专注于完成具体任务，例如录入数据、检索信息，甚至预订行程并安排会议。Salesforce、Anthropic 和 OpenAI 等公司近年来都在这一领域投入巨大。然而，Park 团队的研究表明，模拟代理的成果或将推动更强大的 AI 代理技术的发展。研究启示与隐忧：从机遇到挑战 MIT Sloan 管理学院信息技术副教授 John Horton 对此评价道：“这篇论文展示了如何结合人类生成的个性化数据与 AI 模型的程序化模拟能力，创造全新的研究可能性。” 然而，这项技术也带来了深远的伦理问题。与生成图像技术带来的“深度伪造”类似，代理生成技术可能被用于未经授权地模拟某人，甚至“代表”他们发表不实声明。此外，研究中用于评估 AI 模拟效果的方法也较为基础，例如通过常见的社会调查（General Social Survey）和五大性格特质（Big Five Personality Traits）测试评估代理与主体的相似性。尽管这些方法能衡量宏观趋势，但它们无法完全捕捉人类的复杂与独特性。研究还发现，在一些行为测试中，AI 模拟代理的表现显著逊色。例如，在“独裁者游戏”（dictator game）中，AI 的决策无法准确反映人类对公平等价值的考量。高效“数字分身”：访谈的重要性为了让 AI 更好地模拟个体，研究团队选择了访谈的形式作为数据采集方式。Park 表示，与传统问卷相比，访谈能高效捕捉个体独特的经历与细节。例如，一位刚刚战胜癌症的受访者会因此展现出独特的行为模式，这类信息很难通过常规问卷获取。 Park 的这一观点源自他自己的经验。他在2023年的一篇论文引发关注后，曾接受多次播客访谈。他发现，每次长达两小时的访谈后，听众对他的了解显著加深。“两小时的访谈非常有力量，”他说，“它能揭示很多微妙而重要的东西。” 相比之下，一些公司则尝试通过客户的邮件或数据来构建“数字分身”。例如，AI…

Haystack 的开源开发 LLM 应用设计框架

Posted on November 22, 2024November 22, 2024 by aitrendtrackers@rengongzhineng.io

在人工智能的世界中，开发者有许多工具和技术可以用来创建基于大型语言模型（LLM）的应用程序。而最近，一款名为 Haystack 的开源框架正在崭露头角，成为构建 AI 应用的强大工具。本文将详细解读 Haystack 的独特优势，并探讨其在 LLM 生态系统中的竞争力。最后，我们将通过一个 RAG（检索增强生成）案例来展示其实际应用。什么是 Haystack？ Haystack 是一款专为开发 LLM 应用设计的工具包，它特别适用于处理大量文本或文档的场景。Haystack 的特点是代码量少、易于上手，可以快速搭建生产级别的 LLM 应用。正如其名字暗示，Haystack 就像一组可以自由组合的积木，用于创建各种类型的 AI 系统。以下是一些 Haystack 可实现的功能：在 Python 3.10 环境中，只需一行代码即可安装： Haystack 的核心工作原理 Haystack 的运作基于两个核心概念：通过灵活组合不同的组件，开发者可以创建能够执行复杂任务的 AI 系统。 Haystack 的主要特性 1. 灵活性 Haystack 支持多种 AI 模型（如 OpenAI、HuggingFace）和数据存储系统（如 ChromaDB、Pinecone，甚至是 Neo4j）。 2. 易用性无需深入了解 AI 复杂细节，即可使用 Haystack 构建应用。 3….

美国司法部（DOJ）提交了Google最终判决建议

Posted on November 22, 2024November 22, 2024 by aitrendtrackers@rengongzhineng.io

昨日晚间，美国司法部（DOJ）提交了最终判决建议，正式提出一系列广泛措施，旨在终结谷歌对搜索市场的垄断地位。毫不意外，谷歌对司法部的方案极其不满。该提案要求谷歌出售其 Chrome 浏览器，并保留进一步措施的选项——若行为纠正未能有效提升市场竞争，还可能强制谷歌剥离 Android 业务。除此之外，谷歌被禁止与其他浏览器和设备制造商签署独家默认设置协议，无法再开发新浏览器，还需资助公众教育项目，教导用户如何切换搜索引擎，甚至可能支付用户进行转换。此外，谷歌可能会被限制利用其数据规模优势强化 AI 产品。对此，谷歌首席法务官 Kent Walker 在博文中猛烈抨击该计划，称其为“激进的干预主义议程”。他指责该提案“远远超出了”今年8月美国地方法官 Amit Mehta 针对谷歌垄断行为的裁定范围。司法部的计划中，哪一部分最让谷歌抓狂？Walker 表示，出售 Chrome 不仅“危及数百万美国人的安全与隐私”，还会“削弱”全球最受欢迎的浏览器的质量。他还认为，禁止默认设置协议将损害像 Mozilla 这样的企业，后者依赖谷歌的收入分成来支持 Firefox 等产品的发展。（对此，Mozilla 曾多次拒绝评论谷歌的这一论调。）另外，他指出，限制谷歌 AI 业务的发展，是在“阻止谷歌在可能是最重要的创新领域发挥领导作用”。 Walker 还批评司法部要求谷歌资助技术委员会，以确保其无法规避修正措施，称美国政府的这一举措是“强制性微管理”。但归根结底，Walker 的博文大多是在重申谷歌在垄断案庭审中失败的论点，表明谷歌根本不同意 Mehta 的裁定。即便是一些专家认为相对温和的措施，例如要求设备提供搜索引擎选择界面，而非预装谷歌搜索作为默认选项，也被 Walker 描述为“离谱”。 “司法部的提案甚至要求用户在使用 Pixel 手机访问谷歌搜索前，必须经过两个不同的选择界面，”Walker 写道，“而且这些界面的设计还需要技术委员会批准。这只是冰山一角，真希望这是在开玩笑。” 谷歌在未来几个月将有足够时间对司法部的提案提出抗辩。司法部计划于 2025 年 3 月 7 日提交最终修订版本。此外，在审理补救阶段的证据发现过程中，司法部可能随时调整其方案，随后谷歌可提出上诉。特朗普会否阻止 Chrome 被出售？有可能。候任总统唐纳德·特朗普曾在竞选期间表示，可以通过“更公平”的方式来终结谷歌垄断，而无需拆分其业务。他或许会对此进行干预。美国经济自由项目（American Economic Liberties Project）的反垄断律师 Lee Hepner…

苹果正在秘密研发全新一代 Siri，代号为“LLM Siri”

Posted on November 22, 2024November 22, 2024 by aitrendtrackers@rengongzhineng.io

苹果总部传出的内幕消息透露，苹果正在秘密研发全新一代 Siri，代号为“LLM Siri”。据说，这款新产品经过13年的酝酿，目标直指 OpenAI 的 ChatGPT 和谷歌的 Gemini Live，誓要重新定义语音助手。这款全新 Siri 将搭载大型语言模型（LLM），支持更自然流畅的双向交流，还能更快、更高效地理解并完成复杂任务。不仅如此，用户期待已久的“高级语音”功能也在其中，可能会彻底颠覆现有界面。与目前的 ChatGPT 高级语音模式相似，升级版 Siri 不仅可以对话，还能更深入地获取个人信息，操控第三方应用。更有趣的是，得益于苹果智能（Apple Intelligence）的强大支持，新 Siri 还能进行文本概括和创作，让工作效率大幅提升。据内部消息透露，最早可能在明年 iOS 19 发布时，一小部分忠实果粉能率先体验这款语音助手。而对于其他用户，这款产品要等到2026年春天才能普及，离现在还有一年半的时间！回顾今年6月，当苹果首次提到“Apple Intelligence”开启语音助手的全新时代时，这些传闻就已开始发酵。随后，苹果软件副总裁 Craig Federighi 也暗示过，新版 Siri 的表现将超越 ChatGPT，而招聘公告中提到的“语音助手技术”更是直接戳中了外界的好奇心。不过问题来了，在谷歌和 OpenAI 的相关产品早已上线的情况下，苹果让用户多等一年，这款“新 Siri”究竟能否掀起革命性浪潮？毕竟，在 AI 领域，时间从来不等人啊！

四十多岁是创业的最佳时期？

Posted on November 21, 2024November 21, 2024 by aitrendtrackers@rengongzhineng.io

许多人认为，四十多岁是创业的最佳时期。这个阶段，既有丰富的经验，财务状况相对稳定，又渴望迎接新的挑战。听起来确实很有道理。四年前，有人带着这样的信念，全身心投入，开始打造自己的梦想事业。结果证明，这份努力并非徒劳，业务成功实现盈利，年收入达到六位数。然而，仅仅三个月前，这个事业的主人却选择了放手。回过头来看，如果能重新来过，也许最重要的建议就是：别把所有的一切都押上。首先是身体上的挑战。无可否认，年龄增长带来了改变。年轻时，熬夜是家常便饭，即使只睡四个小时，也能咬牙完成任务。但现在，少于六个小时的睡眠就会让整个人无精打采。有时候甚至需要小睡恢复体力，哪怕只是短短的30分钟车程，也能让人感到疲惫不堪。这让人不禁感叹，那些长途卡车司机是如何坚持下来的。其次是心智的压力。科学研究表明，45岁之后，大多数人的学习和思考能力开始逐渐下降。而这一点在创业初期尤为明显。当时，很多新事物需要学习，比如如何利用社交媒体引流、搭建自动化系统、管理表格，甚至计算损益。这些对一个没有相关背景的人来说都是全新的领域，学习起来需要投入大量时间和精力。虽然随着年龄增长，思维敏捷度有所下降，但通过多年的经验积累和勤奋努力，依然能够迎难而上。尽管效率不如年轻人，但坚持的毅力弥补了很多不足。财务风险是创业过程中不可忽视的难题。即便选择了低成本的模式，比如手工制造，依然面临培训、系统建设、原材料采购等高额支出。随着业务规模扩大，开销也随之增加。没有稳定的收入来源时，很多人只能动用存款来支撑业务，同时还要储备资金应对突发状况。比如货运延误导致销售中断、额外的关税挤压利润空间、快递遗失包裹需要重新生产等问题。更糟糕的是，有些人因为货物质量问题直接损失了数万美元。面对这种财务上的不确定性，很多人被迫压缩开支。度假成为奢侈，日常消费也小心翼翼，甚至开始担忧未来是否能存够养老金。与其冒险，不如更理性地规划自己的财务状况。此外，还需要为自己留一条退路。在二三十岁时，创业失败后可以轻松重返职场。但到了四十多岁，这样的灵活性就大打折扣。一方面，职业空窗期可能让求职者显得“脱节”；另一方面，即使愿意从基层做起，也可能因为“过度资历”而被拒绝。许多数据显示，大部分人的收入高峰期在45岁到54岁之间。一旦错过这个关键阶段，职业发展轨迹基本定型。创业并非没有价值。它教会了人们普通工作无法传授的生存技能，磨炼了心态和行动力，让人变得更加成熟。然而，如果有人告诉你“40多岁是创业的最佳时间”，请务必谨慎思考，尤其是不要把所有的积蓄押在一个不确定的项目上。这是一次深刻的教训，特别是在财务层面。幸运的是，有人最终回归全职工作状态，重新找到平衡，并对退休规划充满希望。未来是否会再次创业？可能会，但下次一定会更加小心，不会轻易孤注一掷。

迈向“代理系统”

Posted on November 21, 2024November 21, 2024 by aitrendtrackers@rengongzhineng.io

两年前，ChatGPT 的推出堪称人工智能研究的分水岭，不仅重新定义了面向消费者的 AI，也激发了各类企业探索 GPT 或类似模型如何在各自的业务场景中发挥作用。转眼到了 2024 年，如今语言模型生态系统蓬勃发展，无论是敏捷的初创企业还是大型企业，都在结合诸如检索增强生成（RAG）等方法，用于内部协作助手和知识搜索系统。 AI 的应用场景呈指数级增长，与之匹配的企业级生成式 AI 项目投资也在迅速增加。毕竟，这项技术每年预计为全球经济贡献 2.6 至 4.4 万亿美元。不过，当前的生成式 AI 还只是第一波浪潮。下一阶段：迈向“代理系统” 最近几个月，许多初创公司和大企业（如 Salesforce 和 SAP）开始迈向“代理系统”的新阶段。这些代理不仅能够基于内部知识（通过 RAG）回答关键业务问题，还能作为自主的任务导向型实体，根据指令或情境决策、制定详细的行动计划，并在数字环境中灵活执行任务，比如使用在线工具、API 等。这种转变标志着 AI 从单纯的自动化向高度自主化发展的重大飞跃。企业可以轻松部署虚拟助手军团来处理各种任务，例如订票或跨数据库数据迁移，大幅节省时间。根据 Gartner 的预测，到 2028 年，企业软件应用中将有 33% 集成 AI 代理（目前不足 1%），而这些代理将自主做出约 15% 的日常业务决策。但问题来了：既然 AI 代理前景如此广阔，企业如何将其融入技术栈，同时保证高精准度？毕竟，没有企业愿意看到 AI 系统因无法理解业务细节而犯错。数据策略：AI 成功的核心对此，Google Cloud 数据分析副总裁 Gerrit Kazmaier 强调，关键在于构建完善的数据策略。他表示：“数据管道必须从‘存储和处理数据的系统’演进为‘创造知识和理解的系统’。这意味着要从单纯收集数据转向精心策划、丰富和组织数据，以支持大型语言模型（LLM）成为值得信赖的智能业务伙伴。” 为 AI 代理构建数据管道过去，企业主要依赖结构化数据（表格形式）进行分析决策，但这只占了实际数据的…

Subscribe 订阅