受生成建模实证成功的启发,研究团队发现,通过从非结构化和噪声数据中学习,超大规模神经网络能够提取出强大的数据表示。在本文中,他们探索了这种方法在消费健康数据领域的扩展潜力,特别是如何通过更高效的样本学习推动运动和活动识别等任务的实现。 穿戴设备:从海量数据到有意义的洞察 如今,能够测量生理与行为信号的穿戴设备已成为日常生活的一部分。这些设备不仅能促进健康行为,还能用于疾病检测以及改善治疗方案的设计与实施。然而,这些设备生成的数据连续、纵向且多模态,其原始信号(如皮肤电活动或加速度计数据)往往难以解读。因此,各种算法应运而生,将这些原始数据转化为更有意义的表示形式。 传统上,这类算法依赖于监督学习模型(如分类模型),旨在检测特定事件或活动(例如识别用户是否正在跑步)。然而,这种方法存在三大限制: 自监督学习(SSL)的突破 SSL通过通用的预训练任务(如拼图重排或图像补全)生成多用途的数据表示,无需依赖标签,能够利用更大比例的可用数据。这种方法为处理穿戴设备生成的大量无标注数据提供了新思路。 结合生成模型在理论与实践中的扩展规律,研究团队提出一个关键问题:扩展定律是否适用于穿戴设备传感器数据?与文本、视频或音频不同,传感器数据具有独特的特点。理解这种扩展规律的表现,不仅能优化模型设计,还能提升任务和数据集之间的泛化能力。 LSM:可扩展的穿戴设备基础模型 在研究中,团队分析了扩展定律是否适用于规模化的多模态传感器数据。他们使用目前最大规模的穿戴设备数据集,包含来自16.5万用户、超过4000万小时的去标识化多模态传感器数据。通过这一数据集,他们训练了一个基础模型,称为大传感器模型(LSM),并在数据、计算和模型参数等维度上展示了显著的性能提升,相较传统方法,性能最高提升了38%。 数据采样与模型训练 参与者佩戴Fitbit Sense 2或Google Pixel Watch 2设备,采集时间覆盖2023年1月至2024年7月。每位参与者提供自报告的性别、年龄、体重和居住州,数据均已去标识化。为了增加数据多样性,研究团队从每位参与者中随机抽取10个5小时窗口的数据。 训练模型时采用了一种“遮蔽”方法,即随机隐藏部分传感器数据,让模型学习如何重建这些缺失部分。这种方法帮助模型识别数据中的潜在模式,不仅适用于下游分类任务,还能实现数据补全(插值)和预测未来信号(外推)的能力。 扩展定律验证与任务应用 研究团队进行了多维度扩展实验,重点分析了计算能力、数据量和模型参数规模对模型性能的影响。结果表明: 此外,研究发现,与增加参与者人数相比,增加每位参与者的数据时长对模型性能的影响更大。这可能是因为更丰富的个人活动样本能帮助模型捕获更复杂的模式。然而,为了实现模型的最大化泛化能力,同时扩展参与者数量和数据时长是理想选择。 未来方向 研究成果证明了大规模数据、模型和计算的扩展策略能够显著提升穿戴设备传感器模型的能力。未来,团队计划探索多样化数据集和定制化预训练技术,以进一步应对穿戴设备数据的独特挑战,为个人健康技术的发展贡献力量。
Author: aitrendtrackers@rengongzhineng.io
KAN:带来全新可能的人工神经网络结构
人工神经元是深度神经网络的核心构件,几十年来几乎没有发生太大变化。这些网络赋予了现代人工智能强大的能力,却也让其变得难以理解。 传统人工神经元的运作原理看似简单:它们接收大量输入,将其加总后,通过神经元内部的数学运算生成输出。这些神经元的组合构成了神经网络,但这些组合的复杂性常让人难以解读其运行机制。 然而,科学家们最近提出了一种全新的神经元组合方式,显著简化了神经元内部的运算,同时将部分复杂性移至神经元外部。在这种设计中,新的神经元只需对输入进行简单求和并生成输出,无需额外的隐藏运算。这种新型网络被称为 Kolmogorov-Arnold Networks(KANs),以启发该设计的俄罗斯数学家命名。https://arxiv.org/abs/2404.19756 KAN:带来全新可能的网络结构 麻省理工学院(MIT)领导的一项研究对KAN进行深入分析,发现这种新架构有助于更清晰地理解神经网络的决策过程,不仅能验证其输出的合理性,还能检测潜在的偏差。初步研究表明,随着KAN规模的增大,其精度提升速度甚至比传统神经网络更快。 纽约大学机器学习领域的学者Andrew Wilson对此评价道:“这项研究非常有意思,人们正在重新思考神经网络的基本设计,这是一个可喜的方向。” KAN的基本概念实际上早在上世纪90年代就被提出,当时研究者已经开始构建一些简单版本。然而,MIT团队进一步扩展了这一想法,展示了如何构建和训练更大规模的KAN,并通过实验验证了它们的表现,同时分析了这些网络的解决问题能力如何被人类解读。正如团队成员、MIT博士生刘子明所说:“我们让这一理念焕发新生。希望通过这种可解释性,不再让神经网络像个黑箱。” 尽管这项研究仍处于初期阶段,但已引发广泛关注。目前,GitHub上已出现了多个项目展示KAN在图像识别和流体动力学等领域的应用潜力。 重塑神经网络:从MLP到KAN 目前几乎所有类型的人工智能,包括大语言模型和图像识别系统,都基于一种名为多层感知机(MLP)的子网络。在MLP中,人工神经元通过层层密集连接,每个神经元接收来自前一层神经元的输入,并通过一种称为“激活函数”的固定数学运算生成输出。这种设计虽然强大,但其内部机制复杂得几乎无法反向解析,尤其是在处理图像识别等复杂任务时。 即便是面对简单的合成数据集,刘子明团队尝试逆向解析MLP时也感到困难。他直言:“如果连合成数据都难以解析,那处理真实数据集就完全没希望了。我们想要改变这种架构。” KAN的突破在于移除了MLP中固定的激活函数,取而代之的是一个更简单的、可学习的函数。这些函数位于神经元外部,每次只处理一个输入值,并将其转换为另一个输出值。在训练过程中,KAN无需像MLP那样学习复杂的权重,而是仅需学习如何表示这些简单函数。研究团队在预印本网站ArXiv上发表的论文中指出,这种设计使得KAN整体的数学形式更易于解读,有望理解其学习到的具体功能。 KAN的未来与挑战 虽然KAN在合成数据上的解释性成果令人鼓舞,但团队尚未在复杂的真实问题(如图像识别)上测试其能力。刘子明表示:“我们正在逐步推进,但解释性本身就是一项极具挑战的任务。” 研究还表明,在科学相关任务(例如物理函数近似)中,随着KAN规模的增大,其任务准确度提升速度显著快于MLP。不过,KAN的训练耗时和计算成本也高于MLP。中国西交利物浦大学的张笛认为,这一限制或可通过更高效的算法和硬件加速器来缓解。 尽管面临挑战,KAN的出现为人工智能网络的设计与理解开辟了全新方向,也许有朝一日,神经网络的“黑箱”问题将成为历史。
斯坦福与 DeepMind 的研究突破:AI 模拟个体
坐下来与一位人工智能(AI)模型进行一场两个小时的访谈:一把友善的声音带领你回顾童年、人生关键记忆、职业经历,甚至你的移民政策观念。不久之后,一个虚拟的“你”将以惊人的准确度呈现你的价值观和偏好。听起来像科幻?如今,这已成为现实。 斯坦福与 DeepMind 的研究突破:AI 模拟个体 近日,一支由斯坦福大学与 Google DeepMind 的研究团队发表了一篇论文(尚未经过同行评审),展示了这一技术的可能性。这项研究由斯坦福计算机科学博士生 Joon Sung Park 领导,团队邀请了1000名参与者,涵盖不同年龄、性别、种族、地区、教育背景和政治理念。参与者接受了两小时访谈,并获得最高100美元的报酬。研究团队利用这些访谈数据,创建了每位参与者的“模拟代理”(simulation agents)。这些虚拟代理随后与人类主体完成了一系列性格测试、社交调查和逻辑游戏,结果显示,虚拟代理的表现与人类主体之间有85%的相似度。 Park 表示:“如果有一群‘迷你版的你’能在世界中活动,并做出和你一致的决策,那可能就是未来的图景。” 模拟代理的潜力:社会科学与技术创新的结合 论文中的“模拟代理”被设想为社会科学研究的一种革命性工具。传统研究中,涉及大规模人群的实验往往耗资巨大或难以实施,而模拟代理为研究复杂社会现象(如社交媒体如何抑制错误信息传播或造成交通拥堵的行为模式)提供了一种经济且高效的替代方案。 这类代理与当前热门的“工具型代理”(tool-based agents)有所不同。后者专注于完成具体任务,例如录入数据、检索信息,甚至预订行程并安排会议。Salesforce、Anthropic 和 OpenAI 等公司近年来都在这一领域投入巨大。然而,Park 团队的研究表明,模拟代理的成果或将推动更强大的 AI 代理技术的发展。 研究启示与隐忧:从机遇到挑战 MIT Sloan 管理学院信息技术副教授 John Horton 对此评价道:“这篇论文展示了如何结合人类生成的个性化数据与 AI 模型的程序化模拟能力,创造全新的研究可能性。” 然而,这项技术也带来了深远的伦理问题。与生成图像技术带来的“深度伪造”类似,代理生成技术可能被用于未经授权地模拟某人,甚至“代表”他们发表不实声明。此外,研究中用于评估 AI 模拟效果的方法也较为基础,例如通过常见的社会调查(General Social Survey)和五大性格特质(Big Five Personality Traits)测试评估代理与主体的相似性。尽管这些方法能衡量宏观趋势,但它们无法完全捕捉人类的复杂与独特性。 研究还发现,在一些行为测试中,AI 模拟代理的表现显著逊色。例如,在“独裁者游戏”(dictator game)中,AI 的决策无法准确反映人类对公平等价值的考量。 高效“数字分身”:访谈的重要性 为了让 AI 更好地模拟个体,研究团队选择了访谈的形式作为数据采集方式。Park 表示,与传统问卷相比,访谈能高效捕捉个体独特的经历与细节。例如,一位刚刚战胜癌症的受访者会因此展现出独特的行为模式,这类信息很难通过常规问卷获取。 Park 的这一观点源自他自己的经验。他在2023年的一篇论文引发关注后,曾接受多次播客访谈。他发现,每次长达两小时的访谈后,听众对他的了解显著加深。“两小时的访谈非常有力量,”他说,“它能揭示很多微妙而重要的东西。” 相比之下,一些公司则尝试通过客户的邮件或数据来构建“数字分身”。例如,AI…
Haystack 的开源开发 LLM 应用设计框架
在人工智能的世界中,开发者有许多工具和技术可以用来创建基于大型语言模型(LLM)的应用程序。而最近,一款名为 Haystack 的开源框架正在崭露头角,成为构建 AI 应用的强大工具。本文将详细解读 Haystack 的独特优势,并探讨其在 LLM 生态系统中的竞争力。最后,我们将通过一个 RAG(检索增强生成)案例来展示其实际应用。 什么是 Haystack? Haystack 是一款专为开发 LLM 应用设计的工具包,它特别适用于处理大量文本或文档的场景。Haystack 的特点是代码量少、易于上手,可以快速搭建生产级别的 LLM 应用。正如其名字暗示,Haystack 就像一组可以自由组合的积木,用于创建各种类型的 AI 系统。 以下是一些 Haystack 可实现的功能: 在 Python 3.10 环境中,只需一行代码即可安装: Haystack 的核心工作原理 Haystack 的运作基于两个核心概念: 通过灵活组合不同的组件,开发者可以创建能够执行复杂任务的 AI 系统。 Haystack 的主要特性 1. 灵活性 Haystack 支持多种 AI 模型(如 OpenAI、HuggingFace)和数据存储系统(如 ChromaDB、Pinecone,甚至是 Neo4j)。 2. 易用性 无需深入了解 AI 复杂细节,即可使用 Haystack 构建应用。 3….
美国司法部(DOJ)提交了Google最终判决建议
昨日晚间,美国司法部(DOJ)提交了最终判决建议,正式提出一系列广泛措施,旨在终结谷歌对搜索市场的垄断地位。 毫不意外,谷歌对司法部的方案极其不满。该提案要求谷歌出售其 Chrome 浏览器,并保留进一步措施的选项——若行为纠正未能有效提升市场竞争,还可能强制谷歌剥离 Android 业务。除此之外,谷歌被禁止与其他浏览器和设备制造商签署独家默认设置协议,无法再开发新浏览器,还需资助公众教育项目,教导用户如何切换搜索引擎,甚至可能支付用户进行转换。此外,谷歌可能会被限制利用其数据规模优势强化 AI 产品。 对此,谷歌首席法务官 Kent Walker 在博文中猛烈抨击该计划,称其为“激进的干预主义议程”。他指责该提案“远远超出了”今年8月美国地方法官 Amit Mehta 针对谷歌垄断行为的裁定范围。 司法部的计划中,哪一部分最让谷歌抓狂?Walker 表示,出售 Chrome 不仅“危及数百万美国人的安全与隐私”,还会“削弱”全球最受欢迎的浏览器的质量。他还认为,禁止默认设置协议将损害像 Mozilla 这样的企业,后者依赖谷歌的收入分成来支持 Firefox 等产品的发展。(对此,Mozilla 曾多次拒绝评论谷歌的这一论调。)另外,他指出,限制谷歌 AI 业务的发展,是在“阻止谷歌在可能是最重要的创新领域发挥领导作用”。 Walker 还批评司法部要求谷歌资助技术委员会,以确保其无法规避修正措施,称美国政府的这一举措是“强制性微管理”。 但归根结底,Walker 的博文大多是在重申谷歌在垄断案庭审中失败的论点,表明谷歌根本不同意 Mehta 的裁定。即便是一些专家认为相对温和的措施,例如要求设备提供搜索引擎选择界面,而非预装谷歌搜索作为默认选项,也被 Walker 描述为“离谱”。 “司法部的提案甚至要求用户在使用 Pixel 手机访问谷歌搜索前,必须经过两个不同的选择界面,”Walker 写道,“而且这些界面的设计还需要技术委员会批准。这只是冰山一角,真希望这是在开玩笑。” 谷歌在未来几个月将有足够时间对司法部的提案提出抗辩。司法部计划于 2025 年 3 月 7 日提交最终修订版本。此外,在审理补救阶段的证据发现过程中,司法部可能随时调整其方案,随后谷歌可提出上诉。 特朗普会否阻止 Chrome 被出售? 有可能。候任总统唐纳德·特朗普曾在竞选期间表示,可以通过“更公平”的方式来终结谷歌垄断,而无需拆分其业务。他或许会对此进行干预。 美国经济自由项目(American Economic Liberties Project)的反垄断律师 Lee Hepner…
苹果正在秘密研发全新一代 Siri,代号为“LLM Siri”
苹果总部传出的内幕消息透露,苹果正在秘密研发全新一代 Siri,代号为“LLM Siri”。据说,这款新产品经过13年的酝酿,目标直指 OpenAI 的 ChatGPT 和谷歌的 Gemini Live,誓要重新定义语音助手。 这款全新 Siri 将搭载大型语言模型(LLM),支持更自然流畅的双向交流,还能更快、更高效地理解并完成复杂任务。不仅如此,用户期待已久的“高级语音”功能也在其中,可能会彻底颠覆现有界面。 与目前的 ChatGPT 高级语音模式相似,升级版 Siri 不仅可以对话,还能更深入地获取个人信息,操控第三方应用。更有趣的是,得益于苹果智能(Apple Intelligence)的强大支持,新 Siri 还能进行文本概括和创作,让工作效率大幅提升。 据内部消息透露,最早可能在明年 iOS 19 发布时,一小部分忠实果粉能率先体验这款语音助手。而对于其他用户,这款产品要等到2026年春天才能普及,离现在还有一年半的时间! 回顾今年6月,当苹果首次提到“Apple Intelligence”开启语音助手的全新时代时,这些传闻就已开始发酵。随后,苹果软件副总裁 Craig Federighi 也暗示过,新版 Siri 的表现将超越 ChatGPT,而招聘公告中提到的“语音助手技术”更是直接戳中了外界的好奇心。 不过问题来了,在谷歌和 OpenAI 的相关产品早已上线的情况下,苹果让用户多等一年,这款“新 Siri”究竟能否掀起革命性浪潮?毕竟,在 AI 领域,时间从来不等人啊!
四十多岁是创业的最佳时期?
许多人认为,四十多岁是创业的最佳时期。这个阶段,既有丰富的经验,财务状况相对稳定,又渴望迎接新的挑战。听起来确实很有道理。四年前,有人带着这样的信念,全身心投入,开始打造自己的梦想事业。结果证明,这份努力并非徒劳,业务成功实现盈利,年收入达到六位数。 然而,仅仅三个月前,这个事业的主人却选择了放手。 回过头来看,如果能重新来过,也许最重要的建议就是:别把所有的一切都押上。 首先是身体上的挑战。无可否认,年龄增长带来了改变。年轻时,熬夜是家常便饭,即使只睡四个小时,也能咬牙完成任务。但现在,少于六个小时的睡眠就会让整个人无精打采。有时候甚至需要小睡恢复体力,哪怕只是短短的30分钟车程,也能让人感到疲惫不堪。这让人不禁感叹,那些长途卡车司机是如何坚持下来的。 其次是心智的压力。科学研究表明,45岁之后,大多数人的学习和思考能力开始逐渐下降。而这一点在创业初期尤为明显。当时,很多新事物需要学习,比如如何利用社交媒体引流、搭建自动化系统、管理表格,甚至计算损益。这些对一个没有相关背景的人来说都是全新的领域,学习起来需要投入大量时间和精力。虽然随着年龄增长,思维敏捷度有所下降,但通过多年的经验积累和勤奋努力,依然能够迎难而上。尽管效率不如年轻人,但坚持的毅力弥补了很多不足。 财务风险是创业过程中不可忽视的难题。即便选择了低成本的模式,比如手工制造,依然面临培训、系统建设、原材料采购等高额支出。随着业务规模扩大,开销也随之增加。没有稳定的收入来源时,很多人只能动用存款来支撑业务,同时还要储备资金应对突发状况。比如货运延误导致销售中断、额外的关税挤压利润空间、快递遗失包裹需要重新生产等问题。更糟糕的是,有些人因为货物质量问题直接损失了数万美元。 面对这种财务上的不确定性,很多人被迫压缩开支。度假成为奢侈,日常消费也小心翼翼,甚至开始担忧未来是否能存够养老金。与其冒险,不如更理性地规划自己的财务状况。 此外,还需要为自己留一条退路。在二三十岁时,创业失败后可以轻松重返职场。但到了四十多岁,这样的灵活性就大打折扣。一方面,职业空窗期可能让求职者显得“脱节”;另一方面,即使愿意从基层做起,也可能因为“过度资历”而被拒绝。许多数据显示,大部分人的收入高峰期在45岁到54岁之间。一旦错过这个关键阶段,职业发展轨迹基本定型。 创业并非没有价值。它教会了人们普通工作无法传授的生存技能,磨炼了心态和行动力,让人变得更加成熟。然而,如果有人告诉你“40多岁是创业的最佳时间”,请务必谨慎思考,尤其是不要把所有的积蓄押在一个不确定的项目上。这是一次深刻的教训,特别是在财务层面。幸运的是,有人最终回归全职工作状态,重新找到平衡,并对退休规划充满希望。 未来是否会再次创业?可能会,但下次一定会更加小心,不会轻易孤注一掷。
迈向“代理系统”
两年前,ChatGPT 的推出堪称人工智能研究的分水岭,不仅重新定义了面向消费者的 AI,也激发了各类企业探索 GPT 或类似模型如何在各自的业务场景中发挥作用。转眼到了 2024 年,如今语言模型生态系统蓬勃发展,无论是敏捷的初创企业还是大型企业,都在结合诸如检索增强生成(RAG)等方法,用于内部协作助手和知识搜索系统。 AI 的应用场景呈指数级增长,与之匹配的企业级生成式 AI 项目投资也在迅速增加。毕竟,这项技术每年预计为全球经济贡献 2.6 至 4.4 万亿美元。不过,当前的生成式 AI 还只是第一波浪潮。 下一阶段:迈向“代理系统” 最近几个月,许多初创公司和大企业(如 Salesforce 和 SAP)开始迈向“代理系统”的新阶段。这些代理不仅能够基于内部知识(通过 RAG)回答关键业务问题,还能作为自主的任务导向型实体,根据指令或情境决策、制定详细的行动计划,并在数字环境中灵活执行任务,比如使用在线工具、API 等。 这种转变标志着 AI 从单纯的自动化向高度自主化发展的重大飞跃。企业可以轻松部署虚拟助手军团来处理各种任务,例如订票或跨数据库数据迁移,大幅节省时间。根据 Gartner 的预测,到 2028 年,企业软件应用中将有 33% 集成 AI 代理(目前不足 1%),而这些代理将自主做出约 15% 的日常业务决策。 但问题来了:既然 AI 代理前景如此广阔,企业如何将其融入技术栈,同时保证高精准度?毕竟,没有企业愿意看到 AI 系统因无法理解业务细节而犯错。 数据策略:AI 成功的核心 对此,Google Cloud 数据分析副总裁 Gerrit Kazmaier 强调,关键在于构建完善的数据策略。他表示:“数据管道必须从‘存储和处理数据的系统’演进为‘创造知识和理解的系统’。这意味着要从单纯收集数据转向精心策划、丰富和组织数据,以支持大型语言模型(LLM)成为值得信赖的智能业务伙伴。” 为 AI 代理构建数据管道 过去,企业主要依赖结构化数据(表格形式)进行分析决策,但这只占了实际数据的…
500强企业Copilot的采用率已达到75%
关于人工智能领域,有两件事是毋庸置疑的。其一,这个行业正在以惊人的速度飞跃发展。其二,成千上万的客户已经在使用微软的人工智能技术,通过早期押注这些平台,不仅获得了巨大的当前收益,也为未来的人工智能升级浪潮奠定了基础。 在微软每年的旗舰活动Ignite大会上,客户、合作伙伴和开发者将齐聚一堂,探索如何充分释放微软技术的潜力,重新定义工作方式。今年大会发布了约80款全新产品和功能,包括Microsoft 365 Copilot的最新升级、Copilot+AI技术堆栈的新功能,以及全新的Copilot+设备方案。所有创新的核心,是微软对安全性的承诺。一年前启动的“安全未来计划”(Secure Future Initiative,简称SFI),让安全成为微软每位员工的首要任务,34,000名工程师专注于此。在本次Ignite大会上,微软将推出符合SFI原则的创新技术,全面贯彻“设计即安全、默认即安全、操作即安全”的理念。 今年的Ignite吸引了超过20万注册者,其中有14,000多人亲临芝加哥的线下活动。参与者可从800多个会话、演示和专家实验室中选择,无法现场参会的用户还可以通过点播形式获取绝大部分内容。 Microsoft 365 Copilot:势不可挡的AI助手 Microsoft 365 Copilot作为工作场景中的AI助手,正在引领行业趋势。据统计,近70%的《财富》500强企业已经在使用Microsoft 365 Copilot。研究机构IDC的一项调查显示,生成式人工智能的采用率已在2024年达到75%,企业每投资1美元,就能获得3.7美元的回报,部分领导者甚至称其回报高达10倍。 案例中提到的用户成果令人印象深刻: 微软正在持续扩展Copilot的生产力功能,例如通过“Copilot Actions”简化日常任务,或通过SharePoint智能助手、实时语言翻译和员工自助服务代理等新功能,帮助企业以更高效的方式完成工作。 Copilot + AI 堆栈与Azure AI Foundry 为支持用户设计和管理更先进的AI应用,微软推出了Azure AI Foundry。这一统一平台提供了包括预制应用模板、简化编码工具以及集中管理功能等一系列资源,帮助开发者和企业以负责任的方式扩展AI应用。 此外,新功能还包括专注于安全与合规的AI报告和图像内容风险评估工具,为组织创建更透明、更安全的AI使用环境。 Copilot+设备:云端新时代 微软正在扩展其云PC解决方案,推出了一款全新设备——Windows 365 Link。这是一款专为连接Windows 365设计的设备,确保用户能够在几秒内安全访问云端桌面。定价为349美元,预计2025年4月开始销售。 Windows 365 Link没有本地数据或应用,用户无需本地管理员权限,从设计上确保数据留存在微软云中。此外,原生处理单元(NPU)的引入,将带来更高效的AI本地化处理能力。 与BlackRock的合作与安全承诺 在安全领域,微软宣布举办史上最大规模的公开安全研究活动——Zero Day Quest。这一专注于AI和云安全的赛事将提供400万美元的奖金池,旨在吸引全球顶尖的安全人才解决关键问题。 与此同时,微软推出了全新的“安全暴露管理”功能,结合微软的图数据和客户的第三方安全工具,帮助团队可视化潜在攻击路径,从而阻止威胁入侵。 更多创新与未来展望 本次Ignite的亮点不仅限于此。通过大会主旨演讲,用户可以深入了解微软领导团队如萨提亚·纳德拉和其他高管分享的前瞻观点。此外,“Book of News”也将为大家提供关于所有公告的完整汇编,供用户进一步探索。 通过这些新发布的技术与创新,微软正在为AI驱动的未来开辟全新道路,让技术成为更广泛社会变革的推动力。
微软最新的 AI 代理现在支持接入 1800 多种模型
企业界如今对 AI 代理充满热情,但业务领导者更关注实际成果和相关用例,而非那些仍显未来化的概念。他们需要易于部署和使用的工具,并希望这些工具支持他们偏好的模型或技术架构。 微软在 Microsoft Ignite 2024 大会上宣布,Microsoft 365 Copilot 引入了全新的无代码和低代码功能,能够满足企业的这些需求。用户现在可以创建自定义的自主代理,或者直接部署现成的专用代理。这些代理支持“自带模型”设置,能接入 Azure AI 库中超过 1800 个模型。 微软 AI 和研究部门企业副总裁 Lili Cheng 表示,企业已进行了大量的 AI 实验,现在希望能够衡量和理解代理如何帮助提升效率、改善性能并降低成本与风险。微软推出的新功能正是为了帮助企业扩展 Copilot 的应用规模。 据 IDC 预测,未来 24 个月,越来越多的企业将构建定制化的 AI 工具。从 Salesforce 和 Snowflake 等科技巨头到 CrewAI 和 Sema4.ai 等小型平台,供应商正在加速推动市场变革。微软的新功能则进一步支持企业“自带知识”和“自带模型”的需求,让用户能够安全地使用专有数据,灵活组合和测试不同模型,避免被单一平台束缚。 通过 Copilot Studio,用户可以使用模板快速创建常见场景的代理(例如销售订单代理和交易加速器代理)。对于更高阶的开发者,微软还提供了全新的 Agent SDK(目前为预览版),支持开发完整的多渠道代理,能与 Microsoft 服务、第三方服务以及网页渠道集成。 Azure AI Foundry 的新功能支持用户添加自定义搜索索引作为知识来源,并通过 SDK 提供简化的开发和管理工具链,适用于定制和部署 AI…