自从生成型人工智能一年半前首次引起全球关注以来,关于这项新技术最适合应用于何处的讨论一直非常激烈。虽然早期的趣味对话和机智的五行诗颇受欢迎,但人们很快发现,许多最大的人工智能机会显然存在于企业领域。 谷歌云的客户和合作伙伴已经发现了利用生成型人工智能创造新流程、效率和创新的真正潜力。想要证据,不妨看看本周在拉斯维加斯举行的Next活动中,展示的300多个组织。 在短短几个月内,这些组织已从人工智能帮助回答问题,转变为人工智能进行预测,再到生成型人工智能代理。生成型人工智能代理的独特之处在于它们可以采取行动实现特定目标,无论是引导购物者找到完美的鞋子,帮助员工寻找合适的健康福利,还是在班次更换期间支持护理人员更顺畅地移交病人。 在与客户的合作中,反馈显示他们的团队越来越专注于提高生产力、自动化流程和现代化客户体验。这些目标现在通过他们正在开发的人工智能代理在六个关键领域得到实现:客户服务;员工赋能;创意构思与生产;数据分析;代码创建;以及网络安全。 这些特殊能力在很大程度上得益于生成型人工智能和人工智能基础模型的新型多模态能力,这使代理能够处理包括文本、语音、视频、音频、代码等在内的多种通信模式的任务。在人类的支持下,代理可以进行对话、推理、学习和决策。 Next活动的舞台上,数百名客户加入谷歌云,展示和讨论他们的人工智能代理和生成型人工智能解决方案的早期版本,并依赖谷歌云技术,包括人工智能基础设施、双子模型、Vertex人工智能平台、谷歌工作区和谷歌分布式云。还有超过100个合作伙伴加入,支持人工智能代理和人工智能解决方案的创建,具体内容可以在此处阅读。 以下是101位行业领袖如何将人工智能投入今天的生产中,创造真实世界的用例,从而转变未来。 客户代理 类似于优秀的销售和服务人员,客户代理能够仔细聆听、理解您的需求,并推荐合适的产品和服务。他们能够无缝跨越多个渠道工作,包括网络、移动和销售点,并可以与语音和视频集成到产品体验中。 员工代理 员工代理帮助员工提高生产力并更好地协作。这些代理可以简化流程、管理重复任务、回答员工问题,以及编辑和翻译关键通讯。 创意代理 创意代理可以为您的组织带来最佳的设计和生产技能,跨越图像、幻灯片,并与员工共同探索概念。许多组织正在为其营销团队、音频和视频制作团队以及所有需要帮助的创意人员构建代理。有了创意代理,任何人都可以成为设计师、艺术家或制作人。 数据代理 数据代理就像是你指尖上的知识丰富的数据分析师和研究员。他们可以帮助回答关于内部和外部来源的问题,综合研究,开发新模型——最重要的是,帮助找到我们甚至还没想到的问题,然后帮助获得答案。 代码代理 代码代理正在帮助开发人员和产品团队更快、更好地设计、创建和运营应用程序,并快速掌握新的语言和代码库。许多组织已经看到了生产力的两位数增长,这导致了更快的部署和更清晰、更干净的代码。 安全代理 安全代理通过大幅提高调查速度、自动化监控和响应来协助安全操作,以实现更大的警惕性和合规控制。它们还可以帮助保护数据和模型免受网络攻击,如恶意提示注入。
Author: aitrendtrackers@rengongzhineng.io
惊爆:Apple重启OpenAI谈判为iphone引入其技术
最近传来小道消息,苹果公司正在与OpenAI重新开启对话,商讨利用这家初创公司的技术为iPhone新增功能提供动力。据知情人士透露,双方已开始探讨可能的合作条款以及如何将OpenAI的功能整合到即将发布的iOS 18系统中。这些人士要求匿名,因为这些讨论是非公开的。 这一动向标志着两家公司对话的重新开启。虽然苹果公司今年早些时候已与OpenAI讨论过合作事宜,但此后双方的合作几乎没有什么进展。同时,苹果还在与Alphabet旗下的Google就许可其Gemini聊天机器人进行讨论。 目前苹果尚未最终决定将使用哪家公司的合作伙伴,也不能保证最终能够达成协议。公司最终可能与OpenAI和Google都达成协议,或者选择另一个完全不同的提供商。苹果、OpenAI和Google的代表均拒绝对此发表评论。 据悉,苹果的下一代iPhone操作系统将包括多项基于苹果自家大型语言模型的新功能——这种AI软件能生成听起来像人类的文本。但苹果公司也一直在寻找合作伙伴,以推出类似OpenAI的ChatGPT的聊天机器人功能。彭博社在三月份首次报道了这些讨论,讨论中还包括AI初创公司Anthropic。 这一最新动态发生在苹果全球开发者大会前大约一个半月,届时公司准备推出新的AI软件和服务。该公司计划将其功能宣传为与设备的集成更加无缝,且比竞争对手的AI产品提供更好的隐私保护。 去年,库克表示他个人使用了OpenAI的ChatGPT,但他指出还有“许多问题需要解决”。他承诺,新的AI功能将在“非常深思熟虑的基础上”引入苹果平台。 通过依赖合作伙伴,苹果公司能加速推进聊天机器人的发展,并规避一些风险。库克将生成性AI功能外包给其他公司,可能会减少其平台的责任风险。
Google最新报告深探生成型AI对经济的影响力!
今天,Google发布了首席科技与社会访问学者安德鲁·麦卡菲(Andrew McAfee)关于生成型AI可能对经济影响的报告。这份报告是麦卡菲研究AI与经济领域成果的结晶,他与谷歌的专家们紧密合作,探讨了生成型AI的快速兴起如何影响生产力、劳动市场以及在AI驱动的经济中成功所需的技能。 想了解更多安德鲁·麦卡菲的观点,请阅读概述或下载完整报告。 生成型AI是那种罕见的技术,足以加速整体经济增长——经济学家所说的“通用技术”。这些创新有潜力对经济和社会产生积极的变革。据估计,美国经济中近80%的工作岗位至少有10%的任务可以通过使用生成型AI来完成,速度提高一倍(且质量不减)。 像蒸汽机和电气化这样的过去的通用技术,其变革是在几十年间逐步实现的。然而,我们预计生成型AI的影响将更加迅速,这得益于其通过互联网快速传播的能力以及因其自然语言界面而易于使用。 这项技术已经带来了巨大的生产力提升,随着人们和组织想出利用生成型AI能力的补充创新,这种提升将会增加并扩散。因此,整体生产力将得到改善,从而加速经济增长。除了更快的增长,生成型AI还将带来其他变化。它将减少对某些技能的需求,增加对其他技能的需求,还将创造出全新的需求。 对于大规模技术性失业的担忧可能有些夸大。通用技术的历史表明,它们带来的增长总是伴随着对劳动力的强烈需求。然而,这种增加的需求往往出现在新的职业中。例如,自1940年以来美国总就业增长的超过85%来自完全新的职业。 生成型AI的迅速变革将要求迅速且有效的再培训努力。这些努力能够利用生成型AI本身,这是一种独特的工具,可以帮助人们学习如何更好地使用它。而且由于生成型AI能够积累知识并按需提供,它在改善初级员工的表现、帮助解决工资不平等方面特别有效。过去的通用技术已经改变了在不同行业中处于领先地位的公司和国家。我们相信,生成型AI将同样具有强大的影响力。
OpenAI联合创始人表示,当前的大型语言模型“可能被低训练了100至1000倍甚至更多”
Meta的Llama 3模型是在创纪录的数据量上训练的,这可能会导致整个人工智能行业的重新思考,并产生更优秀的模型。 在Llama 3中,Meta推出了一款新的语言模型,其在某些领域的表现显著超过其他模型。据Meta称,性能提升的关键在于显著增加的训练数据量和使用1000万高质量示例进行的精细调整。 虽然高质量数据能够提高甚至是较小语言模型的性能已是众所周知的事实——微软最近再次用其Phi-3模型证实了这一点——但用于预训练的数据量仍然令人惊讶。即使是拥有80亿参数的模型也是在大约15万亿个标记上进行训练的。值得注意的是,这种训练不仅远远超过了用于Llama 2的数据量,也超过了DeepMind发展的Chinchilla缩放法则认为的最优数据量。 语言模型可能显著欠训练根据DeepMind的Chinchilla法则,对于一个80亿参数的模型,约2000亿训练标记被认为是最优的,以最有效地利用计算能力。Llama 3的训练数据量是这个数字的75倍。 尽管训练数据量巨大,Meta发现,“80亿和700亿参数模型在我们对其进行最多15万亿标记的训练后,继续呈对数线性改善”,公司的博客文章中提到。 AI研究员Andrej Karpathy在X(前身为Twitter)上解释说,Chinchilla法则“告诉你计算的最优点”,但没有说明一个模型可以被训练到何种程度直到达到其最大性能。Karpathy是OpenAI的创始成员,曾是特斯拉的AI负责人。 尽管目前尚不清楚通过更长时间的训练能够将语言模型的性能提高到何种程度,直到收益变得微不足道为止。然而,Meta已经表明,尚未触及可能的极限。Karpathy希望其他AI公司将跟随Meta的例子,发布更多经过长时间训练的小型模型。
Adobe即将推出的大项目是一款AI,能将低分辨率视频提升至原始质量的8倍
最近,Adobe的研究团队发布了一篇关于名为VideoGigaGAN的新型生成式AI模型的论文,我们认为这种技术可能会在未来的产品中推出。VideoGigaGAN的功能是将低质量视频的分辨率提升至原始分辨率的最高八倍,同时不牺牲视频的稳定性或忽视源材料的重要细节。项目网站上有几个演示视频展示了它的能力,比如将一个模糊的128×128像素的瀑布视频转换成1024×1024像素的高清视频。 值得注意的是,这种AI技术在处理细节上毫不妥协。在人物面部上可以看到皮肤质地、皱纹、头发丝等细节。其他演示视频也展示了类似的高质量效果。比如,通过这项技术,你可以更清楚地看到池塘中游泳的天鹅和树上的花朵。可能会觉得关注皮肤的皱纹或羽毛等细节有些奇怪,然而,正是这种级别的细节处理,Adobe这样的公司必须精确掌握,如果他们打算在广泛的范围内实施图像增强AI。 改进的AI技术复杂难懂。 “GAN”在VideoGigaGAN中代表生成对抗网络,这是一种能够创建逼真图像的AI类型。Adobe的版本特别基于GigaGAN,专注于提升生成内容以及真实照片的质量。正如TheVerge所指出的,这项技术的问题在于它在提高视频质量时会引起多种问题,如奇怪的图像失真。为了解决这一问题,Adobe研究人员使用了多种技术。 研究论文解释了整个过程,尽管内容密集,你可以自行阅读以获取完整的信息。基本上,他们引入了“流引导传播模块”以确保视频帧之间的一致性,使用抗锯齿技术减少图像失真,以及“高频特征传输”来补偿细节突然下降。VideoGigaGAN的内容不止这些,但这就是其主要内容。 潜在的应用 我们是否会在即将推出的Adobe产品中看到这一技术,或者作为一个独立的应用推出?很可能——至少我们是这么认为的。 在过去的一年中,该公司一直在重点实施人工智能到其软件中,从推出Firefly到Acrobat的新助手。就在几个月前的Adobe MAX 2023期间,一个被称为Project Res Up的视频增强器在活动中预览,其性能与我们在VideoGigaGAN演示中看到的类似。一部20世纪40年代的旧电影从480×360像素分辨率提高到了清晰的1280×960像素。河中大象的模糊视频变得清晰可见。演示者甚至提到,软件可以将剪辑的质量提升四倍。 公开承认,这只是猜测,但VideoGigaGAN很可能是Res-Up背后的引擎。Adobe的未来产品可能会为人们提供一种将旧家庭视频或低质量视频提升为我们脑海中想象的电影的方式。也许,最近的预览是即将发布的暗示。 VideoGigaGAN仍在深入开发中,因此尚不清楚何时或是否会发布。这项AI在处理超过200帧的视频或渲染小物体时还存在一些障碍,但我们肯定会继续关注。 下载:https://arxiv.org/pdf/2404.12388
Elon Musk的AI初创公司xAI完成60亿美元融资,估值飙升至180亿美元
Elon Musk 的 AI 初创公司 xAI 正在完成一轮价值60亿美元的投资,使公司估值达到180亿美元。红杉资本是确认的投资者,这轮融资预计将在几周内完成。xAI 正在寻求60亿美元的资金。 这是一笔足以让你早晨喝咖啡时呛到的巨款。 这个新数字是 xAI 此前讨论的融资数字的两倍。xAI 上一轮10亿美元的融资主要由 Elon Musk 融资,但现在外部投资者(如支持 OpenAI 的红杉资本)也加入了混战。Valor Equity Partners 和 Vy Capital 也有望加入。 这笔资金将被用来推进 xAI 的聊天机器人 Grok,使其成为 ChatGPT 的强大竞争对手。xAI 也在积极吸引工程师,其中包括一些来自 Tesla 的人才。 有了 Elon Musk 的名字,180亿美元听起来似乎不多,但放在背景下看,OpenAI 现在的估值为860亿美元,Twitter(X)被收购的价格为440亿美元。简而言之,投资者的这次投注是巨大的。 他们可能并没有错。许多人因为 Elon 的营销,将 Grok 视为一个只会发表搞笑内容的聊天机器人。但未发布的 Grok 1.5 看起来像是一个出色的 AI 模型,而且与流行话题的 ‘X’ 集成也进行得很顺利。xAI 拥有出色的 AI 人才和不屈不挠的 Elon。押注 Elon…
英伟达以7亿美元收购Run:ai,首次向OpenAI交付DGX H200系统
英伟达收购了总部位于特拉维夫的Run:ai,这是一家使开发者和运营团队更容易管理和优化其AI硬件基础设施的公司。虽然交易的具体条款没有公开披露,但有两位接近此事的消息人士向TechCrunch透露,交易金额为7亿美元。 CTech今天早些时候报道称,双方正处于“高级谈判”阶段,英伟达可能会为Run:ai支付高达10亿美元。显然,谈判进展顺利,除了可能的价格变动外。 英伟达表示,它将继续以“相同的商业模式”提供Run:ai的产品,并将投资于Run:ai的产品路线图,作为Nvidia的DGX Cloud AI平台的一部分,该平台为企业客户提供计算基础设施和软件,客户可以使用这些设施和软件来训练生成型和其他形式的AI模型。英伟达DGX服务器、工作站和DGX Cloud的客户还将获得Run:ai的能力,用于其AI工作负载,英伟达表示,特别是用于在多个数据中心位置运行的生成型AI部署。 Run:ai的CEO Omri Geller在一份声明中表示:“Run:ai自2020年以来一直是Nvidia的密切合作伙伴,我们共同的热情是帮助我们的客户最大限度地利用他们的基础设施。我们很高兴加入Nvidia,并期待继续我们的合作之旅。” Geller与几年前在特拉维夫大学与教授Meir Feder(Run:ai的第三位联合创始人)一起学习的Ronen Dar共同创立了Run:ai。Geller、Dar和Feder希望构建一个平台,该平台能够将AI模型“分解”成在硬件上并行运行的片段,无论是在本地、公共云还是在边缘。 尽管Run:ai的直接竞争对手不多,但其他公司正在将动态硬件分配的概念应用于AI工作负载。例如,Grid.ai提供的软件允许数据科学家在GPU、处理器等上并行训练AI模型。 但在其成立的相对早期,Run:ai就设法建立了一个庞大的客户群,这些客户群均为财富500强公司——这反过来又吸引了风险资本的投资。在被收购之前,Run:ai已从包括Insight Partners、Tiger Global、S Capital和TLV Partners在内的投资者那里筹集了1.18亿美元的资金。 在博客文章中,Nvidia的DGX Cloud副总裁Alexis Bjorlin指出,客户的AI部署变得越来越复杂,公司越来越希望更有效地利用他们的AI计算资源。 ClearML进行的一项关于采用AI的组织的最新调查发现,到目前为止2024年扩展AI的最大挑战是计算资源在可用性和成本方面的限制,其次是基础设施问题。 Bjorlin说:“管理和调度生成型AI、推荐系统、搜索引擎和其他工作负载需要精细的调度来优化系统级和底层基础设施的性能。英伟达的加速计算平台和Run:ai的平台将继续支持广泛的第三方解决方案生态系统,为客户提供 选择和灵活性。与Run:ai合作,英伟达将使客户能够访问任何地方的GPU解决方案的单一织物。” Run:ai是自英伟达在2019年3月以69亿美元收购Mellanox以来的最大一笔收购。
Sup3rCC:一款开源机器学习模型,模拟未来气候条件及其对可再生能源资源的影响
随着各国逐渐转向风能和太阳能等可再生能源,理解气候变化将如何影响这些能源变得至关重要。气候变化带来的极端天气事件,让能源规划者难以预测未来的能源需求。虽然存在一些数据,但这些数据在细节上有限,且无法具体显示气候变化将如何影响可再生能源。 国家可再生能源实验室(NREL)的研究人员意识到了这一问题,并开发了一个名为Sup3rCC的新工具来应对这一挑战。Sup3rCC(超级分辨率气候变化影响可再生能源资源数据)是一个开源模型,它使用先进的机器学习技术模拟未来的气候条件及其对可再生能源资源的影响。 Sup3rCC的独特之处在于它大幅提高了气候数据的分辨率,使得数据比现有方法更加详细和准确。它能比传统技术快40倍生成数据,允许能源规划者快速获取关于未来气候条件的详细信息。 该模型将气候数据的空间分辨率提高了25倍,时间分辨率提高了24倍。这意味着它可以提供有关特定地点和时间的气候条件的详细信息,帮助能源规划者更好地理解可再生能源发电将如何受到影响。 通过模拟未来的气候条件,Sup3rCC有助于弥合能源规划与气候研究之间的差距。它允许能源规划者将气候数据纳入他们的模型中,确保他们能够就未来的能源系统做出知情的决策。 总之,Sup3rCC是一个开创性的工具,彻底改变了我们理解气候变化对可再生能源影响的方式。通过提供详细的、高分辨率的气候数据,它使能源规划者能够在气候变化的背景下,做出知情的关于未来能源系统的决策。 下载:https://registry.opendata.aws/nrel-pds-sup3rcc/
为什么市场人员押注于Apple Vision Pro专业版
自从去年各大品牌在 Roblox 和 Decentraland 这样的元宇宙平台上开设虚拟酒吧、银行和卷饼比赛以来,元宇宙似乎已经无处不在。然而,两年过去了,关于新元宇宙活动的品牌公告大大减少,人们更多的讨论转向了这项技术是否被过度炒作,以及还有谁在使用它。 然而,现在有了一款新的 VR 产品。今年二月,苹果发布了售价3500美元的 Apple Vision Pro 混合现实头盔,品牌如 e.l.f. 化妆品、Alo 瑜伽和 Lowe’s 已经开始尝试使用这一产品。虽然体验可能与戴上 Oculus 头盔进入元宇宙相似,但品牌市场营销人员告诉我们,他们对 Vision Pro 和它可能为品牌沉浸式体验和空间计算的未来意味着什么持乐观态度。 “这肯定是我们将来都会使用计算机的方式,”Valtech 北美数字代理的客户体验副总裁 PJ Stephen 在 Marketing Brew 的一次访谈中说。 Vision Pro 的硬件在当前形式下,Stephen 描述为“在脸上戴着一个五磅重的电脑”,可能会成为一些用户和品牌的进入障碍。Vision Pro 还有一些体验限制,如用户无法闻到、触摸或尝到显示的图像——无论是在元宇宙酒吧还是在 Vision Pro 应用中都是如此。 Stephen 更看好 Vision Pro 的原因是硬件可以整合到现有的技术消费习惯中,体验出现在用户的现实生活环境中。“我不认为有人会真的想把元宇宙当作一个去处,”Stephen 说。“Vision Pro 的真正明了之处在于,它不是关于去别的地方——它是关于把事物带入你的空间。” 根据 Stephen 的说法,另一个可能的区别点是头盔的沉浸式视觉体验,这可能有助于触发客户的情感反应,同时允许他们近距离查看产品。迄今为止,像 Wayfair、Lowe’s 和 J.Crew 这样的品牌已经为 Vision…
Snowflake Arctic:企业 AI 领域的佼佼者 —— 高效智能,真正开源
在今天的云计算盛宴上,Snowflake 公司带来了一款名为 Arctic LLM 的“企业级”生成型 AI 模型。这个小家伙不仅完全开源,还特别为处理如数据库代码生成等企业重负荷工作而优化。看起来,Snowflake 是要以此模型作为他们在生成型 AI 领域的一大步。 Snowflake CEO Sridhar Ramaswamy 在新闻发布会上信心满满地表示,Arctic LLM 将是推动公司及其客户构建企业级产品、实现 AI 潜力和价值的基石。看来,他们不仅仅是想做个小试牛刀,而是有志在生成型 AI 大展拳脚。 不仅如此,Snowflake 还大胆宣称,Arctic LLM 在编程和 SQL 生成等任务上,不仅超过了竞争对手 DBRX,甚至在某些方面还超越了 Meta 的 Llama 2 70B。Snowflake 还强调,Arctic LLM 在流行的通用语言理解基准 MMLU 上取得了领先表现,虽然我们知道这些测试有时只是靠死记硬背也能解决。 此外,Arctic LLM 采用了一种叫做“专家混合”(MoE)的架构,将数据处理任务分解为子任务,由更小的专家模型处理。这种设计使得 Arctic LLM 虽然拥有高达 4800 亿个参数,但每次只激活 170 亿个,足以驱动 128 个独立的专家模型,从而在成本上大为节省。 Arctic LLM 不仅会在 Snowflake 自家的…