人工智能实验室OpenAI已经推出了其GPT商店,这是一个为个性化人工智能(AI)应用程序提供市场的平台,该公司在周三的博客文章中宣布。 GPT商店位于广受欢迎的ChatGPT聊天机器人内部,是用户发现和构建GPT(为特定任务量身定制的AI)的地方,例如教授数学或设计贴纸。 这是OpenAI利用ChatGPT在消费者市场上的成功的一次尝试。去年,ChatGPT向世界介绍了生成式AI,以其编写类似人类的散文和诗歌的能力让用户感到惊艳。ChatGPT迅速成为有史以来增长最快的应用之一,但当一些学校放假和这个聊天机器人的新奇感消退时,其增长有所下降。 GPT商店最初将面向支付ChatGPT计划的用户推出,OpenAI表示。在接下来的几个月中,该公司打算为GPT创造者增加一种方式,让他们能够通过个性化AI获得收益。 这家得到微软(MSFT.O)支持的初创公司在11月的首次开发者大会上宣布了GPT商店。最初计划在当月晚些时候上线。 但在12月,OpenAI推迟了GPT商店的启动,根据一份内部备忘录,原因是它继续根据客户反馈“对GPT进行改进”。推迟的背景是OpenAI首席执行官Sam Altman被公司董事会出人意料地解职,以及当员工威胁要辞职时他被重新任命。 此外,OpenAI在周三表示,它正在推出ChatGPT Team,这是一种公司支付费用让员工在工作中使用ChatGPT的ChatGPT版本。ChatGPT Team将公司数据进行隔离,所以输入到聊天机器人的任何信息都仅限于公司内部。ChatGPT Team的成本在每用户每月25至30美元之间。
Author: aitrendtrackers@rengongzhineng.io
2024年人工智能和数据科学的五大关键趋势
2023年,人工智能和数据科学成为了头条新闻,推动这一趋势的当然是生成性AI的崛起。那么,2024年这个领域可能会发生什么,使其继续保持在头条位置?这些趋势将如何真正影响企业? 在过去几个月里,我们对数据和技术高管进行了三次调查。其中两次是在麻省理工学院首席数据官及信息质量研讨会上进行的——一次由亚马逊网络服务(AWS)赞助,另一次由Thoughtworks赞助(尚未发布)。第三次调查是由Wavestone(前身为NewVantage Partners)进行的,我们过去也曾撰文介绍过他们的年度调查。总共有超过500名高级执行官参与了这些新调查,可能有一些参与者重复参加。 《领导AI和数据》月刊洞察 了解人工智能如何影响你的组织,以及这对你的公司和客户意味着什么。 你的邮箱是什么? 注册 隐私政策 调查虽然不能预测未来,但它们确实表明了那些最接近公司数据科学和AI战略及项目的人们正在思考和做什么。根据这些数据高管的说法,以下是五大发展问题,值得你密切关注: 调查表明,尽管对生成性AI的兴奋程度很高,但价值大多尚未交付。 生成性AI的生产部署当然需要更多的投资和组织变革,而不仅仅是实验。业务流程需要重新设计,员工需要重新培训(或者,在少数情况下,被生成性AI系统取代)。新的AI能力需要整合到现有的技术基础设施中。 或许最重要的变化将涉及数据——策划非结构化内容,提高数据质量,整合多元化的数据来源。在AWS调查中,93%的受访者同意数据战略对于从生成性AI中获得价值至关重要,但57%的受访者迄今为止还没有对他们的数据做出任何改变。 生产数据模型——曾经是一种手工艺的活动——正在变得越来越工业化。 这些能力大多来自外部供应商,但一些组织现在正在开发自己的平台。尽管自动化(包括我们下面讨论的自动化机器学习工具)正在帮助提高生产力和促进更广泛的数据科学参与,但提高数据科学生产力的最大好处可能是重用现有的数据集、特征或变量,甚至是整个模型。 但组织对数据产品的看法有两种不同的方式。接近一半(48%)的受访者表示,他们将分析和AI能力包含在数据产品的概念中。大约30%的人认为分析和AI与数据产品是分开的,而且可能仅将这个术语用于可重用的数据资产。只有16%的人表示他们根本不认为分析和AI在产品背景下有意义。 我们稍微倾向于将分析和AI包含在数据产品定义中,因为这是数据被利用的方式。但真正重要的是,组织在定义和讨论数据产品时保持一致。如果一个组织更倾向于结合“数据产品”和“分析和AI产品”,那也可以很好地运作,这个定义保留了产品管理的许多积极方面。但如果没有对定义的明确,组织可能会对产品开发者究竟要交付什么感到困惑。 减少对专业数据科学家需求的另一个因素是公民数据科学的兴起,即具有定量分析能力的商业人士自己创建模型或算法。这些个体可以使用自动化机器学习(AutoML)等工具来完成大部分繁重的工作。对公民来说,更有帮助的是ChatGPT中提供的一项名为“高级数据分析”的建模功能。通过简短的指令和上传的数据集,它几乎可以处理模型创建过程的每个阶段,并解释其行动。 当然,数据科学的许多方面仍然需要专业数据科学家。例如,开发全新的算法或解释复杂模型的工作方式是仍然存在的任务。这个角色仍然是必要的,但可能不像以前那样重要了——也没有了同样程度的权力和光彩。 Thomas H. Davenport 和 Randy Bean 这种C级职位的演变是Thoughtworks调查的主要关注点,87%的受访者(主要是数据领导者,但也有一些技术高管)同意,他们的组织中的人们对于向何处寻求数据和技术相关服务和问题感到完全、在很大程度上或有些困惑。许多C级高管表示,他们与本组织内的其他技术导向领导者的协作相对较低,79%的人同意,他们的组织过去因缺乏协作而受到阻碍。 我们相信,在2024年,我们将看到更多这样的综合技术领导者,他们拥有从向他们汇报的数据和技术专业人员那里创造价值的所有能力。他们仍然需要强调分析和AI,因为这是组织理解数据并为员工和客户创造价值的方式。最重要的是,这些领导者需要高度商业化,能够与高级管理同事讨论战略,并能将其转化为使该战略成为现实的系统和洞察。
英伟达将生成人工智能带给数百万人,利用Tensor Core GPU、大型语言模型和RTX个人电脑及工作站的工具
英伟达今天宣布了GeForce RTX™ SUPER台式GPU,用于强化生成AI性能,以及每个顶级制造商的新AI笔记本电脑和NVIDIA RTX™加速的AI软件和工具。基于数十年的PC领导地位,拥有超过1亿的RTX GPU驱动AI PC时代,NVIDIA现提供这些工具以增强PC上的生成AI体验:NVIDIA TensorRT™加速的流行稳定扩散XL模型用于文本到图像工作流,NVIDIA RTX Remix与生成AI纹理工具,NVIDIA ACE微服务等。AI Workbench,一个易于使用的AI开发者工具包,将在本月晚些时候提供测试版。此外,NVIDIA TensorRT-LLM(TRT-LLM)现支持更多预优化的模型。本月晚些时候发布的NVIDIA技术演示“RTX对话”将允许AI爱好者与他们的笔记、文档和其他内容进行互动。 Jensen Huang表示:“生成AI是计算史上最重要的平台转变,将改变每个行业。”为满足这些需求,英伟达在其完整技术堆栈中提供创新,推动新体验,并在500多个已由NVIDIA RTX技术加速的AI启用PC应用程序和游戏的基础上进行构建。
InseRF: 文字驱动的神经3D场景中的生成对象插入
研究人员来自苏黎世联邦理工学院(ETH Zurich)和谷歌苏黎世(Google Zurich)的合作努力,已经成功创造了名为InseRF的新技术。该方法基于用户提供的文本描述和参考视角中的2D边界框,能够在3D场景中生成新对象。随着在3D生成建模中采用文本到图像扩散模型的强大先验,3D场景编辑领域已经发生了深刻的变革。尽管现有方法在通过风格和外观变化或移除现有对象方面效果显著,但在生成新对象方面仍面临挑战。研究人员在本项研究中解决了这一问题。他们特别提出,将3D对象插入定位于场景的参考视图中的2D对象插入。然后,将这种2D编辑提升为3D,采用单视角对象重建方法。重建的对象随后被插入到场景中,并受到单眼深度估计方法先验的指导。研究人员在各种3D场景上对其方法进行了评估,并对提出的组件进行了深入分析。他们在几个3D场景中进行的生成式对象插入实验显示,与现有方法相比,他们的方法更为有效。InseRF能够在不需要显式3D信息作为输入的情况下,进行可控制和与3D一致的对象插入。 去看看Github: https://mohamad-shahbazi.github.io/inserf/
QuEra 10,000个物理量子位和100个逻辑量子位的量子计算机2026
QuEra,一个由哈佛大学和麻省理工学院的研究人员组成的量子计算创业公司,正雄心勃勃地计划在2026年推出一台具有10,000个物理量子位和100个逻辑量子位的量子计算机。这个先进系统旨在展示“实用的量子优势”,在复杂计算中超越传统的二进制计算机。 QuEra的发展路线图包括中期里程碑,在2024年和2025年分别开发具有256个和3,000个物理量子位的系统。他们独特的方法使用被激光镊子困住的原子作为量子位,与IBM的超导电荷量子位不同。QuEra的技术重点是克服量子计算的主要挑战——错误校正,旨在维持量子信息完整性的长期性。 目前科学界对于何时甚至是否能在实际层面上达到“量子优势”尚无共识。科学家们使用量子计算机进行了大量实验,解决了传统计算机无法解决的问题,但这些实验大多涉及运行特定算法,这些算法在实验室测试之外几乎没有或根本没有实际用途。 然而,包括QuEra团队所做的最新进展表明,一旦扩大规模,目前的进展可能会带来能够执行远远超出任何现有或理论上可行的二进制超级计算机能力的量子计算系统。 如果实现,这场量子革命预计将对密码学、金融科技、化学、人工智能、交通和其他许多领域产生重大影响。
2024年,谷歌云首席技术官眼中的生成AI三大支柱,来看看有啥新花样
在全球各地的组织中,2023年的AI热潮正迅速演变成更有趣、更实用的东西:真正重要的AI驱动商业成果。原因在于AI能力在整个计算堆栈中的最新进展,使得任何行业、地理位置或成长阶段的组织都能接触到通常只有少数人能享受的潜力。随着越来越多的人使用这些新能力,可以期待创新和成果的激增。 谷歌的Gemini等模型系列是生成AI最初突破的最强表达,使人们和设备能够用自然人类语言进行交互。在人类提示的指导下,计算机合成难以想象的大量数据,以消化信息、做出预测、协助任务或创建新颖内容,从文本到图像再到新的计算机代码。Gemini比以往任何时候都走得更远,作为世界上第一个原生多模态模型。 以前,你需要不同的模型来理解文本、音频、代码、图像、数学或视频。Gemini可以同时处理所有这些,就像人类在合作时同时阅读、说话和观察周围世界一样。 杜埃特人工智能摘要 随着生成AI在2024年的更广泛采用,领导者应该考虑三个重要支柱:经济和能源;普及和获取;信任和安全。 在蓬勃发展的AI竞赛中,平衡相互竞争的需求并采取适度的风险将是走在前列的关键。 “我们相信,AI不会结束工作,而是会对人类的创造力、合作和发明提出新的要求,与当今世界面临的挑战相称。” 这个摘要是使用Google Workspace的Duet AI创建的。 在2023年的“哇”时刻之后,许多企业面临着这样的问题:“这对我们的业务意味着什么,成本是多少?”作为谷歌云的首席技术官,我的工作使我有幸了解技术的发展方向(人工智能助手、平台和基础设施的融合),以及一些世界顶尖组织如何已经利用它。总的来说,我看到了三个关键支柱,这将影响公司如何理解、部署和使用2024年的生成AI。 经济和能源 在企业中使用生成AI的可行性通常集中在关键成本上,既包括财务方面,也越来越多地包括环境方面。严格的执行满足了业务的财务生命和遵守法规及企业公民身份的日益重要性。 生成AI使用巨大的计算能力,带来能源使用的成本和社会挑战。客户将需要了解数据中心的能源管理方式,并具有优化生产以使用尽可能清洁的地区和区域的灵活性。这可能会影响编写软件的做法,并可能作为开发者实践的一部分采用碳预算。我们的客户希望我们继续我们的重大可持续性努力,可持续的生成AI在2024年的需求和重要性很可能会上升。 谷歌在2015年将AI融入搜索。亲身经历这种AI扩展挑战——并知道历史上,软件成本的50%或更多是维护,包括改进——使得效率成为我们的早期优先事项。所以我们开发了Tensor Processing Units (TPUs),这是专门处理AI工作负载的专用芯片,包括生成AI,以大幅降低成本和更好的能源使用。成为稀缺的客户投资美元和有限的全球能源供应的伟大管家是所有现代组织的不容置疑的优先事项。 普及和访问 对许多人来说,首次接触生成AI可能是在产品中,如一个将旧数据库转换为新的、更强大的产品的工具,一个帮助管理工作生活的助手,或一个提供高质量医疗问题答案的机器人。这些都依赖于一种新的计算范式,它使用来自更多来源的更多数据,以更灵活的方式。例如,医院账单中的信息可能会被汇总以发现国家健康趋势,或重新利用以跟踪在不同位置提供服务所需的时间,发现护理短缺。 使用正确的基础模型和工具,即使是在人员和资源有限的组织中,也将可能实现这种事情。随着它变得普遍和无处不在,生成AI不再意味着一个模型,而是意味着一个有帮助的、可能是神奇的体验。 还有一个问题是确保生成AI对市场上的每个人都是可访问和有用的,而不仅仅是几个巨头。工具和平台需要允许任何人高效、负责任地开始使用AI,并且这些应该容易找到和表面化。一些界线将变得模糊,包括更无缝地在基于网络的实验环境和具有强大安全性和保证的健壮、平台支持的环境之间转移。 变成根据每个企业的需求和文化定制的产品,甚至适应个别员工和客户。用企业自有数据来打磨和调整大型语言模型(LLM),使公司内部的背景知识和智慧能够提升模型的性能。引入“参数高效微调”技术将使这种定制对更广泛的组织来说更加现实。 我们将看到在提升模型输出方面的迅速进步,如精馏、集成和联合(所有新兴的方式),以及将开发工作开放给更广泛员工的新创作工具。在高度监管的行业,如金融和医疗保健,组织可能会采取比游戏和媒体等行业更为谨慎的方法。 信任与安全 支撑生成AI颠覆的将是对负责任提供商的基本人类和组织信任需求。上面提到的医疗保健例子是一个激动人心的想法,但它强调了对普遍数据加密和AI增强安全性的需求,以便一次访问多个位置的数据,包括不同的云和本地系统,以及有效的成本监控。 我们最新的基于Gemini的生产力、威胁检测和响应进展使生成AI成为企业安全的前沿。如果说有什么,这强调了威胁不会消失,而且可能会获得自己的AI驱动能力。安全性也需要自己的生成AI工具,能够以全新的方式发现和解释威胁。我们的特定领域语言模型Sec-Palm 2,针对广泛的安全用例进行了培训,能够立即识别潜在的恶意脚本,并向团队报告活跃威胁。 就像个人根据与以前的经验相比较来决定是否信任他们所看到、听到和阅读的内容一样,组织也将开始索引他们所知道的。然后,他们可以使知识和数据在创造体验、效率和差异化方面变得更加容易获得和有用,这些差异化作为他们辛苦赢得的可信度的可靠延伸。 2024年开始 我们现在正处于人机交互的一个非凡新阶段。它变得越来越强大,同时也变得更容易使用,无论是对于个人开发者还是企业。远非结束工作,我们相信它将对人类的创造力、合作和发明提出新的需求,与当今世界面临的挑战相称。 在未来一年及以后,我们将看到生成AI变得更加有用,围绕它是如何工作、成本是多少以及如何最好地部署它们以创造突破性体验的透明度更大。通过这种方式,炒作将让位于真正的价值和愉悦。 许多企业已经开始,其他企业正在寻求与AI接触。学习的方式有很多,从视频概述和行业基础知识到培训教程或课程和认证。参与可以很简单,就像尝试一个即开即用的解决方案来促进合作或改善呼叫中心的性能。一旦您和您的组织看到开始是多么容易,我相信您的创造力将解锁更多用例和体验,推动我们所有人的发展。
Unified-IO 2: 通过视觉、语言、音频和动作扩展自回归多模态模型。给大家提前预演了GPT5?
首个自回归的多模态模型,能够理解和生成图像、文本、音频和动作。为了统一不同的模态,将输入和输出——图像、文本、音频、动作、方框等,标记化到一个共享的语义空间中,然后使用单一的编码器-解码器变换模型来处理它们。由于训练如此多样化的模态极其困难,提出了各种架构改进以稳定模型。从零开始训练的模型,在一个大型多模态预训练语料库上进行训练,该语料库来源于多种渠道,使用多模态去噪目标混合。为了学习广泛的技能,比如遵循多模态指令,构建并微调了一个由120个现有数据集组成的集合,其中包括提示和增强。通过单一的统一模型,统一输入输出 2 在 GRIT 基准测试中实现了最先进的性能,并在包括图像生成与理解、文本理解、视频和音频理解以及机器人操控等30多个基准测试中取得了强有力的成绩。 它基于区区70亿参数构建,并经过大量多模态数据的精心训练(包括10亿图像-文本配对、1万亿文本标记,以及大量的视频、图像和3D内容)。在超过35个不同的基准测试中表现出色,统一输入输出 2 不仅仅是人工智能领域的一步,而是一大跃进,展示了多模态训练在理解和生成复杂、跨媒介内容方面的巨大潜力。 所有模型发布给研究社区。 详细的区看看: https://unified-io-2.allenai.org/ 和 https://github.com/allenai/unified-io-2
AI技术已经发现了一种新材料,可以在电池制造中减少对锂的需求
通过人工智能(AI)和超级计算的协同作用,科学家们发现了一种新物质,这种物质有望在电池中减少锂的使用。 这项发现由微软和太平洋西北国家实验室(PNNL)共同完成,后者是美国能源部的一部分。科学家表示,这种材料有潜力将锂的使用量减少高达70%。 自从这种新材料被发现以来,它已被用来为一个灯泡供电。 微软的研究人员利用AI和超级计算机,从3200万种潜在的无机材料中筛选出18种有前途的候选物质,这一过程不到一周就完成了 —— 使用传统实验室研究方法可能需要20多年。 从构想到开发出工作原型电池的过程不到九个月。 这两个机构通过使用先进的AI和高性能计算实现了这一目标,后者结合了大量计算机来解决复杂的科学和数学任务。 微软执行副总裁 Jason Zander 告诉BBC,该科技巨头的使命之一是“将接下来的25年压缩成250年的科学发现”。 “我们认为这样的技术将帮助我们实现这一目标。我认为这是未来进行这类科学研究的方式,”他说。 锂的问题 锂常被称为“白金”,因其市场价值和银白色。它是电动汽车(EVs)到智能手机等一切设备中可充电电池(锂离子电池)的关键组成部分。 随着对该金属的需求激增,以及对电动汽车的需求上升,根据国际能源署的说法,世界可能在2025年就面临材料短缺。 美国能源部预计,到2030年,锂离子电池的需求量将增加十倍,因此制造商正在不断建设电池厂以跟上需求。 锂矿开采可能引起争议,因为它可能需要数年时间才能发展,对环境产生重大影响。提取这种金属需要大量的水和能源,这个过程可能在景观中留下巨大的疤痕,并产生有毒废物。 伦敦帝国理工学院化学系的电池研究团队负责人 Nuria Tapia-Ruiz 博士表示,任何含有较少锂并具有良好储能能力的材料都是锂离子电池行业的“圣杯”。 “AI和超级计算将成为电池研究人员在未来几年的关键工具,以帮助预测新的高性能材料,”她说。 但斯特拉斯克莱德大学化学工程学讲师 Edward Brightman 博士表示,这项技术需要“小心对待”。 “它可能会提出似是而非的结果,或者看起来很好的结果,然后被证明要么是已知的材料,要么是无法在实验室合成的材料,”他说。 这种AI衍生的材料,目前仅被称为N2116,是一种固态电解质,科学家已经将其从原材料测试到工作原型。 由于固态电池比传统的液体或凝胶状锂更安全,它有潜力成为一种可持续的能源储存解决方案。 在不久的将来,充电更快的固态锂电池承诺将具有更高的能量密度,并具有数千次的充电周期。 这种AI有何不同? 这项技术的工作方式是使用微软创建的一种新型AI,该AI经过分子数据训练,可以实际上解析化学。 “这种AI都是基于科学材料、数据库和属性,”Zander解释说。 “这些数据非常可靠,可用于科学发现。” 在软件缩减了18个候选者之后,PNNL的电池专家们接着审查了这些候选物质,并挑选了最终在实验室中工作的物质。 PNNL的 Karl Mueller 说,微软的AI洞察指引他们“比正常工作条件下更快地进入潜在的有益领域”。 “修改、测试并调整这种新材料的化学成分,并迅速评估其作为工作电池的技术可行性,展示了先进AI加速创新周期的潜力,”他说。
AI 魔镜,魔镜,告诉我,谁是世界上最美的人?
加拿大公司NuraLogix在2024年CES展会上展示了一款通过面部诊断疾病的新设备 —— “魔镜” Anura MagicMirror。《Rambler》引用CNET的报道这一消息。 这款设备是一面带有21.5英寸屏幕的台式镜子,配备了摄像头和其他传感器。它通过扫描人的面部来分析皮肤下血管中的血液流动。这是通过专利的透皮光学成像技术实现的。 机器学习算法根据获得的数据分析超过100种健康参数。 Anura MagicMirror能够提供关于血压、体质指数、心率变异性、脉搏率、呼吸率和面部皮肤年龄的信息。该设备还能提供糖尿病、心脏病、中风、高血压、脂肪肝等疾病的风险评估。Anura MagicMirror还提供心理健康风险评估,例如检测焦虑和抑郁的迹象。 扫描一张脸只需30秒,用户随后就可以收到潜在病理的信息。 该设备的发布日期和成本尚未公布。Anura MagicMirror很可能会被用于医院候诊室和养老院。
Nvidia 推出了一款新型芯片,专为在家中运行人工智能而设计。看来,Intel 和 AMD 这样的竞争对手也开始紧随其后了
去年 Nvidia 成为人工智能热潮的中心,原因是其昂贵的服务器图形处理器(例如 H100)对于训练和部署像OpenAI的ChatGPT这样的生成型AI至关重要。现在,Nvidia 正在发挥其在消费者GPU领域的优势,推广所谓的“本地”AI,这种AI可以在家庭或办公室的个人电脑或笔记本上运行。 Nvidia 在周一宣布了三款新的显卡 — RTX 4060 Super、RTX 4070 Ti Super 和 RTX 4080 Super,价格在599至999美元之间。这些显卡具有额外的“张量核心”,专为运行生成型AI应用程序设计。Nvidia 还将为Acer、Dell和Lenovo等公司的笔记本电脑提供显卡。 Nvidia 企业级GPU的需求激增,每个价格高达数万美元,通常以八个GPU一起工作的系统形式出现,这导致Nvidia整体销售额激增,市值超过1万亿美元。 对于个人电脑的GPU长期以来一直是Nvidia的主要产品,主要用于运行视频游戏,但公司表示,今年的显卡在运行AI模型时不需要将信息发送回云端,这方面已经有所改进。 公司表示,新的消费级图形芯片主要用于游戏,但仍然可以快速处理AI应用。例如,Nvidia 表示,RTX 4080 Super生成AI视频的速度比上一代型号快150%。公司最近宣布的其他软件改进将使大型语言模型处理的速度提高五倍。 Nvidia 的产品管理高级总监 Justin Walker 在新闻发布会上告诉记者:“随着1亿RTX GPU的出货,它们为强大的PC提供了大量安装基础,用于AI应用。” Nvidia 预计,在未来一年中将出现新的AI应用,以利用增加的计算能力。预计微软将在今年晚些时候发布新版本的Windows操作系统 — Windows 12,该系统将进一步利用AI芯片。 Walker表示,新芯片可用于在Adobe Photoshop的Firefly生成器上生成图像,或在视频通话中去除背景。Nvidia 也在创建工具,允许游戏开发者将生成型AI集成到他们的游戏中,例如,生成非玩家角色的对话。 在Edge与Server方面,Nvidia 本周的芯片公告显示,尽管它一直是与大型服务器GPU最相关的公司,但它也将与Intel、AMD和高通在本地AI领域竞争。这三家公司都已经宣布了将为所谓的“AI PC”提供动力的新芯片,这些芯片专门用于机器学习。 随着科技行业正在探索部署生成型AI的最佳方式,这成为Nvidia的举措的背景,这种AI需要大量的计算能力,并且在云服务上运行成本非常高。 微软和Nvidia的竞争对手正在推广的一种技术解决方案是所谓的“AI PC”或有时称为“边缘计算”。这种方式不是通过互联网使用强大的超级计算机,而是设备内部拥有更强大的AI芯片,它们可以运行所谓的大型语言模型或图像生成器,尽管会有一些权衡和缺陷。 Nvidia 提出的应用程序可以使用云模型来处理复杂问题,同时使用本地 AI模型来执行需要快速完成的任务。 Nvidia 的 Walker 说:“云中的Nvidia GPU可以运行非常大的大型语言模型,并使用所有那些处理能力来支持非常大的AI模型,同时,您PC中的RTX张量核心将运行更具延迟敏感性的AI应用。” 公司表示,新的显卡将符合出口管制规定,可以运送到中国,为无法获得Nvidia最强大的服务器GPU的中国研究人员和公司提供了一种选择。