Nvidia NIM was rolled out a long time ago, but I haven’t seen it in action yet. In the past few weeks, I’ve played with the OpenAI API and local LLMs. Out of curiosity, I want to see how Nvidia NIM works. This weekend, I tried calling the Llama model and Embedding model on Nvidia’s…
Author: aitrendtrackers@rengongzhineng.io
Meta MobileLLM
人工智能在未来面临巨大的威胁:能源限制。以当前的标准来看,世界能源电网将无法满足对人工智能产品的预期需求。因此,拥有强大的、参数少于十亿的小语言模型(SLMs),即比GPT-4或Claude 3小数千倍的模型,不仅是一个很好的选择,而且是这个领域生存的必要条件。Meta提出了各种算法创新来创建MobileLLM,这是一种新的最先进模型,可能很快成为这一规模的标准,并防止所有人工智能爱好者预见的伟大承诺最终成为空话。 人工智能在未来将面临许多问题,其中一个主要问题是能源供应。假设技术现状保持不变,我们可能很快面临真正的GPU短缺。NVIDIA未能满足大科技公司在资本支出方面的投资需求,导致了一次由资本支出驱动的GPU短缺。然而,未来可能会出现相对于需求的真正GPU短缺,一旦世界开始大量使用LLMs。根据Meta的数据,在一个大多数人每天仅使用LLMs 5%的未来,我们将需要一亿个NVIDIA H100 GPU来为GPT-4提供服务,以达到每秒50个令牌的可接受延迟。 此外,全球对人工智能的预期需求将导致更严重的能源问题。大多数人认为搜索增强的LLMs(长时间推理模型)是解决方案。这些LLMs在直接响应您的请求之前探索解决方案空间,生成多达数百万个可能的响应,然后才定下来。这种范式不仅使平均令牌生成增加了数量级,还可能需要验证者,即在作者寻找解决方案时验证每个想法的附加模型。 然而,边缘人工智能或“设备上”的语言模型可能是一个解决方案,因为这些模型可以在我们个人设备的电池上运行,从而不需要GPU数据中心。然而,这需要克服质量和电池方面的挑战。目前,最好的AI结果来自文件大小远超TB(太字节)范围的模型,而这些模型在智能手机上的存储和运行存在困难。此外,Meta研究人员计算,在0.1 J/令牌消耗的情况下,一个每秒输出10个令牌的LLM将在两小时内耗尽整个电池。 为了应对这些挑战,Meta提出了一些创新方法,例如在较小规模上使用标准的SwiGLU激活函数,并且优先选择更深的网络结构而不是更宽的。研究人员还提出了共享嵌入和解嵌层,以及分组查询注意力来减少KV缓存的约束。此外,他们发现通过重复块来减少内存层次之间的通信开销可以提高准确性。 总的来说,Meta的研究专注于务实,而不是追求AGI或超级智能等遥远的目标。尽管资本支出投资巨大,但实际收入却相形见绌。过分关注“达到AGI”不仅对资本的有效使用不利,而且在能源方面也不可行。Meta的工作表明,提供卓越性能的次十亿LLMs是人工智能领域的未来方向,这将有助于缓解对云服务的巨大需求,并防止能源危机。
OpenAI暂停对中国、香港和澳门的服务
OpenAI,这家运营生成式AI服务ChatGPT的公司,已经暂停了对中国、香港和澳门的服务。 背景 OpenAI通知中国用户,从7月9日起将阻止来自中国、香港和澳门的流量。这一消息由中国国家支持的《证券时报》报道。 生成式AI,如OpenAI的ChatGPT和百度的Ernie,可以生成文本、图像、音乐、计算机代码和其他内容,已经在生命科学、制造、运输、安全和电信等领域得到广泛应用。然而,批评者担心它可能会取代某些类型工作的工人,或不公平地使用人类生成的内容而不给予合理的补偿。 中国已发布指导方针,确保本土AI遵循政策,并且不会泄露来自互联网审查大防火墙外的信息。 脱钩 OpenAI的举动正值美国财政部寻求加强对流入中国科技行业的美国投资的监管,提议全面禁止美国公民和居民对中国的人工智能、量子计算和半导体制造领域的投资。 分析人士表示,这将加速中美两国之间的技术脱钩。OpenAI先进模型(如GPT-4)在中国市场的缺席可能会减缓尖端AI技术的采用和整合,特别是对较小的科技初创公司而言。然而,无法访问OpenAI的大型语言模型也可能会激发本土创新。 国内反应 阿里云对OpenAI的封锁作出反应,宣布其生成式AI平台“百联”将为中国的OpenAI前用户提供替代方案。而百度则推出了一个新套餐,允许前OpenAI用户免费迁移到其AI平台。 根据世界知识产权组织(WIPO)最近发布的数据,中国目前在生成式AI专利方面领先全球。过去十年间,中国提交了超过38,200项生成式AI专利,几乎是美国6,300项的六倍。 尽管如此,美国科技公司通常制造更前沿的AI系统。根据今年的AI指数,2023年美国机构推出了61个著名的机器学习模型,而欧盟推出了21个,中国则为15个。美国也在私营AI投资和新成立的AI初创公司数量上领先于中国,而中国在工业机器人方面领先。 展望 7月4日,中国国务院总理李强在上海的世界人工智能大会上呼吁全球合作和更加开放的心态,强调各国在AI技术、数据和市场上的优势,并呼吁共同合作。他还警告称,迅速发展的AI技术带来的风险需要国际社会的共同关注,并呼吁建立全球AI监管和技术标准。
观看机器人使用Gemini导航Google DeepMind办公室
生成式AI在机器人领域已经展现了巨大的潜力,应用包括自然语言互动、机器人学习、无代码编程甚至设计。谷歌的DeepMind Robotics团队本周展示了另一个潜在的结合点:导航。 在一篇题为《Mobility VLA: Multimodal Instruction Navigation with Long-Context VLMs and Topological Graphs》的论文中,团队展示了如何通过Google Gemini 1.5 Pro教机器人响应命令并在办公室中导航。DeepMind使用了一些自从去年谷歌在大规模裁员中关闭Every Day Robots项目后留下的机器人。 在项目附带的一系列视频中,DeepMind员工以智能助手风格的“OK, Robot”开场,随后要求系统在9,000平方英尺的办公室空间内执行不同的任务。 在一个示例中,一位谷歌员工要求机器人带他去一个可以画画的地方。机器人回答说:“好的,给我一分钟。正在用Gemini思考……”然后机器人带着穿着黄色领结的员工走向一面墙大小的白板。在另一段视频中,另一位员工让机器人按照白板上的指示行事。 一个简单的地图显示了机器人如何到达“蓝色区域”。机器人思考片刻后,带着员工绕了一条长路,最终到达了一个机器人测试区。机器人自信地宣布:“我已成功按照白板上的指示行事。” 在这些视频之前,机器人通过团队称为“Multimodal Instruction Navigation with demonstration Tours (MINT)”的方法熟悉了环境。这个方法实际上是带着机器人在办公室里走动,用语音指出不同的地标。接下来,团队利用层次化的视觉-语言-动作(VLA)方法,结合了环境理解和常识推理能力。一旦这些过程结合,机器人可以响应书面和绘制的命令,以及手势。 谷歌表示,在与员工进行的超过50次互动中,机器人有90%左右的成功率
OpenAI发布AI五级进化系统,揭示通向超越人类智力的路线图
OpenAI发布五级进化系统,跟踪AI超越人类的进展 OpenAI推出了一种五级评分系统,用于跟踪AI在超越人类智力方面的进展。 这意味着什么? OpenAI的新AI评分系统从“能聊天”到“能管理整个公司”: OpenAI认为他们几乎要升级到第二级了。他们已经在内部展示了一些可能符合条件的GPT-4新功能。 这个评分系统并非一成不变——他们会根据员工、投资者和董事会的反馈进行调整。 为什么这很重要? 如果你在家中关注“机器人是否接管世界”这个话题,这为你提供了OpenAI的路线图。它让你窥见了这家最大的AI公司如何看待通用人工智能(AGI)的发展路径。 Anthropic也有自己的框架,称为AI安全等级(ASL),分为三个级别,但它更侧重于安全性(而不是一般能力)。
AI革命:药物发现和开发的新纪元
AI正在改变药物发现和开发的革命 “我们希望将药物发现产业化,”Recursion公司AI和数字科学高级副总裁Imran Haque表示。Recursion成立于2013年,总部位于犹他州盐湖城。公司的愿景是通过AI支持的大规模数据来推动更多药物发现项目。 “我们知道许多[药物候选者]可能不起作用,但[AI将使我们]尽早识别这些失败,”他解释道。 AI的影响 Haque并不是唯一一个认识到AI变革性的人物。Lantern Pharma的首席执行官Panna Sharma也认为,“这将对整个发现和开发链产生巨大影响”。Lantern Pharma是一家位于德克萨斯州的临床阶段肿瘤生物技术公司,使用AI和基因组学创新精准癌症治疗方法。 目前还没有基于AI工具的获批药物,但随着许多AI药物发现公司的管线进入临床试验,突破即将到来。 连接新发现 制药行业已经成功使用计算机和数学模型来识别和设计新药物几十年,但生成式AI——基于深度神经网络和大型语言模型,能够理解和生成文本——带来了巨大变化。 Benevolent AI的首席科学官Anne Phelan解释道:“基于提供的信息,[AI模型]几乎能够思考并提出以前未知的东西。”Benevolent AI成立于2013年,总部位于伦敦,是AI增强药物发现的先驱之一。 许多公司使用AI提供新目标的路径,允许他们做出新的推论和连接。Benevolent AI最近宣布其BEN-8744在Ia期试验中取得了积极的安全数据,这是一种口服磷酸二酯酶10(PDE10)抑制剂,正在开发用于治疗中重度溃疡性结肠炎。 Benevolent的平台将临床和化学数据库中的结构化数据与科学文献中的非结构化数据连接起来。Phelan表示,这给了他们“一团巨大的互联事实”,对于人类来说“太快无法导航”。 “非结构化数据通常是书面文本,我们开发了许多自然语言处理能力,训练了许多非常科学的词典,可以读取书面文本并进行解释,”她解释道。 Benevolent使用这一过程识别PDE10作为溃疡性结肠炎的新目标。“在现有的生物医学文献中没有明确指出PDE10对溃疡性结肠炎有用,”Phelan说。但Benevolent的平台能够将目标在调节炎症和肠道离子通道中的作用信息联系起来,做出新的推论。 “即使所有这些外围信息存在,没有人真正将其汇集在一起……我们能够跨越整个生物医学数据。” 精准肿瘤学 AI在研究和开发中的早期应用之一是重新利用现有药物,被认为是“低垂的果实”。例如,Recursion的当前管线包括三种用于罕见疾病的重新利用药物——两种肿瘤药物和一种超氧化物清除剂——在II期临床试验中。然而,公司现在已经转向肿瘤药物。2023年,Recursion与AI支持的精准医学专家Tempus签署了合作协议,使Recursion能够访问Tempus的去身份化患者中心肿瘤数据集,包括DNA、RNA和健康记录,并结合其自己从基因敲除调查中生成的体外数据。这样,Recursion能够训练其AI模型发现新的肿瘤生物标志物和目标。 Lantern Pharma也选择专注于精准肿瘤学。这个疾病领域具有吸引力,因为已经生成了大量数据,可以用来训练AI模型以指导决策,这比其他疾病领域的数据更多,Sharma说。 Lantern的AI平台——‘药物重新定位和救援反应算法’(RADR)——目前拥有超过600亿个专注于肿瘤学的数据点,预计到2024年将进一步增长到1000亿。这些数据来自内部和已发表的研究、临床试验和公共存储库,并由Lantern的200多个高级机器学习算法库分析,以预测患者对药物候选者的反应。 新分子开发 Benevolent还利用其AI能力加速新分子开发,使用算法来模拟和预测蛋白质中的结合口袋。这种方法用于开发其PDE10抑制剂BEN-8744,因为现有的用于验证目标的抑制剂会渗透到大脑中,可能产生不良副作用。Benevolent能够迅速设计出一种具有选择性但周围受限的强效替代分子。“我们从将这个项目引入我们的投资组合到交付临床质量候选者仅用了两年时间,”Phelan说。“下一步将是将其推向患者。” Recursion采用不同的方法来发现药物,基于其AI驱动的成像技术创建所谓的“生物学地图”。其1536孔高通量系统可以从人类细胞测定中收集显微图像,探测在不同基因被敲除或添加不同化合物时的变化。“然后我们字面上拍照,看看它们在疾病状态与健康状态下是否看起来不同,以及我们的化合物是否让它们看起来更健康,”Haque解释道。 该公司然后将图像输入其内部训练的AI模型,以提取指示样本间生物差异的特征。目前,该系统可以在每个图像中识别出1000种不同的特征。“这被证明是一种非常强大的能力,”Haque说,这是其同时推出数百种药物管线的基础。 未来展望 虽然AI在药物发现中的应用还在发展,但其潜力巨大。通过减少早期发现的时间和成本,提高临床试验阶段的成功率,AI有望彻底改变药物发现和开发流程,为患者带来更好的结果,并在开发未来药物中发挥关键作用。 总结 尽管面临许多挑战,AI在药物发现和开发中的应用正在逐步显现其巨大潜力。通过加速新药开发过程,减少成本,并提高成功率,AI正成为制药行业不可或缺的工具,推动药物发现进入新时代。
生成式AI推动药物发现革命:加速开发,降低成本
生成式AI推动药物发现革命:加速开发过程,降低成本 基于大型语言模型(LLMs)的生成式AI技术,正彻底改变多个行业,包括药物发现领域。通过利用AI解码和操作生物和化学语言,制药公司如今可以更快、更经济地开发新药。本文将探讨生成式AI如何转变药物发现,加速开发过程并降低成本。 生成式AI在药物发现中的作用 生成式AI传统上与理解和生成人类语言相关,但其潜力远不止于此,还包括生物和化学的复杂语言。例如,人类DNA可以被视为一个由30亿个字母组成的独特语言。蛋白质是生命的构建模块,其字母表由20种氨基酸组成。化学物质使用简化分子输入行表示法(SMILES)定义其结构。 生成式AI能够解释这些语言,帮助发现和开发新药疗法。通过将LLM类型的方法应用于这些生物和化学语言,AI模型可以揭示以前无法观察到的见解,加快药物发现过程并显著降低成本。考虑到新药疗法的高失败率——只有10%在临床试验中成功——任何提高效率、减少时间和成本的技术都具有高度价值。 在每个阶段增加价值 生成式AI可以应用于药物发现的各个阶段: 生成式AI使制药公司能够以前所未有的规模、速度和准确性探索潜在的新药物,加快进入临床试验的进程。 AI在药物开发中的案例研究 多家公司在利用生成式AI进行药物发现方面处于领先地位。一个值得注意的例子是Insilico Medicine,该公司使用AI开发了一种用于特发性肺纤维化的药物,这是一种导致肺功能逐渐衰退的罕见疾病。传统上,这个过程需要六年时间和超过4亿美元的成本。通过生成式AI,Insilico将成本降低到十分之一,时间缩短到两年半。 Insilico的AI在药物发现的每一步都发挥了作用:识别靶标分子、生成新的药物候选物,并预测临床试验结果。他们的成功还包括开发一种对所有变种有效的AI生成的COVID-19药物,并启动了超过30个其他项目,针对包括癌症在内的各种疾病。 药物开发的未来 生成式AI对药物发现的影响是革命性的。它承诺以更低的成本更快地治愈多种疾病。凭借AI解码复杂生物和化学语言的能力,可以预见一个新药开发更快、更高效且成功率更高的未来。生成式AI不仅是技术进步,更是医疗保健的颠覆性变革,承诺为全球患者带来更好的结果,并在开发未来药物中发挥关键作用。
新HIV预防药物临床试验取得突破:半年注射一次实现100%保护
新HIV预防药物临床试验取得重大突破:每半年注射一次可实现100%保护 在南非和乌干达进行的大规模临床试验显示,一种新的预防性药物(PrEP)每半年注射一次,可以让年轻女性完全免受HIV感染。 试验背景和目标 这项名为Purpose 1的试验涉及5,000名参与者,在乌干达的3个地点和南非的25个地点进行,旨在测试lenacapavir(Len LA)与另外两种每日口服的药物相比,在预防HIV感染方面的效果。 Lenacapavir是一种融合壳体抑制剂,通过干扰HIV的壳体(保护HIV遗传物质和复制所需酶的蛋白质外壳)来发挥作用。它每六个月皮下注射一次。试验由药物开发商Gilead Sciences赞助,采用随机对照试验方法,测试了以下几个方面: 试验分为三组,以2:2:1的比例将年轻女性随机分配到Len LA、F/TAF口服和F/TDF口服组,采用双盲方式进行,即参与者和研究人员在试验结束前都不知道参与者接受了哪种治疗。 试验结果 在试验的随机阶段,接受Lenacapavir注射的2,134名女性中没有一人感染HIV,显示出100%的有效性。相比之下,服用Truvada(F/TDF)的1,068名女性中有16人(约1.5%)感染HIV,而服用Descovy(F/TAF)的2,136名女性中有39人(约1.8%)感染HIV。 试验的意义 这一突破为HIV预防提供了一种高度有效的新工具。去年全球有130万新发HIV感染病例,尽管比2010年的200万有所减少,但按照目前的速度,很难实现联合国艾滋病规划署(UNAIDS)设定的2025年全球新发感染少于50万的目标,更不用说2030年结束艾滋病的目标。 PrEP并不是唯一的预防工具,应与HIV自我检测、避孕套使用、性传播感染的筛查和治疗以及育龄女性的避孕措施等结合使用。此外,还应为年轻男性提供健康原因的医学包皮环切术。 下一步计划 Purpose 1试验将继续进行,但将进入“开放标签”阶段,参与者将被告知他们属于哪一组,并可以选择他们更喜欢的PrEP方法。 药物推广时间表 Gilead Sciences表示将在未来几个月内向多个国家的监管机构提交所有结果,特别是乌干达和南非的监管机构。世界卫生组织(WHO)也将审查数据,并可能发布建议。 希望这种新药物能被纳入WHO和各国的指南,并在更多的研究中进行测试,以了解如何在现实环境中整合使用。价格是确保在公共部门获得和分发的关键因素。Gilead Sciences表示将向生产仿制药的公司提供许可证,这是降低价格的关键途径。 在理想的情况下,政府将能够以可负担的价格购买这种药物,并向所有需要HIV保护的人提供。
AWS推出生成式AI驱动的App Studio:简化企业级应用开发
AWS推出App Studio:生成式AI助力企业级应用开发 在AWS Summit纽约站,亚马逊旗下的Amazon Web Services, Inc.(NASDAQ: AMZN)宣布推出AWS App Studio。这是一项由生成式人工智能(AI)驱动的服务,使用自然语言即可创建企业级应用程序。用户只需描述所需应用、功能以及要集成的数据源,App Studio便能在几分钟内构建出一个专业开发者可能需要数天才能从零开始完成的应用。 功能与特点 AWS App Studio通过其点击式界面简化了应用的修改过程,用户还可以通过生成式AI助手获得即时任务指导。App Studio为没有软件开发技能的技术专业人员(如IT项目经理、数据工程师和企业架构师)打开了应用开发的大门,使他们能够快速构建由AWS安全管理的内部应用,免除了操作方面的复杂性。 背景与需求 每个公司都有内部流程和活动,这些需要员工每日管理以保持运营。例如,医院采购团队需要跟踪医疗用品的库存,广告公司的客户主管在设计、审查和批准广告时需要遵循特定工作流程,物业管理人员需要监控房屋库存和租赁维修需求。这些流程通常通过电子表格和文档管理,费时费力,容易出错且难以扩展。 尽管定制应用可以大大提高效率,但开发资源稀缺,导致许多内部应用无法实现。当前的低代码工具往往学习曲线陡峭,需要特定平台知识,且开发出的应用常无法满足公司的安全要求,导致IT部门关闭这些应用。使用量增加时,这些应用也难以扩展,用户不得不将托管和运行应用的任务交给公司的开发团队。 AWS App Studio的优势 AWS App Studio是构建企业级应用的最快捷方法,适用于有一定技术经验的人群。其生成式AI助手消除了典型低代码工具的学习曲线,加快了应用创建过程,并简化了用户界面设计、工作流构建和应用测试等常见任务。用户只需通过下拉菜单识别公司需要连接的数据源,并编写简单的提示,如“创建一个用于跨店铺跟踪库存的应用”,App Studio便会生成一个多页面用户界面、数据模型和业务逻辑的应用大纲。 具体案例与用户评价 Campus Life & Style的国家收入经理Scott Puntenney表示,通过App Studio,两人团队能为150人团队构建一个完整的应用,简化数据输入、管理和报告流程,提高市场调研效率,并减少手动数据输入相关的人为错误。Deloitte的US AWS联盟领导者JB McGinnis指出,App Studio帮助技术员工在几分钟内构建安全、可扩展的应用,简化任务并提高运营效率。HealthVerity的工程副总裁Jeremy Stewart提到,App Studio让公司首次能够利用低代码工具,节省开发资源,并专注于面向客户的项目。 总结 AWS App Studio为新一代应用开发者提供了强大的工具,使他们能够用自然语言快速创建和部署企业级应用。通过生成式AI和全面管理的安全性,App Studio消除了传统低代码工具的局限,促进了业务创新和生产力提升。AWS App Studio现已在美国西部(俄勒冈州)地区预览发布,欢迎用户前往aws.amazon.com/app-studio了解更多信息。
三星新品发布:四大Google更新即将登陆Galaxy设备
今天在Galaxy Unpacked发布会上,宣布了即将为三星最新设备推出的四项Google更新,包括Galaxy Z Flip6、Z Fold6和最新的Galaxy手表。以下是一些亮点: 在新的Galaxy Z系列中,Gemini将基于屏幕内容提供相关建议。只需滑动屏幕角落或说“Hey Google”即可调出Gemini。如果用户正在观看YouTube视频,屏幕上会出现“询问关于此视频”的建议。特别是在大屏幕的Galaxy Z Fold6上,用户可以在观看视频时调出Gemini进行分屏操作,实现多任务处理。 目前,Android版Gemini应用支持29种语言,覆盖超过200个国家。这些在Galaxy系列上的更新将在未来几个月内推出。 Circle to Search功能也支持平板电脑和折叠设备,如三星Galaxy Z Fold6和Flip6,并将在今年晚些时候推广到更多三星设备上。 Google与三星持续合作,将最新的更新带到Galaxy产品上,从智能手机到可穿戴设备,甚至是未来的XR平台等新技术。请查看今天在Galaxy Unpacked上宣布的所有内容。