在每个植物、动物和人类细胞内部,都有数十亿个分子机器。它们由蛋白质、DNA 等分子构成,但没有任何单一成分是独立运作的。只有了解这些分子如何在数百万种组合中相互作用,才能真正理解生命的运作过程。 近期发布在《Nature》杂志上的一篇论文中,我们介绍了 AlphaFold 3,这是一种革命性的模型,能够以前所未有的精确度预测所有生命分子的结构和相互作用。在预测蛋白质与其他分子类型的相互作用时,与现有预测方法相比,我们至少提高了 50% 的准确度,而在一些关键的交互类型上,预测准确性翻了一倍。 我们希望 AlphaFold 3 能够帮助我们更深入地了解生物世界并推动药物发现。科学家可以通过我们新推出的 AlphaFold 服务器免费使用其大部分功能,这是一个易于使用的研究工具。为了进一步开发 AlphaFold 3 在药物设计方面的潜力,Isomorphic Labs 正与制药公司合作,将其应用于现实世界的药物设计挑战,最终为患者开发出改变生命的新疗法。 我们新的模型基于 2020 年取得蛋白质结构预测突破的 AlphaFold 2。目前,全球数百万研究人员已利用 AlphaFold 2 在疟疾疫苗、癌症治疗和酶设计等领域取得了新发现。AlphaFold 已被引用超过 2 万次,其科学影响力也通过多项奖项得到了认可,最近还获得了生命科学突破奖。AlphaFold 3 进一步拓展了预测范围,不再局限于蛋白质,而是包含广泛的生物分子类型。这样的进步可能会带来更多科学变革,例如开发可再生材料、更具抗逆性的作物,以及加速药物设计和基因组学研究。 AlphaFold 3 如何揭示生命分子结构 通过一组输入的分子列表,AlphaFold 3 可以生成这些分子的三维结构,展示它们如何组合在一起。它可以对大型生物分子(如蛋白质、DNA 和 RNA)以及被称为配体的小型分子进行建模,配体包含许多药物常用的分子。此外,AlphaFold 3 还能够模拟这些分子的化学修饰,它们调控细胞的健康功能,一旦被扰乱就可能导致疾病。 AlphaFold 3 的强大能力来源于其下一代架构和涵盖所有生命分子的训练。模型的核心是改进版的 Evoformer 模块——这是 AlphaFold 2 能取得非凡成就的深度学习架构。在处理输入数据后,AlphaFold 3 使用扩散网络来组装预测结构,类似于 AI 图像生成器中的扩散过程。该过程从原子云开始,经过多步收敛到最终的、最准确的分子结构。 AlphaFold 3…
Author: aitrendtrackers@rengongzhineng.io
微软和领英发布了有关工作中 AI 现状的《2024 年工作趋势指数》报告。
微软与领英于周三发布了《2024 年工作趋势指数》报告,标题为“AI 工作已到来,现在迎接真正的挑战。”这份联合报告基于对 31 个国家的 31,000 人的调查、领英的劳动力和招聘趋势、微软 365 的生产力数据,以及对财富 500 强客户的研究,详细展示了 AI 在过去一年里如何影响全球工作、领导力和招聘方式。微软还宣布了 Microsoft 365 Copilot 的新功能,而领英也为 Premium 用户提供了超过 50 门免费的 AI 学习课程,旨在帮助各级专业人士提升他们的 AI 技能。 2024 年,AI 将真正影响工作: AI 提升标准并打破职业瓶颈: AI 重度用户的崛起: 领英首席执行官 Ryan Roslansky 表示:“AI 正在重新定义工作,显然我们需要新的行动计划。构建灵活性而非稳定性,并在内部投资技能建设的领导者,将为组织带来竞争优势,打造更高效、积极和公平的团队。” 有关更多信息,可以访问微软官方博客、《2024 年工作趋势指数》报告,以及领英首席经济学家 Karin Kimbrough 的进一步见解。 https://www.microsoft.com/en-us/worklab/work-trend-index/ai-at-work-is-here-now-comes-the-hard-part
苹果在最新的 iPad 中推出了“极其强大的 AI 芯片”
苹果公司推出了配备“M4”芯片的新款 iPad,标志着这家硅谷巨头愈加专注于人工智能服务。最新的 iPad Pro 设备于周二发布,距离 10 月推出搭载 M3 芯片的 Mac 设备仅数月之遥。 为了满足 AI 开发者对计算能力的旺盛需求,苹果、英伟达等大型科技公司正加快研发强大的处理器,旨在处理海量数据。在过去的几个月中,微软、亚马逊和谷歌都推出了面向 AI 的新处理器,凸显了芯片设计对全球顶级科技公司的重要性。 苹果平台架构副总裁 Tim Millet 在周二的发布会上赞扬了 M4 芯片的中央处理器、图形处理器和专用 AI 功能(称为“神经引擎”)的结合,相较于之前的芯片取得了重大进步。他表示,这些组件使 M4 成为“AI 领域极其强大的芯片”。 随着 iPhone 销量下滑,投资者敦促苹果推出新的 AI 功能,与微软支持的 OpenAI 和谷歌竞争。自 OpenAI 18 个月前推出革命性 ChatGPT 聊天机器人以来,新 AI 应用程序的激增引发了一场争夺强大处理器的竞赛,以构建所谓的大型语言模型——即能够生成类似人类文本和图像的 AI 系统。 苹果自 2010 年起就为 iPhone 设计基于 Arm 的处理器,并在 2020 年推出了首款用于 Mac 计算机的 M1…
RAFT:引领 Llama 在 RAG 中发展
引言 经过广泛训练的预训练模型(如 Meta Llama 2)可以对各种问题生成有用的回答。然而,许多应用场景要求模型针对特定领域进行专业化,并在生成回答时利用领域特定的信息。 目前有两种方法可以实现: 1. 领域特定的监督微调(DSF): 在一组代表领域知识的文档上对现有基础模型进行训练。 2. 检索增强生成(RAG): 将这些文档存储在向量数据库中,在查询时检索与问题语义相似的文档,并将其内容作为 LLM 生成回答的上下文。 本文将探讨这两种方法的局限性,并介绍加州大学伯克利分校的研究人员 Tianjun Zhang 和 Shishir G. Patil 提出的一种更优方法。他们提出的 RAFT 方法(Retrieval Augmented Fine Tuning,检索增强微调)在论文中详细阐述,展示了如何使用 Meta Llama 2 和 Azure AI Studio 上的 MaaS 进行研究和实施。 伯克利团队还发表了一篇博客文章,详细解释了前述方法的优缺点,以及 RAFT 方法如何实现更高效的结果。其 RAFT 实现已在 GitHub 仓库公开。 了解 RAFT 方法 在传统 RAG 中,当模型接到查询时,它会从索引中检索可能包含答案的文档,并使用这些文档的内容作为生成回答的上下文。 在微调的情况下,模型回答问题类似于学生在闭卷考试中作答;而 RAG 则类似于学生参加开卷考试,有完整的教科书可供查阅。开卷考试比闭卷考试更容易,因此 RAG…
微软 AI 研究团队推出 SIGMA:一个开源研究平台,旨在推动混合现实与人工智能交叉领域的研究与创新
生成式 AI、超大型语言模型、视觉模型和多模态模型的突破,为开放领域知识、推理和生成能力奠定了基础,能够支持开放式任务辅助场景。这不仅包括生成相关指令和内容,还为构建能与人类在现实世界中合作的 AI 系统提供了起点。这类应用包括混合现实任务助手、交互机器人、智能制造工厂、自动驾驶车辆等。 为了与人类无缝合作,AI 系统必须能够在多模态流中持续感知和推理其周围环境。这一要求不仅限于目标检测和追踪。为了实现有效的团队合作,所有参与者都必须了解物体的潜在功能、它们之间的关系、空间限制,以及这些因素随时间的变化。 这些系统不仅需要对物理世界进行推理,还需要理解人类行为。推理中应包括对实时协作行为的认知状态和社会规范的判断,并且还需涵盖对身体姿势、声音和动作的低级判断。 借助混合现实和 AI 技术(如大型语言和视觉模型)的组合,微软研究院推出了 SIGMA。这款互动程序可使用 HoloLens 2 指导用户完成流程任务。任务可以由大型语言模型(如 GPT-4)或任务库中手动定义的阶段动态生成。当用户在互动过程中提出开放式问题时,SIGMA 可以利用其强大的语言模型提供答案。此外,SIGMA 可以利用 Detic 和 SEEM 等视觉模型,在用户视野中定位并突出显示与任务相关的物体。 SIGMA 选择了几种设计方式来实现其研究目标。一个例子是客户端-服务器架构。HoloLens 2 设备运行轻量级客户端应用程序,将多个多模态数据流传输到更强大的桌面服务器。这些数据流包括 RGB(红、绿、蓝)、深度、音频、头部、手部和视线追踪信息。桌面服务器将数据和指令传送给客户端应用程序,以便在设备上显示内容,并执行应用程序的基本功能。通过这种设计,研究人员能够超越头戴设备当前的计算限制,并为将该程序扩展到其他混合现实设备打开了可能性。 SIGMA 的基础是名为 Platform for Situated Intelligence(psi)的开源架构,该架构支持多模态综合性 AI 系统的开发和研究。psi 框架提供高性能流媒体和日志基础设施,并允许快速原型制作。数据重放基础设施使数据驱动的应用级开发和调试成为可能。Platform for Situated Intelligence Studio 提供了丰富的可视化、调试、优化和维护支持。 虽然 SIGMA 目前的功能还不够完善,但它为未来混合现实与人工智能融合的研究奠定了基础。许多研究主题,特别是感知,可以使用收集的数据集进行探索,这些问题包括计算机视觉和语音识别。 SIGMA 是微软对该领域持续投入的一个例子,也是该公司探索新型人工智能和混合现实技术的代表。Dynamics 365 Guides 是微软为一线员工提供的另一款企业级混合现实解决方案。客户可以在 Copilot in Dynamics 365 Guides 中使用私有预览功能,获得逐步操作指导和工作流程相关信息。AI…
Quora 首席执行官亚当·德安杰洛 (Adam D’Angelo) 谈论了 AI、聊天机器人平台 Poe,以及 OpenAI 为什么不是竞争对手
去年 11 月,亚当·德安杰洛 (Adam D’Angelo) 置身于科技行业最具争议事件的中心。OpenAI,这家估值 800 亿美元、引领 AI 潮流的初创公司,在董事会突然罢免其首席执行官 Sam Altman 后,仅在几天后又重新任命他。德安杰洛在罢免 Altman 的董事会中任职,并且在重新任命他的过程中依然保留了自己的席位。在后续的重组中,原始董事会成员多数离开,他成为唯一留下的成员。 这段时间对 OpenAI 来说显然充满动荡,对德安杰洛来说更是如此,因为此事发生的同时,他的公司 Quora 正在积极进军 AI 领域。 由德安杰洛共同创立并担任首席执行官的 Quora 是一家众包问答网站,在筹集到 7500 万美元(PitchBook 估值 4.25 亿美元)资金的同时,正在构建自己的 AI 平台。2023 年 2 月,该公司推出了 Poe(开放探索平台的缩写),它允许用户向各种聊天机器人提问并交流,让开发者构建自己的机器人,并提供类似 OpenAI GPT 商店的机器人货币化计划和市场。 Quora 的核心问答服务也面临着一些重要问题。谷歌和必应等现有搜索引擎开始使用 AI 提供更流畅的搜索结果和答案,再加上 ChatGPT 和 Perplexity 等工具广泛普及,Quora 能做些什么来确保自己仍然是人们寻找答案的顶尖网站之一?更重要的是,是否还有人真正想要或需要众包问答服务? 对于德安杰洛来说,这些问题与他对 AI 的追求密切相关,他将 AI 视为一种重要工具,能够利用互联网的集体知识。多年来,德安杰洛一直在努力发掘互联网知识储备。他在高中时结识了马克·扎克伯格 (Mark Zuckerberg),并在…
Stack Overflow 与 OpenAI 携手合作,共同增强全球最受欢迎的大型语言模型
Stack Overflow 与 OpenAI 今天宣布了一个全新的 API 合作伙伴关系,将全球领先的技术内容知识平台与最受欢迎的 AI 开发大型语言模型(LLM)相结合,为开发人员提供更强大的支持。 通过这次合作,OpenAI 用户和客户将能够通过 OverflowAPI 获取经过验证的技术数据,以快速解决问题,使技术人员能够专注于优先任务。OpenAI 也将直接在 ChatGPT 中提供 Stack Overflow 上经过验证的技术知识,为用户提供可信、准确且技术性很强的知识和代码。这些信息得益于过去 15 年间在 Stack Overflow 平台上贡献内容的数百万开发者的支持。合作的具体内容包括: OpenAI 首席运营官 Brad Lightcap 表示:“尽可能多地从不同语言、文化、学科和行业中学习,确保我们的模型能够为每个人服务。开发者社区对我们双方都尤为重要。与 Stack Overflow 的深度合作将有助于我们增强双方平台的用户和开发者体验。” Stack Overflow 首席执行官 Prashanth Chandrasekar 补充道:“Stack Overflow 拥有超过 5900 万个问题和答案,是全球最大的开发者社区。通过这次与 OpenAI 的行业领先合作伙伴关系,我们力图重新定义开发者体验,通过社区的力量、顶级数据和 AI 体验来促进效率和协作。我们的 OverflowAPI 和致力于推进负责任 AI 时代的工作目标,是利用经过验证、可信和准确的数据来设立新标准,作为构建技术解决方案的基础。” Stack Overflow 与 OpenAI 之间的首批新集成和功能将于…
微软正在自主构建一个名为 MAI-1 的大型语言模型(不依赖 OpenAI)
据《The Information》报道,微软正致力于打造一个新的大规模 AI 语言模型,名为 MAI-1,有望与谷歌、Anthropic 和 OpenAI 等公司的最先进模型一较高下。这是微软自投资 OpenAI 10 亿美元获取其 AI 模型使用权以来首次自主开发如此规模的 AI 模型。OpenAI 的 GPT-4 不仅为 ChatGPT 提供动力,还驱动了微软的 Copilot 功能。 DeepMind 联合创始人 Mustafa Suleyman 将领导微软的新消费者 AI 部门。 该项目由前 Google AI 高层、曾担任 AI 创企 Inflection 首席执行官的 Mustafa Suleyman 负责。微软于 3 月以 6.5 亿美元的价格收购了该初创公司的大部分员工和知识产权。虽然 MAI-1 或许借鉴了 Inflection 团队带来的技术,但据两位了解项目的微软员工表示,MAI-1 是全新的大型语言模型(LLM)。 拥有大约 5000 亿参数的 MAI-1,将比微软以往的开源模型(如上个月报道的 Phi-3)规模更大,因而需要更多计算能力和训练数据。据报道,MAI-1 与传闻中拥有超过…
X 推出 Stories 功能,由 Grok AI 生成新闻摘要
X(原推特)现在利用 Elon Musk 的 AI 聊天机器人 Grok 为其 Explore 部分的个性化热门故事提供摘要功能。根据 X 工程团队周五发布的公告和截图,X 的高级订阅用户将能够查看 Explore 中 For You 页面每个热门故事的相关帖子摘要。 For You 页面展示用户网络中的热门新闻和故事,并提供其他推荐内容。它是 X 用户想快速了解平台上讨论内容的首选,无需长时间滚动时间线。 举个例子,TechCrunch 的读者在 For You 页面可能会看到有关苹果即将举行的 iPad 活动、微软的安全改革以及 AI 工程师倦怠的故事。当你点击查看各个故事的相关帖子时,页面顶部会出现一个由 Grok 提供的故事摘要,概述该主题。 例如,在有关 AI 倦怠的故事中,Grok 摘要开篇指出:“AI 工程师正面临倦怠和仓促发布的情况,因为科技行业的竞争加剧导致公司优先考虑投资者满意度,而不是解决实际问题。” 在简单提及 AI “内卷”的问题后,故事总结指出“批评者认为,在追求 AI 投资时,适当的保障措施和创新不应成为事后的考虑。” 搞笑的是,摘要下方会显示一条信息:“Grok 可能会出错,请核实其输出。” 这种趋势总结的想法并不新鲜,但使用 AI 聊天机器人来处理摘要则是新的。此前,Twitter 于 2020 年开始为其趋势增加标题和描述,但未借助 AI 机器人,而是由 Twitter…
开源模型 Prometheus 2 能够评估其他语言模型,其效果几乎与 GPT-4 相当
Prometheus 2 是一款开源的语言模型,经过优化能够评估其他语言模型的表现,逐渐与 GPT-4 等商业模型相媲美。 这种评估方式为研究人员和开发者提供了客观的测量标准,并能够针对模型的优缺点提供详细反馈,以实现精准改进,进而不断提升语言模型的质量与可靠性。 目前,像 GPT-4 这样的专有模型通常被用于评估,但因其封闭性、不易控制和价格高昂,使许多人望而却步。韩国 KAIST AI 的金承元团队打造了 Prometheus 2,旨在为大家提供透明、独立、详细的语言模型评估工具。 Prometheus 2 模仿人类和 GPT-4 等模型,掌握了两种常用的评估方法:直接评估(使用评分量表打分)和成对比较(判断两个回答中哪个更优)。 定制评估标准,灵活应用 Prometheus 2 支持根据用户定义的标准进行评估,不局限于“有用性”“无害性”等通用指标,使其可以满足特定应用的优化需求。举例来说,在医疗咨询聊天机器人领域,它可以被用于考量“可信度”“共情力”和“专业准确度”等标准,从而开发出适合不同应用场景的高质量语言模型。 新数据集与混合权重 为了训练 Prometheus 2,研究团队创建了一个名为 “Preference Collection” 的全新成对比较数据集,涵盖超过 1000 种不同的评估标准。最佳效果来自于两个独立模型的联合训练:直接评分模型基于 Feedback Collection 数据集,成对比较模型则基于 Preference Collection 数据集。通过将这两个模型的权重合并,达到了最佳评估效果。 在包含四个直接评分数据集和四个成对比较数据集的测试中,Prometheus 2 在所有可用的评估模型中,显示出与人类判断和商业语言模型最为一致的结果。 虽然在许多测试中落后于 GPT-4 和 Claude 3 Opus,但 Prometheus 2 成功缩小了与这些商业模型之间的差距。 公平与透明的评估工具 Prometheus 2 的代码与数据都已开放至 GitHub…