aitrendtrackers@rengongzhineng.io, Author at AI TrendTrackers

OpenAI发布HealthBench：推动医疗人工智能模型评估迈向临床真实世界

Posted on May 13, 2025May 13, 2025 by aitrendtrackers@rengongzhineng.io

2025年5月12日，OpenAI正式发布一项全新的医疗人工智能评估基准：HealthBench (https://github.com/openai/simple-evals)，该项目旨在评估大型语言模型（LLMs）在真实医疗环境中的性能表现。相较于此前以考试题型或结构化问题为主的医学基准，HealthBench的独特之处在于其构建方式更贴近现实使用场景，强调多轮对话、临床语境、多语言支持与医生专家参与的评分标准。这一基准标志着医疗AI评估方法的根本性转变，或将为医疗辅助决策系统和健康信息平台的开发提供更加稳健的测试框架。医疗AI的评估为何需要更新？长期以来，用于评估医疗AI的基准多集中在标准化考试（如USMLE）或单轮问答任务上。然而，这些方法无法真实反映用户与AI系统之间的复杂互动流程，特别是在实际应用中用户常以自然语言提出不清晰、带有情感或背景模糊的问题。OpenAI指出，如果评估模型仅仅依赖单一问答或静态题库，其结果并不足以反映模型在现实健康咨询中的可靠性、准确性和适应能力。因此，HealthBench在构建过程中广泛采集真实多轮医疗对话，并引入医生主导的评分机制，模拟模型在诊所、远程咨询、医疗助手等情境下的真实任务表现。 HealthBench的五大核心组成推动开放研究与协作为了促进医疗人工智能研究的可重复性与开放性，OpenAI已将HealthBench的全部数据、评分系统与测试接口开放至GitHub（开源地址已附在官方公告中）。研究人员和开发者可以使用这一平台：同时，HealthBench也支持未来新模型的持续评估更新，有望成为医疗AI领域的长期标准之一。医疗AI的未来：潜力与责任并存 OpenAI在公告中特别指出，尽管当前模型已在多个医疗任务中表现接近专业水准，但真正进入临床应用仍需解决三个关键问题：总结 HealthBench 的发布，不仅是AI模型评估方法的一次飞跃，更是OpenAI在推动“安全、有益人工智能”愿景中的又一实际步骤。通过将模型放置在真实世界的医疗对话环境中，并由全球医生集体制定标准，OpenAI 希望打造一个更加现实、透明和可持续的医疗AI评估框架。未来，随着AI系统在医疗领域的进一步拓展，HealthBench将成为衡量“AI是否真正对人类健康有益”的重要参考尺度。

Gemini 2.5 推动视频理解进入新时代

Posted on May 13, 2025 by aitrendtrackers@rengongzhineng.io

Google 近期发布了两款全新 Gemini 模型：Gemini 2.5 Pro Preview（5月6日）和 Gemini 2.5 Flash（4月17日）。这两款模型标志着视频理解技术的一次重大飞跃。Gemini 2.5 Pro 在多个关键视频理解基准测试中取得了最先进的性能（SOTA），在相同测试条件下（使用相同的提示词和视频帧）超越了包括 GPT-4.1 在内的近期模型。此外，该模型在一些高难度任务上（例如 YouCook2 的密集字幕生成、QVHighlights 的关键时刻检索）表现可媲美专业微调模型。而对于对成本敏感的应用，Gemini 2.5 Flash 则提供了极具竞争力的替代方案。 Gemini 2.5 的技术突破 Gemini 2.5 是首个能够原生结合音频、视觉、代码与其他数据格式的多模态模型，开启了全新的视频+代码处理能力。应用实例一：将视频转化为交互式应用 Gemini 2.5 Pro 解锁了视频到交互式应用的全新可能。在 Google AI Studio 中，Video to Learning App 启动项目展示了如何使视频学习更具效果与互动性。使用流程如下：在教育与互动内容生成领域，Gemini 2.5 Flash 也展现出强大能力。应用实例二：p5.js 动画自动生成 Gemini 2.5 Pro 还能从视频中自动提取信息并生成动画，例如：应用实例三：视频中“关键时刻”的检索与描述在处理长视频（如 Google…

OpenAI 正与微软（Microsoft）就双方数十亿美元的战略合作进行重新谈判

Posted on May 12, 2025 by aitrendtrackers@rengongzhineng.io

据《金融时报》2025年5月11日报道，人工智能公司 OpenAI 正与微软（Microsoft）就双方数十亿美元的战略合作进行重新谈判，旨在为 OpenAI 未来的首次公开募股（IPO）扫清道路，同时保障微软对最先进 AI 模型的持续访问权。当前谈判的核心在于：微软截至目前已向 OpenAI 投资逾 130 亿美元，该公司在 OpenAI 盈利实体中将获得多少股权仍未明朗。报道称，微软愿意放弃部分股权，以换取在 2030 年之后仍能继续使用 OpenAI 研发的前沿技术。这次协商还包括对2019年微软首轮投资（10亿美元）时所签协议的全面修订。根据《信息》网站早前报道，OpenAI 已告知部分投资者，在公司重组进程中，将向最大出资方微软分享更少的收入份额。 2025年1月，微软在与甲骨文（Oracle）及日本软银集团（SoftBank）成立合资企业后，已调整与 OpenAI 的部分合作条款，该合资项目计划在美国建设规模高达 5000 亿美元的新一代人工智能数据中心。目前，微软方面拒绝就上述报道置评，OpenAI 也尚未回应路透社的置评请求。此次谈判若达成成果，或将为 OpenAI 推动IPO奠定关键制度基础，并进一步明确这家 AI 先锋企业与全球最大科技巨头之一之间的权益边界。

前苹果首席设计官回顾了其在苹果的设计生涯、公司文化、标志性产品的背后故事

Posted on May 12, 2025May 12, 2025 by aitrendtrackers@rengongzhineng.io

前苹果首席设计官乔尼·艾夫（Jony Ive）在一次罕见公开采访中，回顾了其在苹果的设计生涯、公司文化、标志性产品的背后故事，并向整个科技行业提出了警示。这场对话发生在 2025 年 Stripe Sessions 大会期间，由 Stripe 联合创始人帕特里克·科利森（Patrick Collison）主持。历时一小时的采访中，艾夫深情讲述了塑造其职业生涯的个人与专业经历，并分享了他目前在独立设计工作室 LoveFrom 的探索。从一台 Macintosh 开始艾夫谈到，他在英国求学期间首次接触到苹果Macintosh电脑，那一刻成为他人生的重要转折点。他将这台设备视为其创造者价值观的体现。“我们所创造的事物，是我们是谁的证明。”他如此总结。他还引用乔布斯的著名比喻，把Mac称作“思想的自行车”（bicycle for the mind），这场体验促使他于90年代初迁居加州，并最终加入苹果。在苹果的文化中成长 1992年，艾夫正式加入苹果。在短暂的顾问工作后，他迅速崭露头角，最终领导工业设计团队，主导了iMac、iPod、iPhone、Apple Watch等标志性产品的设计。他强调，苹果的设计工作深植于公司文化之中。他分享了多种旨在培育同理心与协作精神的内部做法，例如每周设计团队共进早餐的传统：“每个星期五早上，设计团队的一名成员轮流为所有人准备早餐。”除此之外，团队成员还常在彼此家中共事，营造非正式的亲密氛围。他认为，这些行为直接体现在产品设计的细节之中，“为彼此而创造”，是苹果用户体验理念的根基。 “关怀的细节” 艾夫持续强调细节的重要性。他以苹果包装盒内电缆的小标签设计为例，指出即便是极为微小的设计决策，也可能影响上百万用户的日常体验。“我非常清楚，在设计一个解决方案时——比如一个如何整理电缆的小标签——会有成百上千万的人接触它。” 这类设计绝非随意而为，而是承载着一种“关怀伦理”。他引用乔布斯的一句话说：“你可以通过所创造的事物，向人类表达感激。” LoveFrom 的设计哲学自2019年离开苹果以来，艾夫与长期合作伙伴马克·纽森（Marc Newson）共同创办了设计工作室 LoveFrom。虽然该机构运作低调，但近年来逐渐提升了公众曝光度。其作品涵盖产品设计、建筑、软件及品牌识别等领域，其中最具代表性的项目之一，是为英国国王查尔斯三世加冕仪式设计的官方形象系统。艾夫表示，LoveFrom 继续秉持其在苹果形成的设计原则，但已发展出新的使命：将每个项目视为“真诚地提升人类”的机会。LoveFrom 的团队成员不仅包括设计师，还有音乐人和字体排印师。对科技行业的警示采访的最后，艾夫对科技产业提出了严肃的思考。他警告，设计师与技术从业者必须对自己产品的后果保持高度警觉。他指出，良好的初衷并不能抵消带来的负面影响，因此创造者必须承担责任。“即使你的动机是无辜的，但如果你参与的事物带来了不良后果，你也必须为此负责。” 他还批评当前科技行业的整体氛围：“我确实感受到，在硅谷和我们整个行业中，‘人类的快乐’正在缺失。我们开发的产品很复杂，对吧？而有时候，人们把‘快乐’误解为‘肤浅’。” 这是艾夫自2019年离开苹果以来，极为少见的公开露面。他在此次采访中未对外界盛传的与OpenAI联合打造 AI 硬件设备的合作计划作出回应。

伊丽莎白·霍姆斯的伴侣创办了新的血液检测初创公司

Posted on May 12, 2025May 12, 2025 by aitrendtrackers@rengongzhineng.io

伊丽莎白·霍姆斯（Elizabeth Holmes）曾因创办Theranos公司成为硅谷明星人物，身穿标志性的黑色高领毛衣，常被拿来与苹果创始人史蒂夫·乔布斯相提并论。她曾登上各大杂志封面，也曾受邀到白宫出席活动。然而，外界鲜知的是，Theranos 所宣称的能够检测数百种疾病的血检技术并不真实。正如《华尔街日报》的调查揭露，以及随后推出的畅销书、播客、电视剧和刑事案件所呈现的那样，Theranos 实际上多使用第三方设备进行基础检测，甚至有时根本未进行任何检测。由此带来了大量错误诊断，最终在霍姆斯因欺诈被起诉前，公司彻底崩溃。霍姆斯始终坚称自己无罪，但她在 2022 年被判定犯有欺诈罪，并被判处 11 年监禁，目前在德克萨斯州布赖恩联邦监狱服刑。与此同时，与霍姆斯共同育有两名子女的比利·埃文斯（Billy Evans），早在一年半前就在特拉华州注册成立了一家名为 Haemanthus 的公司，开始筹划下一项创业计划。根据特拉华州和德克萨斯州的公开企业文件，该公司曾在奥斯汀市南拉马尔（South Lamar）街区的多个地址运营，而埃文斯一家也居住于该区域。 Haemanthus 初期通过亲友募集了 350 万美元资金，今年春季开始在奥斯汀和旧金山湾区向更广泛的高净值人士寻求额外 1500 万美元融资。两位知情人士透露，亿万富翁迈克尔·戴尔（Michael Dell）旗下的投资公司已拒绝参与该轮融资。公开记录中唯一一位被识别出的投资人是马修·E·帕克赫斯特（Matthew E. Parkhurst），他是奥斯汀市中心一家地中海风味小酒馆的部分股东，也涉足其他投资领域。帕克赫斯特未回应记者的置评请求。 Haemanthus 的高管团队大多来自自动驾驶公司 Luminar。据埃文斯的 LinkedIn 资料显示，他曾在该公司任职两年。Luminar 当前正面临市场困境。该初创企业的首个市场目标是宠物医疗。Haemanthus 目前已获得一项专利。根据其营销材料和专利描述，公司正研发一种设备，能够通过激光扫描宠物的血液、唾液或尿液，从分子层面进行分析。宣传资料称，该设备可在数秒内识别并量化如葡萄糖和激素等生物标志物，并运用“深度学习模型”来检测癌症和感染。随着私募股权公司大量收购和整合独立兽医诊所，动物医疗已发展成一个庞大的产业。仅宠物癌症筛查市场就价值数十亿美元。医疗保健投资银行 Edgemont Partners 将其称为“抗衰退产业”。 Haemanthus 告诉投资人，公司拥有约二十名顾问，包括兽医和诊断专家，尽管未公布具体名单。此外，Haemanthus 的长远目标是研发一款指甲盖大小、可穿戴于人体的版本。营销材料中称，“根据我们的经验和合作方意见”，该目标预计需要三年时间和7000万美元资金。值得注意的是，投资者推介资料中并未提及埃文斯与伊丽莎白·霍姆斯的关系。

中国刚刚制造出全球最快的晶体管，而且它不是由硅制成的该晶体管运行速度提高了 40%，能耗更低

Posted on May 12, 2025 by aitrendtrackers@rengongzhineng.io

The 2D transistor’s design looks like a series of interwoven bridges. Photo: Peking University/modified by ZME Science. 在北京大学，一组中国科学家可能刚刚颠覆了整个计算产业。他们采用实验室培育的超薄铋材料，并结合一种迥异于当今硅芯片的结构，构建出目前世界上最快、最节能的晶体管。据研究团队称，这款新型晶体管的性能不仅超越了英特尔和台积电所生产的最先进芯片，同时还降低了能耗。更为关键的是，它完全不含硅。这款二维、非硅基晶体管体现了芯片制造理念的根本性重塑。 “如果说基于现有材料的芯片创新是一种‘捷径’，那么我们基于二维材料的晶体管就是‘换道超车’。”北京大学化学教授、该研究的负责人彭海林在接受《南华早报》采访时表示。从“鳍片”到“桥梁”的转变要理解这款晶体管的突破之处，首先需回顾它所替代的传统设计。自上世纪90年代以来，晶体管——这些驱动从智能手机到超级计算机一切设备的微型开关——主要依赖硅材料和“鳍式场效应晶体管”（FinFET）结构。这种结构类似微型摩天大楼，以垂直方式构建在芯片上，能够在纳米尺度更好地控制电流。但FinFET 正面临空间瓶颈。随着芯片尺寸缩小至数纳米，工程师们正触及物理极限。当晶体管尺寸降至3纳米以下时，性能提升变得极为困难，功耗却开始上升。传统路径已经难以为继。因此，彭海林团队选择彻底放弃旧架构，转而开发全新结构。采用环栅结构的二维晶体管他们的新型晶体管基于“全环栅场效应晶体管”（GAAFET）架构。与FinFET 仅在晶体管通道三面包裹栅极不同，GAAFET 在四周完全包覆通道，从而提升对电流的控制能力，并显著减少能量浪费。不过，这种结构本身并非首次出现。真正的创新在于它所使用的材料。铋元素带来的优势该团队使用的是铋氧硒化物（Bi₂O₂Se）作为晶体管通道材料，以及铋硒氧化物（Bi₂SeO₅）作为栅材料。这些材料属于“二维半导体”范畴，具有原子级厚度和卓越的电学性能。尤其是铋氧硒化物，在极小尺度下仍能实现高速电子传输，这是传统硅材料难以企及的。电子在该材料中的迁移速度更快，即使在高度压缩的空间内也不例外。其高介电常数意味着能更高效地储存和调控电荷。这带来了更快的开关速度、更少的能量损耗，以及更低的过热风险。彭海林指出：“这能显著减少电子散射和电流损耗，让电子几乎无阻地流动，就像水在光滑水管中穿梭。” 此外，材料间界面的平滑性远胜于目前工业中常用的半导体-氧化物组合，意味着缺陷更少、电气噪声更低。综合上述因素，该晶体管在性能上取得了惊人突破。研究团队称，相较目前最先进的3纳米硅芯片，其运行速度提高了 40%，同时能耗降低约 10%。被迫而来的技术转向该技术进展的背后，还潜藏着地缘政治因素。由于美国主导的出口限制，中国企业被禁止采购最先进的硅芯片制造设备。比如能够生产 3 纳米芯片的极紫外光刻机，仅由西方少数几家公司掌握。通过开发一款不依赖硅、且可用中国现有工具制造的晶体管，彭海林团队或许找到了绕开制裁的新路径。 “虽然这条路线是因当前制裁被迫走出的，但也正因如此，研究者被迫从全新视角寻找解决方案。”彭海林表示。尽管实验室中成果斐然，量产仍面临诸多挑战。这类晶体管能否规模化制造？能否在真实运算环境中承受高温与高压？何时才能应用到消费级设备中？这些问题尚未有定论。但研究团队表示，他们已在推进量产工作。使用该晶体管构建的逻辑单元原型表现出极低工作电压与高电压增益，显示出良好的电路整合前景。此外，他们基于现有制造平台进行设计，也意味着其生产门槛可能低于其他实验性技术。研究团队在结论中写道：“这项成果证明二维 GAAFET 晶体管在性能与能效方面已可与现有硅基晶体管相媲美，是下一个技术节点的有力候选者。” 当然，从实验室原型走向商用芯片，往往需要多年甚至数十年。设计单个晶体管相对容易，要将数十亿个集成在一块可靠可量产的芯片上，才是真正的考验。…

如何让代码库快速建立索引：Cursor 的默克尔树实践

Posted on May 12, 2025May 12, 2025 by aitrendtrackers@rengongzhineng.io

知名 AI IDE 产品 Cursor 日前宣布年经常性收入突破 3 亿美元，其代码库快速索引能力成为一大亮点。据介绍，Cursor 使用了默克尔树（Merkle Tree）结构来加快代码的索引速度。以下是其具体实现方式的详解。默克尔树简述默克尔树是一种树形数据结构，所有叶子节点都用数据块的加密哈希值进行标记，而非叶子节点则是其子节点哈希值的组合哈希。这种结构可以高效检测任何层级的数据变更，只需比较哈希值即可。其基本原理如下：如果数据中任何一部分发生更改，相关哈希值也会随之改变，最终导致根哈希的变动。这种机制为数据完整性验证和高效同步提供了强有力的支持。 Cursor 如何使用默克尔树进行代码索引根据 Cursor 创始人及其安全文档的内容，代码索引过程如下：第一步：代码分块与处理 Cursor 首先在本地对代码进行分块，将文件切分为语义上有意义的片段，以便后续处理。第二步：构建默克尔树并同步在开启代码库索引功能后，Cursor 会扫描编辑器中打开的文件夹，并计算所有有效文件的哈希，构建默克尔树。随后该树会被同步到 Cursor 的服务器。第三步：生成嵌入向量完成分块后，片段被发送到服务器，由 OpenAI 的嵌入 API 或其他定制模型生成向量表示，用以捕捉代码语义。第四步：存储与索引嵌入向量与元数据（如起止行号、文件路径）一起被存储于远程向量数据库 Turbopuffer 中。为保护隐私，每个向量仅附带经过混淆处理的相对文件路径。创始人表示，代码内容并不被数据库持久保存，只在请求生命周期内存在。第五步：定时增量更新系统每 10 分钟使用默克尔树检查哈希是否有变动，只上传已变更文件。这种机制大大减少了带宽使用，是默克尔树结构在索引系统中的核心价值之一。代码分块策略代码分块策略的优劣直接影响嵌入质量。常规的字符、词或行级切分往往无法识别语义边界，导致效果不佳。更优的方式包括：嵌入在推理阶段的用途生成嵌入后，系统如何实际使用这些信息？语义搜索与上下文检索用户在使用 Cursor 的智能功能时（如 @Codebase 或 ⌘ Enter 提问）会触发如下流程：…

阿里巴巴集团的研究人员提出ZeroSearch

Posted on May 10, 2025 by aitrendtrackers@rengongzhineng.io

阿里巴巴集团的研究人员近日提出了一种新颖的人工智能训练方法，或将彻底改变当前依赖昂贵商用搜索引擎API进行信息检索训练的现状。这一技术被命名为“ZeroSearch”，使大型语言模型（LLMs）能够通过模拟搜索过程来学习搜索技能，从而无需在训练阶段实际访问搜索引擎。 https://alibaba-nlp.github.io/ZeroSearch 据研究团队介绍，ZeroSearch采用强化学习框架，通过激励模型搜索能力的方式训练AI，但在整个过程中不与真实搜索引擎进行交互。这一方法不仅显著减少了训练过程中的API调用成本，也为开发者提供了更大的控制权，能够更精确地管理AI在训练中接触到的信息类型和质量。当前，开发能自主搜索信息的AI助手所面临的两大挑战是：首先，训练阶段由真实搜索引擎返回的文档质量不可预测；其次，大量API调用的高昂费用严重限制了模型训练的可扩展性。研究人员指出，强化学习训练通常需要进行数十万次搜索请求，而这类请求通过商用搜索引擎API进行将带来极高成本。为解决这一难题，ZeroSearch提出以轻量级监督微调起步，将语言模型转变为具备检索能力的模块，能够根据查询生成相关或不相关的文档，并在后续训练中采用“基于课程的演化策略”逐步降低文档质量，从而模拟真实搜索的挑战。研究者进一步解释称，大型语言模型在大规模预训练中已掌握丰富的世界知识，因此在面对搜索请求时具备生成相关文档的能力。与真实搜索引擎的主要区别仅在于返回内容的文本风格。在涉及七个问答数据集的大量实验中，ZeroSearch训练出的模型不仅与依赖真实搜索引擎的模型表现相当，甚至在多项任务中实现超越。其中，一个拥有70亿参数的检索模块已能与谷歌搜索持平，而一个140亿参数的模块更是超出谷歌的表现。成本对比亦十分显著：使用SerpAPI调用谷歌搜索进行6.4万次查询的开销约为586.70美元，而利用四块A100 GPU运行ZeroSearch的模拟训练仅需70.80美元，节省幅度高达88%。论文指出，这一成果展示了在强化学习环境中，用训练良好的语言模型替代真实搜索引擎的可行性。 ZeroSearch带来的变革意义远不止于成本节省。该方法标志着人工智能训练模式的重大转变，即AI系统可以在不依赖外部工具的前提下实现自我提升。对于预算有限的小型AI公司和初创企业而言，此举无疑降低了进入门槛，有助于技术公平化。同时，开发者在训练过程中可对模型所接触到的信息进行更精细的控制，避免由真实搜索引擎带来的信息质量不确定性。该方法已成功应用于多个模型系列，包括Qwen-2.5与LLaMA-3.2，并支持基础模型与指令微调版本。研究团队已在GitHub和Hugging Face平台上公开了相关代码、数据集与预训练模型，供其他研究人员和企业参考使用。随着大型语言模型技术的不断演进，ZeroSearch等自我模拟训练方法预示着AI系统未来将以更独立的方式发展，不再依赖大型科技平台提供的外部服务。这不仅可能重塑AI开发的经济结构，也可能加速技术生态的多元化与去中心化进程。有趣的是，阿里巴巴通过教会AI“无需搜索引擎即可搜索”的能力，反而可能削弱了传统搜索引擎在AI发展过程中的必要性。在不久的将来，随着AI系统日益具备自给自足的能力，整个科技格局或将焕然一新。

Gemini 2.5 Pro 预览版（I/O 版）：前端开发与智能编程能力大幅跃升

Posted on May 10, 2025 by aitrendtrackers@rengongzhineng.io

2025年5月6日，Google 发布了 Gemini 2.5 Pro Preview（I/O 版），这是一版专为开发者提前准备的升级版本，其焦点在于进一步提升编码性能，尤其是在前端开发、用户界面构建、代码重构与智能代理型工作流等方面展现出了显著进步。该版本目前已通过 Google AI Studio 和 Gemini API 向开发者开放使用，并将在 Google I/O 大会前率先亮相。为什么值得关注 Gemini 2.5 Pro（I/O 版）？在本次预览版中，Google 强调了模型在“编码能力与响应延迟之间的权衡”方面取得了新的平衡点。根据 Replit 总裁 Michele Catasta 的评价： “在执行对延迟敏感又需高度可靠的任务时，Gemini 2.5 Pro 是目前最佳的前沿模型。” 这意味着，Gemini 2.5 Pro 不仅提升了智能判断和代码抽象能力，同时在实际部署和响应效率上也更加贴近生产环境所需。前端开发能力跃居榜首新版 Gemini 2.5 Pro 在 WebDev Arena 排行榜中位列第一，这一榜单专注于衡量模型生成网页应用时的人类偏好表现。该模型在美观性、功能性、响应式设计等方面表现突出，超越以往版本。开发者可以在以下关键场景中看到其强大实力： ✅ 高质量 UI 构建例如，在 Gemini 95 启动项目中，开发者可通过该模型直接添加符合设计语言的视频播放器，无需手动查阅设计稿或编写繁琐的…

OpenAI 结构改革：迈向民主化 AI 的新篇章

Posted on May 10, 2025May 10, 2025 by aitrendtrackers@rengongzhineng.io

OpenAI 董事会近日宣布，将对其组织结构进行一次重要的演进。这一决定不仅关乎法律形态的转变，更是一次深层次的理念更新，意图在确保“通用人工智能（AGI）造福全人类”这一使命不变的前提下，增强组织的灵活性、资源获取能力以及全球服务能力。这一结构调整，标志着 OpenAI 正式从一种早期实验性的组织形态，迈入具有广泛社会责任感和全球服务能力的新阶段。从非营利实验室到全球性科技力量 OpenAI 自成立以来一直是一个非营利性组织，其最初目标是探索人工智能的可能性，并确保人工智能的技术成果不会被少数人或组织所垄断。2019 年，为了更高效地推动研发与部署工作，OpenAI 成立了一个受非营利机构监管的营利性子公司（LLC），以便引入外部资本支持更大规模的技术投入。如今，OpenAI 宣布将该 LLC 转变为一个公共利益公司（PBC, Public Benefit Corporation）。这种新型企业结构在美国法律中被定义为既追求营利，也必须考虑其对社会整体的正面影响，适用于那些在利润之外，还追求使命导向的企业。著名公司如 Patagonia、Anthropic、X.ai 等都采纳了此种结构。此次变更将不会削弱 OpenAI 非营利机构的控制力。新的 PBC 仍将处于非营利组织的监管之下，而非营利机构还将成为 PBC 的主要股东，从而拥有更丰富的资源，进一步推动其使命的落地。 Sam Altman 写给员工的一封信：AI 是人类共同的工具，不是特权的象征在这次结构调整发布的同时，OpenAI 首席执行官 Sam Altman 向全体员工与利益相关者发出了一封长信。他在信中强调，OpenAI 从一开始就不是一家“普通的公司”，而它也永远不会是。 “我们的使命是确保通用人工智能（AGI）造福全人类。” Sam 回顾了 OpenAI 成立之初的情景——一群人在厨房桌前苦思该研究什么，当时他们既没有产品计划，也没有盈利模式，更无法想象今天 AI 能在医疗建议、学习效率、生产力等方面发挥巨大作用，更不会想到训练和部署 AI 系统所需的算力规模会达到数千亿美元甚至未来可能达万亿美元的级别。早期许多参与者认为 AGI 应该掌握在“少数值得信赖的人”手中。但今天，OpenAI 的信仰是不同的。Sam 明确指出： “我们相信 AGI 是历史上最强大的工具，它应该直接赋能每一个人。” OpenAI 致力于构建一个民主化的 AI…

Subscribe 订阅