OpenAI公司近日宣布,其年度经常性收入(ARR)已突破100亿美元,这一里程碑距离ChatGPT首次推出尚不足三年,标志着这家位于旧金山的人工智能初创企业已成为全球增长速度最快的科技公司之一。 据OpenAI发言人介绍,这一收入数据包括来自消费者端的ChatGPT产品、企业端服务,以及API接口的收入,但不包括与微软的授权收入或其他一次性大型交易。 在2024年,OpenAI的年度经常性收入为约55亿美元,短短一年增长近一倍。然而,这种增长也伴随着高昂的成本:公司去年亏损高达50亿美元。 消息人士透露,OpenAI的目标是在2029年实现1250亿美元年收入。《The Information》率先报道了这一雄心勃勃的收入计划。此类增长预期也为其高估值提供了支撑。今年3月,OpenAI完成了一轮高达400亿美元的融资交易,成为有史以来最大规模的私募科技交易之一。目前公司估值相当于其年收入的约30倍,凸显主要投资者对其超高速增长潜力的信心。 OpenAI自2022年底发布面向大众的ChatGPT后迅速走红,并在随后一年内推出企业版本。如今,公司支持的每周活跃用户已达5亿人次。截至2025年6月,其企业版用户数已突破300万,较2月的200万增长迅猛。 OpenAI目前的主要投资方包括微软、日本软银、Coatue、Altimeter、Thrive等知名机构。值得注意的是,微软不仅是OpenAI的重要投资方,还与其展开了深度合作,在其Azure云平台集成OpenAI技术,并在Windows、Office等产品中嵌入GPT模型,持续推动其在企业级市场的扩张。 此次收入突破标志着OpenAI已不再只是一个实验室项目,而是真正迈入全球AI商业化的核心舞台。随着企业客户不断涌入、模型能力持续提升,OpenAI正在快速向全球最具影响力的AI平台迈进。
Siri在WWDC中的缺席显得格外刺眼
在2025年全球开发者大会(WWDC)上,尽管苹果公司发布了大量与“Apple Intelligence”相关的新功能,包括跨App的实时翻译、图像生成和视觉搜索等内容,但曾被寄予厚望的智能语音助手Siri几乎未获提及,令外界关注。 Siri在本次大会中的缺席显得格外刺眼。过去一年,苹果曾在广告中大力宣传“个性化Siri”的到来,并在2024年的WWDC中首次公布相关计划,承诺将在“未来一年内”逐步上线。但到目前为止,这些功能依然遥遥无期。 苹果软件工程高级副总裁克雷格·费德里吉(Craig Federighi)在今年的主题演讲中仅简要表示:“我们正在继续推进让Siri更加个性化的工作,但这项工作需要更多时间来达到我们的高质量标准。”除了表示Siri已变得“更自然、更有帮助”,并承诺将在未来一年分享更多内容外,关于Siri的更新几乎没有其他实质性信息。 这一“沉默”也让业界重新关注苹果在生成式AI领域的迟缓进展。与谷歌、微软、OpenAI和Anthropic等竞争对手相比,苹果在推动AI助手、开发者平台和高级模型能力等方面明显滞后。以谷歌为例,其Gemini助手已在Android平台上开放访问,能够读取并分析用户屏幕上的内容,执行图像识别和复杂响应;微软则已在Windows 11中整合AI功能,如通过文件管理器实现图片模糊处理、内容摘要等快捷操作。 相比之下,Apple Intelligence的初始表现饱受质疑。今年早些时候,部分通知摘要功能因生成内容不准确而被临时禁用,例如BBC曾指出系统会将多个新闻标题混合生成错误摘要。 面对竞争压力,苹果本次WWDC采取的策略是推出一系列以ChatGPT为后端支持的小型AI实用功能,诸如实时翻译、多语言消息传递,以及结合OpenAI的图像生成能力(Image Playground)等。用户可将好友照片变换为油画风格,也可通过视觉智能在屏幕上识别内容并快速执行搜索或操作。 此外,苹果还开放了其本地大语言模型API供开发者使用,进一步推动AI在iOS生态中的嵌入式应用。然而,用户期待已久的“Siri支持多模型切换”或“集成谷歌Gemini”的功能并未出现。 去年6月,费德里吉曾在一次现场答问环节中提及希望Apple Intelligence未来能够让用户“选择他们想使用的模型”,并点名提到Gemini。今年2月的一项后端更新也曾暗示苹果可能在后台测试Gemini的集成;4月,在谷歌搜索垄断审判的庭审中,谷歌CEO桑达尔·皮查伊表示,计划在2025年中期与苹果达成协议,并在年底前完成Gemini的正式整合。 目前来看,这一合作仍在“待定”状态,苹果本次未在WWDC上披露相关进展,引发外界对其AI战略完整性的疑问。 在AI赛道激烈竞速之下,苹果错过了去年的关键窗口,如今面对来自谷歌、微软和OpenAI的持续压力,其如何加快Siri的步伐,重塑其AI助手的地位,正成为业界关注的焦点。
谷歌公司近日推出了其迄今为止最强大的AI模型升级版——Gemini 2.5 Pro预览版
谷歌公司近日推出了其迄今为止最强大的AI模型升级版——Gemini 2.5 Pro预览版,该版本将在未来几周正式上线,届时将作为企业级应用的稳定版本全面推向市场。 此次更新的Gemini 2.5 Pro基于5月发布的版本进行优化,并在谷歌I/O大会上首次展示。根据LMArena的评测,2.5 Pro的Elo分数上升了24分,达到1470分,继续在排行榜上保持领先地位;在WebDevArena中也取得了1443分的成绩,提升35分,同样登顶。此外,该模型在编程方面表现尤为出色,领先于包括Aider Polyglot等高难度编程基准测试。 在推理能力方面,2.5 Pro在GPQA和“人类最终考试”(HLE)等严苛评测中展现出顶尖水平,这些评测主要衡量模型在数学、科学、知识和逻辑推理方面的能力。 除了性能升级,此次版本还对2.5 Pro在语言风格和结构表达上的表现进行了显著改进,更具创意,响应内容格式更清晰,回应了开发者在上一版本中的反馈。 目前,开发者已可通过 Google AI Studio 和 Vertex AI 平台,在Gemini API中使用该升级预览版本。值得一提的是,谷歌此次还引入了**“思维预算(thinking budgets)”功能**,使开发者能够更灵活地控制使用成本与响应延迟。 此外,升级版的2.5 Pro现已开始在Gemini应用中陆续推出,供用户抢先体验。
HIV治愈方法近日取得了一项被誉为“重大突破”
在寻找HIV治愈方法的全球努力中,墨尔本的科学团队近日取得了一项被誉为“重大突破”的进展,使研究人员感到“震惊”。这一成果由彼得·多尔蒂感染与免疫研究所(Peter Doherty Institute for Infection and Immunity)的科学家主导,展示了一种全新方法,可将潜伏在白血球中的HIV病毒“暴露”出来,为彻底清除体内病毒铺平道路。 HIV的最大挑战之一在于其“潜伏”能力——该病毒可隐藏在某些白血细胞中,形成病毒“储存库”,长期以来既难以被免疫系统识别,也难以被现有药物清除。因此,即使在严格服药控制下,病毒仍可能随时被重新激活。 此次发现基于mRNA技术,这项技术因在新冠疫情期间被Moderna和辉瑞/BioNTech用于疫苗研发而广为人知。相关研究成果已于《自然通讯》(Nature Communications)期刊上发表。 研究团队首次证明,mRNA可以被送入HIV潜伏的白细胞中,关键在于他们研发出一种全新形式的脂质纳米颗粒(Lipid Nanoparticle,LNP),名为“LNP X”。这种新型LNP能被此前无法接受常规LNP的白血球吸收,从而将mRNA输送到病毒藏身之处。mRNA进入细胞后,会“指令”细胞将病毒揭示出来,使其暴露于免疫系统视野。 研究负责人之一、博士后研究员保拉·瑟瓦尔(Dr Paula Cevaal)指出,过去普遍认为不可能将mRNA传递到这种类型的白血细胞中。她回忆,在实验室会议上首次看到测试结果时,团队简直难以置信。为了验证准确性,实验多次重复,结果均保持一致。“从完全不起作用,到突然全部奏效,简直是天壤之别”,她形容当时实验室成员的反应是“全体倒吸一口气”。 不过研究人员强调,这项研究目前仍处于实验室阶段,使用的是来自HIV感染者捐献的细胞。未来仍需通过动物试验和人体安全性测试,才可能进入临床疗效试验阶段,整个过程预计将耗费数年时间。 瑟瓦尔表示:“在生物医学领域,很多研究最终无法进入临床,这是现实。我们不想描绘比实际更美好的前景。”但她也指出,在HIV治愈研究领域,从未有哪种方法能像这项研究一样如此有效地“揭示”潜伏病毒,因此她对未来在动物和人类中能否复制这一成效充满希望。 参与研究的另一位负责人、墨尔本大学的迈克尔·罗奇博士(Dr Michael Roche)指出,这项技术的潜力可能不限于HIV治疗。因涉及的白血球类型也参与许多其他疾病,如癌症等,该技术或许能为更多疾病的治疗带来新方向。 英国弗朗西斯·克里克研究所的逆转录病毒专家乔纳森·斯托伊博士(Dr Jonathan Stoye)虽未参与研究,但表示该研究在“唤醒”潜伏病毒方面是现有策略的重大进展。他指出,目前仍存在关键未知数:是否需要完全清除所有潜伏病毒,或只需清除绝大多数?如果仍有10%的病毒储备幸存,是否会导致再次感染?这些问题仍需进一步研究验证。 牛津大学詹纳研究所的托马斯·汉克教授(Prof Tomáš Hanke)则对研究观点提出质疑,认为将RNA导入白血细胞的难度被夸大。他指出,认为该方法能触及所有潜藏病毒的细胞“只是一种梦想”。 尽管未来道路仍充满不确定性,但此次研究为mRNA在血液细胞中的治疗性递送提供了突破性范式,也为人类治愈HIV的希望点亮了一束新的曙光。
苹果公司即将举行的2025年度全球开发者大会
据报道,苹果公司即将举行的2025年度全球开发者大会(WWDC)将以其操作系统的大规模设计和生产力升级为主题。尽管外界普遍关注生成式人工智能的快速进展,苹果此次大会的AI更新内容相对有限,未能引发行业内的广泛期待。 此次大会的重头戏将是对iPhone、iPad、Mac、Apple TV、Apple Watch和Vision Pro等设备的软件界面进行全面重构。苹果计划正式采用基于年份的命名方式,放弃过去以版本号命名的做法,因此将发布包括iOS 26、iPadOS 26、macOS 26、watchOS 26、tvOS 26和visionOS 26在内的一系列新系统。这些系统在苹果内部拥有各自的代号,如Luck、Charisma、Discovery等,而macOS将继续沿用以加州地标命名的传统,今年的版本将名为“macOS Tahoe”。 在视觉设计方面,所有操作系统将引入代号为“Solarium”的全新界面风格,灵感源自Vision Pro的visionOS。新界面以“数字玻璃”为核心,强调光效与透明感,工具栏与选项卡将焕然一新,应用图标和按钮也将统一改版。Mac系统的菜单栏和窗口按钮将采用全新设计,同时,iPhone、iPad和Mac上的小组件虽外观调整,但功能保持不变。 iOS和iPadOS系统中,三款核心应用将迎来大幅重构:电话、Safari浏览器和相机应用。其中,电话应用将首次整合收藏联系人、通话记录和语音信箱为一体;Safari将采用更透明的地址栏设计;相机应用则简化界面,优化多种拍摄功能之间的切换。 信息应用(Messages)也将获得重要升级,加入投票功能及可同步设备间的聊天背景图,旨在挑战Meta旗下的WhatsApp地位。 一款长期存在于macOS系统中的“预览”应用(Preview)将首次登陆iOS和iPadOS,为用户提供PDF文件的管理、批注和编辑功能。此外,全新的“游戏”应用也将上线,整合Apple Arcade平台和游戏下载功能,尽管在吸引核心游戏玩家方面效果或仍有限。 Vision Pro方面,新系统将支持“眼动滚动”功能,用户可通过眼球动作滚动页面。此外,苹果还计划支持第三方魔法棒式手部控制器,如Sony的PlayStation VR设备,增强虚拟现实交互体验。 iPad的多任务处理功能将全面升级,更加接近Mac的操作逻辑,但可能要求搭配键盘和触控板使用。Apple Pencil也将支持数字书法笔尖,而键盘输入则新增阿拉伯文与英文的双向切换模式。 苹果还计划新增无线网络信息同步功能,允许设备之间共享曾连接过的网络信息,提高用户跨设备的连网体验。 在人工智能方面,苹果虽然未能如Google、Meta、Microsoft或OpenAI般激进,但也将推出若干AI功能,统称为“Apple Intelligence”。最明显的变化是“系统级翻译”,将实现电话和文本的实时翻译功能,并逐步推广至AirPods等设备。这项功能虽然早已在Android设备中普及,但对苹果用户而言将是首次整合。 第三方开发者也将首次获得访问苹果底层大语言模型的权限,从而构建定制化AI功能。这些模型已应用于苹果自身的“Writing Tools”、“Genmoji自定义表情”和摘要工具中。Genmoji也将迎来升级,用户可将两个标准表情合成为一个全新的表情图示。 快捷指令(Shortcuts)应用将升级为AI驱动版本,进一步简化跨平台任务的执行。苹果亦将推出新版基础模型,支持本地和云端运行,开发者将可调用本地版本。 此外,苹果正开发AI驱动的电池优化模式,尤其适用于即将发布的轻薄版iPhone 17,预计将在稍后推出。另一个重大合作动向是苹果正寻求将Google的Gemini模型引入,与现有支持ChatGPT的Siri和Writing Tools形成替代关系,但受限于美国司法部对苹果与Google搜索合作案的审查,该合作尚不会在WWDC上公布。 Siri的重大升级仍在开发中,暂未准备好公开展示。未来的全新Siri(内部代号LLM Siri)将能访问用户个人数据,并更精准控制应用程序,但预计至少需一至两年后才会亮相。 苹果亦计划对日历和健康应用进行全面重构,配合一项名为“Mulberry”的AI医生服务,但这些功能已被推迟至下一代操作系统(iOS 27与macOS 27),内部代号为Buttercup与Honeycrisp,预计将在2026年发布。 去年未能正式推出的Swift Assist编程助手工具也将重新回归,现将通过集成Anthropic等第三方模型,提升Xcode开发效率,以解决此前因AI“幻觉”问题导致的推迟上线。 整体而言,本届WWDC尽管在AI方面动作不大,但在操作系统视觉风格、应用功能和平台整合方面,仍显现出苹果的战略转型意图。面对外部技术浪潮的加速推进,苹果选择以系统生态为核心继续稳步前行。
Geek Out Time: Playing with Prefix Tuning on Google Colab
Prefix Tuning is one of the coolest Parameter-Efficient Fine-Tuning (PEFT) methods to adapt large language models without retraining the full model. To appreciate how it works, let’s set the stage: traditional fine-tuning involves updating all of a model’s parameters, which is expensive and compute-intensive. Then came prompting — where we steer the model using smart input formatting…
苹果内部其实正在测试远为强大的模型
据内部消息人士马克·古尔曼(Mark Gurman)透露,尽管Apple Intelligence推出已满一年,但苹果公司在生成式AI方面的实际进展仍十分有限。在即将于2025年6月9日召开的年度开发者大会(WWDC)前夕,苹果在AI领域的表现更多体现在更新包装与品牌重塑,而非实质性技术突破。 小模型对外开放,大模型仍属内部测试 古尔曼透露,今年WWDC的AI亮点将是苹果首次允许第三方开发者使用其自研的基础模型(Foundation Models)。这些模型可直接运行于苹果设备本地,规模约为30亿参数。虽然体量在业内不算大,但足以支持诸如文本摘要等基本功能,并将被集成进开发者应用中。 然而,苹果内部其实正在测试远为强大的模型。据悉,苹果目前拥有参数规模分别为3亿、7亿、330亿和1500亿的AI模型。特别是这款1500亿参数的云端模型,在内部基准测试中表现已可与ChatGPT当前版本相媲美,具备处理复杂任务的能力,是苹果自研AI系统中的“旗舰”。 不过,这款顶级模型目前仅限于苹果内部“Playground”测试平台使用,员工可借此与OpenAI的ChatGPT、谷歌Gemini等主流产品进行对比评估。目前并无对公众开放计划。 苹果高层分歧仍存,未决策打造自有聊天机器人 古尔曼指出,苹果管理层对AI战略仍未达成一致,尤其在生成幻觉(hallucination)风险上的顾虑,使得公司暂时搁置打造自主聊天机器人的计划。这也可能解释了为何Apple Intelligence如今集成了ChatGPT作为内建选项。 Siri与其他AI项目纷纷延后,重心仍在“基础体验” 除了开放模型之外,苹果预计将在WWDC发布一系列较小型的AI功能更新,包括: 这些功能更多体现为市场营销层面的“AI标签化”,而非实质技术突破。 与此同时,苹果多个重大AI项目进展缓慢,面临延期: 苹果AI战略:谨慎与滞后 自2024年6月推出Apple Intelligence以来,苹果虽打出口号“为所有人打造的AI”,但实际首发版本因功能缺乏亮点而未获开发者及用户认可——例如Genmoji、自动输入、上下文通知等功能反响平平。 相比之下,谷歌与OpenAI正积极推动多模态搜索、视频AI及自主代理系统的研究与应用。OpenAI还与苹果前首席设计官Jony Ive合作开发下一代AI硬件。相较之下,苹果显得更为保守。 例如,计划中让Siri读取个人数据以生成个性化回应的“Personal Context”功能至今仍未准备就绪。 总结 整体来看,尽管苹果具备先进的AI研发能力,但由于内部策略分歧与风险顾虑,其AI战略步伐相较行业领先者依然显得滞后与保守。
Meta Prompting 完整指南
Meta Prompting,即“元提示工程”,是一种利用大语言模型(LLM)协助生成、优化提示词(prompt)的方法。正如LLM可以帮助写作者克服“空白页面”的障碍,它也可以帮助提示工程师搭建提示结构。这一过程不仅提高了提示开发的效率,也开启了全新的自动化提示优化路径。 在这份指南中,来自各大研究机构和平台的多个Meta Prompting方法被系统总结,涵盖具体应用方式、技术流程、优缺点以及模板示例,为提示开发人员提供了详尽参考。 什么是Meta Prompting? Meta Prompting是一种使用LLM来生成或改进其他提示词的提示工程方法。与传统的提示工程不同,Meta Prompting依赖模型自身的适应性和反馈能力,动态地调整提示内容,以适应复杂任务和多变的上下文环境。 1. PromptHub 的 Prompt Iterator PromptHub 推出的 Prompt Iterator 工具自动化提示生成循环:生成输出 → 用户反馈 → 提示优化 → 再次输出,极大地简化了提示迭代过程。适用于所有付费方案。 2. Meta-Prompting(来自斯坦福与OpenAI的合作研究) 核心概念:使用一个“元专家”模型协调多个具备不同专长的专家模型,共同解决复杂任务。 流程: 优点: 缺点: Meta Prompt 模板摘录: 3. Learning from Contrastive Prompts (LCP) 由Amazon提出,利用对比学习优化提示词。 流程: 优点: 缺点: 4. Automatic Prompt Engineer (APE) 由滑铁卢大学提出,将提示优化视为“程序搜索”。 流程: 优点: 缺点: 5. PromptAgent…
力提示(force prompting)的新方法
布朗大学与DeepMind的研究团队最近展示了一项名为“力提示(force prompting)”的新方法,该方法允许生成式视频模型在无需依赖3D建模或物理引擎的情况下,通过模拟“力”的作用来生成逼真的视频运动效果。 所谓“力提示”,即研究人员通过人工设定方向与强度的力向量,引导AI生成运动。模型可以处理两种类型的力:一种是作用于整个场景的“全局力”(如风),另一种是针对特定点的“局部力”(如轻敲物体)。这些力被表示为向量场,并被直接输入至视频生成系统,从而转化为自然的运动表现。 本研究基于CogVideoX-5B-I2V视频模型,并整合了ControlNet模块以处理物理控制信号,整个系统以Transformer架构为基础,可生成每段49帧的视频。训练仅耗时一天,使用了四张Nvidia A100显卡。 在训练阶段,研究人员采用了完全合成的数据集:包括1.5万段不同风速下旗帜飘动的视频,用于训练对全局风力的响应;1.2万段滚球视频和1.1万段花朵因撞击而晃动的视频,则用于训练局部力的处理。每个训练样本都包括文本提示、初始图像和一个代表力的向量场(或移动信号),这些三维模拟力被投影到二维图像坐标中。研究人员还对背景、光照、摄像机角度和力的方向进行随机化,增强模型泛化能力。 尽管数据量有限,模型依然展现出较强的泛化能力。例如,它能分辨轻物体比重物体更易被推动,还能识别满的洗衣篮比空的移动得慢。这种“直觉物理”(intuitive physics)能力是在没有真实物理模拟的条件下学到的。 在人类主观评估中,“力提示”方法优于文本描述或运动路径控制等传统方式,甚至在运动匹配度与现实感方面超过了使用真实物理模拟的PhysDreamer模型(尽管后者图像质量更高)。消融实验进一步显示,训练数据的多样性对于模型识别力的方位与强度至关重要。若缺乏多样背景或文本中缺少与物理相关的词汇,模型表现显著下降。 值得注意的是,模型将物体视为整体单位:即使只是某个部位受力,整个物体都会运动。同时,模型还能够在生成视频过程中保留原图中的风格特征,如光照和景深。 不过研究人员也指出,该方法并不能完全替代高精度物理仿真。在复杂场景中,模型有时仍会出错,比如烟雾忽略风的作用,或人体手臂像布一样摆动。然而,作为一种高效手段,“力提示”为AI生成视频注入了具有物理可信度的动态表现。 DeepMind首席执行官Demis Hassabis近期也强调,像Veo 3这样的AI视频模型正在逐步理解物理规律。他认为,这是AI从图像处理迈向对世界物理结构建模的重要一步,也将推动更具通用性AI系统的发展,使其能通过模拟环境中的经验学习,而不再仅仅依赖于静态数据。
埃隆·马斯克(Elon Musk)于2025年6月3日表示,SpaceX今年的营收预计将接近155亿美元
埃隆·马斯克(Elon Musk)于2025年6月3日表示,SpaceX今年的营收预计将接近155亿美元,显示出这家私人航天公司持续高速增长的态势。目前,SpaceX已成为全球最繁忙的火箭发射公司之一。 马斯克在社交平台X上指出,SpaceX今年的业绩增长主要由两个关键业务部门推动:一是以“猎鹰9号”(Falcon 9)火箭为核心的发射业务,二是“星链”(Starlink)卫星互联网服务。尽管SpaceX自2002年成立以来始终为私营公司、并不公开披露其财务数据,但据《华尔街日报》此前报道,2022年SpaceX的年营收为46亿美元;而截至2024年底,公司估值已达到3500亿美元。 在发射业务方面,猎鹰9号作为部分可重复使用的火箭,已成为全球卫星发射的主力工具,频繁被用于美国政府项目及私营卫星运营商的任务。分析人士指出,该业务的持续增长受益于SpaceX对火箭可重复使用性的专注投入,以及多个竞争对手火箭面临的技术问题和延迟。 与此同时,星链计划在近地轨道部署大量卫星,为地面用户提供高速互联网服务,也成为营收增长的主要驱动力。据咨询公司Quilty Space估算,星链业务营收将在2025年增长至123亿美元,较2024年的78亿美元显著上升。星链吸引了大量家庭用户,并在政府业务和企业客户方面不断扩展,客户名单中包括联合航空(United Airlines)与迪尔公司(Deere)等知名企业。 除商业化运营外,SpaceX还在持续加大对航天器开发与基础设施的投入,尤其是“星舰”(Starship)项目。该项目旨在研制一款用于深空探索的重型运载火箭,目标是实现载人火星任务。SpaceX首席财务官布雷特·约翰森(Bret Johnsen)曾在今年3月一场行业活动上表示,星舰的研发是一项极为庞大的工程,公司正以自有资金支持这一总高约400英尺、被称为“史上最强火箭”的载具。 马斯克还表示,SpaceX的商业营收将在2026年超过美国国家航空航天局(NASA)的全部预算。白宫此前已提出将NASA下一财年的预算从当前的近250亿美元削减至188亿美元。尽管如此,NASA仍在多项科学探索和太空任务中扮演重要角色,且SpaceX为NASA的主要承包商之一。据马斯克透露,2025年SpaceX约有11亿美元营收将来自NASA。 这一系列数据凸显了SpaceX在商业航天领域日益突出的主导地位,同时也反映出私营企业在太空探索和全球通信基础设施发展中的战略性作用正迅速上升。