Meta正在加速AI大战步伐!据知情人士透露,Meta计划在第二季度推出独立版Meta AI应用,正式加入Facebook、Instagram和WhatsApp的“Meta家族”,与OpenAI的ChatGPT、谷歌的Gemini展开正面对决。 📌 Meta AI独立App来了! 自2023年9月Meta AI聊天助手上线以来,这款生成式AI已被深度集成到Facebook、Instagram、WhatsApp和Messenger中。今年4月,Meta甚至直接用它取代了这些应用的搜索功能,意图让全球用户习惯在社交平台内直接使用AI助手。 但相比ChatGPT等AI工具,Meta AI一直缺乏独立应用,用户粘性也较低。据数据公司Business of Apps分析,Meta AI独立网站每月访问量不足1000万次,远远落后于ChatGPT、Gemini等竞争对手。 为了改变这一局面,Meta CEO马克·扎克伯格(Mark Zuckerberg)决心打造一款独立的Meta AI App,让用户能更直接、更个性化地体验AI助手的功能。 扎克伯格在1月份的财报电话会议上表示:“2025年,Meta AI将成为全球首个触达10亿人的AI助手。” 现在来看,这款独立App无疑是迈向这一目标的关键一步。 💰 付费订阅也要来了? 除了独立App,Meta还计划推出Meta AI的付费订阅服务,类似OpenAI的ChatGPT Plus,每月收费解锁更强大的AI能力。 Meta首席财务官Susan Li此前暗示,公司未来将通过**“个性化推荐”+“高级AI订阅”来实现Meta AI的商业化。目前,Meta仍未公布定价策略,但可以预见,Meta AI未来可能会有基础免费版+高级付费版**的组合。 🆚 AI大战:Meta vs. OpenAI vs. Google vs. xAI Meta AI的独立化,与最近Google和马斯克xAI的AI应用布局不谋而合: Meta要想超越ChatGPT、夺取AI助手市场的主导权,不仅要在用户体验上做文章,还需要在技术上迎头赶上OpenAI的GPT-4.5、GPT-5等强力对手。 🔥 扎克伯格:这是场硬仗,所有人准备加班! 知情人士透露,扎克伯格对Meta AI的竞争力非常焦虑,内部已对AI团队施加**“7天工作制”**的高压,以加速产品迭代。他在1月的内部邮件中写道: “2025年将是激烈的一年,我们正在打造全球最重要的技术——AI、智能眼镜、社交媒体的未来。我们需要最优秀的人才,全力以赴。” 🚀 2025,AI大战全面升级! 独立版Meta AI的推出,意味着这场AI助手大战正进入白热化阶段。面对ChatGPT的领先地位,Meta能否凭借自己的**社交生态+硬件设备(如Ray-Ban智能眼镜)**撬动市场?让我们拭目以待!
Aria Gen 2来了!AI感知、机器人、可穿戴计算的新突破
自2020年推出以来,Project Aria 一直是全球研究人员探索机器感知与人工智能前沿的关键平台。而今天,Meta正式发布Aria Gen 2智能眼镜,这款新一代研究设备将在机器感知、上下文AI、机器人学等领域开启全新可能。 Aria Gen 2:更智能的AI研究工具 相比第一代产品,Aria Gen 2带来了多个行业领先的创新,让研究人员能够更深入地探索AI如何从人类视角理解世界。 🔍 主要升级亮点: 这不仅是一款智能眼镜,更是Meta在可穿戴计算和AI感知技术上的又一次突破。Reality Labs Research与FAIR AI实验室将利用它推进AI研究,同时,Project Aria也将为学术界和商业实验室提供这项前沿技术。 🚀 赋能AI研究与机器人学 过去四年,Project Aria已经促成了多项关键研究成果,包括Ego-Exo4D数据集,这套由第一代Aria眼镜采集的数据集已成为计算机视觉与机器人领域的基础工具。 📌 研究应用实例: 📅 设备即将开放申请,敬请期待! Meta将在未来几个月公布设备供应计划,对Aria Gen 2感兴趣的研究人员可以注册获取更新。 Aria Gen 2不仅是一款智能设备,更是迈向下一代计算平台的重要一步。期待全球研究人员解锁更多创新应用,让AI更懂世界!https://docs.google.com/forms/d/e/1FAIpQLSfukXP5q6dclAAA3php-OCO1TcwFc5Opegrvw23wHwEbOFJbA/viewform
英伟达的AI狂潮让戴尔赚翻了,但代价不小
当戴尔(Dell Technologies Inc.)与埃隆·马斯克的xAI公司敲定价值50亿美元的服务器供应协议时,这无疑是这家40年历史的科技巨头的重大胜利。然而,这个“大单”背后的利润空间却相当有限——据知情人士透露,该交易的毛利率仅为个位数百分比。 这并非戴尔一家的困境,而是整个美国服务器行业在AI时代的缩影。英伟达(Nvidia Corp.)的技术让戴尔、惠普企业(HPE)和超微(Super Micro)迎来了销售爆发,但与此同时,这些公司却在利润率和客户掌控力上节节败退。 英伟达:服务器厂商的幕后操盘手 如今的AI服务器市场,真正掌握主导权的并不是戴尔或HPE,而是英伟达。作为AI计算的核心芯片供应商,英伟达不仅制定规则,还在不断蚕食服务器制造商的利润空间。 最典型的例子就是戴尔的这笔xAI交易——不仅服务器本身的利润率低,甚至连原本属于戴尔的网络设备业务也被英伟达抢走了。知情人士透露,这次交易中的网络组件将由英伟达提供,而不是戴尔自家的产品。 更让服务器厂商头疼的是,英伟达正在从“芯片供应商”向“全方位AI基础设施供应商”转型,推出了自家的AI服务器和配套产品,这无疑进一步挤压了戴尔和HPE等传统服务器厂商的生存空间。 戴尔、HPE只能当“搬运工”? 英伟达的强势,让服务器制造商在芯片分配上毫无话语权。“Nvidia掌握着服务器厂商能拿到多少货的生杀大权。”分析师Simon Leopold表示。由于AI芯片供应紧张,戴尔和HPE无法自主决定采购量,必须依赖英伟达的分配。 传统上,服务器厂商通常扮演的是客户和芯片厂商之间的桥梁角色——他们帮企业客户挑选芯片、定制服务器方案,并搭配存储、网络等高利润产品。然而,现在客户往往直接找英伟达谈方案,戴尔、HPE只能‘照单生产’,难以通过额外设备和服务提升利润。 比如,马斯克的xAI在采购服务器时,首先和英伟达敲定使用哪款GPU、采购多少数量,之后才由戴尔来组装服务器。这种模式削弱了服务器厂商的议价能力,也让他们难以向客户推销自己的附加产品。 戴尔、HPE和超微拒绝对上述情况置评。但戴尔曾表示,虽然AI服务器的利润率较低,但这些大订单仍能为公司带来稳定的营收,并为后续销售其他设备和服务创造机会。 英伟达与戴尔:亦敌亦友的微妙关系 尽管英伟达在服务器市场日益强势,但它仍然需要像戴尔这样的合作伙伴来推进AI计算的普及。两家公司在AI服务器领域的合作甚至有了自己的品牌——“Dell AI Factory”。去年,英伟达邀请了大量戴尔销售团队前往加州总部培训,以获得AI顾问认证。 不过,英伟达的一些举措也让合作伙伴不满。在AI浪潮初期,戴尔甚至不得不销售英伟达自家的AI服务器,因为当时戴尔还没有推出自己的产品。直到去年,戴尔才削减了对英伟达服务器的销售激励政策,以推广自己的AI服务器产品。 英伟达的快速产品迭代也让服务器厂商苦不堪言。据业内人士透露,英伟达会频繁修改产品规范,导致戴尔、HPE等厂商不得不不断调整产品方案,甚至经常出现产品还未上市,英伟达就推出新一代芯片的情况,使得他们始终落后于英伟达自己的产品节奏。 AI服务器市场还能有变数吗? 戴尔、HPE等服务器厂商如果想要在AI市场扳回一城,可能只有两个机会: 不过,即便是企业市场,英伟达也没有打算放手。就在本周,英伟达宣布与思科(Cisco)深化合作,将思科的网络设备直接整合到英伟达的AI服务器中,进一步简化企业客户部署AI的流程。这无疑让戴尔和HPE的处境更加艰难。 戴尔首席运营官Jeff Clarke在财报会议上表示:“现在AI在企业市场的部署才刚刚起步,我对我们的机会充满信心。”但从目前的市场格局来看,戴尔和HPE的机会窗口或许并不会太大。 总结一下:AI服务器的蛋糕确实越来越大,但戴尔和HPE只能分到“最瘦的那一块”。真正掌握主动权的,还是英伟达。
强化学习让Spot机器狗奔跑速度飙升!
还记得波士顿动力(Boston Dynamics)的那只四足机器人Spot吗?它最近在机器人界又火了一把!一年多前,该公司发布了一个研究版的Spot,开放了底层API,让开发者可以直接控制Spot的关节。而最近,机器人与人工智能研究所(RAI Institute)利用强化学习(Reinforcement Learning,RL)技术,让Spot的奔跑速度提升了三倍之多!如果去年在ICRA@40会议上听过Marc Raibert的演讲,那就知道这绝不是传言,而是现实。 Spot狂奔,每秒5.2米! 在一段新发布的视频中,Spot以每秒5.2米(约时速11.6英里)的速度狂奔。而它的出厂最高速度只有1.6米每秒!看到这个小黄狗跑得这么快,确实有点奇怪,毕竟它的奔跑方式和真正的狗完全不同。RAI研究员Farbod Farshidian表示:“Spot的步态并不符合生物学规律,但它本来也不是生物。”由于机器人的驱动系统与肌肉不同,其运动方式自然也不一样。 经过强化学习训练,Spot采用了一种类似小跑的步态,并增加了“腾空阶段”(四脚同时悬空),让它真正进入了“奔跑”模式。这个腾空动作其实是强化学习“发现”的,并不是工程师们直接编程给它的,而是AI在试图寻找最快移动方式时,自然演化出来的。 强化学习PK传统模型预测控制 那么,为什么波士顿动力的官方控制器做不到这一点呢?原来,官方控制器使用的是“模型预测控制”(MPC),即基于对机器人物理特性的数学建模,实时优化执行任务。虽然这种方式稳定可靠,但由于模型总会有一定误差,因此机器人无法真正突破性能极限。 强化学习的不同之处在于,它不依赖实时计算,而是在模拟环境中进行大量训练,找到最优策略后,再应用到真实机器人上。例如,在训练Spot的高速奔跑时,研究人员可以在模拟环境里同时训练几十甚至上百只Spot,让它们尝试各种可能的奔跑方式,并最终找到最佳策略。 限制Spot速度的不是马达,而是电池! 令人意想不到的是,Spot的速度瓶颈并不在于马达性能,而是电池供电能力!研究人员原本以为Spot会受到驱动系统的扭矩和速度限制,但实验结果显示,真正的障碍竟然是电池无法提供足够的能量。 Farbodian解释说:“如果我们换上更强的电池,Spot还能跑得更快!”而他们目前唯一的限制是无法直接获取Spot电池的电压数据,否则还可以在仿真训练中进一步优化能耗管理。 但强化学习的意义远不止于提升速度,它还可以优化Spot的能耗,延长电池寿命,甚至让它在办公室或家居环境中更安静地移动。 跳跃自行车:RL新神器登场! 除了Spot,RAI研究所还开发了一款全新的机器人平台——超机动载具(Ultra Mobility Vehicle,UMV),这是一辆会跳跃的自行车! 这辆“智能单车”没有陀螺仪等稳定装置,仅靠轮胎的前后移动和方向调整来保持平衡。它的“秘密武器”是顶部的配重块,通过高速上下移动来调整重心。通过强化学习,UMV不仅能在复杂地形上保持稳定,还能完成“飞跃”障碍物的炫酷操作,比如跳上比自己还高的桌子。 UMV的另一大亮点是,它竟然能倒着骑!这在传统控制方法下几乎是不可能实现的,尤其是在崎岖不平的地形上。RAI研究所的Marco Hutter表示:“强化学习的真正魅力在于,它能发现传统控制方法难以实现的全新运动方式。” 目前,RAI团队正在努力让UMV在真实户外环境中实现更高级的“自行车跑酷”操作,预计很快就能发布更多演示视频。 强化学习,让机器人能力无限突破! RAI研究所最近还宣布与波士顿动力合作,共同推动人形机器人的强化学习研究。相比四足机器人,人形机器人有更多自由度和更复杂的运动模式,因此传统的MPC控制器已经很难驾驭。而强化学习的泛化能力,使其成为未来人形机器人控制的关键技术。 RAI的研究目标不仅仅是让某种特定机器人变强,而是建立一整套适用于所有机器人平台的通用强化学习工具。从四足机器人到两轮自行车,再到未来的无人驾驶汽车和人形机器人,强化学习正逐步解锁机器人硬件的潜在能力,让它们真正突破极限。 未来,或许不仅是Spot会跑得更快,跳跃自行车能玩花式跑酷,人形机器人也能像科幻电影里的角色那样灵活自如——而这一切,都离不开强化学习的加持!
Perplexity进军浏览器市场,新品“Comet”即将登场!
AI搜索引擎Perplexity正在悄悄扩张其产品版图,这次的目标是浏览器市场。 本周一,该公司在X(原Twitter)上发布公告,透露正在打造一款名为Comet的全新浏览器,并开启了抢先体验名单注册。不过,目前尚不清楚Comet何时发布,也没有任何界面预览,唯一可以确定的是——Perplexity不满足于只做AI搜索引擎。 Comet能在“浏览器大战”中杀出重围吗? Perplexity的一位发言人在接受TechCrunch采访时表示:“就像Perplexity重新定义了搜索一样,我们也要重新发明浏览器。” 然而,这条赛道早已人满为患。从谷歌Chrome、微软Edge到苹果Safari,市场上的主流浏览器都已占据稳定份额。而在第三方阵营,包括即将发布的Dia浏览器等产品,也在主打AI驱动的浏览体验,试图分一杯羹。 那么,Perplexity凭什么能在这场浏览器混战中站稳脚跟?答案可能在于其AI搜索引擎的用户基础。 目前,Perplexity的AI搜索每周处理超1亿次查询,拥有一批忠实用户。如果Comet浏览器能深度整合AI搜索功能,提供更智能的浏览体验(比如AI摘要、自动整理网页内容等),它或许能吸引一部分用户放弃传统浏览器,改用Comet。 Perplexity的狂飙之路:从AI搜索到浏览器,野心不小 Perplexity的产品扩张速度堪称激进。今年以来,该公司已经推出多款重量级新品: 这家成立于2022年的初创公司,短短几年内已经成长为AI搜索领域的重要玩家,估值高达90亿美元,并从风投机构筹集了超过5亿美元资金。显然,Perplexity正在全力拓展自身生态,从AI搜索,到AI助手,再到AI浏览器,目标直指下一代智能互联网入口。 法律麻烦:Perplexity的“内容争议”仍未解决 尽管Perplexity一路高歌猛进,但它也面临着越来越多的法律挑战。 Perplexity则坚称,它尊重出版商,并提供内容共享收益模式,试图与新闻机构建立合作关系。但从当前的法律纠纷来看,这种模式似乎并未彻底平息争议。 AI浏览器的未来:机会与挑战并存 Comet浏览器的推出,标志着Perplexity正式进军互联网浏览市场。但问题是,AI驱动的浏览器能否真的改变用户习惯? 无论如何,Perplexity显然不只是想做“搜索框”这么简单,它要打造的是一个完整的AI驱动互联网体验。而Comet浏览器,或许正是其迈向更大野心的重要一步。
Claude 3.7 Sonnet上线,Anthropic向OpenAI和DeepSeek宣战!
Anthropic最新发布的Claude 3.7 Sonnet正式加入AI智能体大战,不仅对OpenAI和DeepSeek发起挑战,更可能改变企业AI市场的游戏规则。这款新模型的最大亮点在于,它允许用户精细控制AI的“思考时间”,在即时响应与深度推理之间自由切换。此外,Anthropic还同步推出了Claude Code——一个专为开发者打造的命令行AI编程助手,进一步巩固其在企业市场的竞争力。 这次升级不仅是一次技术突破,更是一场战略性的进攻。就在上个月,DeepSeek以更低的算力成本推出高性能AI模型,直接引发了硅谷震动,甚至让Nvidia股价在一天内暴跌17%。如今,Anthropic的策略是:与其卷算力成本,不如在“推理能力”上下功夫,提供企业真正需要的AI智能体。 Claude 3.7的“思考模式”能否改变AI竞争格局? Claude 3.7 Sonnet带来了一个革命性的功能——“思考模式(Thinking Mode)”开关。用户可以根据任务复杂度调整AI的处理时间: Anthropic产品负责人Dianne Penn表示:“推理、规划和自我纠正不应该是分开的能力。AI应该像人类一样,能区分何时需要快速反应,何时需要深思熟虑。” 从基准测试来看,Claude 3.7在研究类任务上的准确率达到78.2%,超越了DeepSeek-R1,甚至逼近OpenAI最新模型。而在企业应用方面,它在**零售工具使用(81.2%)和指令遵循(93.2%)**上的表现尤为突出,这些恰恰是竞争对手表现欠佳的领域。 相比之下,DeepSeek和OpenAI仍然主攻数学计算等传统AI测试项目,而Claude 3.7则试图用一个统一的模型,在“秒回”与“深度思考”之间自由切换,有望帮助企业减少多个AI系统的维护成本。 DeepSeek的低成本优势,会被Claude 3.7的“智能切换”打败吗? Claude 3.7 Sonnet的发布正值AI行业风起云涌之际。上个月,DeepSeek横空出世,以远低于美国科技巨头的成本打造了一个性能接近的AI模型。这一举动不仅让硅谷高层震惊,甚至直接影响了Nvidia的股价,投资者开始质疑:AI真的需要如此昂贵的算力吗? 企业如今面临的核心问题是:究竟该押注哪种AI架构? Anthropic的定价策略也显示了他们的“稳扎稳打”——Claude 3.7保持了原有**$3/百万输入token,$15/百万输出token**的收费标准,即便增加了推理功能,价格依旧不变。相比之下,OpenAI的Deep Research工具则需要更高的付费门槛,DeepSeek则走免费开源路线,市场定位截然不同。 Claude Code:AI写代码的新助手,开发者的最佳拍档? 除了Claude 3.7,Anthropic还推出了一款专为开发者打造的AI编程助手——Claude Code。这是一个命令行(CLI)工具,允许开发者将复杂的工程任务交给AI处理,并且需要人类审核后才能提交代码,以确保开发过程的安全性和可靠性。 Anthropic平台负责人Michael Gerstenhaber表示:“我们的AI可以同时帮助Thompson Reuters做法律研究,也能帮助GitHub等开发者平台提升编程效率。” 这一点直接将Claude Code定位为OpenAI Codex、Github Copilot等AI编程工具的有力竞争者。 Claude Code的核心特点包括: Claude 3.7的终极测试:从“打游戏”到企业智能体? Anthropic产品团队用一个有趣的例子来展示Claude 3.7的推理能力——让AI玩《宝可梦》。 Penn透露,Claude 3.7能成功闯过多个关卡:到达朱红市(Vermilion City)、捕获多只宝可梦、进行练级,并且能根据对战策略选择最优精灵。相比之前版本连游戏开头的村庄都无法走出,这一进步十分明显。 虽然“打游戏”看似只是个娱乐测试,但其背后反映的AI能力正是企业最需要的:能够在复杂环境中管理资源、制定战略、进行实时决策。 这意味着,Claude 3.7不仅能处理客服自动回复,还能承担企业级数据分析、法律研究、金融建模等高阶任务,一款模型就能满足多种需求,而无需企业同时维护多个AI系统。 Claude 3.7的未来:一体化AI是趋势,还是伪命题? Anthropic的这一战略,或许会彻底改变AI在企业市场的定位。过去,AI系统往往是针对特定任务打造的专业工具,但Claude 3.7的逻辑是:为什么不能让AI根据任务需求自动调整? 如果Claude…
Deep Research的困境:AI的“无限实习生”仍需监督
OpenAI的Deep Research看起来是专为研究分析人士打造的工具,但当实际使用时,它却屡屡在关键时刻掉链子。它的演示效果惊艳,但一旦深入测试,就会发现许多有趣的错误——而这些错误,恰恰决定了它是否真的能被信赖。 对于依赖数据分析的人来说,工作往往包括寻找、整理、比对信息,制作图表,调整数据结构,以更清晰的方式呈现问题,并最终形成一份能够影响决策的报告。这个过程通常需要大量的人工劳动,而Deep Research理论上应该能极大地缩短这一过程。那么,它真的做到了吗? 错误的来源:数据不可靠,结论更不可靠 为了避免凭空测试浪费时间和查询额度,不妨看看OpenAI官方演示的示例——关于智能手机市场的研究报告。表面上看,它提供了一张精美的数据表,似乎节省了大量时间。但关键问题是:数据的来源是否可靠? Deep Research的来源包括Statista和Statcounter,但这两个来源本身就存在问题: 当我们深入查证时,Deep Research声称日本市场的智能手机份额为69% iOS vs 31% Android,但事实却截然不同: 如果连一张表格的基本数据都需要人工逐项核实,那这项技术又如何能真正提升效率? LLM的悖论:擅长模糊问题,却无法给出确定答案 这暴露了一个更深层次的问题——LLM(大型语言模型)天生不是数据库。 Deep Research试图通过模糊推理来找出用户“可能想要的答案”,但最终用户需要的是一个精准的、可验证的答案。这导致了一个根本性的矛盾: 更尴尬的是,Deep Research不仅选错了数据来源,甚至连数据都引用错了。这意味着,即便它能找到合理的研究来源,它依然无法精准提取正确的结论。 “无限实习生”的瓶颈:错误率无法忽视 在AI研究工具的实际应用中,有一个关键问题:如果一份报告中的数据85%是正确的,剩下的15%是错误的,那么这是否意味着它可以被信赖? 对研究人员来说,答案是否定的。数据的可靠性是“非黑即白”的问题,而不是一个“正确率越高就越好”的渐进过程。 这与许多技术进步的逻辑不同。比如,智能手机、电动车或云计算的进步是线性的——它们随着时间推移变得更好、更高效。但在AI研究工具的案例中,只要错误率存在,整个产品的价值就会被削弱。 从技术炫技到实用产品:AI研究工具的未来? OpenAI面临的挑战不仅仅是技术问题,更是产品定位问题。目前,像Deep Research这样的工具并未真正找到稳定的市场定位: 结论:AI研究的真正价值是什么? 尽管Deep Research存在这些缺陷,它仍然提供了一种增强人类能力的方式,而非完全替代研究人员的工作。就像史蒂夫·乔布斯所说,计算机是“思想的自行车”——它让人们走得更远、更快,但无法独立前行。 AI研究工具的正确使用方式,不是让它完全取代人类分析,而是作为“无限实习生”,让专家在更高层次上进行判断和调整。 未来,AI研究工具的方向可能有两个: 但无论如何,目前Deep Research仍然需要人类的监督,而这恰恰是它的最大限制——也是最有趣的地方。
OpenAI开放Deep Research权限,AI智能体大战升级,DeepSeek与Claude迎来新对决
OpenAI今天正式宣布,将其强大的Deep Research功能开放给所有ChatGPT Plus、Team、Education和Enterprise用户。这一举措被业内认为是OpenAI自推出ChatGPT以来最具颠覆性的AI智能体升级。 根据OpenAI官方X账号的声明,Plus、Team、Education和Enterprise用户每月将获得10次Deep Research查询权限,而Pro级别订阅者则可享受120次查询额度。这一变化显然是OpenAI在面对AI竞争加剧时做出的策略性调整,尤其是在DeepSeek和Claude不断推出新功能的背景下。 DeepSeek的开源策略对决OpenAI的付费模式 OpenAI的这一扩展显然不是偶然。最近,AI领域的竞争格局发生剧变,来自中国的DeepSeek通过MIT开源许可发布DeepSeek-R1模型,直接挑战了OpenAI的封闭式订阅商业模式。 两种路线的对比尤为鲜明:OpenAI选择把最强大的功能放在付费墙后,而DeepSeek则反其道而行之,采取“免费放出技术,让生态百花齐放”的策略。这种模式让人想起当年Linux如何颠覆封闭系统,如今在服务器市场上的主导地位就是最佳例证。 市场已经开始对这种开放模式做出反应。Perplexity AI近期就集成了DeepSeek-R1,并以远低于OpenAI的价格推出了自己的研究工具。与此同时,Anthropic则采取了另一种策略,Claude 3.7 Sonnet专注于“透明推理”,让用户可以清晰地看到AI的思考过程。 结果是,AI研究市场正变得更加分散,每家公司的策略都不尽相同。对于企业来说,这意味着选择增多,但决策难度也更大——到底该投资封闭的专有解决方案,还是转向开放技术,以推动更广泛的创新? 从“封闭花园”到“公共广场”,OpenAI的微妙调整 Sam Altman曾在X上发文称,Deep Research“对某些用户来说,可能值1000美元一个月”。这一表述不仅暗示了用户对AI研究工具的高度依赖,也反映出OpenAI在商业模式上的微妙权衡——如何在保持高端产品的独占性和实现“让AI造福全人类”之间取得平衡? 此次扩展并不意味着OpenAI放弃了“高端订阅”模式。相反,免费用户仅获得2次查询权限,更多像是一种“试用版”策略,让用户感受到AI的强大能力,但如果想要真正利用Deep Research,就得掏钱订阅更高级别的套餐。 Plus用户(20美元/月)每月10次查询,而Pro用户(200美元/月)可获得120次查询。这种定价模式确保了高端用户仍然享有更强的使用权,同时让更多人有机会接触这一技术,而不至于影响公司的盈利能力。 Deep Research的隐藏优势与潜在盲点 在一项名为“人类最终考试”(Humanity’s Last Exam)的测试中,Deep Research的准确率达到了26.6%。相较于其他AI模型的成绩,这已经是一个重大突破,毕竟一年前,这种测试的AI正确率甚至不到10%。 Deep Research的核心优势在于其跨领域信息整合能力,它不仅可以搜索上百个在线来源,还能分析文本、图片、PDF,并自主纠错,生成接近专业级水准的研究报告。然而,它也存在一些潜在问题,比如: 尽管如此,Deep Research仍然在AI研究领域取得了显著突破,超越了DeepSeek、Google和Anthropic等竞争对手在Perplexity Labs的测试成绩。 Deep Research如何改变企业知识工作? 对于企业管理者而言,Deep Research既是一个生产力工具,也可能带来工作流程的根本性变革。它可以让研究任务从几天缩短到几分钟,但同时,也需要企业重新思考信息获取和分析的方式。 未来,AI不会完全取代分析师,而是促成“人机协作”模式,企业需要建立新的工作流程,让人类专家负责提问、评估信息、监督AI生成的洞察。 此外,定价模式本身也会影响企业对AI的使用方式。Pro订阅用户的120次查询,每次的成本约为1.67美元——相较于人类研究人员的成本,这几乎可以忽略不计。但查询次数的限制也意味着企业必须更有策略地使用AI,而不会无节制地调用它来处理低价值任务。 长期来看,真正的竞争优势不再是信息获取能力,而是如何更有效地整合AI提供的洞察,让知识变成可执行的决策。 AI研究革命,已然到来 Deep Research的扩展标志着AI研究工具进入全面竞争阶段。OpenAI、DeepSeek、Anthropic、Perplexity等公司正各自押注不同的战略方向,试图在这场AI智能体大战中占据优势。 对于企业来说,问题已经不再是“要不要适应AI”,而是如何在最短时间内建立起新的流程、技能体系和文化思维,以在这场变革中抢占先机。
微软将OpenAI的野心外包给软银?
在通往“超级智能”的征途中,OpenAI迎来了新的资本金主——软银。虽然说微软“外包”了OpenAI的雄心壮志可能有些夸张,但整体方向上似乎没错,至少在算力供应方面,微软正在逐步抽身,而软银正在接管。 “星门计划”(The Stargate Project)的宣布已经为这一趋势埋下伏笔。当时,孙正义(Masa Son)和拉里·埃里森(Larry Ellison)站在白宫,与山姆·奥特曼(Sam Altman)一起发布该计划,而微软只是以“技术合作伙伴”的身份参与,而非资本提供方。微软甚至专门发布了一份公告,强调其与OpenAI的合作关系正在“演变”,允许OpenAI寻找其他云服务商,特别是正在建设第一座“星门”数据中心的甲骨文(Oracle)。 微软的态度很明显:他们并没有和OpenAI彻底分手,而是转向“开放关系”。但潜台词也很清楚:微软不想继续承担OpenAI的全部算力需求,甚至连主要算力提供方的位置都不想坐了。 这在OpenAI的内部财务预测中也有所体现。据《The Information》的Cory Weinberg、Jon Victor和Anissa Gardizy披露,OpenAI预计到2030年,软银将提供其75%的计算能力,而目前微软几乎是唯一的算力供应商。换句话说,微软正在逐步放手,而软银正在全面接管。 当然,情况比这更复杂。微软仍然是OpenAI的重要合作伙伴,尤其是在早期投资方面。未来,如果OpenAI成功转型为盈利公司,微软很可能成为其最大股东之一。但不管怎么说,微软现在的态度已经很明显:是时候让OpenAI自己飞了。 从商业角度来看,这也完全可以理解。微软CEO萨提亚·纳德拉(Satya Nadella)要对股东负责。虽然与OpenAI的合作让微软股价一路高歌,但这不可能无限期持续下去。华尔街迟早会对科技巨头的AI投入开始“秋后算账”,正如之前DeepSeek事件所透露的那样。这也是为什么所有科技巨头的资本支出(CapEx)都在趋同,除了苹果——但那又是另一个故事了。 微软的策略很明确:保持年度资本支出在800亿美元,而不是为了“星门”计划直接飙升到1800亿美元。毕竟,这个项目的预算高达5000亿美元,虽然这个数字可能只是为了讨某位喜欢“大数字”的总统欢心,但即便按最保守估算,也是一笔天文数字。而OpenAI似乎真的有办法搞到这笔钱——主要靠软银。 纳德拉在接受CNBC采访时笑称自己“今年就出80B”(80亿美元),这句话一度被解读为对OpenAI“星门”计划烧钱模式的调侃。但更深层次的含义是向华尔街传递信号:微软不会再无止境地给OpenAI输血,他们已经找到方法将额外的AI支出转嫁出去。 根据《The Information》的报道,OpenAI目前正在进行400亿美元的新一轮融资,而软银预计会提供其中的75%。其中近一半的资金将用于“星门”数据中心建设。此外,OpenAI预计今年三分之一的收入将直接来自软银——投资、购买、再投资,形成一个自给自足的闭环。这种模式是否涉及财务灰色地带?暂且不论,但显然软银正在成为OpenAI的绝对核心金主。 得益于软银的资金支持,OpenAI的营收预测也得到了大幅上调。今年的收入预计将从37亿美元暴涨至125亿美元,到2026年达到280亿美元。而且,大部分收入仍然来自ChatGPT,而不是API或其他B2B业务,这表明OpenAI的核心业务模式可能比想象中更稳固。不过,代价同样不小——今年的现金消耗预计将从去年的20亿美元激增到70亿美元,并在2027年达到峰值——200亿美元。公司预计要到本世纪末才能实现盈利。 这样的烧钱速度,恐怕只有孙正义才能接受。但与过去的失败投资(比如WeWork)不同,如果OpenAI真的能兑现其承诺,打造一个“超级智能”时代,回报可能会比当年的阿里巴巴投资更加惊人。当然,前路依然漫长,且资金需求巨大。 OpenAI预测,到2030年,其运营成本将达到3200亿美元,其中超过一半用于训练AI模型。这一点或许正是微软最不愿意继续投入的部分。因此,他们选择了退出,让软银接手。这也意味着,OpenAI和软银的合作目标已经锁定——全速冲向AGI(通用人工智能),再冲向“超级智能”。 然而,这一切的前提是,他们真的能建成“星门”数据中心。毕竟,这个计划不仅需要天量资金,还需要至少8吉瓦的电力——这无疑将是未来科技界最值得关注的超级工程。而微软,则似乎已经乐于退居二线,静观其变。
谷歌最新AI视频模型Veo 2定价曝光,每秒50美分
谷歌悄悄公布了其AI视频生成模型Veo 2的收费标准,而这个价格可能让不少人倒吸一口凉气。 根据谷歌官方定价页面的显示,使用Veo 2的成本为每秒50美分,换算下来就是每分钟30美元,每小时高达1800美元。对此,谷歌DeepMind研究员Jon Barron还特意拿《复仇者联盟4:终局之战》做了个对比——这部漫威大片的制作预算高达3.56亿美元,相当于每秒烧掉3.2万美元。 不过,用户花钱生成的视频未必每一秒都能用上,而且Veo 2目前也还达不到“漫威大片流水线”的水准。谷歌在发布公告时提到,Veo 2擅长生成时长两分钟或以上的视频,但想指望它产出三个小时的史诗级大片,可能还为时尚早。 另外,OpenAI最近也推出了Sora视频生成模型,定价方式则是捆绑到ChatGPT Pro订阅中,每月收费200美元。这两家AI巨头的较量,看来在视频生成领域也已经打响了。