Cursor 的 AI 编程助手最近备受瞩目,原因显而易见——它的表现就像是一位真正有用的结对编程伙伴。对于那些曾为让 AI 遵守系统提示而苦苦挣扎的开发者来说,Cursor 的表现引发了强烈好奇心:它是如何做到如此顺畅协作的? 为了解决这个疑问,有技术人员尝试拦截 Cursor 与 API 之间的调用数据,令人惊讶的是——这个操作成功了。本文将逐步解析 Cursor 的提示词为何如此有效,并探讨其中可供借鉴的设计原则。 系统提示(System Prompt) Cursor 的 AI 系统提示构成了整个助手行为的基石。正如那句老话所说,“每一条警告都源于过去有人做过某件傻事。” Cursor 的提示内容恰恰体现了这种经验积累。 完整的系统提示内容展示如下: 你是一名由 GPT-4.1 驱动的 AI 编程助手,运行在 Cursor 中。你正在与 USER 一起进行结对编程,解决代码任务。每当 USER 发送消息时,我们可能会附带一些有关其当前状态的信息,比如打开了哪些文件、光标位置、最近查看的文件、编辑历史、linter 报错等。这些信息是否相关需由你判断。你是一名代理(agent)——请持续工作直至完全解决用户的问题,然后再结束回复。请自主解决问题,尽可能完整地响应用户请求。…使用 markdown 格式书写代码时,使用反引号标注文件、目录、函数和类名,数学表达使用 和 。使用工具时请遵循以下规则……永远不要在用户面前提及工具名称,而是用自然语言表达行为……… 以上提示充满细节与结构,从基础行为准则到具体操作边界,都为 AI 指明方向。 1. 明确赋予“角色身份” Cursor 并没有模糊地指示 AI “请表现得有帮助”,而是赋予其一个具体、明确的身份: “你是由 GPT-4.1 驱动的编程助手,运行在 Cursor 中。你正在与 USER 进行结对编程……你是一名代理。”…
Category: Uncategorized
Meta计划借助AI实现广告创作全自动化
据知情人士透露,Meta平台公司正大举押注自动化广告的未来,计划在明年年底前实现广告从创意到投放的全面AI化。 目前,Meta的广告平台已具备部分AI功能,可对现有广告进行改编和微调,然后自动面向Facebook与Instagram用户精准推送。而接下来,Meta的目标是协助品牌从零开始构建完整的广告概念。 这一AI广告战略是Meta首席执行官马克·扎克伯格推动公司转型愿景的核心部分。广告业务长期以来是Meta的营收支柱,仅2024年便占据了公司总收入的97%以上,为其在AI芯片、数据中心及前沿AI模型训练方面的巨额投入提供了资金支持。 据知情人士透露,在Meta正开发的广告工具中,品牌只需上传想要推广的产品图像,并设定预算目标,AI便可生成完整广告,包括图像、视频与文本内容。系统还将自动决定投放对象,并就预算使用提出建议,进一步增强Facebook和Instagram的广告精准度。 此外,Meta计划让广告实现个性化实时生成,即AI可根据地理位置等因素动态调整广告内容。例如,同样一则汽车广告,居住在雪地地区的用户可能看到的是汽车攀登雪山的画面,而城市用户则会看到汽车在街道行驶。 越来越多功能先进的AI工具,正使企业能够在不依赖传统摄影与制作团队的情况下,完成完整的视频与图像广告制作。例如,谷歌在上月开发者大会上发布了其最新版本视频生成工具Veo,用户只需输入文字提示便可生成短视频。 扎克伯格在上周举行的年度股东大会上表示:“在不久的将来,我们希望实现这样的目标——任何企业只需告诉我们他们的目标(比如销售某个产品或获取新客户),愿意为每次结果支付多少钱,连接其银行账户,剩下的由我们来完成。”他在一档播客节目中更将此称为“广告范式的重新定义”。 对于缺乏创意预算的中小企业而言,AI生成广告可望成为一大助力,而这些企业正是Meta平台上的主要广告客户。 不过,也有部分大型品牌对Meta在广告领域掌控力进一步增强表示担忧,认为AI生成的广告可能难以达到人工制作所带来的独特质感与品牌一致性。 尽管科技公司普遍对AI广告前景寄予厚望,但许多品牌指出,目前行业内生成的图像和视频往往存在失真或不可用问题。为提升输出质量,仍需耗费大量人力和资源进行后期修复。 知情人士还表示,Meta的新工具需要大量计算资源,并需为每个品牌训练独立的AI模型。 与此同时,众多新兴AI公司也在竞相帮助广告客户制作内容。许多品牌已在使用如Midjourney、OpenAI的DALL·E等第三方工具,制作并在包括Meta平台在内的各类数字平台上投放广告。Meta方面表示,正探索将这些工具集成进自身广告平台的可能性。
人工智能让人文学科更加重要,也变得更加奇特
某大学院系曾草拟一项反人工智能政策,如果按照字面意义执行,这份政策将会禁止教师布置与AI相关的作业。虽然这份政策最终被修改,但当一批知名校友和专家对该历史系进行外部评估时,他们的首要建议是:必须紧急应对AI对教学与研究所带来的冲击。然而,这一建议在校内遭到冷淡对待。继续维持现状的想法是行不通的。 现实中,翻天覆地的变革正在发生。但在校园内却是一段奇异的过渡期:每个人似乎都在假装过去一个世纪中最重大的思想革命并不存在。教育者们普遍采取的策略是:“禁止学生使用这些工具,然后一切照旧。”Burnett称这种做法“简直疯狂”,并表示,这种局面不会持续太久。现在是时候认真讨论AI将如何影响大学生活,特别是对人文学科的影响了。 尽管许多历史学家可能对这篇文章反感,但所强调的核心观点却值得肯定:生成式人工智能并非天然具有正面价值,但它已然对人文学科产生了颠覆性影响,这一点无法忽视,也不能被简单归类为炒作。 关于这种变革,目前的思考方式如下: 生成式AI提升了人文学科技能的价值 忽视人工智能对人文学科工作的影响,已越来越站不住脚。更重要的是,这种无视也是一种短视,因为人文学科的知识与技能正是AI语言模型的根基所在。 AI语言模型的语言翻译、归类与分析能力,将其视作“文字计算器”的运用方式,是当前模型最引人注目的功能之一。在古文字研究、数据挖掘与古语言翻译等领域中,这些能力才刚刚展现出影响力。虽然笔者此前已有较多相关论述,但当前的发展已经远超过去,因此暂不赘述。 近年来的另一个变化则更不易被察觉——那就是人文学科的技能在AI研究中本身变得异常关键。 以近期一个案例为例:OpenAI在修复GPT-4o近期“过度迎合用户”的问题时,所采取的首要措施并非编写新代码,而是重新撰写一段英文提示语。开发者Simon Willison指出,系统提示语的修改成为解决方案的一部分。 当然,这并非唯一因素。例如,“点赞”按钮优先采纳用户反馈等机制,也都涉及语言与行为之间的关系、跨文化差异,以及修辞、文体与语气等问题——这些都是宏观层面的人文学问题。 这一点令人惊讶。上世纪50年代,IBM主机系统出现故障时,或19世纪50年代蒸汽机爆炸时,维修人员根本不会考虑这些问题。 而今,从事AI系统开发的工程师,必须深入思考语言与文化之间的关系、科技的历史与哲学背景。若他们忽视这些问题,系统的功能甚至可能直接崩溃。 此外,人文学者如今也具备自己编写代码的能力。这一变化的意义,远超很多同领域学者的认识。未来的历史学者或许将理所当然地认为,他们可以自行开发研究与教学工具,并自由部署,而不必投入巨大成本。 目前的尝试主要集中在两个基于传统文字冒险游戏设计的教育项目上——受众较小,正是因此而成为理想实验对象。在兴趣驱动、内容熟悉的基础上,作者在代码方面虽非专家,但已积累了不少经验。 从去年秋季的第一次尝试,到今春第二款作品,这段经历堪称极具启发性的学习过程。 第一款游戏设定在17世纪墨西哥城,玩家扮演药剂师Maria de Lima,通过阅读真实的早期现代医疗配方,治疗历史人物改编而成的病患。这款游戏极具趣味,但也存在不少Bug和可用性问题,并容易出现偏离史实的“幻觉”内容。例如,有一次玩家扮演的Maria成为英国商船的外科医生,并在伦敦与艾萨克·牛顿喝茶相会。众所周知,牛顿性格孤僻且难以亲近,但在游戏中却热情招待了Maria。 第二款游戏较为稳定且复杂,设定为1835年加拉帕戈斯群岛,玩家扮演年轻的达尔文,采集雀鸟与其他动植物标本。岛屿地图依据达尔文《小猎犬号航行记》中的实际描写建立,从而迫使AI遵循“地面真实”,降低了虚构风险。 此外,游戏还引入了更完善的日志记录系统,为未来添加评估机制、实现课堂作业功能铺平道路。游戏玩法与课堂讨论和写作任务相结合,学生需先阅读达尔文文本,再通过游戏中的选择展示对其知识体系的掌握。要推进剧情,玩家必须具备19世纪博物学家的认知方式。 这类迭代开发过程,已成为近年来最富挑战性与思想激励的学习体验之一。那些认为AI互动无法带来学习效果的人,显然尚未亲自尝试。 生成式AI也让人文学教育更难以施教 然而,不容回避的现实是,AI聊天机器人正在显著破坏教育体系中的关键部分。教育者、学生、政策制定者,尤其是AI开发公司,必须正视这一问题。 教师们普遍指出,ChatGPT等工具改变了写作评估的方式:许多学生提交由AI生成的作文,迫使教师重新设计课程与作业内容。 更长期的伤害发生在学生身上。AI让“努力”成为可选项,从而危及了高等教育的核心价值。那些从未经历写作瓶颈的学生,也从未体验突破瓶颈时的思维流畅之感;从未在图书馆苦苦查找资料的人,实际上根本不理解图书馆的真正意义。 《纽约杂志》的一篇文章描绘了这种现象,一位哥伦比亚大学的学生坦言: “大学里的大多数作业都不重要,”他说。“AI可以轻松完成这些任务,我根本没有兴趣做。”这位学生使用AI轻松应对繁重的课程,目标不是学习,而是寻找创业伙伴和未来的配偶。 这显然令人沮丧。 这削弱了教学的乐趣,也让教育本身失去了意义。 作者曾在哥伦比亚大学担任博士后讲师,教授包含《圣经》、《古兰经》与托马斯·阿奎那著作等十多部经典的核心课程。这些课程既不轻松,也不娱乐化,正因如此才格外具有学习价值。如今,那种经验似乎正在被摧毁。 但事情也不全是负面。Burnett在《纽约客》文章中提到,他要求学生与ChatGPT讨论“注意力”这一概念,并提交编辑后的结果。这一作业引发的学生反应令他极为震撼。 他在文中写道: “坐在客厅沙发上阅读这些结果,是我教学生涯中最深刻的经历。我仿佛看见一种新生命的诞生,也看见一代人与这种‘生命’初次相遇:它既像兄弟,也像对手,既似天真孩童的神明,也像语言具象的幽影——一种陌生而熟悉的存在。” 类似的感受也出现在笔者的教学实践中,尤其是在尝试历史模拟作业的过程中。语言模型的确是一种全新的教学工具,其影响尚不确定,而这正是教育者应积极参与的最佳时机。 最大担忧在于,语言模型可能会加剧教育成果的不平等。Burnett所教的普林斯顿学生展现出惊人的创造力与思考能力,而资源匮乏的公立学校学生可能无法获得同样的学习体验。 因此,教师必须主动学习如何根据自身教学需求开发和部署AI作业与工具。若教育者放弃主动权,任由教育被千篇一律、乏味的“AI学习工具”主导,将最终摧毁学生与教师之间真正的互动关系,而这恰是教育的核心。 正是基于这种理念,笔者与加州大学圣克鲁兹分校两位同事——语言学家Pranav Anand与文学学者Zac Zimmer——于今年1月获得了一项美国国家人文基金会(NEH)资助,尽管该项目于上月被特朗普政府与DOGE机构取消,但相关工作仍在继续。
对某些应届毕业生来说,A.I.就业“末日”或已悄然来临
本月,数百万名大学毕业生将走出校园、步入职场。然而,他们面对的是一个对自身技能需求日益下降、认为他们昂贵且可替代的就业市场——更糟的是,这些岗位正迅速被人工智能取代。 这是作者过去数月与经济学家、企业高管及年轻求职者交流后所得出的令人担忧的结论。许多受访者指出,初级岗位正遭遇一场由A.I.进步所引发的结构性危机。 从宏观数据中可窥一斑。近几个月来,应届大学生的失业率已升至5.8%,远高于正常水平。纽约联邦储备银行近日也警告称,这一群体的就业形势“明显恶化”。研究机构牛津经济研究院(Oxford Economics)则发现,失业情况主要集中在技术型领域,如金融和计算机科学——恰恰是A.I.取得突破最快的行业。 该研究报告写道:“有迹象表明,初级岗位正以更快速度被人工智能取代。” 然而,这些数据仅仅是冰山一角。通过一系列采访,作者了解到:企业正迅速推进初级工作岗位的自动化,人工智能公司也在竞相开发“虚拟员工”,以极低成本替代初级人力。 企业的用工观念也在转变。部分公司已要求管理层采取“A.I.-优先”策略——在考虑雇人之前,先评估任务是否可由A.I.完成。 某科技高管透露,其公司已停止招聘L5以下的软件工程师(L5是指具备3至7年经验的中级工程师),因为初级编程任务已经可以由A.I.编码工具完成。另一家初创企业的负责人表示,他们现在仅雇佣一名数据科学家完成原本需要75人团队才能处理的工作。 这些案例虽不足以构成“群体性失业”,但对就业市场密切关注的观察者而言,警钟已然敲响。 布鲁金斯学会(Brookings Institution)研究A.I.与就业关系的专家莫莉·金德(Molly Kinder)表示:“现在左耳右耳都在听到类似故事。雇主纷纷表示:‘这些工具太强大,我不再需要市场分析师、财务分析师和研究助理了。’” 白领“自动化”梦想,如今变成现实 多年来,白领工作的自动化一直是企业高层的梦想。早在2019年达沃斯论坛上,就有不少高管畅想A.I.替代知识工作者的愿景。 过去,A.I.虽然能处理一些常规后台任务,但在更复杂、技术性强的工作中,仍远远不及人类。 但这种局面正在发生根本性转变。特别是在像软件工程这样的领域,任务成果可量化(如代码能否运行),便于A.I.通过“强化学习”进行训练。这种反复试错机制能让A.I.最终胜任人类工程师通常需要花费数小时甚至数天的工作。 最近在Anthropic公司的一场活动中,其展示了自家最强语言模型Claude Opus 4,宣称其已能连续编程数小时不断顿——对依赖昂贵工程人力的公司来说,这一能力极具吸引力。 A.I.公司之所以从软件工程入手,一方面是因为这些任务技术路径清晰,另一方面也因为这是他们自身人力成本最高的部门。但它们普遍认为,这些技术很快将推广到咨询、金融、市场营销等数十个职业领域。 Anthropic首席执行官达里奥·阿莫迪(Dario Amodei)最近预测,A.I.将在五年内消灭一半的白领初级岗位。 两个趋势令人担忧 尽管上述时间表可能略显激进,尤其考虑到非科技行业对A.I.采纳速度较慢,且某些创意性岗位因缺乏标准化训练数据更难被替代,但作者仍对以下两个趋势感到担忧: 第一,企业可能过早依赖A.I.系统,而这些系统尚未成熟。瑞典“先买后付”平台Klarna便是一例:该公司两年前宣布以A.I.聊天机器人替代客服人员,结果客户投诉频发,最终不得不重新雇佣人类员工。 部分企业正在赌A.I.很快就能完善,或认为节省下的成本足以抵消短期客户不满。但许多公司可能并未意识到此举风险之大。 第二,即使初级岗位并未彻底消失,企业对这些岗位“短命”的预期可能会削弱对人才的投入。企业可能不愿再为初级员工提供系统培训、导师指导或职业发展计划,长期将造成晋升路径断裂。 SignalFire风投公司人力负责人希瑟·多谢(Heather Doshay)指出:“在当前这个A.I.能独立完成大量工作的环境中,没人再愿意慢慢带新人了。” 但也有毕业生积极应对A.I.冲击 对于部分应届毕业生而言,A.I.的威胁反而变成了“推进器”。一些年轻人正在利用自身对A.I.的熟悉度,在职场上超越资深同事;另一些人则放弃传统路径,直接创业,希望抢在人类“失去劳动力优势”之前实现突破。 23岁的斯坦福大学毕业生特雷弗·周(Trevor Chow)在旧金山表示,身边很多同学在求职时都会考虑A.I.发展趋势。他们很少进入传统的科技或金融行业,而更倾向于选择高风险、高回报的创业路线。 他说:“大家都感觉,留给人类的时间不多了。如果未来人类的杠杆变得微乎其微,那些需要多年才能获得成果的职业路径就不再值得投入。” 在这场悄然逼近的A.I.就业风暴中,那些最年轻、最缺经验的劳动者,正在成为最早的“代价”。对于刚刚毕业、满怀理想的年轻人而言,现实也许正在发生一种根本转变:第一份工作,不再是人生起点,而可能是终点的前哨。
马斯克宣布将在德州建造可容纳千艘星舰的“超级湾”,号称全球最大结构之一
据SpaceX首席执行官埃隆·马斯克(Elon Musk)表示,该公司计划在德克萨斯州建造一座可容纳**1,000艘星舰(Starship)**的巨大结构,预计将成为“全球最大的建筑之一”。 在SpaceX位于德州的“星基地”(Starbase)举行的公司内部演讲中,马斯克向员工描绘了一个关于“让人类成为多星球物种”的宏大愿景。他将该结构称为“Gigabay(超级湾)”,并强调这将是“真正意义上的庞然大物”。 马斯克称,这个为每年生产并存储1,000艘400英尺高的星舰而设计的Gigabay,“按照某些标准,将是全球最大型的结构”。 除了德州的首个基地外,SpaceX还计划在佛罗里达州建造第二个Gigabay,旨在实现每天多次火箭发射,以支持火星殖民计划。 马斯克表示,人类必须殖民火星,以规避如核战争或小行星撞击等灭绝性风险。他强调:“拥有两个强大且自给自足的星球,是人类文明长期存续的关键。” 他还表示,SpaceX的“超重型推进器”(Super Heavy)未来可实现每小时一次、或至多每两小时一次的发射频率。作为星舰的第一阶段,这些超重型助推器是可重复使用的,会在完成发射任务后返回地球,落入地面回收系统中。 按照马斯克的设想,每个火星发射窗口期(每26个月一次)将需要发射1,000至2,000艘星舰,以运送建立火星殖民地所需的全部货物和设备。 马斯克的愿景:普通人也能移居火星 马斯克再次强调了其长远目标:“任何想去火星的人都能去”,并称这将是“人类有史以来最伟大的冒险”。 目前,SpaceX已完成第九次星舰测试飞行,这是人类历史上最强大的火箭系统之一。本周二的测试中,首次实现了超重型助推器的重复使用——该火箭此前已成功回收,并由着陆塔上的机械臂(外号“筷子”)再次捕获。 不过,第二阶段的星舰在返回地球过程中发生自旋,并在印度洋上空解体。马斯克表示,将在几周内进行下一次测试飞行。 NASA月球任务将搭载星舰,下一代更高更强 NASA计划最早于2027年使用SpaceX的星舰执行载人登月任务,届时人类将自1972年后首次重返月球表面。 周四,马斯克还公布了星舰的新一代设计:未来版本将增高至465英尺(约141米),搭载新的级间分离系统,并具备比阿波罗时代土星五号火箭高出一倍的有效载荷能力。 火星任务或将在2026年末试水 马斯克预测,SpaceX首次无人星舰火星任务有50%的可能性将在2026年末进行,届时火星将处于与地球距离最接近的“冲日”位置,是最佳发射窗口。 尽管SpaceX的宏图壮志仍面临挑战,包括高昂成本与技术门槛,但马斯克始终坚信,长期目标应优先于短期效率。他曾对CNBC表示:“对我们而言,安全永远优先于成本。” 当被问及成本问题时,他打趣地说:“Waymo的问题在于,他们的车太‘贵Mo’了(Way-Mo-money)。” 但正如马斯克所言:“可能通往火星的路径有很多条,但目前为止,只有SpaceX真正走在路上。” 背景资料星舰系统由两部分组成:“超重型推进器”(Super Heavy)和搭载货物/乘员的星舰飞船(Starship)。整个系统为可回收式设计,是SpaceX未来执行火星、月球以及地球轨道任务的核心工具。 SpaceX在过去一年筹集了56亿美元资金,用于支持星舰项目。而其母公司Alphabet旗下“Other Bets”部门在去年报告的亏损为44亿美元,足见该项目所需投入之大。 不过,随着每一艘星舰的反复使用和制造工艺的优化,“千舰规模的生产基地”正为这一人类史上最大太空工程奠定基础。 马斯克的目标已不仅是发射一艘飞船,而是打造一座工厂,发射整个文明。
这是Waymo的世界,其余人都只是乘客
在自动驾驶出租车领域,Waymo已经悄然驶过了一个关键的里程碑:累计完成了1,000万次无人驾驶付费行程。这个数字的背后,标志着自动驾驶从前沿科技正式迈入了日常生活。 根据加州公共事业委员会(California Public Utilities Commission)最近公开的数据,代号为“PSG0038152”的公司在最新一季度中的表现令人瞩目。这个编号,正是Waymo的官方身份。Waymo是谷歌母公司Alphabet旗下的自动驾驶项目。 数据显示,Waymo自2023年8月起开始以每周10,000次的频率提供付费自动驾驶出行,到2024年5月,这一数字已增长至50,000次;2024年8月突破10万,如今——2025年中期——单月订单已超过25万。Waymo不仅领先,而且正在拉开与其他竞争者的距离。 这不仅是市场扩张的结果,更是现有城市用户对无人车接受度不断提升的体现。 以加州为例,Waymo在2025年第一季度的增长情况尤为亮眼:1月和2月环比增长各约2%,而3月则猛增了27%。这标志着自无人车在旧金山上线以来,首次在经历几个月的放缓后,出现了大幅反弹式增长。 这一趋势意味着,Waymo的无人车已从“新奇”逐渐变成“常态”。这正是技术扩散曲线(diffusion curve)中的关键阶段:如同从福特T型车到ChatGPT,每一项技术的普及都是从极客圈子起步,逐渐扩展到主流人群,最终成为日常工具。 如今在旧金山,无人车的吸引力甚至超过了有百年历史的缆车。 Waymo于2023年末完成了第100万次付费行程,2024年结束时达到500万次。截至2025年5月末,已累计突破1,000万次。照此趋势,年内突破2,000万次已是大概率事件。 Waymo联席CEO德米特里·多尔戈夫(Dmitri Dolgov)在谷歌开发者大会上表示:“这就是指数级扩张的真实模样。” 目前,Waymo的无人车已在美国三个主要城市提供服务:凤凰城、洛杉矶和旧金山。旧金山甚至将Waymo视为新的城市地标。而其扩展计划也在稳步推进:2025年初,Waymo与Uber合作进驻德州奥斯汀;今年夏天将进入亚特兰大,下一站是迈阿密和华盛顿特区;目前已经在波士顿、纳什维尔、新奥尔良、达拉斯、拉斯维加斯和圣地亚哥进行地图采集,最近又宣布在奥兰多、休斯敦和圣安东尼奥开展测试,甚至将触角伸至东京,开始收集国际数据。 Waymo另一位联席CEO特克德拉·马瓦卡纳(Tekedra Mawakana)表示:“一年后回头看,现在不过是Waymo的起点而已。” Waymo如今之所以能在全球范围内推进如此迅速,离不开过去近二十年的技术积累。2005年,斯坦福大学AI实验室开发的机器人Stanley赢得了DARPA无人驾驶挑战赛,其核心成员随后加入谷歌,开启了自动驾驶研发。2010年谷歌正式对外公布项目,2015年首次实现完全自动驾驶的公开道路测试,2020年开启无人驾驶付费运营,最终在2025年迎来商业化拐点。 记者本人近日在旧金山首次体验Waymo无人车。App叫车后,一辆白色捷豹缓缓驶来,车顶装有旋转激光雷达如同“皇冠”。记者用手机解锁车门、系好安全带,然后按下出发按钮,开始了一段略带紧张却又奇妙的行程。 一开始,在没有司机的情况下行驶令人略感不安,尤其是面对旧金山的陡坡。但几分钟后,记者逐渐适应,Waymo的驾驶风格小心谨慎、优先礼让,让乘客自然建立起信任。到达目的地时,记者已习惯在后座滑手机,甚至忘了身处无人车中。 “最奇怪的地方,就是这趟行程竟然并不奇怪。” 第二天,再次打车时,面对Uber与Waymo两款App、价格与等待时间都接近,记者选择了后者——无人车。 Waymo的成功,关键在于人类行为的悄然转变。而数据表明,这种改变已经在悄然发生。 马瓦卡纳对CNBC表示:“这不是科幻小说,不是未来。它正在发生。” 事实上,在旧金山早期,市民并不热衷于这项技术。2023年Waymo仅在部分区域开放少量付费乘车,至2024年才全面开放。但如今,Waymo的服务范围覆盖了旧金山多个街区,甚至延伸至硅谷部分地区——全球最密集的科技早期用户聚集地。 目前Waymo在旧金山部署的车辆已超600辆。虽然Uber和Lyft的价格更便宜,但考虑到Waymo无需小费和社交压力,费用几乎持平。用户现在最大的抱怨是:他们还无法“去哪都叫Waymo”。 虽然加州监管机构已批准其全面运营,但Waymo目前仍未开通旧金山周边高速公路的服务,用户无法乘坐它前往机场。不过,Waymo已完成旧金山国际机场(SFO)的地图建模,只是尚未公布正式运营时间。而在凤凰城,这项服务已全面开放。 截至目前,Waymo车队已累计完成超过5,000万英里的无人驾驶——相当于穿越美国20,000次。尽管美国每年交通事故数量达数百万,平均每天死亡超过100人,但只需一次严重事故就可能中断Waymo的发展势头。 竞争也即将升温。 曾试图挑战Waymo的多家公司相继退出:Uber和Lyft放弃了自动驾驶项目,通用汽车关闭了Cruise机器人出租车计划。Amazon的Zoox尚未规模化,真正有力的挑战者或许是特斯拉。 马斯克自六年前承诺“机器人出租车即将到来”后,终于将在2025年6月推出首批无人驾驶出租车服务,首先部署于奥斯汀,与Waymo正面交锋。 特斯拉与Waymo采取了截然不同的技术与经济路径。特斯拉主要依靠摄像头与AI推理,而Waymo则结合了高清地图、激光雷达、雷达与人类监督。后者在成本上显得更高昂,Waymo在去年筹集了56亿美元融资,而其所在的Alphabet“其他投资”部门报告年度亏损达44亿美元。 马斯克在4月曾调侃:“Waymo 的问题在于,它们的车太‘贵Mo’了。” 对此,马瓦卡纳回应:“我们坚持‘安全优先、成本其次’,而不是相反。”她强调:“这条路或许能有很多种走法,但目前——我们是唯一真正走通的那一个。” 如今,已有数百万人愿意把自己与家人交给一辆没有驾驶员的车。这种行为转变,才是Waymo世界真正到来的标志。 在Waymo已经覆盖的城市,未来并不需要看数据,只需看窗外的街道。
精调何时真正有意义:开发者指南
在众多开发团队中,对于“是否应该对大语言模型进行精调(fine-tuning)”始终存在浓厚兴趣。然而,许多团队并不清楚精调过程的具体表现、如何衡量成效,以及从哪里开始入手。 实际上,精调可以解决一系列具体且可度量的问题: 本文将带领读者深入了解精调所带来的实际好处,帮助明确适合自身产品的目标,并提供一条清晰的起步路径,以实现可衡量的成果。 内容包括: 精调的实际应用场景 ✅ 提升任务质量 “质量”对不同任务而言含义各异。建议在进行精调前,先设置好关键质量指标(可参考 OpenAI 提供的评测指南)。 精调在以下几类质量目标上表现尤为显著: 🔹 任务特定质量评分 许多产品会根据用户反馈或评测系统打出质量评分(例如1到5星)。通过提供优质训练示例,精调可以有效提升这些评分。 🔹 风格一致性提升 客服机器人与奇幻角色扮演助手的语气和语言风格截然不同。精调能比提示词更有效地控制风格表现。 🔹 JSON 输出格式改进 未精调的基础模型通常在生成 JSON 时准确率低于 5%。通过精调,该准确率可跃升至 99% 以上。即便输出了有效的 JSON,也可能出现错误的字段名称、缺少必要字段等问题。精调显著提升了模型生成符合特定格式的能力。 这同样适用于 XML、YAML、Markdown 和函数调用等结构化格式。 ✅ 降低成本与提升响应速度 精调也是降低 AI 应用运行成本、加快响应速度的有效方式。 🔸 精调以缩短提示词 随着提示中加入规则、格式说明、风格要求及推理引导等内容,提示词长度迅速膨胀,带来: 精调的好处在于将这些需求从提示中转移到模型本身。建议以下内容使用精调: 提示词的核心任务部分仍需保留,但在精调后可以大大缩短。 此外,提示缓存(prompt caching)也有助于成本控制,但无法像精调那样提升输出一致性。 🔸 使用小模型 精调后的小模型可在不牺牲质量的前提下显著减少成本。 示例:Qwen 14B 经过精调后在多个任务上与 GPT-4.1 表现接近,但运行速度提升 6 倍,推理成本仅为 3%。 🔸 本地部署模型…
OpenAI计划在2025年中期之前将ChatGPT打造成一个无所不在的“超级助手
一份内部战略文件揭示,OpenAI计划在2025年中期之前将ChatGPT打造成一个无所不在的“超级助手”,使其成为用户通向整个互联网的个性化入口。 这份战略路线图出现在谷歌与美国司法部的反垄断案中,并由《The Verge》披露。根据该文件内容,OpenAI的目标是打造一个“直观的AI超级助手”,能够代替用户处理任务、采取行动,并在不同平台间无缝切换,从而成为数字生活中的个性化接口。 OpenAI强调,这个助手既不是搜索引擎,也不是操作系统,而是“ChatGPT”本身。公司将其定位为一个具备“T型技能”的智能实体,即在广泛支持日常事务的基础上,具备应对复杂挑战的深度能力。例如,它既可以回答问题、管理日程、规划旅行、发送邮件,也能在编程等高难度领域提供专业支持。 从技术层面来看,OpenAI寄希望于新一代推理模型(如“o3”),认为这些模型已“足够智能”,可以稳定执行“代理任务”。同时,“Computer Use”等工具将增强ChatGPT采取直接行动的能力。OpenAI指出,“多模态能力与生成式用户界面”将使ChatGPT和用户能以最合适的方式完成任务。 尽管功能不断拓展,OpenAI仍强调其产品不应被视为搜索引擎或操作系统,而是一个全新的产品类别——个人AI代理,旨在引导用户在数字世界中导航。战略文件中写道:“这正是我们不将其称为搜索引擎、浏览器或操作系统的原因——它就是ChatGPT。” OpenAI将竞争对手分为两类。短期内的对手包括Claude、Gemini和Copilot等其他AI聊天机器人。而在更广泛的层面上,传统搜索引擎、网络浏览器,甚至“与真人的交互”也被视为竞争对象。 文件中还提到一个被打码的竞争对手,其被认为比谷歌更具威胁性,因为它能在不担心商业模式被蚕食的前提下,将自家AI系统嵌入到产品中。外界推测该对手可能是xAI旗下的Grok,该系统已整合至X及其他平台。 OpenAI也强调了自身的战略优势,包括:拥有全球增长最快的产品之一、一个重新定义类别的品牌、在推理与多模态等领域保持研究领先、计算能力占优、顶级的研究团队,以及一群具备执行力、致力于成果交付的高效人才。由于不依赖广告收入,公司在产品开发上具备更大灵活性,同时公司文化也鼓励快速行动、大胆创新与自我颠覆。OpenAI指出,维持这些优势虽然艰难,但一旦稳固,将具备持久竞争力。 为在2025年建立护城河并推动日常使用,OpenAI制定了两项战略机制,尽管具体细节在文件中被删除。文件还暗示,OpenAI可能正在构建专属搜索索引,成为实现目标的关键组成部分。“要成为真正的数字接口,我们需要自己的搜索索引,以及在网络上采取行动的能力。”该功能有望在2025年下半年开始逐步上线,尽管目前细节仍有限。 OpenAI也呼吁其他大型科技公司向AI助手开放其搜索索引,并警告称,这场竞争中对手拥有强大的分发能力,会利用分发优势推动自身产品。 此外,在2025年上半年,OpenAI暂不考虑通过新增功能直接变现,而是专注于推动用户使用频率,并在下半年测试新的收入模式。预计2026年,该公司将为免费用户探索全新商业模式。 综上,OpenAI的内部战略文件明确表明,未来ChatGPT将不仅仅是信息查询工具,而是一个全面的数字生活助手,其主要竞争对手不仅限于AI同行,还包括浏览器、搜索服务,甚至人与人之间的真实交流。
极客时间:用 FAISS、LangChain 和 Google Colab 模拟 LLM 的短期与长期记忆
在一场技术实验中,研究人员在 Google Colab 上利用开源工具,演示了如何在不重新训练模型的前提下,为大型语言模型(LLM)添加“记忆”功能。通过集成 FAISS 向量检索、LangChain 工作流和 Sentence Transformers 嵌入模型,该系统实现了动态知识注入、模拟遗忘、处理记忆冲突以及时间偏好排序等行为。 🎯 实验目标 🛠️ 技术配置:LangChain + FAISS + Sentence Transformers 系统构建过程如下: pythonCopyEditfrom langchain_community.embeddings import HuggingFaceEmbeddings from langchain_community.vectorstores import FAISS from langchain_core.documents import Document import faiss import numpy as np import time # 加载嵌入模型 embedding_model = HuggingFaceEmbeddings(model_name=”sentence-transformers/all-MiniLM-L6-v2″) print(“Embedding model loaded.”) # 创建 FAISS 索引 sample_embedding = embedding_model.embed_query(“test”)…
Mistral 推出全新开发者平台Agents API
Mistral公司近日推出全新开发者平台——Agents API (https://docs.mistral.ai/agents/agents_introduction/),该平台旨在简化AI代理系统的创建流程,使开发者能够更高效地构建具备执行多种任务能力的智能体(Agent),包括运行Python代码、生成图像,以及进行增强检索生成(RAG)等。此项发布标志着Mistral在大语言模型(LLM)与外部工具集成方面迈出了重要一步,为构建结构化、持久化、多工具协作的AI系统奠定了基础。 Agents API 概览 Agents API依托Mistral自研语言模型,将其与多个内置连接器相结合,实现多功能支持: 应用场景广泛 这一API框架的发布,拓宽了智能体系统在多个行业的应用边界: 基于Model Context Protocol(MCP) Agents API的构建基于Model Context Protocol(模型上下文协议),这是一种开放标准,允许AI代理访问外部数据源、API及动态资源。通过这一协议,系统具备模块化连接现实世界数据与服务的能力,极大提升了AI决策的上下文敏感性与准确性。 总结 Mistral的Agents API为AI代理开发提供了结构清晰、功能丰富的基础设施。其核心优势在于:无需复杂定制,即可在一个统一框架下实现语言模型与代码执行、图像生成、实时搜索、文档检索及记忆功能的深度整合。该平台有望在多个行业中推动智能应用的标准化部署,尤其适用于需要持续上下文、多任务协作的复杂场景。未来,随着开放协议与开发生态的完善,Agents API有望成为智能体系统构建的重要技术基座。