aitrendtrackers@rengongzhineng.io, Author at AI TrendTrackers

AI辅助开发引发担忧：核心编程技能正面临“被淘汰”危机

Posted on May 8, 2025 by aitrendtrackers@rengongzhineng.io

2025年5月7日，软件开发社区内对人工智能辅助工具的依赖度持续上升，引发了业界对开发者核心技能退化的担忧。AI联合编程工具如今已成为开发流程中不可忽视的一环，自动生成模板代码、定位错误、构建模块的能力极大提升了开发效率。然而，有评论指出，这种依赖如果过度，可能正在悄然削弱开发者本身的编程能力与逻辑思维素养。黑箱隐忧：信任不透明系统的代价现代AI系统普遍运作于“黑箱”模式之中，其内部决策路径复杂且不透明。开发者通常只看到输入与输出，却难以理解AI如何得出结果。这种信息不对称在AI建议出错时尤为危险。若开发者本身缺乏坚实的编程基础，就很难判断AI生成代码是否合理，也无法识别隐藏的Bug、安全漏洞或架构问题。技能退化：编程核心能力正在“失能” 软件开发是一门需要不断训练的技艺，涉及算法思维、逻辑推理、调试技巧以及对系统架构的深刻理解。这些能力往往通过亲自解决问题、经历失败与修正过程来逐步积累。 AI工具虽然便利，却可能逐渐替代这些必要的锻炼过程。评论认为，开发者一旦习惯依赖AI： AI不完美：错误输出的风险不可忽视尽管AI生成的代码在形式上常常无懈可击，但其语义正确性与架构合理性并不能始终保障。由于训练数据本身可能存在偏差，AI工具也可能继承甚至放大这些问题。更严重的是，开发者若不具备识别错误的能力，就可能基于错误建议构建整个系统，最终引发质量问题、资源浪费，甚至安全漏洞。平衡之道：AI应成为“增强工具”，而非开发者替身有观点指出，AI工具的最佳定位应是“增强人类能力”，而非“取代开发者”。开发者在使用AI时，仍需主动思考、理解生成内容的来龙去脉，避免陷入“盲信”的误区。未来的软件开发将是人机协作的过程，而非单纯依赖算法完成决策。行业建议：在AI时代守住开发本源为避免核心技能被逐步削弱，软件开发教育和从业标准亟需做出相应调整。建议包括： AI无疑为开发带来变革，但其真正的价值在于辅助而非替代人类智慧。只有保持独立思考与动手实践的能力，开发者才能在这个技术飞跃的时代中保持不被淘汰的竞争力。

苹果高管暗示 Safari 将引入 AI 搜索功能，有望撼动谷歌霸主地位

Posted on May 8, 2025 by aitrendtrackers@rengongzhineng.io

2025年5月8日，苹果服务业务高级副总裁艾迪·库（Eddy Cue）在美国司法部针对 Alphabet/谷歌的反垄断审判中作证时表示，苹果正“积极考虑”将移动版 Safari 浏览器的搜索体验转向人工智能搜索引擎。这一表态可能预示着苹果将在搜索领域对谷歌发起挑战，也为两家公司之间每年高达200亿美元的默认搜索引擎协议投下不确定因素。 Cue 在证词中指出，Safari 浏览器的搜索量在去年首次出现下滑，这一变化主要源于用户越来越倾向于使用基于大型语言模型的搜索解决方案。“在 AI 出现之前，我一直觉得其他搜索引擎都不是合适的选择，”Cue 说，“但现在，有新的参与者用不同的方式来解决这个问题，我认为这带来了更大的潜力。” 他提到的一些新兴公司，包括采用对话式搜索方式的 Perplexity，以及 OpenAI 等致力于重塑信息检索方式的企业。Cue 透露，苹果已与 Perplexity 进行了接触，并将这类 AI 搜索工具“加入列表”，即 Safari 设置中可选的默认搜索引擎选项。然而他也指出，这些工具目前还“可能不会成为默认”，因为它们在索引能力方面仍需改进。目前，苹果在 iPhone 设置中允许用户选择默认搜索引擎，选项包括 Google、Yahoo、Bing、DuckDuckGo 和 Ecosia，谷歌仍为默认选项。苹果也在最新 iOS 版本中集成了 AI 聊天机器人扩展，目前采用的是 OpenAI 的 ChatGPT，未来计划增加谷歌的 Gemini 等其他选择。不过，Cue 的发言重点在于 Safari 地址栏输入查询时所默认调用的搜索引擎。 AI 搜索工具在用户体验上提供了传统语义搜索引擎所无法实现的新优势。例如，用户可以输入像“我看过一部电影，一开始是一个女孩在卧室对嘴型唱歌，后来有个穿着雷神服装的女孩卡在摩天大楼上”这样模糊而自然的查询，AI 可以通过多个搜索步骤组织出更准确、有用的回答。然而，这些系统也可能出现“幻觉”，即在知识盲区生成错误答案，这种问题已在谷歌当前的 AI 搜索摘要中多次出现。市场对 Cue 的表态反应迅速，谷歌与苹果的股价双双下跌，反映出投资者对两家公司合作关系未来走向的担忧。分析人士指出，如果苹果逐步淡化对谷歌搜索的依赖，将对搜索市场格局产生深远影响，也可能引发AI搜索工具更广泛的竞争与创新浪潮。

亚马逊推出新型仓储机器人 Vulcan：具备“触觉”但不会取代人类工人

Posted on May 8, 2025 by aitrendtrackers@rengongzhineng.io

2025年5月7日，亚马逊在德国举办的活动中正式发布其最新仓储机器人——Vulcan，这是一款具备“触觉”的机器人，能够完成以往只有人类才能胜任的存储任务。然而，亚马逊强调，Vulcan 并非为了取代工人，而是为了创造更多技术含量更高的岗位。 Vulcan 最早在4月被媒体独家曝光，当时它正在华盛顿州斯波坎的亚马逊仓库中将物品分类存放进高大的黄色货箱中。这款机器人配备了AI驱动的传感器，可通过“触感”判断物体所需的压力和扭力，从而实现更精准的操控。这一创新型机械手让 Vulcan 能够处理斯波坎仓库库存中75%的100万种独立物品。与自2021年以来亚马逊广泛使用的依赖摄像头和吸盘的机器人不同，Vulcan 的手部结构更加先进，可以执行更多样化的任务。据亚马逊机器人团队负责人 Aaron Parness 介绍，Vulcan 每天可连续运作20小时。 Parness 表示，Vulcan 的推出不是为了替代员工，而是为了创造维护、操作、安装和建造机器人等新岗位。当被问及亚马逊是否计划实现仓库完全自动化时，Parness 明确回应：“完全自动化是不现实的。如果我们让 Vulcan 负责100%的存储与拣选，那几乎是不可能完成的任务。” 当前 Vulcan 的目标是在仓库中完成顶部货架100%的存储任务，这些区域对人类而言难以触及。通过让工人专注于中部货架（即“动力区”）的作业，可有效降低工伤风险。亚马逊仓库的工伤率长期高于行业平均水平，尽管公司声称近年来已有明显改善。斯波坎仓库的一位员工 Kari Freitas Hardy 表示：“我们每天在十小时的工作中要爬很多次梯子，频繁地伸手、下蹲，工作对身体负担很重。如果有 Vulcan 这样的技术能让我只在‘动力区’内操作，我的工作会轻松很多。” 目前，Vulcan 的工作效率已与人类相当，能够处理最多8磅重的物品。为保障安全，Vulcan 的工作区域设有围栏，与人类工人隔离。行业专家普遍认为，未来很长一段时间内，人类与机器人将继续在仓库中协同工作。Gartner 分析师 Bill Ray 指出：“若构建一个复杂且全自动的系统，一旦出故障，就可能导致整个作业流程瘫痪。完全取代人类不仅成本高昂，还风险巨大。” Freitas Hardy 目前已从拣货工人转岗至机器人相关岗位，是亚马逊自2019年以来投入12亿美元技能培训计划中的一员。虽然她个人收入尚未提升，但亚马逊表示，参加“机电与机器人学徒计划”的员工平均薪资可提升约40%。据亚马逊透露，开发 Vulcan 的团队在过去三年中从最初的数人扩展至超过250人。尽管公司未公布具体开发成本，但 Parness 表示，该机器人代表着巨大的商业潜力：“Vulcan 能以更类似人类的方式与世界互动，意味着我们能将自动化应用到更多流程中，进一步降低成本、提升配送速度。” 另一个潜在收益在于降低错误率。Gartner 的 Ray 强调：“产品退货成本极高，很多退货是由于错发物品造成的。机器人在这方面能显著减少错误，带来直接的成本节省。” 相比之下，亚马逊2023年宣布测试的类人机器人 Digit 仍未在规模化运营中展现效率，尽管其旨在协助搬运与整理托盘。当被问及 Vulcan 是否标志着机器人从“噱头”转向现实应用时，Parness…

谷歌出资支持三座新型核能发电厂项目开发，满足数据中心能源需求

Posted on May 8, 2025May 8, 2025 by aitrendtrackers@rengongzhineng.io

2025年5月7日，核能开发公司 Elementl Power 宣布，已与谷歌签署合作协议，将在三个地点开发先进核反应堆项目。这是科技巨头与核能产业携手合作、以满足数据中心庞大能源需求的又一案例。根据协议，谷歌将为这三座核电站提供早期开发阶段的资金支持。每个项目预计将产生至少600兆瓦的发电容量。尽管协议具体条款尚未公开，但谷歌的资金将用于选址许可、获取电网接入权、合同谈判等前期关键事项。此外，谷歌将保留在项目建成投运后购买其所产电力的选项。至于具体建设地点，目前仍处于保密状态。谷歌全球数据中心能源主管 Amanda Peterson Corio 表示：“谷歌致力于推动加强我们运营所在地电网的项目，而先进核能技术能够提供稳定、基载、全天候的能源。此次与 Elementl Power 的合作，有助于我们以匹配当前 AI 与美国创新步伐的速度前进。” Elementl Power 成立于2022年，是一家专注于核电项目开发的企业。目前尚未建设任何实际电站，其运营模式为技术中立，即尚未选定具体的核反应堆技术，而是待项目准备开工之时，再选择最具成熟度的技术方案。该公司董事长兼首席执行官 Chris Colbert 表示：“像这样具有创新性的合作关系，是动员资金建设新型核能项目的关键。核能对于提供安全、可负担且清洁的基载电力至关重要，同时也有助于企业推进其长期净零碳排放目标。”Colbert 曾担任 NuScale Power 的首席财务官、首席运营官及战略主管，该公司正致力于小型模块化反应堆的开发。 Colbert 补充指出，在项目进入最终投资决策阶段后，Elementl 将通过基础设施基金等渠道筹集建设资金。该公司目标是在2035年前为电网新增10吉瓦核能发电容量。此次协议并非谷歌首次涉足核能领域。2024年10月，谷歌已与小型模块化反应堆公司 Kairos Power 达成合作，承诺购买其反应堆群所发电力。当时谷歌表示，第一个反应堆将于2030年投入使用，其余将在2035年前陆续上线。尽管今年初中国人工智能初创公司 DeepSeek 表示，随着 AI 模型效率提升，未来可能不再需要大量扩建电力资源以支撑数据中心运营，但科技行业领军者如亚马逊和英伟达仍认为，基载电力需求正快速增长。 Anthropic 联合创始人 Jack Clark 在4月估计，为满足AI发展所需，到2027年全球需新增50吉瓦电力容量，相当于约50座核电厂。

Gemini 2.5 Pro 预览版（I/O 特别版）：代码性能再升级

Posted on May 7, 2025May 7, 2025 by aitrendtrackers@rengongzhineng.io

2025年5月6日，谷歌AI团队提前数周发布了 Gemini 2.5 Pro 预览版（I/O 特别版），以便让开发者能更早上手使用这款具备更强代码能力的模型。此次更新带来了前端与用户界面开发方面的显著改进，同时在代码转换与编辑、复杂智能代理工作流的构建等基础编程任务方面也有全面提升。 Replit 总裁 Michele Catasta 表示：“在能力与延迟之间的权衡上，Gemini 2.5 Pro 是目前最优的前沿模型。期待将其应用于 Replit Agent，在延迟敏感的任务中提供高可靠性。” 引领前端网页开发的行业标杆目前，Gemini 2.5 Pro 已位居 WebDev Arena 排行榜榜首，该榜单依据人类偏好评估模型构建美观且功能完备的网页应用的能力。凭借这一领先表现，Gemini 2.5 Pro 正为 Cursor 的创新代码代理提供支持，并推动与 Cognition 和 Replit 等公司的合作，共同拓展智能代理编程的边界，为开发者解锁全新可能性。 Cognition 创始团队成员 Silas Alberti 指出：“更新后的 Gemini 2.5 Pro 在我们面向初级开发者的评测中表现领先。它是首个成功完成我们关于请求路由后端大规模重构评估任务的模型，展现出如同高级开发者般的判断力与良好抽象选择。” Gemini 2.5 Pro 的实际应用亮点凭借对代码的深刻理解和强大的推理能力，Gemini 2.5 Pro 成为众多开发者首选的开发工具。以下是部分亮点应用场景：从视频到代码 Gemini 2.5 Pro 在视频理解方面实现了突破，在…

作为一位经验丰富的大型语言模型（LLM）用户，其实日常并不常用生成式LLM

Posted on May 6, 2025 by aitrendtrackers@rengongzhineng.io

近日，有技术人员正着手制定一份个人伦理声明，以明确其对生成式人工智能（GenAI）的立场。虽然其对当代生成式AI存在诸多批评，但也依然参与其中。在撰写该声明的过程中，这位资深人士对自己如何在职业和个人领域使用LLM进行了深刻反思——无论是在BuzzFeed担任高级数据科学家期间，还是在业余时间撰写博客与开发开源软件方面。过去十年，该人士一直研究与开发文本生成工具，从char-RNN模型、微调GPT-2，到使用GPT-3进行实验，以及持续探索ChatGPT与其他LLM API的可能性。虽然不自称是LLM的顶尖使用者，但其已积累大量实战经验，了解这类“下一个词预测”模型的局限性，也善于挖掘其优点。令人意外的是，该人士实际上远没有外界所想的那样频繁使用LLM，尤其是在工程领域。但这并不代表LLM对其毫无价值——相反，这需要具体情况具体分析。与LLM的交互方式多年来，为了从LLM中获取最佳效果，该人士掌握了众多技巧。其中最著名的便是提示词工程（prompt engineering）——即通过特定方式撰写提示词，引导模型生成目标输出。提示词中若加入如“为你带来经济奖励”或“请优化你的回答”等语句，确实可以提升模型对提示的遵循性和输出质量。每当同事表示LLM输出与预期不符时，该人士常建议其加强提示词设计，这通常都能解决问题。尽管提示词工程有效，业内并不喜欢这一现象。强化学习与人类反馈（RLHF）等技术本意是减少对提示词设计的依赖，结果却反而让提示词工程更有回报。如今，“提示词工程师”虽成段子，但实际上，这项技能已成为LLM用户的基本要求。专业人士使用有效的工具，即便这些工具显得有些“可笑”，也是对专业的体现。因此，该人士从不使用ChatGPT.com或其他面向大众的LLM前端，因为这些界面控制力有限。其通常通过各LLM服务的后台UI访问模型，这些界面本质是API功能的轻量封装，也便于将其整合进代码。直接调用API可设置“系统提示词”（system prompt），以更精细地控制生成规则。例如，“限制在30词以内”或“禁止使用‘delve’一词”，放在系统提示词中往往比用户提示词中更有效。而像ChatGPT.com这类接口若无法自定义系统提示词，极有可能默认使用不可控的系统提示词——例如，当ChatGPT.com曾过于迎合用户时，OpenAI修改了系统提示词，要求其“避免无依据的奉承”。该人士偏好使用Anthropic的Claude API，尤其是Claude Sonnet版本，因为其表现较少“机械感”，且在代码问题上的回答更准确。通过API，还可调控“温度”（temperature）参数，从而影响生成的“创造力”。默认状态下，LLM不会始终选择概率最高的下一个词，这样才能生成多样化的结果。该人士倾向将温度设为0.0，以获得确定性输出；若需少量变异，则设为0.2–0.3。而现代LLM通常默认温度为1.0，这可能加剧“幻觉问题”——即输出看似连贯却事实错误。 LLM在职业问题解决中的应用以下是过去几年在BuzzFeed中使用生成式LLM解决实际问题的几个项目示例：每个项目从提出到交付仅需1–2小时。若无LLM，部分任务如文章分类则需构建训练数据、手工标注、复杂建模，耗时数日且较为枯燥。而LLM能快速提供80%的解决方案，其余20%则需人类继续优化与验证。尽管如此，幻觉仍是问题，使用者仍需保持警觉。此外，还有一个非文本生成但实用的应用场景：文本嵌入（text embeddings）。现代文本嵌入模型本质上也是LLM，但其输出为多维向量而非下一个词。这些模型的进步也得益于ChatGPT推动的技术演进，如更长上下文窗口与训练方法。BuzzFeed已广泛使用嵌入技术做内容推荐与相似文章识别，但这属于另一个话题。 LLM用于写作？该人士明确表示，并不使用LLM撰写博客内容。原因有三：其写作风格过于独特，带有直率、讽刺与偶尔的“社死”感；即便给予模型多个范文进行few-shot学习，生成内容依然偏向“漫威电影对白”；更重要的是，出于伦理考虑，不愿将大部分文字让AI代笔。此外，该人士多写技术圈最新事件，而这些内容通常不在LLM的训练数据中，增加了幻觉风险。不过，其也发现一个有趣用法：将博客草稿喂入LLM，要求其模拟一位愤世嫉俗的Hacker News评论员，写出五条可能的负面评论。这种方法能发现文章的逻辑漏洞，却不会直接建议如何修改，从而促使创作者主动修正内容。例如该文草稿就因LLM指出示例过于简单而添加了更多细节。 LLM用于陪伴？并未将LLM作为聊天伙伴。尽管Character.ai与Replika等项目成功表明这一用途存在价值，但该人士认为，与一个既友善又习惯性撒谎（幻觉）的“朋友”相处并不现实。即使能设计提示词要求LLM指出其错误，也无法彻底解决“幻觉”这一根本问题。 LLM用于编程？确实在特定场景下使用LLM辅助编程。例如，编写正则表达式是其长期痛点，自ChatGPT出现以来常用其节省大量时间。后来则扩展至更多问题，如要求Claude Sonnet用Python和Pillow库合成五张图片、按特定布局排列等任务。这类问题虽可通过搜索解决，但LLM可提供更精准的、定制化的答案。对于复杂任务，如在Hugging Face的Trainer类中实现SQLite日志记录器，其仍持谨慎态度。但Claude提出的一些代码优化思路，如缓存连接、JSON字段、批量写入等，带来意外启发，最终提高开发效率。但在真正的数据科学工作中，LLM生成代码的帮助有限，尤其涉及数学运算时准确性差。该人士更偏好使用polars而非pandas，而LLM常将两者混淆。此外，其做数据可视化主要用R和ggplot2，也未尝试过用LLM辅助。至于内联代码建议工具如GitHub Copilot，其评价为“注意力杀手”。代码建议弹出时需在编写与审核之间不断切换，虽有轻微效率提升，但成本高、干扰大，性价比低于偶尔提问LLM。代理与“vibe编码”？对代码代理（agents）与“vibe编码”持保留态度。尽管这些概念以MCP与ReAct等理论为基础，确实提高了一些任务的稳定性与模块化，但迄今尚未发现真正的新颖用途，反倒使流程更复杂。至于vibe编码，如Claude Code或Cursor那种自动写整段代码的代理体验，更被认为是“AI赌博”而非“AI开发”。除非仅用于私人小项目，否则这种方法无法支撑专业代码质量的底线。总的来说，虽然技术不断演进，但该人士对当前编码效率感到满意，能快速正确完成所有任务。 LLM用户的未来？如今关于LLM的舆论已经两极分化，哪怕仅表示“LLM有一些用途”也可能招致网络攻击。该人士明确反对科技评论员Ed Zitron的观点——后者认为LLM产业必败，因其成本高昂且无现实用途。事实上，两个命题可以同时为真：（a）LLM公司难以实现投资回报；（b）LLM在实际问题中确实有高影响力的应用价值，只是不足以支撑AGI的炒作。正是这种“既非黑也非白”的灰色地带，使社交媒体难以承受理性讨论的负担。即便OpenAI与所有LLM公司突然解散，仍有Qwen3、DeepSeek R1等开源模型可以替代，且具备相似性能。它们可托管在Cerebras、Groq等能从推理请求中盈利的平台。因此，OpenAI的倒下不会终结LLM的发展，这是一记已经响起的钟，无法回响归零。对软件工程师，尤其数据科学家而言，始终应在恰当时机选择正确工具，LLM就是工具箱中一件工具而已。LLM的效能因场景而异，有时高效，有时反效，但绝非无用。它更像把方钉塞进圆孔——会有损坏风险，而不用LLM则像精心打造一个圆钉。但某些情境中，强推方钉是合理的，关键在于判断当前更需要速度还是精度。 ……也许，接下来可以请LLM帮忙写比喻。

OpenAI仍将维持现有的混合结构

Posted on May 6, 2025 by aitrendtrackers@rengongzhineng.io

在OpenAI寻求重组其盈利部门的过程中，微软公司成为最关键、也是目前仍未明确表态的主要投资者。尽管OpenAI已表示将继续推动将其营利性业务部门转型为“公共利益公司”（Public Benefit Corporation），但最新计划中保留了非营利组织对整体公司的控制权，这意味着OpenAI仍将维持现有的混合结构。微软自早期起即成为OpenAI最大的外部投资者之一，其累计投资高达137.5亿美元。在OpenAI试图调整公司治理架构之际，微软的立场尤为关键。据多位知情人士透露，微软正在积极就重组计划的各项细节进行磋商，并希望确保任何结构性变更不会对其投资造成风险。当前，微软仍是唯一与OpenAI就此方案持续谈判的投资方。 OpenAI在一份声明中指出，公司正在与微软密切合作，并期待在不久的将来敲定本轮资本重组的具体细节。首席执行官萨姆·奥特曼（Sam Altman）在致员工的信中透露，此次维持非营利组织主导权的决定，是在与公民领袖及加州和特拉华州总检察长办公室的深入讨论后作出的。奥特曼强调，公司期待与这些监管方、微软及新任非营利董事会成员继续就重组方案展开对话。此次重组的背景之一，是OpenAI希望在更清晰的法律框架下吸引新一轮大规模融资。尽管放弃了让营利部门独立掌控公司整体业务的初衷，奥特曼表示，新结构依然能够达到相似的商业目的。例如，软银集团已表示，愿意在这一框架下推进其高达300亿美元的投资承诺。然而，微软的批准对于重组能否顺利推进至关重要。据悉，目前仅OpenAI内部人士、微软及少数早期投资者拥有正式投票权。这使得微软在谈判中具有实质性影响力。尤其考虑到微软与OpenAI之间存在独特的合作关系，包括对核心技术的独家许可协议和营收分成机制，其关注的焦点还包括股权结构和合同条款等关键商业要素。除了争取微软支持，OpenAI还必须获得加州与特拉华州总检察长的认可，特别是对非营利组织在未来营利性实体中的股权估值，相关程序正在进行中。与此同时，OpenAI也面临来自共同创始人埃隆·马斯克（Elon Musk）的法律挑战。马斯克此前曾尝试通过法律手段阻止OpenAI成为营利企业，尽管法院否决了其主要诉求，但仍允许部分诉讼继续推进。此外，马斯克还提出收购OpenAI非营利控股资产的高达974亿美元报价，但未获成功。OpenAI方面则指责马斯克试图借此拖延OpenAI进度，以利于其竞争对手的AI创业项目。总体来看，OpenAI在重组进程中正面临复杂博弈，其是否能够在保持初衷的同时，赢得关键投资方和监管机构的信任，将成为接下来能否完成架构转型的关键。

谷歌在即将举行的I/O大会之前，意外泄露了其全新设计语言“Material 3 Expressive”的细节

Posted on May 6, 2025 by aitrendtrackers@rengongzhineng.io

谷歌在即将举行的I/O大会之前，意外泄露了其全新设计语言“Material 3 Expressive”的细节，这一设计原计划在发布会上正式亮相。谷歌在其官方设计网站上短暂发布了一篇相关博文后迅速删除，但该页面已被互联网档案馆捕捉并保存。据悉，“Material 3 Expressive”是谷歌近年来最为重大的用户界面设计变革之一，旨在为Android系统带来更具情感表达力的视觉体验。谷歌表示，该设计更新是其有史以来研究最深入的一次，共进行了46项研究、涵盖数百种设计方案，并向逾18,000名参与者展示，以评估用户在实际操作中的情感反应与易用性。研究方法包括眼动追踪、问卷调查、小组访谈、体验实验和可用性测试等，目的是了解用户在界面中最关注的内容以及他们对不同视觉风格的偏好。据谷歌介绍，新设计重点在于强化界面中“最重要”的按钮和信息，使用户能够更快速地识别与操作。测试数据显示，相比旧版本，用户在识别和点击核心UI元素上的反应速度提升了四倍之多。泄露的图片显示，Material 3 Expressive在视觉上更具活力，采用了浮动工具栏、加大按钮尺寸、鲜明色彩与更具表现力的几何图形，旨在提供更个性化、直观的操作体验。这种设计不仅适用于系统UI和谷歌自家应用，还将提供模板供第三方开发者在其App中使用，从而扩展至更多Android设备。不过，这种设计风格的接受度因年龄段不同而有较大差异。数据显示，80%以上的Z世代（Zoomers）用户更喜欢这种新风格，而在55岁以上用户中，这一偏好比例则下降至52%。尽管如此，谷歌仍表示，Material 3 Expressive在用户中普遍被评价为“更酷”的设计风格。值得注意的是，尽管该设计将在Android 16中正式引入，但其实际推广效果仍取决于OEM厂商的采纳程度。由于Android为开源系统，各大手机厂商如三星、OnePlus等通常会基于Android打造自家定制系统（如One UI、Oxygen OS），并不完全采用谷歌的设计语言。因此，除非使用Pixel系列设备，否则普通用户可能仅能体验到部分Material 3 Expressive设计元素。谷歌也承认，尽管Material Design的理念推出多年，但真正实现统一Android设计风格始终面临挑战。目前多数应用仅选择性采用部分Material UI元素，很少有开发者全面采纳谷歌的设计框架。在监管机构持续关注谷歌与OEM合作关系、Play商店政策的背景下，谷歌亦难以通过强制方式推动Material 3 Expressive的全面落地。虽然这次泄露意外揭示了未来Android界面的重要变革方向，但该设计能否突破以往命运，实现真正意义上的广泛应用，仍有待观察。

Waymo公司正在加快其位于亚利桑那州新工厂的无人驾驶出租车（robotaxi）生产进度

Posted on May 6, 2025 by aitrendtrackers@rengongzhineng.io

Waymo公司正在加快其位于亚利桑那州新工厂的无人驾驶出租车（robotaxi）生产进度。该公司多年对其Jaguar I-Pace电动车自动驾驶车队的规模保持低调，其中包括用于测试及商业化运营的车辆。直到近日，Waymo才首次对外透露其商业车队的具体规模。 Waymo于本周一宣布，其现有的商业运营无人驾驶出租车已超过1,500辆，并正通过与Magna公司的数百万美元合作投资，在亚利桑那州新建的一座工厂生产逾2,000辆自动驾驶版I-Pace电动车，以进一步扩充车队规模。 Waymo与Magna的合作关系已持续多年，早先两家公司曾在底特律的工厂进行合作，该工厂目前已关闭。如今的新工厂占地239,000平方英尺，选址在凤凰城郊区的梅萨市（Mesa），该地不仅是Waymo的现有Robotaxi市场之一，也临近旧金山、洛杉矶和奥斯汀等其它服务区域，具备战略地理优势。 Waymo发言人向媒体表示，公司曾考察多个选址方案，最终选择梅萨，是基于其对周边市场的地理优势以及全年稳定气候条件，这些有助于在车辆面向公众使用前的验证流程中提升效率。 Waymo在其官方博客中披露，今年早些时候已从捷豹公司接收了车辆底盘。之后，Waymo与其合作方Magna将负责将自动驾驶系统集成至车辆中。公司强调其采用了一项全新流程，以缩短“生产–验证–上路”周期。据介绍，这些自动驾驶汽车在离开工厂后不到30分钟便可投入接送乘客的服务。若车辆被分配至其他城市，仅需数小时即可完成运输和本地部署，迅速投入使用。这家位于梅萨的新工厂还具备整合其他车型平台的能力，Waymo预计将在今年晚些时候把第六代自动驾驶系统整合至Zeekr RT车型中。此外，Waymo还表示，该工厂将逐步引入自动化装配线与其他效率提升措施。未来一旦达到满产状态，年产量将可达到数万辆全自动驾驶汽车，标志着Waymo在自动驾驶规模化生产方面迈出关键一步。

苹果公司正在与亚马逊支持的初创公司Anthropic展开合作

Posted on May 5, 2025May 5, 2025 by aitrendtrackers@rengongzhineng.io

苹果公司正在与亚马逊支持的初创公司Anthropic展开合作，联手打造一款以人工智能为核心的“情境编程（vibe coding）”平台。根据《彭博社》5月初的报道，此次合作旨在将Anthropic的Claude Sonnet模型整合进苹果自家的开发工具Xcode中，协助程序员编写、编辑和测试代码，推动AI在软件开发流程中承担更多实际工作。所谓“情境编程”，原先被称为“面向非程序员的AI编程”，如今正逐步进军企业市场。该方法允许开发者以自然语言描述开发目标，AI则自动生成代码，从而简化传统编程流程。业内观察指出，苹果此举标志着其在AI领域战略布局的进一步深化，尤其是在过去一向坚持内部自研的背景下，如今开始对外部AI技术开放合作，显示出面对竞争压力所作出的适应与转变。消息人士透露，这项合作的核心在于Xcode新版将直接集成Claude Sonnet模型，使其具备AI驱动的代码生成与测试能力。目前，该工具尚处于内部测试阶段，苹果尚未决定是否将其向公众开放。对此，Anthropic拒绝置评，苹果方面也未做出回应。实际上，苹果早在2024年便曾宣布计划推出一款名为Swift Assist的AI编程助手，但该项目最终并未落地。知情人士称，研发进展缓慢或是导致项目搁置的关键原因。此次与Anthropic联手，苹果显然吸取教训，选择在内部进行充分试验后再决定是否公开发布，体现出更为谨慎的策略。 Claude Sonnet模型所代表的是一种全新编程范式，其核心在于“基于意图”的代码生成，即AI通过理解开发者的目标来生成程序逻辑，而非依赖传统语法输入。这种方法代表了编程由人类主导向AI辅助的重大转变，强调开发者描述“想做什么”而非“怎么做”。当前，“情境编程”这一新兴领域正由多家AI初创公司主导，包括Windsurf、Replit、Cursor、Bolt与Lovable等。它们为开发者提供了使用自然语言创建应用的能力，大幅降低了编程门槛。在这样的竞争格局中，苹果与Anthropic的合作则是大型科技企业加速追赶的重要信号。 Anthropic总部位于旧金山，由多位前OpenAI高管于2021年联合创办，其中包括首席执行官Dario Amodei、Daniela Amodei、Jack Clark、Sam McCandlish和Tom Brown。公司致力于构建“可引导、可解释且稳健”的大型AI系统，强调AI系统的可控性与透明度。其Claude系列聊天机器人，尤其是Sonnet版本，在多个应用场景中表现出色，被视为GPT-4与Meta Llama 3的有力竞争者。随着AI编程助手日益受到关注，苹果与Anthropic的联手亦被解读为行业新风向的明确信号。据报道，OpenAI也正计划以30亿美元收购AI编程新秀Windsurf，反映出科技巨头们在AI开发领域的投资与并购活动日益频繁。此外，苹果近年来不断升级其设备芯片，增强处理AI任务的能力，并持续推动与ChatGPT等AI工具的深度整合。无论此次“情境编程”工具最终是否对外开放，可以确定的是，未来的软件开发将越来越由“能写代码的机器”主导，而谁能训练出这些机器，谁就有可能引领下一代技术革命。

Subscribe 订阅