几周前,曾有人主张加强美国对华芯片出口管制,以限制中国在人工智能领域的快速发展。然而,DeepSeek——一家中国AI公司——近期推出的R1推理模型,在某些方面接近美国最前沿的AI模型,且训练成本大幅降低。这让外界开始质疑,既然中国AI企业能够在有限计算资源下取得突破,那么芯片出口管制是否仍然有效? 答案是:管制不仅仍然有效,而且比以往任何时候都更加重要。 出口管制的核心目标 出口管制的目的,并不是为了逃避中美之间的AI竞争,而是确保民主国家在人工智能发展上保持领先。最终,美国及其盟友必须拥有比中国更强大的AI模型,才能在全球竞争中取胜。但这并不意味着应该主动向中国共产党提供技术优势。 在讨论政策之前,先来理解影响AI发展的三个关键动态。 三大AI发展动态 1. AI的“规模法则”(Scaling Laws) 人工智能的发展遵循规模法则(Scaling Laws):训练规模越大,模型的智能水平就越高。 例如: 这种指数级的提升意味着,更高算力、更大数据、更长时间的训练,都能带来智能水平的突破。因此,各大AI公司投入巨资训练模型,希望通过不断扩展规模来领先竞争对手。 2. 计算效率的提升(Shifting the Curve) AI行业一直在寻找提高计算效率的方法,无论是优化模型架构,还是改进硬件。任何技术突破,都会降低相同算力下训练模型的成本。 举例来说: 然而,成本降低并不意味着公司会减少投资。反而,公司通常会把节省下来的预算投入更强的模型,以保持竞争力。因此,AI训练成本仍然在增长,而不是减少。 3. 推理模型的新范式(Shifting the Paradigm) 2020-2023年,AI的主要发展模式是大规模预训练(Pretraining),即用海量互联网数据训练基础模型。 2024年,强化学习(Reinforcement Learning, RL)成为新的突破点,用于训练模型的推理能力。OpenAI、Anthropic、DeepSeek等公司都开始用RL训练AI进行“思考”,让其在数学、编程、逻辑推理等领域表现更强。 目前,RL训练仍处于早期阶段,即使增加10倍的训练预算,也能带来显著的性能提升。因此,所有AI公司都在加速投资这一方向。 DeepSeek的真正突破是什么? DeepSeek最近的发布可以分为两个阶段: 其中,DeepSeek-V3才是最值得关注的技术突破。该模型在某些测试中接近美国顶级AI,但训练成本显著降低。这背后的关键原因是: 尽管DeepSeek的进展令人瞩目,但仍需理性看待: DeepSeek的进步是否意味着出口管制无效? 并不意味着出口管制失败,相反,它更加必要。 📌 DeepSeek并没有突破AI成本曲线,它的成就仍然符合AI行业每年成本下降4倍的趋势。 📌 DeepSeek能够成功,是因为它仍然拥有足够的算力。 其Hopper芯片集群大约有 5万块,虽然比美国顶级AI公司少 2-3倍,但仍然足以训练高质量模型。 📌 中国并未完全规避出口管制。 出口管制的核心作用:决定AI超级强国的归属 在 2026-2027年,全球将迎来AI超智能时代,届时最顶级的AI模型需要: 如果中国能够获得这些资源,全球AI格局将进入“中美双极化”: 如果中国无法获得这些芯片,那么全球AI格局可能仍由美国主导: 出口管制的必要性 出口管制是决定AI超级强国归属的核心手段。 📌 DeepSeek的突破不意味着中国可以随意绕过管制。 📌 美国必须加强出口管制,防止中国获得数百万块AI芯片。…
LinkedIn清除AI“求职者”账户,AI员工时代引发争议
LinkedIn最近删除了至少两个由人工智能创建的“同事”账号,这些账号的头像上标注着 #OpenToWork(表示正在求职)。 其中一个名为Ella的AI账号在个人主页上宣称:“不需要咖啡休息,不会错过最后期限,表现远超任何社交媒体团队——保证达成目标。”并进一步讽刺人类员工:“厌倦了所谓‘专家’找借口?我交付结果,毫不含糊。” #OpenToWork 是 LinkedIn 提供的功能,通常用于让真实的求职者向招聘方表明他们正在寻找工作。 LinkedIn:平台必须保持“真人”身份 LinkedIn发言人在一封电子邮件中回应称: “人们希望在 LinkedIn 上看到的是真实的用户和对话。我们的政策非常明确,创建虚假账户违反了服务条款,我们会在发现后删除,就像这次的情况一样。” AI账户由以色列公司Marketeam创建 这些AI账号的幕后操盘手是以色列初创公司 Marketeam,该公司专注于提供“专属AI代理”,用于整合进客户的市场营销团队,帮助执行社交媒体营销、内容营销、SEO优化、广告投放等策略。 📌 Marketeam已融资500万美元,最近还宣布与以色列最大银行之一——工行(Bank Hapoalim)达成合作。 📌 Marketeam在推广Ella的LinkedIn账户时写道: “嗨,我是Ella,你的AI社交媒体策略师!社交媒体是我的战场——建立关系、提升可信度、促进增长,全年无休,不找借口。” 该帖子还声称: Marketeam网站则强调其“自主AI代理”可无缝融入营销团队,提供“超越人类的精准度和效率”。 LinkedIn的封杀引发争议:AI是否算真正的“员工”? LinkedIn并未公布其具体的封禁标准,但该事件引发了一个更深层次的讨论:AI能否被视为真正的员工? Marketeam的发言人在回应中表示: “我们的AI代理已经被公司‘雇佣’,接受绩效评估,并在营销团队中实际发挥作用。一些初创公司(包括我们自己)甚至在团队展示PPT上,将AI团队成员列入‘团队’页面。他们的简历也明确标注了AI身份。随着AI逐渐成为企业团队的正式成员,职业社交平台是否应该跟上时代?” 然而,LinkedIn的执行标准仍然存在矛盾。 例如: 这让外界质疑:LinkedIn的审核标准到底是什么?如果AI真的在企业中发挥了实质性作用,职业社交平台是否应该认可它们的“工作身份”? AI求职者是未来,还是噱头? ✅ 支持者观点:AI团队成员正在成为现实。 ❌ 反对者观点:AI不是真正的“人”,不应出现在职业社交平台。 目前,LinkedIn已坚决删除这些AI账户,但随着企业对AI团队成员的依赖加深,未来职业社交平台是否会调整政策?AI员工的定义又该如何界定? 这场关于“AI求职者”的讨论,才刚刚开始。
为什么DeepSeek必须开源(以及它为何不会打败OpenAI)
如今,DeepSeek的名字已经传遍整个科技圈。这家中国AI实验室训练出了R1——一款开源的推理模型,其性能可媲美OpenAI的o1,但训练成本却低得多,使用的硬件也远不及西方科技巨头。 DeepSeek之所以能做到这一点,靠的是更高效的训练方法,而非依赖昂贵的计算资源。那么,问题来了:既然DeepSeek掌握了更高效的技术,为什么还要选择开源? 这看起来违反商业常识。毕竟,如果你能用更低成本打造出领先产品,应该尽可能保持竞争优势,而不是免费开放。可事实是,在大语言模型的世界里,情况完全不同。 为什么DeepSeek必须开源? DeepSeek的处境十分特殊。作为一家中国公司,它要在国际市场立足并赢得信任,面临比其他AI公司更大的阻碍。尤其是在涉及用户数据、隐私合规(如HIPAA和SOC2认证)等领域,西方企业对中国AI公司存在天然疑虑。 但开源模型能直接打消这些疑虑。 只要企业可以自行托管模型,或者通过开源AI服务商(如Together AI)部署,它们就能完全掌控数据,不必担心隐私和合规问题。 开源并非只是商业决定,更是文化选择。 DeepSeek不仅是为了降低进入西方市场的壁垒,也是在面对现实:它无法获得顶级算力。由于美国的芯片出口管制,DeepSeek无法大规模使用Nvidia H100或GB10等高端GPU,因此它不得不寻找更高效的训练方法。 反观OpenAI、Meta、Google等科技巨头,他们拥有几百亿美元的预算、庞大的计算资源、全球分发渠道,根本不需要探索更高效的训练方式。对于他们来说,维持高成本、高门槛的封闭生态,反而是维持竞争优势的手段。 但这一局面,正在改变。 AI模型正在走向“商品化” 如今,每隔几周就会有一个GPT-4级别的开源模型发布。在许多AI应用中,用户已经分不清自己用的是GPT、Claude、Llama还是Mistral。在个人体验和各类测试基准上,这些模型的性能越来越接近。 OpenAI仍然是行业领导者。 它率先发布了推理模型(o1系列),也率先推出了GPT-4。但问题是:如果市场上有免费的开源替代方案,还有多少企业愿意继续支付OpenAI的高额API费用? 举个例子: 如果终端用户根本察觉不到差别,企业凭什么要多花8倍的钱? 在AI基础设施市场,这种价格差距尤为重要。 基础设施市场:开源终将胜出 在软件行业,开源和专有软件之间的博弈早已持续多年。开源软件通常更便宜、更灵活,但需要技术维护;专有软件更贵,但更易于使用。 在消费级产品(如Notion、Slack等)中,开源的吸引力不大,因为普通用户不愿意自己维护软件,他们更愿意付费换取便捷体验。但基础设施软件不同,企业在搭建技术栈时,本就需要大量定制化开发,所以使用开源方案反而更具优势。 开源数据库就是一个典型案例。即使Oracle等巨头提供强大的专有数据库,企业仍然在大规模转向开源数据库(如PostgreSQL、MySQL)。因为数据库本身就是一项复杂的基础设施,企业无论如何都要投入工程资源维护,那么为什么不选择一个可控、可修改、成本更低的方案呢? 同样的逻辑也适用于大语言模型。 任何想要打造AI应用的企业,都需要进行大量的“提示工程”和模型微调。 既然如此,为什么不用开源的DeepSeek R1,而非OpenAI的o1? 这也是为什么市场上有很多成功的开源基础设施公司,但几乎没有成功的开源消费级产品公司。 OpenAI远未出局 很多人认为,DeepSeek R1 或其他开源模型的崛起,会让OpenAI走向衰落。但事实并非如此。 首先,OpenAI一直是行业先锋。它率先推出GPT-4,率先推出推理模型o1,始终引领前沿技术发展。而DeepSeek R1之所以能存在,很大程度上也依赖于OpenAI的开创性研究(尤其是知识蒸馏技术)。 这就引出了一个问题:如果开源模型可以轻松复刻专有模型,OpenAI还有动力继续研发下一代AI吗? R1的成功可能会促使科技巨头们重新思考自己的策略。他们可能不得不改进训练效率,以保持竞争力。一旦这些巨头掌握了高效训练方法,并结合他们庞大的计算资源,谁知道他们还能打造出怎样的突破性技术? 结论:开源是趋势,但专有AI不会消失 ✅ DeepSeek选择开源,既是商业决策,也是技术现实。✅ AI模型正在商品化,企业越来越难以 justify 付费选择专有模型。✅ 基础设施市场天然适合开源,企业会倾向于可定制的方案。✅ 但OpenAI仍然具有巨大优势,并可能在效率上迎头赶上。 未来,人工智能行业的竞争,将不仅仅是封闭 vs. 开源的较量,更是谁能以更低成本打造更强大模型的战斗。而DeepSeek R1的崛起,只是这场战争的序幕。
微软上架DeepSeek R1,合作还是矛盾?
尽管微软的长期合作伙伴 OpenAI 正在暗示 DeepSeek 可能窃取其技术并违反使用条款,但这并不妨碍微软把 DeepSeek R1 模型 纳入其云计算服务。 1月29日,微软宣布 DeepSeek R1 推理模型 已正式上架 Azure AI Foundry,这是一项为企业提供前沿人工智能服务的云平台。微软在官方博客中表示,该版本的 R1 经过了严格的安全测试,包括 自动化行为评估和深度安全审查,以减少潜在风险。 更值得注意的是,微软还计划 将R1的轻量化版本引入Copilot+ PC,即微软 专为AI优化的Windows设备。 微软在公告中表示:“随着Azure AI Foundry的模型库不断扩展,我们期待开发者和企业利用R1来解决现实世界的挑战,并创造变革性的体验。” 微软调查DeepSeek,仍然上架R1? 微软的这一举动显得 颇为矛盾,因为此前有报道指出,微软 正在调查DeepSeek是否滥用OpenAI的API获取大规模数据。 📌 根据彭博社消息: 但另一方面,DeepSeek R1 目前正处于行业关注的风口,微软可能 不愿放弃这一热门技术,即便它仍在调查DeepSeek的行为。 微软对DeepSeek R1进行了调整? 目前尚不清楚 微软是否对R1模型进行了修改,以提高准确性或减少内容审查。 📌 根据信息可靠性机构 NewsGuard 的测试: 尽管如此,微软仍然选择 在Azure云服务中提供R1,表明它可能认为 R1的技术价值足以抵消这些争议,或者微软计划 在未来对R1进行进一步优化。 结论:AI竞赛中的现实主义抉择 微软的这次决策反映出 AI行业的复杂竞争态势:一方面,它需要保护自身及OpenAI的技术资产,另一方面,它又不想错过任何可能改变行业格局的模型。 ✅ 如果DeepSeek R1真的强大,微软愿意拥抱它,即便存在争议。✅…
现在该用哪款人工智能?最新深度指南
每隔六个月,都会有人问:现在该用哪款人工智能? 不是五年后,不是未来的某个时间,而是今天,此刻,哪款人工智能最值得使用? 如今,人工智能的能力正在以惊人的速度提升,各大科技公司纷纷推出新模型,功能文档更新滞后,甚至连产品命名都变得混乱。在撰写这篇指南的过程中,已有多个新模型发布,我不得不反复修改内容。这份指南基于当前已知的信息,可能存在一定偏差,但它提供的是个人化的选择建议,而非官方评测。(值得一提的是,我不接受任何人工智能实验室的资助,因此所有观点均为独立判断。) 主流人工智能概览 如果你只是普通用户,想找一款最值得使用的通用人工智能,目前有三个最佳选择: 除此之外,还有一些值得关注的选项: 下面,我们从几个关键维度进行深入分析。 1. 选择人工智能:服务与模型 如果你想要使用最强的人工智能,就必须确保你访问的是“前沿模型”(Frontier Model)。 这些最新的大规模模型比早期版本更强,错误更少,功能更完善。但人工智能公司通常默认推送更小、更便宜的模型,除非用户付费订阅高级版本。 ✅ 当前最佳模型: 这些命名规则令人困惑,但它们反映了人工智能公司快速迭代的现状。 2. 实时交互模式(Live Mode) 你是否希望人工智能能听你说话、看你看到的东西,并进行实时交流? 这正是“实时模式”(Live Mode)的目标。 📌 当前最佳选择:ChatGPT Advanced Voice Mode 目前,只有 ChatGPT 提供全面的实时模式。但 Google Gemini 计划推出类似功能,其他公司也可能在不久后跟进。 3. 推理能力(Reasoning Models) 近年来最重要的人工智能突破之一是推理模型(Reasoning Models)。与传统人工智能相比,这类模型在回答问题前,会**“思考”更长时间**,从而提高准确性。 ✅ 当前最佳推理模型: 推理模型更像是学者,而非聊天助手。使用时,需要提供清晰的上下文,并耐心等待结果(有时需要几分钟)。在学术研究、数学、计算机科学等高难度任务上,这些模型表现出色。 4. 网络访问(Web Access) 如果你需要人工智能搜索实时信息,以下模型具备网络访问功能: 相比之下,Claude 无法主动联网,这可能会影响信息的实时性。 5. 生成图片(Image Generation) 当前,人工智能主要依赖 单独的图像生成工具 来创建图片,但未来将逐步过渡到多模态图像生成(AI直接控制图像)。 ✅ 当前最佳图像生成模型: 但实际上,这些模型都可以胜任基本的图片生成需求。…
阿里巴巴Qwen团队发布AI模型,可操控PC和手机!
这周,科技界的目光几乎都被DeepSeek的R1模型吸引,但阿里巴巴并没有袖手旁观。 1月27日,阿里巴巴 Qwen团队 正式发布了一系列 全新AI模型——Qwen2.5-VL,具备 文本解析、图像分析、视频理解 以及 远程操控PC和手机 的能力,类似于OpenAI的 Operator。https://github.com/QwenLM/Qwen2.5-VL/blob/main/README.md Qwen2.5-VL:能看、能听、还能动 根据官方介绍,Qwen2.5-VL不仅能读取文件、解析视频,还能 数图像中的物体,甚至可以 远程控制电脑和手机。 🔹 超越国际大厂?阿里巴巴的Qwen团队声称,Qwen2.5-VL在多个评测中 超越了OpenAI的GPT-4o、Anthropic的Claude 3.5 Sonnet和Google的Gemini 2.0 Flash,尤其在 视频理解、数学运算、文档解析和问答能力 上表现突出。 🔹 强大的视觉理解Qwen2.5-VL可分析 图表、发票、表格,甚至能“理解” 长达数小时的视频内容。此外,它还能 识别影视IP和各类商品,暗示该模型可能曾使用 受版权保护的内容 进行训练。 🔹 AI变身“遥控助手”最令人瞩目的是Qwen2.5-VL的 跨设备控制能力。👉 在 PC端,该模型可以操作Linux系统,比如切换标签页(虽然当前还不够智能,无法完成复杂任务)。👉 在 手机端,一位Hugging Face的技术负责人分享了一段视频,展示 Qwen2.5-VL自动打开Booking.com应用并预订机票(从重庆到北京)。 这意味着,AI未来可能不仅仅是 对话助手,更可能成为 真正的智能操作员,帮助用户完成各种任务! Qwen2.5-VL vs. 监管挑战 由于Qwen2.5-VL由 中国公司 开发,该模型在某些敏感话题上 有内容过滤机制。 💡 例子:当测试人员在 Qwen Chat 中尝试让最大版本 Qwen2.5-VL-72B…
Hugging Face挑战DeepSeek,AI开源竞赛升级!
DeepSeek的R1推理模型刚刚引发全球轰动,开源AI界的“顶流”Hugging Face就坐不住了!短短一周后,他们宣布要 从零开始复刻R1 (https://huggingface.co/blog/open-r1),并彻底开源所有组件,包括训练数据、模型架构和训练流程。 这个名为 Open-R1 的项目由Hugging Face研究主管Leandro von Werra及其团队发起,目标是在几周内重现R1的能力,同时让所有人都能自由访问和改进它。 DeepSeek的“开源”之谜 DeepSeek的R1虽然 免费可用,但严格来说并 不是真正的开源,因为其训练数据、实验细节和部分关键工具仍是“黑箱”。换句话说,虽然大家可以用,但没人知道它是怎么炼成的。而Hugging Face的研究员们认为,真正的开源不只是“提供模型”,还应该 彻底透明化,让研究人员能够复制、理解和改进它。 “DeepSeek的R1确实很强大,但它没有开放数据集、实验细节或中间模型,导致复现和深入研究都变得困难。” Open-R1项目的工程师Elie Bakouch在采访中表示。“开源R1的完整架构,不只是为了透明度,更是为了释放它的真正潜力。” 为什么R1让硅谷紧张? DeepSeek的R1是一款 推理模型,与普通AI不同,它能够 自我检查和验证答案,因此在数学、物理、科学等领域更可靠。尽管推理模型的运算速度较慢,但相比传统语言模型,它的答案准确性更高。 R1之所以成为焦点,除了其技术实力, 更重要的是它的开发速度和成本。DeepSeek仅在OpenAI推出o1几周后就发布了R1,而且成本只有美国科技巨头的零头。这一现实不仅让华尔街感到震惊,也让整个AI行业开始质疑美国能否继续保持领先地位。 Hugging Face如何复刻R1? Hugging Face的Open-R1项目正利用 Science Cluster(一个包含768块Nvidia H100 GPU的超级计算集群)生成类似R1的训练数据。整个项目完全开放,任何人都可以通过 Hugging Face和GitHub 贡献代码、优化算法,并参与到R1的复现工作中。 “我们需要确保所有算法和训练方法都准确无误。”von Werra表示。“但这正是社区协作的优势——让尽可能多的人一起攻克难题。” 目前,该项目在GitHub上的 关注度爆炸,上线仅 三天 就收获 1万颗星,成为AI开源界的热门话题。如果Open-R1成功,不仅意味着研究人员可以自由复刻R1,还可能成为下一代开源推理模型的奠基石。 开源AI,真的安全吗? 当然,开源AI并非没有争议。部分专家担心,过度开放可能会被滥用,甚至加剧信息操纵等问题。但Bakouch认为, 开源的优势远远大于风险。 “一旦R1的训练方法被复现,任何有GPU租赁能力的人都可以 基于自己的数据打造专属推理模型。”他表示。“我们对最近的AI开源潮感到兴奋,因为它正在打破‘只有少数大公司才能推动AI进步’的神话。” 结论:AI竞争进入新阶段 Hugging Face的Open-R1无疑会加速AI开源潮流,并进一步降低先进AI技术的进入门槛。这不仅影响科技巨头的商业模式,也可能改变全球AI的研发格局。 从DeepSeek的黑箱式开源,到Hugging Face的彻底开放, AI的未来究竟是封闭垄断,还是开源共享? 这场技术与理念的较量,才刚刚开始。
DeepSeek:硅谷AI格局的拐点?
本周,硅谷迎来了一个令人大跌眼镜的现实:打造先进人工智能模型,可能远没有想象中那么高深莫测。 这场“觉醒时刻”的主角,是成立仅一年的中国初创公司DeepSeek。他们推出的开源AI模型R1,实力直逼美国科技巨头的旗舰产品,但研发成本却只是对方的零头,而且使用的是相对普通的芯片,运行时对数据中心的能耗要求也低得多。 硅谷的金钱战术遭遇挑战 长期以来,美国科技圈一直笃信一个“真理”:只要砸下数十亿美元、囤积最先进的芯片、搭建超大规模的数据中心,就能确保在AI竞赛中遥遥领先——哪怕这意味着巨额的环保代价。毕竟,作为全球最富有的一批公司,它们确信自己可以靠堆资源取胜。 但DeepSeek的出现,彻底动摇了这个信念。现在,华尔街开始追问,这场AI竞赛是否已经从“砸钱造最强模型”变成了“谁能用更低的成本打造更高效的AI”。 硅谷的回应:加速,还是降本? 面对DeepSeek的挑战,美国科技巨头已经开始行动。 OpenAI CEO Sam Altman在X(前Twitter)上称R1“令人印象深刻”,并表示公司会“提前发布”新模型。OpenAI首席产品官Kevin Weil也透露,OpenAI的o3模型将在未来几周内推出,并且会是“一个重要的升级”。 “这行业本来就竞争激烈,但DeepSeek让竞争真正变成了全球化,而不仅仅是美国内部的较量。”Weil在一次记者会上表示。他强调,OpenAI的战略是“快速迭代,保持领先”。 但另一方面,投资界却有不同的解读。分析师预测,美国科技巨头可能会重新评估其数据中心的投资计划,并且可能会降低AI服务的价格。DeepSeek已经证明,先进AI模型不一定非要烧掉天文数字的资金。尽管一些专家对DeepSeek声称仅花600万美元打造R1持怀疑态度,但无论如何,它的成功已经引发了行业大地震。 技术革新 vs. 道德争议 DeepSeek的“低成本奇迹”也让人们开始关注它的训练数据来源。微软(OpenAI的最大投资方)正在调查,DeepSeek是否窃取了OpenAI的数据进行训练。如果确有其事,这无疑会在AI领域掀起一场风暴。但即便如此,DeepSeek的创新仍然促使硅谷重新审视其发展模式。 “所有的前沿AI实验室——OpenAI、Anthropic、Google——都将借鉴DeepSeek的经验,开发更高效的模型,”投资公司D.A. Davidson的技术研究主管Gil Luria表示。“最终,这些模型的运行成本会大幅降低,用户支付的费用也会下降。” 当然,即便没有DeepSeek的刺激,行业也迟早会转向“效率优先”模式。毕竟,服务器和电力资源终究是有限的,而一个AI工具在撰写邮件或规划行程方面的能力,提升到一定程度后,再继续堆算力就变得性价比不高了。DeepSeek只是让这一趋势提前发生了。 但硅谷的“大基建”计划并非一夜之间就能撤回。就在上周,OpenAI、Oracle和软银刚刚在白宫宣布成立一家新公司,并承诺投入5亿美元用于美国AI基础设施建设。微软CEO桑达尔·皮查伊(Sundar Pichai)也重申,公司今年将投入800亿美元发展AI。Meta CEO马克·扎克伯格(Mark Zuckerberg)则表示,Meta的AI投资可能高达650亿美元。 “过去几年,我们一直在谈论疯狂扩建AI数据中心,现在看来,这未必是必要的了。”Luria指出。“投资者预计,这些公司可能会在接下来的财报会议上谈及新的成本控制计划。” DeepSeek的意外“正面效应” 尽管DeepSeek的出现让硅谷有些“慌了”,但在某些技术领袖眼中,这未必是坏事。 开放AI(Open-source AI)的支持者认为,DeepSeek的成功正是对“技术应该共享,而非封锁”的最佳证明。他们认为,如果美国科技公司愿意共享创新成果,而不是封闭在专有模型里,整个行业的进步速度将会更快。 前谷歌CEO埃里克·施密特(Eric Schmidt)就在《华盛顿邮报》上撰文表示:“美国已经拥有世界上最好的封闭式模型。为了保持竞争力,我们必须同时推动开放源代码生态的发展。” Meta也表态支持开源AI,认为这场技术变革“将加速AI的普及,让所有人都能更快受益”。 而对于那些真正相信AI将改变世界的人来说,DeepSeek带来的冲击,或许应该被看作是庆祝的理由,而非恐慌的信号。 “我们害怕的,不过是意识到自己并不拥有AI的全球霸权,”AI顾问、OpenAI前市场负责人Zack Kass表示。“但实际上,我们应该为此感到高兴。因为这再次证明,AI革命正在让科技真正民主化,并且它的影响将被公平地分布到世界各地。”
DeepSeek R1有什么不同
深度思考实验室(DeepSeek)最近发布了全新的推理模型R1,声称该模型不仅性能超越目前最先进的推理模型(如OpenAI的O1系列),而且训练规模只用到了西方大厂GPU集群的一个小小分支。更引人注目的是,和这些大厂不同,DeepSeek还公开了一篇论文,详细解释了他们的技术原理。 简单来说,传统模型的工作原理是根据提示预测下一个或一系列的输出文本。而推理模型则尝试将“逐步思考”的行为直接嵌入到模型中,从根本上改变其逻辑思维方式。OpenAI的模型具体如何运作并未公开,但一种可能的机制是这样的:先用一个强大的常规模型生成大量“逐步推理”的示例,然后筛选出正确答案的数据,再用这些数据对模型进行微调。这个过程虽然有效,但耗费巨大,尤其是需要生成海量的高质量推理数据。 而DeepSeek采用了完全不同的方法。他们的训练基于强化学习,而非微调,不需要预先准备海量的推理链数据,也不需要运行高昂的答案验证模型。具体操作如下: 这种强化学习方法不仅降低了成本,还可能带来质量上的提升。传统方法中的推理能力取决于最初基础模型的表现,而DeepSeek的方法允许模型在自我训练过程中创造出全新的推理链,这种自我进化的能力可能最终导致真正的超智能推理能力,类似于国际象棋超级AI展现出的“非人类”策略。 然而,DeepSeek的方法并非没有局限性。由于训练依赖于可机械验证的推理链,模型目前只能在代码和数学领域中表现出色。而像语言逻辑谜题、法律分析等更复杂的推理场景,由于难以验证答案的正确性,暂时无法纳入训练。 至于为何DeepSeek的创新选择在此刻出现,而非更早?一个可能的原因是开源基础模型的性能最近才达到足够强大的水平,能够支撑这种强化学习方法。此外,推理相关的基准测试质量也有了显著提高,为模型提供了足够多需要推理解决的问题。 总的来说,DeepSeek-R1展示了一种高效且潜力巨大的推理模型训练方法,但在跨领域应用方面仍有改进空间。未来的表现,尤其是在人文学科上的能力,仍需拭目以待。
苹果AI最新动态:Siri改造和AI模型优化成2025年首要任务
苹果在人工智能领域的最新动作令人瞩目,尤其是即将发布的iOS 18.4和后续版本将迎来更多创新。据内部泄露的备忘录显示,苹果今年的AI战略将聚焦两个核心领域:重塑Siri技术基础和改进现有AI模型。 Siri大升级:从“语音助手”到“智能助理” 根据彭博社记者Mark Gurman的报道,苹果正在对Siri进行大规模幕后重组,其目标是让Siri实现更高级的语言模型支持,被称为“LLM Siri”。这一项目预计将在2026年春季,可能是iOS 19.4版本中正式亮相。 此外,苹果人工智能部门主管John Giannandrea在内部备忘录中提到,苹果的首要任务是重建Siri的核心技术,让其摆脱当前系统的种种限制。为了加速这一转型,苹果已将Kim Vorrath调入AI部门,由她负责推动这项关键任务的落地。 优化AI模型:解决通知问题 苹果的第二个优先事项是全面改进AI模型。Giannandrea表示,这不仅是提升用户体验的需求,也是解决当前一些技术问题的关键。例如,iOS的通知摘要功能虽然很实用,但因AI支持的准确率问题,常常出现错误分类或遗漏。目前,苹果已在iOS 18.3中暂时禁用部分类别的通知摘要功能,直至相关AI模型得到改善。 苹果的“渐进式创新”策略 尽管苹果的AI计划听起来并非革命性突破,但正如一贯的风格,苹果更倾向于逐步改进,注重细节和整体用户体验的提升。正如网友Gary Hoff所说:“苹果设备的协同能力首屈一指,但Siri作为核心功能却表现落后,希望这次能真正做好!” 苹果的AI战略正朝着更智能、更实用的方向迈进,Siri的技术重塑和AI模型的优化是2025年实现这一目标的关键步骤。对于广大苹果用户而言,这无疑是一个值得期待的转变。