开源 AI 竞赛再度升温,美国科技界正与中国的 DeepSeek 正面交锋。就在 DeepSeek 以低成本 AI 模型震惊硅谷的几天后,Allen Institute for AI(AI2)高调宣布,其新推出的开源模型在多个基准测试上可媲美甚至超越 DeepSeek V3 和 OpenAI 的 GPT-4o。 这款新模型是 AI2 去年 11 月发布模型的升级版,参数量从 70 亿激增至 4050 亿,规模扩大近六倍。DeepSeek 的成功让开源 AI 站上聚光灯,而 AI2 也希望借此证明,美国的开源 AI 团队同样能在开放与封闭模型的性能差距上迎头赶上。 AI2 资深 NLP 研究主管 Hannaneh Hajishirzi 在接受 Tech Brew 采访时表示,美国本土的开源大模型屈指可数,主要有 AI2 的这款模型、Meta 的 Llama 以及少数几个其他项目。因此,这次 AI2 证明了,只要采用他们的训练方法,开源模型也能缩小差距,甚至超越 DeepSeek V3。 强化学习之争:谁学了谁? AI2…
Meta 正在押注人形机器人领域
Meta 似乎正在押注人形机器人领域,准备在科技版图上再掀一波风潮。根据《彭博社》报道,这家科技巨头正在其 Reality Labs 硬件部门内组建一支全新的团队,目标是打造能够执行实体任务的机器人,甚至可能涉足家务机器人领域,让智能助手从虚拟世界走进现实。 这支全新的机器人团队将由前 Cruise(自动驾驶汽车初创公司)CEO Marc Whitten 领导。据悉,Whitten 还是科技圈的老熟人,曾在亚马逊、微软和 Sonos 等公司任职,履历相当亮眼。而除了硬件开发,这个团队还将专注于机器人软件和 AI 领域,为未来的智能机器人铺路。 值得一提的是,Meta 并不打算直接推出一款自家品牌的机器人——至少短期内不会这么做。公司高层,包括 CTO Andrew Bosworth,在规划中更倾向于构建一个机器人市场的硬件基础,就像 Google 通过 Android 操作系统推动整个智能手机行业一样,Meta 似乎希望用类似的模式影响机器人市场。 此外,Meta 还在与多家机器人公司洽谈合作,其中包括 Unitree Robotics 和 Figure AI,或许未来会携手推出机器人原型。科技界的巨头入局,这波人形机器人革命,可能真的要来了!
极客时间:“Vibe Coding” 在 Google Colab 上玩转 OpenAI & DeepSeek
一种全新的编程方式——“Vibe Coding”正在崛起!这个术语由特斯拉前AI负责人、OpenAI联合创始人Andrej Karpathy提出,强调利用大型语言模型(LLMs)来加速编码,减少手写代码的繁琐工作,更多依赖AI自动补全。开发者不再需要逐行精雕细琢,而是通过高层次指令引导AI,并快速迭代优化。随着语音驱动AI的兴起,编程变得更加直观,模糊了构思与执行之间的界限。 语音驱动的编程体验 语音编码的核心是流畅度。开发者只需用自然语言描述需求,AI工具就能将其转化为可执行代码。不再是逐字符敲代码,而是告诉AI:“写一个函数分析客户评论情感并用柱状图展示。”AI会生成Python代码,包括数据预处理、NLP情感分析以及Matplotlib可视化。然后进一步优化:“让颜色根据情感强度从红到绿渐变。”几分钟内,一个完整的原型就诞生了。这不仅减少了开发摩擦,还让编程更具创造性和互动性。 AI如何改变编程? 随着GitHub Copilot、OpenAI GPT模型和DeepSeek等AI编码助手的普及,软件开发的范式正在发生变化。过去,开发者需要手写每一个函数,而现在,他们可以与AI协作,让AI建议、完善甚至自动生成完整应用程序。这种转变使编程更偏向问题解决,而不是死磕语法。Karpathy将其描述为一种“AI原生”的开发模式,工程师更像是AI的指挥官,指引AI高效构建解决方案。 在Google Colab上尝试语音编程(OpenAI方案) 想体验语音驱动的编程?Google Colab是一个很棒的实验环境,语音识别工具可以无缝对接AI模型。 第一步:安装所需库 在Colab单元格中运行以下命令: 第二步:搭建AI语音编码系统(基于OpenAI) 以下代码实现了一个语音编码系统,可以录制语音、转录成文本并由GPT模型自动生成Python代码: 运行代码后,对着麦克风说“打印Hello”,AI会自动生成并执行 print(“Hello”) 语句。这就是AI语音编程的魅力! DeepSeek方案:语音编程的另一种选择 如果想尝试OpenAI之外的替代方案,DeepSeek提供类似的API进行语音转录和代码生成。 第一步:安装所需库 第二步:使用DeepSeek实现语音编码 代码结构与OpenAI版本类似,只是API调用方式有所不同。 语音编程的未来?机遇与挑战并存 AI辅助编程的出现,无疑大幅提高了开发效率,让更多人可以专注于解决问题而不是死磕代码细节。但与此同时,也带来了一些隐忧: 不过,科技总是在不断发展,关键在于如何学会适应、利用AI,而不是被AI取代。 不妨试试“Vibe Coding”,看看AI如何改变你的编程方式!
马斯克97.4亿美元收购OpenAI?这场硅谷AI战争愈演愈烈
硅谷AI战局再升级!由马斯克的x.AI牵头的投资财团,向OpenAI提出97.4亿美元的收购要约,试图将这家全球最知名的AI公司收入囊中。然而,OpenAI CEO Sam Altman对此嗤之以鼻,直接拒绝了这笔交易,甚至在社交媒体上开玩笑反击:“要不你把X(推特)卖我,十分之一的价格如何?” 但有趣的是,尽管Altman已经公开表示不接受,OpenAI董事会尚未正式拒绝。按照法律规定,董事会通常需要对竞标进行正式评估,即使出价来自竞争对手。 马斯克收购要约的五大看点 1. 收购截止日期:2025年5月10日 这并不是一个无期限的报价,马斯克的财团给出了明确的截止日期:2025年5月10日。除非交易提前完成、双方同意终止谈判,或OpenAI正式书面拒绝,否则这笔交易始终有效。 2. 全现金交易,没有贷款 马斯克的团队承诺,这笔97.375亿美元的收购完全以现金支付。 这与他2022年收购Twitter(现X)时的做法形成鲜明对比——当时,他向银行借了130亿美元来完成交易。而如今,马斯克的净资产已飙升至约4000亿美元,主要得益于他的政治盟友特朗普当选。不过,这次出资的并不仅仅是马斯克个人,交易文件显示,还有7家投资方,包括x.AI、8VC和SpaceX投资方Vy Capital,以及一些未公开的“其他”投资者。 3. 马斯克团队要求完全审查OpenAI的财务和人员 在交钱之前,马斯克团队希望全面审查OpenAI的业务、财务、资产,并与OpenAI员工进行访谈,即所谓的“尽职调查”(Due Diligence)。 虽然这在大规模收购交易中很常见,但问题是——x.AI是OpenAI的竞争对手,如果马斯克的团队拿到了OpenAI的核心数据,是否会利用这些信息来增强自己的AI业务?此外,如果他们在审查过程中发现任何问题,也可以借此撤回报价。 4. 这个报价可能让马斯克的诉讼站不住脚 有趣的是,马斯克目前正起诉OpenAI,试图阻止其从非营利机构转换为营利性公司,但这次收购报价却与他的诉讼主张相矛盾。 OpenAI的律师在法庭文件中指出,马斯克一方面起诉称OpenAI的资产不能“私有化”,另一方面又试图以近100亿美元收购它,这简直就是“自相矛盾”。OpenAI方面甚至质疑:马斯克的报价可能根本不是认真的,而是为了扰乱竞争对手。 但马斯克团队坚称,这笔交易是**“真金白银”**,并表示如果收购成功,这笔钱将用于OpenAI非营利机构,以继续推动其使命。 5. 如果OpenAI继续保持非营利,马斯克可能撤回收购 马斯克的法律团队在周三提交的法庭文件中表示,如果OpenAI承诺保持非营利性,他就会撤回收购要约。 换句话说,马斯克似乎并不是真的想买OpenAI,而是想利用这次收购报价,把Altman的私有化进程搅黄。有业内人士猜测,马斯克的策略可能是人为抬高OpenAI的市场估值,让Altman需要支付更高的价格才能完成私有化。 对此,OpenAI董事会的律师表示,马斯克的报价“并没有为OpenAI的非营利机构定价”,因为“非营利组织不是可以被收购的”,等于直接堵死了这条路。 AI大战白热化,马斯克能否搅局成功? 马斯克和Altman之间的矛盾,已经不仅仅是商业竞争,更涉及理念之争、权力之争以及私人恩怨。马斯克当年帮助创立了OpenAI,但后来因理念不合退出,现在又通过诉讼和收购双管齐下,试图阻止其私有化。 但Altman并不打算让步,他不仅拒绝了收购要约,还在加速OpenAI的扩张。OpenAI目前估值高达900亿美元,去年12月刚刚完成5亿美元融资,有着强大的资本支持。 这场AI权力角逐,最终谁能笑到最后?或许,真正的赢家还未浮出水面。
Perplexity推出Sonar API,让AI搜索嵌入更多应用
AI搜索创业公司Perplexity又放大招了!本周二,该公司正式推出API服务 Sonar,让企业和开发者可以直接将Perplexity的生成式AI搜索工具集成到自己的应用中。 Perplexity在博客中表示,目前大多数生成式AI的回答仅基于训练数据,这极大限制了其能力。而Sonar API通过实时联网获取权威来源的信息,从而提升搜索结果的准确性和可靠性。 两大版本,按需选择 Sonar API目前提供两个版本,针对不同需求的开发者: 价格方面,基础版Sonar采用更轻量的模型,费用为: 而Sonar Pro因为支持更深入的查询,价格也更高: 值得注意的是,Sonar Pro的定价更不稳定,因为它会在单次查询时运行多个搜索任务。 Zoom已率先用上Sonar API 有了Sonar API,Perplexity的AI搜索引擎不再局限于其官网和App,而是可以嵌入各种企业应用。比如,Zoom已集成Sonar API,用于其视频会议平台的AI助手。 这个AI助手能够在不离开视频窗口的情况下,直接搜索并提供带引用来源的实时答案,大大提升用户体验。 Sonar API成Perplexity新收入来源 Perplexity目前的主要盈利模式是订阅服务,提供无限次AI搜索及附加功能。而API的推出,意味着它可以靠企业级服务进一步变现,拓宽收入来源。 不过,AI API市场正在“卷”价格,过去一年,各大科技公司已经疯狂削减API接入费用。Perplexity也宣称,Sonar是目前市面上最便宜的AI搜索API,希望以此抢占市场。 Sonar Pro:表现碾压Google、OpenAI? Perplexity表示,Sonar Pro在SimpleQA(一个衡量AI聊天机器人答案准确度的基准测试)中,击败了Google、OpenAI和Anthropic的领先模型。如果这一数据属实,Sonar Pro很可能成为AI搜索领域的新晋黑马。 Perplexity融资9亿美元,估值飙升 去年12月,Perplexity刚刚完成5亿美元融资,由Institutional Venture Partners领投,公司估值达90亿美元。如今,随着Sonar API的发布,Perplexity的扩张野心已经浮出水面。 AI搜索的竞赛仍在加速,Perplexity这波操作能否真正撼动Google和OpenAI?或许,很快就能见分晓。
硅谷新潮流:“Vibe Coding” 让AI写代码
最近,硅谷又整出了一个新词——“Vibe Coding”(氛围编程),由OpenAI联合创始人Andrej Karpathy提出,核心理念就是“全身心投入氛围,忘掉代码的存在”。 这一概念的本质,是让AI工具(比如Replit Agent)承担编程中的大部分工作,以极快的速度搭建软件。虽然这种方式降低了编程的门槛,但专家们也警告,这并非没有风险。 编程不再靠手,而是靠“感觉” AI 生成代码的能力已经突飞猛进,但Karpathy的“Vibe Coding”概念,彻底打破了传统的编程认知。他在社交平台X上表示:“这已经不能算是真正的编程了,我只是看看、说说、运行、复制粘贴,然后它就能运作。” 早在ChatGPT推出后不久,Karpathy就曾说过:“当下最流行的编程语言是英语。”如今,他的想法进一步演化,认为代码根本不需要深究,AI可以靠几句提示词(prompt)自动生成所需功能。 硅谷大佬们也看到了这种趋势的潜力。OpenAI CEO Sam Altman最近在印度表示,“到2025年底,软件工程将发生巨大变化”。与此同时,扎克伯格也在《Joe Rogan Experience》播客中提到,AI很快就能取代Meta的中级工程师。 “Vibe Coding”怎么玩? Karpathy分享了自己如何利用AI进行“Vibe Coding”: 这种方式让很多非程序员也能快速上手。剑桥大学AI研究员Harry Law表示:“对于完全没经验的初学者,能在短时间内搭建出一个能运行的项目,带来的满足感是巨大的。” Replit CEO Amjad Masad 透露,75%的Replit用户从未写过一行代码,这正是“Vibe Coding”带来的变化。连AI创业公司Menlo Park Lab的创始人Misbah Syed都表示,现在只需要几个提示词,就能把一个想法变成产品。 “Vibe Coding”也有隐患 但这种新模式并非没有问题。 Law指出,过度依赖AI可能导致开发者缺乏对系统架构和性能优化的理解,而且随着项目规模扩大,AI生成的代码可能会变得难以维护,甚至存在安全漏洞。 一位微软高级软件工程师匿名表示:“这概念有点被过度炒作了。”他认为,AI适合处理零散的任务,但在长期维护和扩展项目时,LLM(大语言模型)会变得混乱,甚至生成大量无用代码。 风投公司A16z的合伙人Andrew Chen也表达了类似的看法:“用最新的AI工具写代码确实很酷,但有时候真的让人抓狂。” Karpathy自己也承认,AI有时候**“修不好bug”,但他的方法是——“换个方式写,或者随便改点东西,错误总会消失”**。 当AI已经在颠覆传统编程方式,是时候让整个行业来一次“Vibe Check”(氛围检测)了。
OpenAI将直接推出GPT-5
OpenAI最新动态震惊业界!原本计划推出的o3模型被紧急叫停,取而代之的是一个更“简化”的产品方案。据CEO Sam Altman透露,未来几个月内,OpenAI将直接推出GPT-5,这款新模型将整合o3的技术,并应用于ChatGPT和API服务。换句话说,o3不会作为独立模型发布了。 去年12月,OpenAI曾表示计划在2025年初发布o3。而就在几周前,该公司首席产品官Kevin Weil还在采访中确认o3预计会在2-3月上线。如今,这一计划突然生变,显然是出于更宏观的产品策略调整。 Altman在X上的发文透露,OpenAI意识到当前产品线的复杂性,用户需要在ChatGPT中手动选择模型的体验“让人抓狂”。因此,公司决定采取“统一智能”策略,目标是让AI“开箱即用”,无需用户做过多选择。 此外,Altman还宣布,一旦GPT-5正式上线,所有用户都可以在“标准智能”设定下无限制使用该模型,前提是符合“滥用限制”(具体规则尚未公布)。ChatGPT Plus订阅用户可以使用更高等级的GPT-5智能,而ChatGPT Pro用户则可享受更高级别的智能体验。 更令人期待的是,GPT-5不仅仅是一次升级,还将集成语音、画布(Canvas)、搜索、深度研究等功能。Altman表示,OpenAI的目标是创建一个能自动调节思维时间、适用于各种任务的智能系统,实现真正的“统一AI体验”。 在GPT-5到来之前,OpenAI还计划在未来几周内发布GPT-4.5(内部代号“Orion”)。据悉,这将是OpenAI最后一款非“链式思维”模型。相比之下,o3和其他“推理模型”在数学和物理等领域的表现更加稳定,而Orion在这些方面仍有一定局限性。 OpenAI近年来大力推动推理模型的发展,而这一趋势如今已在行业内引起连锁反应。例如,来自中国的AI实验室DeepSeek近期推出的R1模型在多个基准测试中与o1不相上下。与o1不同的是,R1是一个开源模型,开发者可以自由下载并使用。这无疑给OpenAI带来了新的竞争压力。Altman在社交媒体上坦言,DeepSeek的进展已经缩小了OpenAI的技术领先优势,因此公司决定加快产品发布节奏,以保持市场竞争力。 不过,GPT-4.5(Orion)似乎遇到了一些技术难题。彭博社、《The Information》和《华尔街日报》均报道称,与GPT-4o相比,Orion的提升幅度并不如GPT-4对比GPT-3时那么显著。这或许意味着,真正的革命性突破还要等到GPT-5的发布才能见分晓。
OpenAI 自研 AI 芯片计划曝光,目标 2026 年量产
据 报道,OpenAI 正在加紧研发其首款自研 AI 芯片,并计划与 台积电(TSMC) 合作生产。初步试产预计需要数月时间,而大规模量产目标定在 2026 年。 这款芯片将采用 TSMC 最先进的 3nm 制程工艺,确保 OpenAI 在 AI 硬件竞赛中保持领先。项目团队由前 Google 芯片专家 Richard Ho 领导,团队规模目前约 40 人,并与 Broadcom 深度合作,致力于打造一款既能 训练 又能 推理 AI 模型的芯片。不过,初期部署预计规模较小,难以与 Google 或 Amazon 等科技巨头的芯片项目相比。 OpenAI 为何要自研 AI 芯片? 目前,AI 计算的核心战场仍由 Nvidia 主导,但越来越多的科技巨头开始走向 自主芯片开发,以降低对外部供应商的依赖,同时提升计算效率。Amazon、Microsoft 和 Meta 等公司早已投入巨资打造自家 AI 硬件,而 OpenAI 选择自研芯片,更多是为了在未来的供应链谈判中争取更大话语权。 消息人士透露,OpenAI 此举并不意味着会完全抛弃 Nvidia,而是希望在未来的…
OpenAI 推出竞赛编程 AI,大模型推理能力迎来突破
竞赛编程一直以来都是测试编程能力和问题解决技巧的试金石。这类挑战要求选手具备高级算法思维、代码优化能力以及精确执行力,因此也成为 AI 推理能力的重要测试场。虽然 Codex 等早期 AI 模型已经展现出强大的代码生成能力,但它们主要依赖大规模采样和启发式方法,难以真正理解问题并灵活应对。 OpenAI 最新研究突破了这些局限,通过强化学习(RL)大幅提升 AI 在竞赛编程中的推理能力,让 AI 不再只是“拼代码”,而是真正学会如何思考和解决问题。 强化学习 + 竞赛编程:AI 正式进入推理时代 OpenAI 推出的竞赛编程 AI 采用了一种全新的方法,重点在于提升大模型的推理能力,让 AI 在面对复杂问题时能像人类一样分析和优化解法。 研究对比了三种不同模型: o3 模型的表现最为惊人,在 2024 IOI 竞赛中拿下金牌,并在 CodeForces 竞赛平台上达到了 2724 分,超过 99.8% 的人类选手。这一突破表明,AI 不仅能与顶尖程序员媲美,而且可以完全依靠自我学习来解决问题,而不需要人为干预或特殊优化。 编辑 技术突破:强化学习让 AI 具备真正的推理能力 OpenAI 的竞赛编程 AI 之所以能超越传统方法,核心在于强化学习和推理能力的结合,带来了更智能、更系统的编程能力。相比于过去依赖暴力搜索和手工规则的 AI,这一方法实现了以下关键进步: 相比于 AlphaCode 这样的竞赛 AI 依赖大规模采样和手工筛选,o3 采用强化学习的方式,真正实现了问题理解和自主推理,而不是单纯地“蒙答案”。 竞赛成绩:AI 已迈入顶级人类程序员行列 OpenAI…
WASM会取代容器
2030年,没有人会记得Kubernetes。 当人类发明了容器技术,还没高兴多久,OKR和SCRUM就来了。而现在,一场新的技术变革已经在酝酿之中——WebAssembly(WASM)正在悄悄取代容器,成为下一代开发者的终极武器。 为什么容器已经变得“讨人厌”? 容器技术的出现,曾经解决了许多软件开发的痛点。虚拟机虽然功能强大,但并不够轻量,而容器的出现带来了更快的构建速度、几乎瞬间的启动体验,以及更少的虚拟化开销。 然而,到了今天,容器已经变成了让开发者头疼的东西。DevOps的承诺早已被复杂的工具链和过度绑定所侵蚀,程序-容器-Linux三者的紧耦合让开发体验大打折扣。 大多数开发者的目标是写代码、上线新功能、达成季度KPI,不是研究Docker的构建优化。没人会把“提高Docker构建速度”当成核心目标,除非他是刚刚被重新包装成“PlatformOps”(前DevOps,前Ops)的团队成员。 WASM:真正的“写一次,跑遍全球” WebAssembly(WASM)正逐步替代容器,甚至在某些场景中已经做到了。 WASM提供了一种真正的跨平台体验——任何能运行V8引擎的环境,都能执行WASM代码,而现在支持V8的地方越来越多。更重要的是,WASM已经支持多种编程语言编译,而对于尚不支持的语言,未来也能通过WASM解释器运行。 目前WASM的最大障碍是系统接口支持不足,比如文件访问、网络通信等。但这些都是时间问题,等到这些功能完善,WASM将彻底释放潜力。 WASM vs JVM:这次真的不一样? 当然,反对WASM的人最喜欢拿Java虚拟机(JVM)来对比。毕竟,JVM早就提出了“写一次,跑遍全球”的口号,而且全球超过30亿台设备在运行Java。 但JVM的最大问题是——它的字节码无法在浏览器中运行(RIP Java Applets)。现代应用需要跨平台共享代码,而JVM在这一点上明显力不从心。更何况,现在市场正逐步从JVM迁移到静态编译的二进制文件,比如GraalVM、Kotlin Native、Scala Native等。 WASM在浏览器端的天然兼容性,才是它真正的杀手锏。 微服务时代,WASM如何颠覆游戏规则? 在微服务架构中,服务之间主要通过HTTP、RPC 或消息队列进行通信。尽管这种解耦方式带来了很多好处,但网络延迟、带宽开销以及系统可靠性问题仍然是摆在开发者面前的挑战。 这正是WASM即将改变游戏规则的地方。 像AWS Lambda这样的无服务器平台已经把微服务拆分到了极致。但Cloudflare Workers的模式更进一步:当一个Worker调用另一个Worker时,它实际上不会发起真正的网络请求,而是直接在同一个V8运行时中执行。 这意味着:✅ 零网络开销 —— 没有额外的网络延迟,调用就像本地函数一样快。✅ 不需要容器 —— Cloudflare Workers完全运行在V8沙盒里,直接支持JavaScript、TypeScript,以及编译成WASM的代码。 相比之下,容器无法在同一进程中调用另一个容器,但V8可以。换句话说,WASM+V8沙盒的模式,能够提供微服务的开发体验,同时享受单体架构的运行效率。 Cloudflare并不是唯一在做这件事的公司。Wasmer等项目也在尝试构建类似的WASM解决方案,未来的应用架构可能将发生彻底的变化。 WASM正在加速普及,开发者该如何准备? WebAssembly仍然是一项年轻的技术,但发展速度惊人,生态系统正在快速扩展。也许现在它还不适合所有应用场景,但不妨关注它的最新进展。想提前体验未来?可以尝试在Cloudflare Workers上开发项目,感受无容器架构的魅力。 如果你目前的主力语言是Python、Ruby 或 PHP,先别着急,这些语言的WASM支持还在完善中。但如果想提前适应潮流,建议把Go或Rust加入你的技术栈,这样当WASM真正成为主流时,你已经站在了风口上。 如果你还在构建Docker镜像,或许是时候重新思考你的开发体验了。