在今天的专栏中,将会探讨并分析一种重要的人工智能进展,这种进展似乎推动了新发布的OpenAI o1生成式AI模型表现得格外出色。 之所以说“似乎”,是因为OpenAI对于其“秘密武器”保持相对保密态度。他们将其生成式AI视为专有技术,出于盈利目的,并不愿完全透露内部的技术细节。因此,我们必须通过巧妙的分析,合理推测他们的聪明设计。 既然如此,挑战接受。 在进入正题之前,值得一提的是,这篇文章是关于OpenAI o1生成式模型的持续评估和评论系列的第五部分。若想了解o1的概述和详细解读,请参见该系列的第一部分。第二部分讨论了链式思维(CoT)如何通过双重检查来减少AI幻觉和其他问题。第三部分探讨了链式思维如何用于检测生成式AI的欺骗行为。第四部分则着重介绍了o1模型在提示工程中的显著变化。 今天的第五部分将深入探讨强化学习(Reinforcement Learning,简称RL)的重要性。 强化学习作为AI的关键技术 强化学习是这一进展的核心。那么,什么是强化学习呢?首先,大家可能已经在日常生活中接触到类似的概念。比如,家里有一只喜欢冲向门口迎接客人的狗,如何训练它不再这样做呢?最简单的方法就是通过正强化,比如当狗保持冷静时,给它一些奖励。当它冲向客人时,则可以通过严厉的语气来进行负强化。经过反复训练,狗狗会明白该如何行为,从而建立和谐的家庭环境。 同样的原理可以应用在现代AI中。生成式AI在进行数据训练时,可能会接触到大量不适当的内容。如果AI输出这些内容,后果可想而知。因此,如今我们使用“人类反馈的强化学习”(RLHF)来防止AI输出不当内容。在AI发布前,聘请的人员会对AI生成的输出进行标注,标记不当内容。这一过程帮助AI学习并避免重复这些错误,正如当初ChatGPT成功推出一样。 提升生成式AI的强化学习 传统的强化学习多用于AI模型的训练阶段,而现代AI可以在运行时(即测试时)进行强化学习。比如,当AI生成的结果与预期不符时,可以进行标注,以便AI下次避免同样的错误。然而,问题在于,AI可能无法理解错误的根本原因,只会避免特定的输出。这种基于结果的强化学习可能会过于狭隘,无法广泛应用。 为了解决这个问题,提出了“基于过程的强化学习”。生成式AI可以通过链式思维(CoT)分步骤解决问题。通过对每个步骤进行强化学习,AI可以逐步改进,而不是仅关注最终的生成结果。例如,在回答问题时,AI可以逐步展示其推理过程,我们可以针对每个步骤进行评估和反馈,而不仅仅是针对最终结果进行调整。 强化学习的两种方法 强化学习可以分为两种方法:基于结果的强化学习和基于过程的强化学习。基于结果的强化学习仅关注最终结果,而基于过程的强化学习则关注AI解决问题的各个步骤。通过结合这两种方法,AI能够更好地进行调整,提升其性能。 在2023年发表的一项研究中,OpenAI的研究人员指出,基于过程的强化学习在某些领域的表现优于基于结果的强化学习,尤其是在数学问题的解决中。或许,OpenAI o1正是采用了这种基于过程的强化学习方法,结合链式思维,使其在科学、数学和编程等领域表现尤为出色。https://arxiv.org/abs/2305.20050 结论 总结来看,OpenAI o1可能在强化学习上进行了创新,尤其是结合了链式思维和基于过程的强化学习。这使得AI在特定领域中能够生成更准确和更优质的结果。尽管这一技术目前可能仍在试验阶段,但其潜力巨大,值得持续关注。 期待该系列的下一部分更新,敬请期待。
Author: aitrendtrackers@rengongzhineng.io
口哨声、歌声、boing声和biotwang声:用AI识别鲸鱼叫声
谷歌推出了一款全新的鲸鱼生物声学模型,可以识别八个不同的鲸鱼物种,其中包括两种物种的多种叫声。这个模型还包含了最近被确认为布氏鲸发出的“Biotwang”声。为了保护生活在偏远环境中的动物,研究人员必须能够追踪它们,了解它们的种群动态。随着长期被动声学监测技术的发展,基于大量声景数据的自动物种识别工具已经成为保护与生态研究的关键。然而,尽管有像Google Perch这样的鸟类声音识别模型,开发能够同时分类多个鲸鱼物种叫声的模型仍然充满挑战。https://github.com/google-research/perch/tree/main/chirp 鲸鱼的声学范围极为广泛,蓝鲸的声音可以低至10赫兹,而齿鲸(如虎鲸)的声音可高达120千赫兹。此外,录音还会因地点和时间的不同而产生巨大变化,使得模型开发更加复杂。特别是一些神秘的鲸鱼种类,其叫声特征仍不为人知,这进一步加剧了识别难度。一个典型的例子是“Biotwang”声,这种声音最早在马里亚纳海沟被记录,带有金属质感,与典型的鲸鱼低沉叫声完全不同。最近,NOAA(美国国家海洋和大气管理局)的研究人员将其确定为布氏鲸独特的叫声。 如今,谷歌的鲸鱼生物声学模型已能够识别八个物种,并可以区分两种物种的多种叫声类型。这个模型帮助研究人员分析了超过20万小时的海洋录音,解锁了许多关于鲸鱼生态的新发现。目前,模型已通过Kaggle Models开放下载。 项目背景 谷歌的鲸鱼叫声分类项目始于2018年,当时与NOAA的太平洋群岛渔业科学中心合作,开发了一个检测座头鲸叫声的模型。该模型通过分析NOAA收集的18.7万小时音频数据,确认了座头鲸的时空分布模式,还发现了它们在Kingman Reef的新分布地点。后来,谷歌与加拿大渔业和海洋部(DFO)合作,开发了一个虎鲸检测模型,帮助DFO实时监测濒危的南部居民虎鲸种群。 新的鲸鱼生物声学模型 最新的多物种模型能够为八种鲸鱼提供分类分数,并可进一步区分其中两种物种的不同叫声类型,总共涵盖了12个分类。模型使用原始音频数据生成频谱图,将其分类为12种鲸鱼叫声或物种之一。由于鲸鱼栖息环境中可能包含大量背景噪音,模型还特别训练了大量负样本,确保它能够有效排除背景音干扰。 模型在测试集上的表现非常优异,尤其是对于小须鲸、北大西洋露脊鲸、北太平洋露脊鲸和布氏鲸的分类,表现尤为突出。 模型中的新标签 除了常见的鲸鱼叫声,模型还包括了一些较为独特的声音。例如,小须鲸发出的“boing”声最早在上世纪50年代的潜艇录音中被记录,直到2005年才被确认属于小须鲸。北太平洋露脊鲸则以其“枪声”叫声而闻名,这种声音独特于该物种的东部种群。布氏鲸的“Biotwang”声也经过NOAA研究人员的确认,进一步丰富了模型的分类能力。 新发现 布氏鲸虽然在全球都有目击报告,但人们对其种群结构和迁徙模式知之甚少。通过谷歌模型对西太平洋声景数据的分析,研究人员发现了布氏鲸的叫声在该区域的季节性变化,揭示了不同种群之间可能存在的差异。这一发现为了解该物种的生态提供了重要线索。 扩展到更多物种 尽管模型目前仅涵盖了约94种鲸类物种中的八种,但它的潜在应用范围远远不止于此。研究人员可以使用模型的预训练嵌入技术,快速识别和分类新的鲸鱼声音或物种,为鲸类研究和保护提供强有力的支持。
LinkedIn在更新服务条款之前,就已经开始使用用户数据训练其AI模型了
根据404 Media的最新报道,一些LinkedIn用户发现该平台正在未经同意的情况下使用他们的数据来训练生成式AI模型。LinkedIn表示,这些数据的使用是为了提升如写作辅助等功能,虽然用户可以在账户设置中的“生成式AI改进数据”选项下关闭该功能,但默认情况下它是开启的。 LinkedIn声称其采用“隐私增强技术”来匿名化数据,保护个人身份信息。然而,很多人对公司敏感信息被自动使用感到不满,尤其是没有事先通知的情况下。 目前,欧盟、欧洲经济区和瑞士的用户由于更严格的隐私规定,暂时免于此类数据使用。 尽管LinkedIn开始处理用户数据用于AI训练,但它的服务条款并未同步更新。微软旗下的LinkedIn告诉404 Media,它将很快更新这些条款。而现在,这些条款已经按照要求完成了更新。 LinkedIn发言人在给TechRadar Pro的一封电子邮件中提到:“我们正在进行一些改变,让LinkedIn用户在数据如何用于生成式AI训练方面拥有更多选择和控制。我们引入了默认启用的AI工具,这些工具可以为所有用户带来帮助,但同时也确保那些有特定隐私偏好的用户可以轻松选择退出。虽然用户可以选择退出,但很多人来到LinkedIn是为了求职和拓展人脉,生成式AI正是帮助专业人士适应这种变化的一部分。” 发言人还补充道,目前不会对欧洲经济区和瑞士的用户启用生成式AI数据训练功能,也不会向这些地区的用户提供相关设置。 然而,数据处理并不止于此。LinkedIn还使用其他机器学习工具来进行个性化推荐和内容审核,这些功能同样是基于“选择退出”机制,并需要提交一个单独的数据处理异议表单。 尽管LinkedIn已更新了服务条款,但由于披露和解释的时间较晚,用户对这次重大改变的突然实施感到不满,并提出了隐私和透明度方面的质疑。
迈克尔·戴尔谈AI
迈克尔·戴尔,作为全球少数几位从零开始将公司带到880亿美元营收并仍在继续领导的企业家之一,创立并掌舵戴尔科技公司已经四十年。他于1984年在大学宿舍创办的这家公司,如今已成长为科技巨头,凭借惊人的韧性应对一波又一波的技术浪潮。 迈克尔·戴尔认为,人工智能(AI)是一股不同凡响的趋势,它将彻底改变组织的运作方式和商业模式。他的公司如今正向企业提供端到端的AI解决方案,帮助企业在应对成本、人才、数据安全和风险的同时,加速进行AI实验。尽管目前只有不到10%的企业通过大规模应用AI实现了盈利,戴尔科技凭借加速AI服务器、非结构化数据存储、AI个人电脑以及网络服务,押注企业将希望掌控AI以保护其日益重要的数据资产。 在谈到AI的潜力时,迈克尔·戴尔认为,AI及生成式AI(gen AI)正在推动数据的解锁,开启了新的认知和智能时代。他表示,AI将大大加速科学发现,并改善人类生活的方方面面。尽管AI带来了许多不确定性,但戴尔对其潜力充满兴奋。 对于戴尔科技的客户,几乎所有有趣的创新都离不开数据。无论是自动驾驶汽车,还是mRNA疫苗的药物研发,所有世界上的难题都需要更多的计算能力和数据。戴尔认为,AI的广泛关注让很多领域重新得到了重视,尤其是在药物研发、供应链预测等方面,AI带来了巨大的潜力。 关于数据管理,他指出,大多数数据将源于现实世界,而无论是在云端还是在本地设施中处理这些数据,企业都需要严密保护其最有价值的资产——数据。戴尔科技的任务是为客户提供最佳的选择和方案,帮助他们在不妥协数据安全的情况下利用AI提升效率和生产力。 在AI监管方面,迈克尔·戴尔表达了对监管机构的同情,因为科技变化速度如此之快。他认为,AI将增强而非取代人类,未来的AI工具将帮助员工更好地完成工作,带来更多的灵活性和机会。然而,他也承认,需要有一定的法律框架来防止技术被滥用。 关于是否对生成式AI存在过度炒作的疑问,迈克尔·戴尔坦言,任何具有重大意义的突破都会伴随着过度的期待和夸张的预测,但方向无疑是正确的。他认为,尽管过程中会有失败,但总体上AI带来的变革不可忽视。 最后,戴尔还分享了他四十年职业生涯中应对科技行业重大转折的经验,尤其是在私有化以及收购EMC和VMware等交易中。他指出,快速适应变化、解决客户的实际问题是企业成功的关键。而对于未来PC的变化,他相信,AI将为PC赋能,帮助用户更高效地处理信息,提升生产力。 对于年轻一代,他建议要专注于数学和科学,并鼓励孩子们保持好奇心,追随自己的兴趣。
TikTok 周一在联邦法院出庭
TikTok 周一在联邦法院出庭,面临一场事关生死的诉讼,因为一月份的最后期限临近,届时该应用可能会在美国被禁止运营。 经过数小时的质询后,法庭的倾向性依然不明朗。这是 TikTok 面临的最严重的法律挑战,可能决定其在美国的未来。 由三名法官组成的美国哥伦比亚特区巡回上诉法院小组对 TikTok 的辩护持怀疑态度,即表达自由应优先于华盛顿的国家安全担忧。原因在于 TikTok 的母公司字节跳动总部位于中国,而中国是美国的对手。 与此同时,法官们也指出,数百万美国 TikTok 用户和 TikTok 在美国的运营确实享有《第一修正案》保护,政府关闭该应用可能会侵犯这些权利。 法律专家认为,若没有具体证据,禁止 TikTok 违反了《第一修正案》。在四月,美国总统拜登签署了一项法律,给 TikTok 母公司字节跳动 90 天时间寻找非中国买家,否则该应用将在全国范围内被禁止。 争议焦点:言论自由与国家安全之战 除非被推翻,该法律将在 1 月 19 日生效。如果案件拖延下去,预计可能会延长。 华盛顿的这场法律战展示了迄今为止数字言论自由与国家安全保护之间最为高调的冲突。 拜登政府正在为国会通过的禁令辩护,而前总统特朗普则在竞选活动中表示他现在支持 TikTok 在美国的存在,这与他在白宫时试图关闭该应用的立场相反。 司法部已要求三名法官小组在 12 月前作出裁决。无论裁决结果如何,都可以向联邦上诉法院的全体法官提出上诉。之后,任何一方都可以请求美国最高法院审查该决定。 TikTok 声称自己被不公正地针对 TikTok 的律师认为,该应用被不公正地单独挑出来。律师安德鲁·平克斯(Andrew Pincus)指出,若政府想要禁用 TikTok,必须提供“严格审查”的理由,即必须有强有力的理由,并且证明在禁用之前已用尽所有处理 TikTok 问题的其他方法。他说,政府在这两方面都未能达标。 法官斯里·斯里尼瓦桑(Sri Srinivasan)提问:如果美国与某个国家交战,而该国控制着美国的一家媒体公司,根据 TikTok 的逻辑,美国是否必须先满足这些严格的法律要求,才能禁止该媒体公司? TikTok 的律师平克斯将 TikTok 比作《政治》杂志和《商业内幕》,这两个媒体由一家德国公司拥有,但其美国作者仍然享有在美国的权利。 外资拥有权成为关键因素 斯里尼瓦桑指出,不同之处在于,政治和商业内幕并非由美国的外国对手控制,而 TikTok 则是由总部位于中国的字节跳动拥有。…
亚马逊正在要求公司员工每周五天到办公室工作
亚马逊正在要求公司员工每周五天到办公室工作,首席执行官安迪·贾西在周一的一份备忘录中写道。 这一决定标志着亚马逊早期返工政策的重大转变,此前公司要求员工每周至少三天在办公室工作。现在,公司给员工时间到明年1月2日开始遵守新政策。 根据贾西的说法,除特殊情况外,公司员工每周都需要在办公室工作,或者需要获得其所在部门S团队领导的特别许可。S团队是指那些直接向亚马逊首席执行官汇报的核心高管团队。 “在疫情之前,人们每周可以远程工作两天并不是理所当然的,未来也将如此——我们的期望是,除特殊情况外,人们应当在办公室工作,”贾西表示。 贾西还指出,亚马逊计划通过减少管理层级简化其公司结构,以“削减层级,扁平化组织结构”。他说,到2025年第一季度末,每个S团队的组织结构应当将员工与管理者的比例提高至少15%。所谓的普通员工指的是那些通常不负责管理其他人员的员工。 亚马逊表示,每个团队将审查其组织结构,并可能会发现某些职位已不再需要。公司补充称,任何变化或调整都将在团队层面宣布。 在贾西接任CEO之前,亚马逊在疫情期间迅速增加了员工数量,而后他实施了广泛的成本削减措施,包括公司27年历史上最大规模的裁员。在第二季度,亚马逊的员工总数达到153万人,比一年前增长了仅5%。相比之下,2022年第二季度,亚马逊的员工人数增长了14%,达到152万人。 贾西在一封长信中写道,亚马逊正在进行这些变革,以加强其公司文化,并确保公司保持敏捷。他特别强调,公司创建了一个“官僚主义邮箱”或专门的电子邮件别名,用以清除公司内部任何不必要的流程或过多的规章制度。 “我们希望像世界上最大的初创公司一样运作,”贾西写道。“这意味着我们要怀有不断为客户发明新产品的激情,保持强烈的紧迫感(对于大多数重要机会来说,这是一场竞赛!),承担高度的责任,快速决策,精打细算并注重节俭,深度协作(当你与队友一起发明和解决难题时,你需要密切合作),以及对彼此的共同承诺。” 亚马逊的股价在下午交易时略有下跌。 以下是亚马逊首席执行官安迪·贾西的备忘录全文: 大家好,我想写封简短的信,告诉大家我们正在进行的一些改变,这些改变将进一步加强我们的文化和团队。 首先,从大局来看,我对我们共同取得的进展感到满意。我们的商店业务、AWS和广告业务继续在庞大的基础上增长,Prime Video也在不断扩展,而像生成式AI、Kuiper、医疗保健等新投资领域也在良好发展。与此同时,我们在增长和创新的同时,也在继续改善我们的成本结构和运营利润率,这并不容易做到。总的来说,我对我们的发展方向感到满意,并感谢全球团队的辛勤工作和创造力。 回想我在亚马逊的时间,我从未想过自己会在公司待上27年。我和我妻子曾在1997年写在餐巾纸上的计划是只待几年,然后搬回纽约市。部分让我留下的原因是公司前所未有的增长(我加入公司前一年的年收入是1500万美元——今年预计将超过6000亿美元),持续不断的发明热情,每天都在致力于让客户的生活更轻松、更好,以及这些优先事项带来的机会。但我之所以还在这里的最大原因是我们的文化。专注于客户是文化中令人鼓舞的一部分,但还有与我们一起工作的人、当我们表现最好时的协作和发明方式、我们长期的视角、我在所工作的每个层级上一直感受到的责任感(我从五级员工做起)、我们做出决定和行动的速度,以及缺乏官僚主义和政治斗争。 我们的文化是独特的,且在我们前29年的成功中扮演了至关重要的角色。但是,保持你的文化强大并不是与生俱来的权利。你必须一直为此努力。考虑到我们业务的广泛性、相关的增长率、每个业务领域所需的创新,以及我们过去6到8年间为推动这些目标所聘用的人数,保持文化强大是很不寻常的,甚至会对最强的文化构成挑战。加强我们的文化仍然是我和S团队的首要任务。我时刻在思考这一点。 我们希望像世界上最大的初创公司一样运作。这意味着我们要对客户怀有不断发明的激情,保持强烈的紧迫感(对于大多数重要的机会来说,这是一场竞赛!),承担高度责任,快速决策,精打细算并注重节俭,深度协作(当你与队友一起发明和解决难题时,你需要密切合作),以及对彼此的共同承诺。 S团队和我过去几个月一直在思考两个问题:1/ 我们的组织结构是否适合推动我们所期望的责任感和速度?2/ 我们的设置是否足够有助于发明、协作和彼此的联系(以及我们的文化),从而为客户和公司提供我们能够提供的最好的服务?我们认为我们在这两方面可以做得更好。 关于第一个话题,我们始终致力于招聘非常聪明、有高判断力、富有创造力、专注交付且有使命感的团队成员。而且,我们一直希望那些从事具体工作的人拥有高度责任感。随着我们在过去几年里快速且大幅度扩展团队,我们也不可避免地增加了很多管理人员。在此过程中,我们也增加了比以往更多的层级。
Microsoft 365 Copilot: Wave 2
自从发布以来,微软的Copilot已经证明自己是ChatGPT的有力竞争者,甚至偶尔还超越了OpenAI的产品。然而,随着ChatGPT的不断升级,Copilot逐渐落后——直到现在。 在周一举行的“Microsoft 365 Copilot: Wave 2”线上发布会上,微软展示了即将为企业和个人用户推出的多项Copilot人工智能助手升级。 这次升级相当令人印象深刻,包括与Microsoft 365应用的进一步集成,以及为团队、群组或家庭提供的协作AI使用方式。此次发布的一个亮点功能是“Copilot Pages”。 Copilot Pages 当用户使用企业账户登录Copilot时,会发现一个新选项,可以在“工作”与“Web”标签之间切换。其中的“工作”标签,微软称之为BizChat,这是一种可以从Microsoft 365应用中的工作数据中提取答案的工作流程。现在,BizChat增加了一个全新的“Pages”功能。 通过Pages,用户可以将Copilot从企业数据中提取的洞见进行编辑,添加到Page页面中,并与团队分享进行协作。Page类似于普通的可编辑文档,支持分享和共同编辑链接。这个功能突显了多用户协作AI的趋势,类似于You.com的协作AI助手以及Salesforce的Agentforce套件。 从今天起,Pages将逐步向Microsoft 365 Copilot用户开放,并将在未来几周内向使用Microsoft Entra账号登录的免费用户提供。 Microsoft 365应用中的Copilot 微软Copilot的一大优势就是能够直接帮助用户使用Microsoft 365应用,这些应用已经成为许多人工作流程中的核心部分。随着Wave 2的推出,微软根据用户反馈,进一步提升了Copilot在这些应用中的功能,并改进了用户体验。 首先,Excel中的Copilot已经全面开放,支持公式、数据可视化和条件格式等功能。此外,微软宣布Excel中的Python功能进入公开预览阶段,用户现在可以通过自然语言在Excel中进行Python操作,无需编写代码即可完成高级分析,比如预测和风险评估。 与此同时,PowerPoint中的Narrative Builder也已经全面推出,该功能可以快速生成演示文稿的初稿。只需输入主题,Builder就会自动生成大纲。 Teams中的Copilot 在Teams中,Copilot现在能够总结会议内容和聊天记录。用户可以通过询问Copilot了解错过的会议内容,它会同时提供会议中的重要内容和聊天中的信息。此功能将于下月全面开放。 Outlook中的Copilot也有新功能——“优先处理我的收件箱”,该功能会分析收件箱,标记出最重要的邮件并提供摘要,并解释为何这些邮件被优先处理。未来,用户甚至可以教Copilot根据特定话题或关键词优先处理邮件。 此外,Copilot在Word中的功能也有显著提升,现在用户可以直接在文档中与Copilot实时协作,编辑各个部分。同时,OneDrive中的Copilot能够帮助用户快速找到文件,提供摘要甚至进行文件对比。 Copilot Agents 微软还推出了Copilot Agents,即可以根据用户需求执行特定任务的AI助手。这些助手可以根据需求完全自主工作,或者作为简单的“提示-回应”助手。用户可以使用Copilot Studio中的Agent Builder来创建这些AI助手,应用于BizChat或SharePoint中。 这些Copilot Agents和Agent Builder现已对用户全面开放,SharePoint中的Agent功能则将在10月初进入公开预览阶段。 Copilot使用最新的LLM模型 最后,微软确认Copilot现在已经集成了最新的GPT-4o模型,这使得Copilot的响应速度比之前快了两倍。微软还表示,将继续为Copilot引入最新的AI模型,包括最近发布的OpenAI o1,它是目前OpenAI最先进的推理模型。 这些升级表明,微软正在全力推动Copilot的进化,以在与ChatGPT的竞争中保持优势。
AWS 收购芯片设计公司Annapurna Labs后
近年来,诸如AMD和Nvidia等知名处理器制造商,尤其是那些面向云端AI的公司,纷纷表现出希望控制更多计算业务的迹象,通过收购软件、互联技术和服务器制造商来掌握“全栈”控制权,从而在满足客户需求的设计上获得优势。 亚马逊网络服务(AWS)早在2015年就通过收购芯片设计公司Annapurna Labs,率先进行垂直整合。AWS技术负责人Ali Saidi和Annapurna Labs工程总监Rami Sinno在IEEE Spectrum的采访中,分享了垂直整合设计的优势,并展示了位于德州奥斯汀的硬件测试实验室。 垂直整合的工程师需求Rami Sinno表示,在垂直整合公司工作的芯片设计工程师需要具备不同的技能。例如,传统信号完整性工程师通常专注于信号分析和实验室测量,而AWS希望这些工程师还能编写代码,分析系统级工作负载下的信号影响。这种灵活的思维方式有助于团队在全栈开发中取得更大成果。 Graviton系列处理器的演变Ali Saidi解释了Graviton系列的演变过程。Graviton 1主要是AWS验证Arm架构能否在其云服务中提供相同体验的试验品,而Graviton 2则成为首款面向通用工作负载的市场领先产品。随着客户的需求多样化,AWS不断改进处理器性能,例如增加处理复杂数学运算和媒体编码的能力。 AWS的芯片设计有何不同AWS在芯片设计上的一大优势在于硬件和软件团队的紧密协作,从开发初期就开始共同工作,使得在芯片投产时,软件几乎已经完成。这种快速迭代的方式使得AWS能够在设计过程中显著提高效率,缩短开发周期。 云端设计加速AWS不仅是云服务提供商,还在云上设计芯片。通过动态调整电子设计自动化(EDA)所需的服务器资源,AWS能够在项目后期大规模加速迭代,从而缩短设计周期。这使得AWS能够更快地推出产品,满足数据中心级别的部署需求。 亚马逊电商的贡献作为AWS的主要客户之一,Amazon.com在2023年的Prime Day中使用了超过25万个Graviton处理器,支持其网站和相关服务,显示出AWS处理器在大规模商业应用中的显著成效。 实验室的独特优势Sinno提到,Annapurna Labs的实验室紧邻硬件和软件开发团队,这种共址模式极大地加快了AI芯片和服务器的测试与交付速度,确保在设计和测试中可以快速修复问题,满足云规模部署的需求。AWS的垂直整合还允许工程师在问题出现时迅速修复,从而提升系统的稳定性和效率。 总体而言,AWS通过垂直整合在硬件和软件设计、开发、测试等多个环节上取得了显著优势,确保其产品能够快速响应市场需求,并在云计算和AI领域占据领先地位。
谷歌在在线展示广告技术上的垄断,Meta无法有效竞争
据报道,Meta Platforms Inc.(前身为Facebook)于2018年与谷歌达成了一项协议,此前公司内部已得出结论,认为由于谷歌在在线展示广告技术上的垄断,Meta无法有效竞争。前Facebook广告技术负责人布莱恩·博兰德(Brian Boland)在美国司法部的反垄断审判中作证,称Facebook最初计划在网站展示广告市场与谷歌直接竞争,然而,到了2017年,Facebook认识到与谷歌的竞争将会面临巨大挑战,原因在于谷歌的广告工具给予自己明显优势。 Facebook曾通过“Facebook Audience Network”努力允许广告商在Facebook和Instagram等社交平台上投放广告,并通过该网络在网站和应用中购买广告。然而,博兰德表示,谷歌的广告工具通过在线广告拍卖中的“最后一看”机制让其能在其他竞标者出价后再决定是否购买广告。这种做法被博兰德形容为谷歌能优先挑选最好的“苹果”,而其他人只能接受剩下的“残次品”。 经过六个月的谈判,Facebook与谷歌于2018年签署了内部称为“Jedi Blue”的协议。该协议使Facebook在通过谷歌的广告交换平台竞标时获得了优待。该协议得到了两家公司最高层的批准,包括Facebook首席执行官马克·扎克伯格和谷歌首席执行官桑达尔·皮查伊亲自签字。 虽然在法庭上并未披露这份协议的具体内容,但相关文件显示,谷歌提出取消“最后一看”优势,前提是Facebook需支付15%的广告媒体费用。多州总检察长曾在2020年起诉谷歌垄断广告技术市场,指控该协议违反反垄断法,认为谷歌向Facebook提供这一协议是为了阻止其采用一种名为“header bidding”的新技术,该技术可能削弱谷歌的垄断地位。 尽管如此,纽约一位法官驳回了这些指控,认为公司达成协议并无不合理或可疑之处。而欧洲反垄断执法机构在调查后,于2022年3月关闭了相关调查,未采取任何行动。 司法部去年起诉谷歌垄断广告技术市场时,并未指控该协议具有反竞争性,而是强调即便像Meta这样的科技巨头也无法与谷歌竞争。
OpenAI计划在明年调整其复杂的非营利企业结构
据《财富》杂志报道,OpenAI首席执行官Sam Altman在公司的每周会议上透露,OpenAI计划在明年调整其复杂的非营利企业结构。Altman表示,OpenAI将逐步摆脱由非营利实体控制的模式,转型为更传统的盈利性组织。不过,Altman并未详细说明如何实现这一目标,也没有明确说明公司未来的具体企业结构。发言人则向《财富》表示,OpenAI仍然专注于“构建对所有人有益的人工智能”,并强调非营利性质依然是其使命的核心,未来将继续保留这一部分。 OpenAI于2015年成立时是一个完全依赖捐赠资金的非营利组织。公司在介绍其结构的页面上提到,多年来总共仅筹集了1.305亿美元的捐款,而这显然不足以支撑其在计算能力和顶尖人才上的高昂成本。因此,OpenAI在非营利组织的基础上设立了一个盈利性子公司来解决资金短缺问题。据《财富》解释,目前OpenAI的非营利实体控制着其盈利部门,而该盈利部门则通过一个控股公司接收包括微软在内的企业投资。 在这种结构下,OpenAI的利润分配设有上限,即分配给投资者的利润(包括微软在内)有限制,超出这一上限的利润将归入其非营利部门。根据《信息》杂志6月份的报道,OpenAI的收入呈现爆发式增长,特别是由于订阅版ChatGPT的推出,其年化收入在今年上半年翻倍。 这种复杂的企业结构也导致了2023年Altman被OpenAI非营利董事会罢免,理由是董事会“对其继续领导OpenAI的能力失去信心”。不过,仅五天后,该董事会被解散并重组,Altman也重新担任了CEO职务。