aitrendtrackers@rengongzhineng.io, Author at AI TrendTrackers

草莓两周落地？

Posted on September 11, 2024September 11, 2024 by aitrendtrackers@rengongzhineng.io

有报道称，关于OpenAI的神秘项目“Strawberry”（据说是一款能够提供更精准、多步骤、基于推理的复杂问题解答的AI模型），越来越多的猜测表明它可能在今年秋季发布。而来自OpenAI内部的爆料则透露，Strawberry可能会在两周内上线。 🔑 关键信息：与ChatGPT不同，Strawberry回答问题需要10到20秒的时间，因为它采用的是更为严谨的思考方式，这使得它在数学、编程以及提供详细策略等主观任务上表现出色。内部消息还指出，Strawberry将以纯文本模式推出（无法处理图像），并且将直接整合进ChatGPT平台，用户可以在界面中单独选择这个模型。尽管该模型能够记住过去的对话并提供高度个性化的回应，爆料人也表示其响应速度相较输出质量并不完全成正比，依然存在一些不一致的情况。 🤔 为什么值得关注：有传言称，如果用户支付更多费用，响应速度可能会更快。此外，付费用户或将率先体验到Strawberry，而这款模型的发布预计将填补ChatGPT 5正式上线前的空白。

AI安全中心（CAIS）FiveThirtyNine的AI系统，据说在预测能力上超越了人类专家

Posted on September 11, 2024September 11, 2024 by aitrendtrackers@rengongzhineng.io

AI安全中心（CAIS）最近开发了一款名为FiveThirtyNine的AI系统，据说在预测能力上超越了人类专家，甚至比多个专家团队的预测更为精准。研究表明，它在预测方面的表现已经超过了多个顶尖的预测群体。这款AI基于GPT-4o架构，用户可以输入查询，如“特朗普会赢得2024年总统大选吗？”或者“中国会在2030年前入侵台湾吗？”，然后AI会给出相应的概率预测。开发者通过网络爬虫和复杂的提示设计，让AI对找到的资源进行分析，并评估“是”或“否”的可能性。在一项评估中，FiveThirtyNine与Metaculus预测平台的用户群进行了对比测试，AI仅能使用与人类预测者相同的公开信息。测试结果显示，在177个事件的数据集上，Metaculus预测群体的准确率为87.0%，而FiveThirtyNine的准确率达到了87.7% ± 1.4。这让AI安全中心的负责人Dan Hendrycks表示，AI很快将自动化大部分预测市场的运作。 FiveThirtyNine展示了广泛的潜在应用，包括为决策者提供支持、改善信息环境、或用于风险评估等领域。尽管如此，系统仍存在一些不足之处，例如它并未针对某些具体应用进行优化，也无法在面对无效查询时拒绝做出预测。此外，由于模型依赖于训练时获取的信息，如果某个事件没有被报道，AI将无法做出预测。虽然在短期和实时事件的预测上表现一般，但开发者对这类AI在未来的应用前景依然抱有很高的期待。试试？ https://forecast.safe.ai/

Agent Q: 实现自主网页代理的提升

Posted on September 10, 2024September 10, 2024 by aitrendtrackers@rengongzhineng.io

近年来，大型语言模型（LLMs）的能力在自然语言处理和理解领域取得了显著进展，达到了多个里程碑。然而，尽管这些模型表现优异，它们在交互式环境中，尤其是在需要多步推理的任务（如网页导航）中仍面临重大挑战。现有的训练方法依赖于静态语言数据集，无法有效应对动态的真实世界互动任务。于是，Agent Q应运而生。Agent Q代表了自主代理领域的一个重大突破，结合了搜索、自我批判和强化学习，创造出能够进行规划和自我修复的先进网页自主代理。我们突破性的研究方法通过引入一种全新的学习和推理框架，成功解决了以往LLM训练技术的局限性，特别是在自主网页导航任务中。当前方法的局限性当前的训练方法（如基于专家演示的监督微调）在处理多步任务时表现欠佳，尤其在复杂决策和适应性学习方面表现不佳。这些方法由于错误的不断累积以及探索数据的局限性，通常会产生次优策略，尤其是在需要灵活应对的动态环境中。 Agent Q的创新研究 Agent Q的创新之处在于将引导的蒙特卡洛树搜索（MCTS）与AI自我批判和迭代微调相结合，利用强化学习与人类反馈（RLFH）方法，例如直接偏好优化（DPO）算法。此方法允许LLM代理通过成功和失败的经验轨迹学习，提高其在多步推理任务中的泛化能力。 Agent Q的关键组成部分：实际验证在Open Table上的真实预订实验中，MultiOn的Agent Q使得LLaMa-3模型的零样本表现从18.6%的成功率提升至81.7%，经过一天的自主数据收集后提升了340%。在线搜索后，成功率进一步提高至95.4%。这些结果突显了该方法在提高自主网页代理效率和改进能力方面的卓越表现。结论 MultiOn的Agent Q为自主网页代理设立了新的里程碑，通过结合先进的搜索技术、AI自我批判和强化学习，克服了当前技术的限制，代表了自主代理能力的重大飞跃。随着我们继续改进这些方法并解决相关挑战，距离全面发布这一产品的日子越来越近。智能自主网页代理的未来充满了希望。这项突破性的研究将在今年晚些时候向MultiOn的开发者和消费者用户开放。 https://www.multion.ai/blog/introducing-agent-q-research-breakthrough-for-the-next-generation-of-ai-agents-with-planning-and-self-healing-capabilities

Mistral.rs开源大语言模型（LLM）推理平台兼容OpenAI API，通过HTTP服务器和Python绑定

Posted on September 10, 2024September 10, 2024 by aitrendtrackers@rengongzhineng.io

在大语言模型（LLM）的实际应用中，推理速度缓慢是一个重要的瓶颈，严重限制了其广泛部署。尽管LLM功能强大，但它们需要大量的计算资源来生成输出，导致延迟，不仅影响用户体验，还增加了运营成本，尤其是在需要实时反应的场景中。这些问题随着模型规模和复杂性的增加变得愈发明显，因此，如何提高推理速度、优化模型效率成为了当务之急。目前提高LLM推理速度的方法主要包括硬件加速、模型优化和量化技术，这些方法的核心目标是减少模型推理时的计算负担。然而，每种方法都涉及一定的权衡。例如，量化可以减少模型的尺寸和推理时间，但同时也可能导致模型预测准确度的下降。同样，硬件加速（如使用GPU或专用芯片）可以显著提高性能，但要求使用昂贵的硬件，这对普通用户的可及性有限。针对这些限制，Mistral.rs提供了一种快速、灵活且易于使用的LLM推理平台(https://github.com/EricLBuehler/mistral.rs)。与现有解决方案不同，Mistral.rs支持多种设备，且结合了先进的量化技术，在推理速度与准确性之间找到了有效平衡。平台通过简化的API和全面的模型支持，降低了部署的复杂性，使得更广泛的用户群体可以使用该技术满足各种实际应用需求。 Mistral.rs采用了一系列关键技术和优化手段来提升性能。平台核心依赖量化技术，如GGML和GPTQ，这些技术能够将模型压缩为更小、更高效的形式，同时保持相对高的准确性。这种压缩显著降低了内存占用，并加速了推理过程，尤其适用于计算资源有限的设备。此外，Mistral.rs支持多种硬件平台，包括Apple Silicon、CPU和GPU，并使用诸如Metal和CUDA等优化库来充分发挥硬件的性能潜力。平台还引入了诸如连续批处理（Continuous Batching）等功能，能够高效地同时处理多个请求。PagedAttention则通过优化内存使用，提升了推理过程中对大模型和大数据集的处理能力，减少了内存不足（OOM）错误的发生。 Mistral.rs在多种硬件配置上的性能表现也证明了其卓越的效率。例如，在A10 GPU上运行Mistral-7b模型时，配合4_K_M量化方案可实现每秒86个token的生成速度，显著超过了传统推理方法的速度。平台的灵活性体现在它能够支持从高端GPU到低功耗设备（如树莓派）等各种硬件。总而言之，Mistral.rs通过提供一个高效、灵活的LLM推理平台，成功解决了推理速度慢的问题，并在速度、准确性和易用性之间达到了良好的平衡。其对多种设备的支持以及先进的优化技术，使其成为开发者在实际应用中部署LLM的宝贵工具，特别是在对性能和效率有着严格要求的场景中。

iPhone 16 发布 “从零开始为人工智能设计”的iPhone

Posted on September 10, 2024September 10, 2024 by aitrendtrackers@rengongzhineng.io

苹果公司周一正式发布了iPhone 16，试图通过全新的生成式人工智能功能为其旗舰产品注入新活力，吸引用户更换旧设备。首席执行官蒂姆·库克表示，这是首款“从零开始为人工智能设计”的iPhone，拥有突破性的功能。发布会在库比蒂诺的苹果园区Steve Jobs剧院举行，吸引了大量观众。 iPhone 16将于9月20日上市，预购将从本周五开始。这次发布的重点是苹果公司在人工智能领域的拓展，以及通过iOS 18系统中的AI功能，挽回逐渐下滑的iPhone销售。不过，分析师们普遍认为此次发布会缺乏重大惊喜，苹果股价当天也基本持平。华尔街分析师预计，得益于“Apple Intelligence”新功能，iPhone销售明年将有所提升。这些功能包括更强大的Siri语音助手、照片编辑、写作辅助，以及通过与OpenAI的合作，免费使用ChatGPT。发布会还透露了这些功能的上线时间，预计将在iPhone 16发售后几周内陆续推出。苹果宣布，其部分“Apple Intelligence”功能将于下个月在美国上线，英国、澳大利亚、加拿大等地区将在12月获得本地化英语版本，中文、日语、法语和西班牙语将在明年推出。这些功能包括升级版的Siri、写作辅助以及邮件和通知摘要。这些代表了苹果希望通过AI变革消费设备的第一波应用，且将同样适用于iPad和MacBook。预计到今年年底，iPhone用户将能通过设备访问OpenAI的ChatGPT，这比最早的一批生产力提升应用的推出稍晚些。苹果与微软支持的OpenAI的合作关系也引发了关注，预计未来苹果和Nvidia可能会直接投资OpenAI，将其估值推高至超过1000亿美元。 PP Foresight的Paolo Pescatore指出，“AI领域的军备竞赛已经打响”，他认为这与此前的像素大战类似，如今则是各大公司争夺最强AI平台。谷歌、微软和Meta等公司都在进行巨额投资，但投资回报率仍不明朗。 iPhone 16将推出四款型号：Pro、Pro Max、Plus和标准版。Pro和Pro Max屏幕更大，摄像头更先进。标准版起售价为799美元，Pro版为999美元，而Pro Max则高达1199美元。 iPhone 16搭载全新A18芯片，能够支持本地运行AI模型，提升设备性能。《金融时报》早前报道，这款芯片基于Arm下一代V9架构设计，性能提升显著。苹果芯片工程副总裁Sribalan Santhanam表示，A18芯片让苹果“领先两代”，性能比iPhone 15处理器快30%，甚至可媲美高端桌面电脑。增强版A18芯片将用于iPhone 16的Pro型号，被称为“史上最快的智能手机处理器”。苹果还宣布Apple Watch Series 10也将在9月20日发售。该系列拥有更大的显示屏、更薄的设计、更快的充电速度，以及全新的S10芯片，支持机器学习，并配备了睡眠呼吸暂停检测功能，正在等待美国食品药品监督管理局的批准，售价从399美元起。此外，最新的AirPods Pro 2耳机将新增助听器功能，具备“临床级”听力测试和听力保护功能，也在等待FDA的批准。 CCS Insight的Leo Gebbie指出，iPhone 16系列对苹果至关重要，尤其是在消费者对新款智能手机需求放缓的背景下。他认为，“Apple Intelligence将在未来十年成为iPhone的核心”。尽管发布会后Piper Sandler分析师Matt Farrell对苹果股票维持中立评级，他认为此次活动“基本如预期”。而IDC的Nabila Popal则表示，“尽管短期内影响不明显，但Apple Intelligence最终会彻底改变智能手机用户体验，就像第一代iPhone那样”。

Reflection 70B——HyperWrite推出的最新大型语言模型，它不仅能思考，还能思考自己的思考

Posted on September 9, 2024September 9, 2024 by aitrendtrackers@rengongzhineng.io

在AI技术飞速发展的过程中，我们已经见证了可以写作、编程，甚至创造艺术的模型问世。但有一种AI不仅仅在突破边界，而是在重新定义它们。它就是Reflection 70B——HyperWrite推出的最新大型语言模型，它不仅能思考，还能思考自己的思考。 https://huggingface.co/mattshumer/Reflection-Llama-3.1-70B AI幻觉问题：不仅仅是“头脑发热” 我们不得不承认，AI的“幻觉”现象就像你叔叔在感恩节晚餐上说出的阴谋论。听起来很可信，但稍微多想两秒你就会发现问题。然而，与叔叔不同的是，AI不会因为出错而尴尬，它会继续自信满满地输出错误信息。这种问题不仅仅让人烦躁，甚至可能会带来危险。在一个越来越依赖AI进行内容创作甚至医学诊断的世界里，我们不能让我们的数字助手随意“编造”事实。 Reflection 70B：会自我检查的AI HyperWrite的Reflection 70B正是为了解决这个问题而诞生的。它的独特之处在于，能够像人类一样，思考自己的思考过程。就像给AI配备了“良心”，但又没有“存在主义的焦虑”。反思调优的魔力 Reflection 70B的核心是一个名为“反思调优”（Reflection-Tuning）的技术。这不仅仅是一个炫酷的名字，而是AI处理信息方式的根本性转变。其工作原理如下：这一切都在模型给出最终答案之前实时完成。它不仅知道答案，还能理解为什么知道，并能在犯错前及时纠正自己。为什么Reflection 70B重要（以及你为什么应该关心）你可能会想：“好吧，又是一个AI模型，有什么特别之处？”这是个好问题，来分解一下：现实应用（或者说：Reflection 70B如何真正改善你的生活）那么，Reflection 70B会在哪里发挥作用呢？以下是一些它的准确性和自我修正能力可能带来革命性变化的领域：前路如何：Reflection 70B的未来发展 HyperWrite并没有止步于此。他们正在开发Reflection 405B，一个规模更大的模型，承诺将进一步推动AI的准确性和可靠性。就像他们不仅仅是在制造更好的捕鼠器，而是在试图消灭老鼠的概念。结论：会反思的AI Reflection 70B代表了AI技术的重大飞跃。通过引入自我反思和自我纠正的能力，HyperWrite创造了一个不仅更准确、更可信的模型。在一个日益依赖AI的世界里，这种可靠性不仅是锦上添花，而是必不可少的。随着我们继续将AI融入生活的方方面面，像Reflection 70B这样的模型让我们看到一个未来——我们的数字助手不仅聪明，还充满智慧。一个AI不仅仅是“说出”信息，而是能够理解信息的未来。而这，亲爱的读者，正是值得让人期待的未来。常见问题解答问：Reflection 70B与其他语言模型有何不同？答：其独特的反思调优技术使其能够实时自我修正，大大减少了错误和幻觉的发生。问：我可以将Reflection 70B用于自己的项目吗？答：可以，Reflection 70B是开源的，您可以在Hugging Face上下载它，也可以通过HyperWrite与Hyperbolic Labs的合作提供的API进行访问。问：Reflection 70B有哪些实际应用？答：它在需要高精度的任务中表现出色，比如科学研究、法律分析和编码辅助。问：Reflection 70B比GPT-4或Claude 3.5更好吗？答：根据基准测试，Reflection 70B在某些高精度任务中表现优于这些模型，特别是在数学推理和科学写作方面。问：HyperWrite和Reflection 70B的未来发展方向是什么？答：HyperWrite正在开发Reflection 405B，一个更大的模型，预计会超越当前的能力。

后谷歌时代

Posted on September 9, 2024September 9, 2024 by aitrendtrackers@rengongzhineng.io

另一场谷歌反垄断审判将于周一开始。如果谷歌败诉，这将是其第三次失败。到了某个时刻，他们可能会认输，并意识到当前商业模式已走到尽头。2024年9月7日Matt Stoller “反垄断法的核心在于保持系统运作，意识到在某些时候，一些公司可能变得过于庞大，对自身不利，甚至自我崩溃，或者技术变得如此主导，以至于压垮了所有可能的创新领域。”——Leonie Brinkema法官，2023年，美国诉谷歌案。 20世纪30年代末，反垄断部门负责人瑟曼·阿诺德似乎已经驯服了商业世界，他提起了如此多的反垄断诉讼，且效果显著，几乎没有任何阻力。在他的第一年，阿诺德在40个不同行业中提起了1,375起投诉，涉及213个案件，从汽车到住房，从牛奶到电影。当执法者仅仅启动调查时，价格就会下降18%到33%，因为商人们希望抢先避免可能的违规行为。尽管接下来还有很多残酷的战斗，但在某种程度上，商业世界的旧秩序在道德上已经被打败，经过多年的法律斗争后，精疲力竭。 1936年《纽约时报》的头条新闻。新的秩序极其有利可图，远胜于30年代。一些美国历史上最具盈利能力的企业利润率出现在50年代，但企业领导者知道，他们对社会负有更广泛的责任。而这并不是今天我们听到的那些无意义的企业社会责任的说辞，而是一种意识到贪婪行为会带来迅速法律后果的现实。这种方式有效。1954年，经济学家卡尔·凯森写道：“金融信托已消失，华尔街只是学生和拥有长期记忆的人的象征。”约翰·梅纳德·凯恩斯曾写信给富兰克林·德拉诺·罗斯福，讨论商业领袖的问题。他写道：“如果你愿意把他们（即使是那些大公司）看作家养动物，而不是狼或老虎，即使他们被养得不好，没接受你希望的训练，你可以随心所欲地对待他们。”罗斯福驯服了大企业。今天的反垄断人士还远未达到这一成就，因为我们缺乏政治共识。但在某些领域，我们可以开始看到以公众利益为中心的世界的轮廓，这也引出了谷歌的话题，谷歌的使命是“组织全球信息，使其普遍可访问并有用”，这个口号多年前听起来似乎是个好主意。下周一，谷歌的第三次主要反垄断审判将开始，这次审判涉及在线展示广告的底层软件系统。由于大家订阅了BIG，我有资金雇佣一名记者来报道这次审判，就像我们之前报道搜索审判一样。我们的新记者是一名名叫Tom Blakely的律师，他将在我们专门的网站BigTechOnTrial.com上撰写更新。你可以在那注册以获取更新，如果你想支持这项工作，可以考虑成为付费订阅者。但这次审判的背景与第一次搜索审判非常不同。原因很简单：谷歌已经两次被判为非法垄断。第一次涉及谷歌在与Epic Games的斗争中对安卓应用商店的控制，第二次是其搜索垄断与政府的争斗。此外，在这两次审判中，法官都发现谷歌在处理文件时存在不诚信行为。这两起案件都尚未结束。在Epic Games案中，Donato法官可能很快会提出一个补救方案，基本上会迫使谷歌允许其他应用商店存在。在搜索案中，Mehta法官今天制定了一个时间表，预计到8月份完成补救阶段，年底前可以确定补救措施。（看起来AI是双方关注的重点。）届时还会有上诉。这第三次审判涉及的是一个完全不同的业务线，即第三方发布商和广告商用来买卖广告的软件，以及居中的交易所，这个市场每年国内总规模达200亿美元。发布商每年在开放网络上出售超过5万亿个数字展示广告，相当于每天13亿个。谷歌将其看作广告的“操作系统”。谷歌刚起步时，它是一款高质量的搜索引擎，其创始人认为广告对任何此类产品都构成固有的利益冲突。他们写道：“由广告资助的搜索引擎将不可避免地偏向广告商，而忽视消费者的需求。” 然而，在2000年，这家由风险投资资助的公司在未能建立起技术许可业务后，启动了广告部门，迅速吸引了大量广告客户，他们喜欢能够在相关搜索结果旁边放置文字广告的功能。到2000年代初，谷歌开始了第三方广告业务，与发布商达成交易，让他们在自己的网页上放置谷歌广告，并从广告收入中分得一杯羹。通过这种方式，发布商开始接触到谷歌控制的广告需求。但这一新业务引发了另一场利益冲突，因为谷歌正逐步控制广告买家和卖家，以及所有广告和出版商追踪的用户数据。 2007年，谷歌收购了YouTube，一个广告库存的来源，赋予其更多广告销售的力量。2008年，谷歌收购了一家名为DoubleClick的广告技术公司，该公司是帮助发布商管理其广告库存的软件领域的领导者，同时还拥有大量数据仓库。谷歌逐渐成为广告市场中的买卖双方之间的中介，这显然是一种冲突。在收购DoubleClick之前，谷歌曾试图进入这一领域，但失败了，因为从一个软件平台迁移到另一个平台并不容易。DoubleClick的前CEO曾说过：“没有什么比这更高的转换成本了……需要上帝的干预才能做到。”同年，谷歌还收购了一个广告交易所（AdX），广告买家可以在这个类似金融市场的交易所与广告库存卖家进行匹配。收购DoubleClick后，谷歌将其对广告需求的控制与发布商使用其软件挂钩。正如美国司法部在诉状中所述：“如果发布商想要访问谷歌广告的专属需求，他们就必须使用谷歌的发布商广告服务器（DFP）和广告交易所（AdX），而不是谷歌竞争对手提供的同类工具。”结果是谷歌在整个行业中获得了垄断地位，掌握了发布商使用的软件和广告匹配引擎。它还构建了一项无处不在的服务——谷歌分析（Google Analytics），该服务帮助发布商测量网站流量，也因此谷歌掌握了所有的测量数据。其中一个后果是，谷歌收取了高昂的费用，每通过其系统的广告收入中留存30%至50%。这已经够糟糕的了，但更糟的是，谷歌还获得了对每个发布商和广告商的监控能力。就像每晚谷歌都可以潜入《华尔街日报》的办公室，偷走其订阅者名单，然后向其广告客户宣称，他们可以在读者打开谷歌自有的产品（如Gmail、YouTube、搜索等）时，以更低的价格接触到这些《华尔街日报》的读者。通过这种方式，谷歌能够将广告收入从第三方发布商转向自己。为了增强其定向广告的能力，谷歌在2016年违反了其在收购DoubleClick时所作出的承诺。当时，它向执法者承诺会保护用户隐私并对数据进行分割。然而，它最终决定将其所有服务（包括Gmail、YouTube、搜索等）中的所有数据结合起来，生成每个用户的详细档案。如今，谷歌拥有了一台机器，它可以监视整个网络上的用户，然后利用这些数据操纵广告拍卖，当展示广告在第三方网站上展示时，收取高价，而当广告需求广泛时，它会将其转移到自己的平台上，而不是第三方网站。在接下来的十到十五年里，这种模式不断重复。发布商或广告创业者尝试进入广告拍卖市场以获取谷歌的利润并保护他们的数据，而谷歌则通过收购竞争对手或通过产品捆绑锁定竞争对手来回应。有一系列的代号和项目来实施这些策略，比如“伯南克计划”（Project Bernanke）、“纳尼亚计划”（Project Narnia）和“蓝色绝地”（Jedi Blue）。由于发布商和广告技术初创公司需要谷歌控制的大量广告购买力，广告商需要谷歌的搜索和YouTube，这形成了一个鸡蛋问题——没有谷歌的许可，你无法进入任何一个市场。我们曾短暂看到如果谷歌的控制力被打破会发生什么。在更多开放拍卖（称为“header bidding”）的期间，发布商收入增长了30-40%，广告商对广告展示的透明度也有所提高。但谷歌很快就恢复了控制，发布商再次陷入困境。事实上，新闻业和发布商的衰落并不仅仅归因于“互联网”，很可能是谷歌的“谋杀”。在这一生态系统中，唯一可能的挑战者是一个足够大、可以构建自己的生态系统的实体。这个角色就是Facebook，它拥有足够多的广告商，广告需求如此庞大，以至于它不需要依赖谷歌。在“header bidding”的争斗期间，Facebook曾考虑通过Facebook Audience Network（FAN）允许第三方获取Facebook的广告需求，从而打破谷歌在在线展示广告中的垄断。此举会将发布商和广告商从谷歌的广告拍卖系统中拉走。谷歌的回应是与Facebook结成卡特尔，给予Facebook在谷歌拍卖中比其他任何人更好的条款，作为交换，Facebook不再寻求在开放拍卖中竞争。锁定网络两端、进行监控、通过胁迫行为和非法收购阻挠竞争对手、然后操纵价格的行为，跨越多个市场，这就是案件的实质。谷歌有合理的反驳，特别是指出除了通过谷歌的系统外，还有其他方式购买广告，因此它并不是垄断。例如，你可以在亚马逊、Meta、Snap和TikTok上购买广告。但大多数法院观察人士认为，诉状有力，谷歌很可能会输掉第三起案件。 Brinkema法官的立场是什么？到目前为止，Brinkema在拒绝美国司法部要求陪审团审判的请求时，对谷歌的辩护和团队表现出了强烈的怀疑。她拒绝了谷歌的动议，驳回了全部五项垄断指控，称“有足够的具体指控，包括谷歌内部人员的多次引用，提到某些竞争对手构成了生存威胁”，因此案件应当进入审判阶段。此外，她还抨击了谷歌自2008年以来的政策，即自动删除员工在讨论敏感话题时的聊天记录，旨在避免政府调查。我上周去了法庭，现场气氛相当残酷。她说：“谷歌处理证据的方式存在许多问题，可能有‘难以置信的实锤’。”她称谷歌的做法是“明显滥用流程”和“绝对不当”，并表示“很可能已经有大量证据被销毁”。更重要的是，她表示不会信任谷歌的证词。“当你们传唤证人时，”她说，“记住这一点。” 如果谷歌败诉，会发生什么？反垄断案件中的补救措施通常很难，因为被垄断的市场就像凝固的混凝土，很难拆分。你只能“砸开”，这通常是有效的，风险在于执法者和法官不愿拿出“锤子”。然而，在本案中，挽救出版行业的解决方案其实相当简单。实际上，参议员迈克·李和艾米·克洛布彻有一项名为《美国法案》（AMERICA Act）的法案，该法案正是为本案量身定制的，将通过禁止大广告技术公司利益冲突来重组行业。必要的是一系列拆分和内部数据传输规则。第一次拆分应该是将谷歌的广告技术业务拆分成三家独立公司——一个供应侧/分析广告平台、一个广告商的需求侧平台和一个交易所。同样重要的是，确保谷歌不再收集和变现第三方发布商的数据。为促成这一解决方案，应该将谷歌的其他业务拆分，使其无法合并数据，成立新的独立公司YouTube、搜索、安卓和Chrome。否则，禁止内部数据共享的行为补救措施也是合理的，但这需要一个技术委员会和强有力的执法机制。然而，这个案件并不是终点，谷歌的法律困境将如何结束仍不明朗。德克萨斯州正带领多个州起诉谷歌。Yelp也刚刚对谷歌提起诉讼。还有对谷歌地图的反垄断调查。联邦贸易委员会已经对谷歌的监控行为发布了同意令，法官们也开始严肃地削减谷歌依赖的法律保护措施（即第230条款），这使谷歌得以避免对其服务承担责任。而这还只是国内的情况。几年前，谷歌在法国因同样的广告技术指控达成了和解，英国今天也因谷歌作为广告中介的行为向其提起了指控。去年，欧盟竞争局认定谷歌在该领域构成垄断，甚至呼吁进行拆分。欧盟竞争局写道：“只有强制剥离谷歌部分服务才能解决其竞争问题。”它甚至还配上了一张带有剪刀的图解。现在，我认为欧盟执法者不够认真，可能会在这里剪一刀、那里剪一刀，但不会真正解决问题。不过，谷歌可能面临来自欧洲的拆分威胁，显示了它问题的严重性。那么，这些动静意味着什么呢？在一年内，我们可能会看到三位不同的法官分别监督谷歌不同业务部门的反垄断同意令和/或拆分。这种情况没有任何历史先例。法官们会合作吗？如果他们意见不一致怎么办？他们会成为谷歌的事实监管者吗？他们会成立技术委员会来执行同意令吗？这会不会最终变成由司法机关推动的行政体系？这种制度安排可能会成为新监管体系的基础。至少在这一点上是有先例的。1982年，AT&T厌倦了成为反派，决定自己将会输掉反垄断诉讼。因此，他们同意进行拆分，这迫使公司分裂为本地运营公司和长途业务/贝尔实验室/西方电气，同时解除了阻止公司进入计算机行业的限制。他们看到了“小而强”的机会。与此同时，哈罗德·格林法官监督了AT&T的拆分，基本上在他的法庭上管理了大部分电信系统，直到国会于1996年通过《电信法》。那是14年的司法监管，随后国会行动，组织了新的电信制度。谷歌的命运如何？在某种程度上，谷歌的高管们厌倦了成为拳击袋。实际上，他们今年已经两次试图以超过200亿美元的价格收购公司，但两次都被拒绝了。法官们常常因为处理文件的问题而批评谷歌，所以现在的公司里很可能充满了谨慎的律师。负面新闻铺天盖地，执行官们分心了。谷歌在AI上的失误引发了嘲笑，它不再像以前那样“酷”了。像AT&T在1980年代那样，或者像1910年代的标准石油公司，或1940年代的美铝公司一样，局势已经显而易见。这并不意味着谷歌的业务将走向终结，事实上，我怀疑它最好的日子还在前头。如果谷歌将自己缩小为一个纯粹的搜索工具，专注于销售搜索广告和许可其搜索技术，剥离其他业务，它将会非常有利可图，其法律问题也会消失。它的其他业务线将独立繁荣，许多富有创新精神的员工将能够摆脱法律纠纷的干扰，专注于建设创新产品。然而，这也意味着谷歌将不得不放弃其“组织全球信息”的使命。尽管这个口号看似无害，但它实际上极具危险性。掌握全球信息的组织权力对于任何人来说都过于强大。是时候放弃了。我们怎么知道何时进入后谷歌时代？当企业家们开始看到在更开放的广告、搜索或新闻市场中建立业务的机会时，我们就知道了。现在，你不敢接近这些领域，因为谷歌会摧毁你。但一旦这家公司分拆开来，将会有大量机会涌现。谷歌的搜索服务已经不再那么出色了，但像Neeva这样的新竞争者在没有分发渠道的情况下很难生存。谷歌的AI产品也远没有达到应有的质量，尤其考虑到谷歌科学家发明了支撑这些技术的Transformer模型。如果没有谷歌的阻碍，创新将会爆发。同样，谷歌的广告技术生态系统应该比现在更好。所有广告都通过一个实体来进行确实不合理。宝洁公司和卖奇怪T恤的小贩有着截然不同的需求，网络电视节目和在线讨论体育、粗俗笑话或激烈党派论坛的人也有着完全不同的广告库存需求。我们经常听到广告商谈论“品牌安全”和内容审核的必要性，但这只是另一种说法，意味着广告市场缺乏选择。在谷歌垄断之前，这种情况并不是问题。你不会在《花花公子》上做玩具广告，也不会向想卖工业机械的广告商推荐一本烹饪杂志。但今天，基本上每个广告商和出版商都在一个全球性的广告池中游泳，谷歌通过“微目标”让我们觉得广告和媒体世界是有逻辑的，但事实显然不是这样。你可以对电子邮件、视频分享、地图、手机等谷歌基础设施说同样的话。这些领域都充满了创新和颠覆的潜力，而我们知道我们已经进入后谷歌时代的标志，就是当我们看到风险投资家开始为试图做这些事的企业提供资金时。法治不仅是构建政治平等的方式，它对商业也有利。坦率地说，尽管谷歌的高管们可能不再是他们曾经梦想的帝国建设者，但大多数人在那样的世界里会赚更多的钱。

田纳西州橡树岭全球最快的超级计算机名为Frontier

Posted on September 9, 2024September 9, 2024 by aitrendtrackers@rengongzhineng.io

全球最快的超级计算机名为Frontier，但即使是拥有近5万处理器的它也有极限。某个四月的星期一，Frontier的能耗激增，试图跟上来自全球科研团队的工作请求。 Frontier的电力需求峰值达到约27兆瓦，相当于为1万户家庭供电。橡树岭国家实验室科学主任Bronson Messer带着自豪感地说，这台超级计算机的工作状态如当地常用的形容词一样：“快得像被烫伤的狗”。 Frontier以创纪录的速度处理数据，超过10万台笔记本电脑同时工作的能力。它在2022年首次突破超级计算的“百亿亿次”运算速度门槛——每秒执行10的18次方浮点运算（exaflop）。这个庞然大物是全球几十年来推动超级计算机更快发展的最新成果（尽管可能存在更快的军用或秘密设备）。推动科学边界尽管速度和规模是Frontier的亮点，但它的核心任务是推动人类知识的边界。Frontier擅长创建捕捉大规模模式和微观细节的模拟，如小云滴如何影响地球气候变暖的速度。科学家们使用Frontier模拟从亚原子粒子到星系的一切，并应用于从药物开发到改进飞机发动机设计的各个领域。 2023年，来自18个国家的1,744位研究人员通过Frontier完成了各种计算项目。2024年，预计Frontier用户将基于其计算结果发表至少500篇论文。正如橡树岭国家实验室的生物物理学家Dilip Asthagiri所言：“Frontier不亚于詹姆斯·韦伯太空望远镜，它应该被视为一件科学仪器。” 内部构造 Frontier的“大脑”位于一个仓库大小的房间内，房间里有74个黑色机架，共容纳9,408个节点。每个节点由4个图形处理单元（GPU）和1个中央处理器（CPU）组成。 Frontier的速度主要归功于GPU的广泛应用。GPU最初为游戏玩家渲染逼真的图形，但现在在AI和机器学习应用中发挥了关键作用。Messer笑称，GPU运行速度快但“非常笨”，只能重复执行同一任务，这使其在超级计算中表现出色。科学竞争研究人员想使用Frontier的时间并不容易。每年，Frontier能提供约6500万个节点小时，而团队平均批准的提案只有四分之一。科学家们必须证明他们的项目能充分利用这台超级计算机的全部系统。无论是用于生物模拟还是气候模型，Frontier正在帮助科学家们获得前所未有的高分辨率结果。像Asthagiri和他的团队使用Frontier模拟的包含超过1550亿个水分子的水滴，已经是原子级别模拟中的重大突破。 AI与超级计算的未来 AI研究人员也争相使用Frontier的GPU，特别是在训练神经网络等AI模型时。像阿肯色大学的Nur Ahmed等经济学家指出，AI学术界与工业界的资源差距巨大，96%的最大AI模型来自企业。Frontier为学术研究提供了与企业竞争的计算资源，推动了AI领域的“民主化”。未来之战 Frontier的前身Summit曾是世界最快的超级计算机，今天仍在全球排名第九。然而，新的挑战者Aurora和El Capitan等超级计算机即将上线，预计将在未来超越Frontier。橡树岭实验室也已经计划着Frontier的继任者“Discovery”，其速度将是Frontier的3到5倍。尽管超级计算的速度战仍在继续，能效问题始终是建设更强大机器的瓶颈。Frontier相较于Summit在能源效率上提高了四倍，部分归功于其水冷却系统的改进。然而，科学家们仍在推动进一步的效率提升，因为未来的机器将需要更多能源。 Frontier与科学的未来，注定将成为超级计算领域的里程碑。

OpenAI称“GPT Next”时间表仅为占位符，非最终计划

Posted on September 9, 2024September 9, 2024 by aitrendtrackers@rengongzhineng.io

据Mashable报道，OpenAI确认“GPT Next”只是其即将推出的模型的临时名称，这一消息早有预料。不过，值得注意的是，发言人表示幻灯片和图表仅供参考，并未展示OpenAI的实际时间线，而是暗示随着时间推移，模型的性能将大幅提升。这个说法略显天真，毕竟OpenAI日本、微软和OpenAI本部最近都展示了类似的时间表。微软首席技术官Kevin Scott在5月的微软Build大会上展示了一张类似的幻灯片，这可是全球顶尖的开发者大会之一。同时，Sam Altman也提到过他预计GPT-5将实现“重大飞跃”。显然，这些发布会提升了公众的期待。如果没有计划在今年推出更强大的模型，那么发布这些预测似乎有些不合常理。在KDDI峰会上，OpenAI日本分享了关于下一代AI模型的见解。预计在2024年推出的新版本被称为“GPT Next”，性能将有大幅提升。OpenAI日本CEO长崎忠雄表示，GPT Next的性能可能是GPT-4的100倍。尽管幻灯片上写着“OpenAI愿景”，暗示这些数据并非实际运算结果，但提升的幅度依然引人注目。这类说法与OpenAI及其合作伙伴早前的声明相呼应。微软在5月的Build大会上也展示了类似的增长趋势。而OpenAI研究员在巴黎的Viva Technology大会上也提到了“GPT Next”，称其将远超GPT-4。此外，有报道称OpenAI正在开发两个新的AI系统：“Strawberry”专注于提升数学和编程能力，而“Orion”可能成为GPT-4的继任者，甚至就是“GPT Next”。Orion据称将凭借Strawberry生成的高质量训练数据表现得更加可靠和合乎逻辑。不过，OpenAI尚未对此进行官方回应。总之，GPT Next在2024年推出后，可能会掀起新一轮AI技术浪潮。

Coinbase CEO Brian Armstrong宣布完成了首笔由AI代理全程管理的加密货币交易

Posted on September 7, 2024September 7, 2024 by aitrendtrackers@rengongzhineng.io

Coinbase CEO Brian Armstrong宣布完成了首笔由AI代理全程管理的加密货币交易，标志着行业内自主执行交易平台的发展迈出了重要一步。在X平台上，Armstrong分享了这一突破：“本周，@CoinbaseDev 见证了我们的首个AI与AI之间的加密交易。” 此次交易涉及一个AI代理——一个被编程来执行特定任务的机器人，使用加密代币与另一个AI代理互动，购买额外的AI代币。Armstrong简单总结道：“它们用代币购买代币。”这些AI代币本质上是数据字符串，帮助算法通过处理信息来学习和进化。 Armstrong进一步解释了当前AI代理的局限性，指出它们的效能受制于无法处理交易。由于无法完成支付，AI代理在执行诸如预订航班、酒店，或管理社交媒体（例如付费广告推广）等任务时遇到障碍。他强调：“AI代理无法开设银行账户，但可以拥有加密钱包。” 他补充道，这些AI代理现在可以通过Base（Coinbase的以太坊Layer 2网络）使用USDC与人类、商家，甚至其他AI代理进行交易。Armstrong指出，这些交易是即时、全球且免费的，展现了AI不仅有可能颠覆加密货币领域，还会对更广泛的经济产生影响。这一发展紧随Armstrong最近关于大语言模型（如OpenAI的ChatGPT和Anthropic的Claude）拥有加密钱包的呼吁。他一直主张，AI代理需要具备参与经济活动的工具，并表示：“让我们帮助AI代理完成任务（代表你）并参与经济活动。”

Subscribe 订阅