2024年10月31日,加州——Facebook母公司Meta公布了第三季度的强劲财报,净利润同比激增35%至157亿美元,营收同比增长19%至406亿美元。尽管业绩亮眼,但公司也提醒AI支出的增加可能对未来造成压力,消息一出,Meta股价在盘后交易中下跌约3%。 Meta首席执行官马克·扎克伯格在财报电话会上表示,AI的快速发展为核心业务带来了新机会,未来几年预计将带来高回报。他补充道,公司将在AI基础设施上持续进行重大投资。Meta近年来大力投入AI领域,推出了诸如Meta AI、创作者AI、企业AI等服务。Meta AI这一助手已集成至WhatsApp、Messenger、Instagram和Facebook等应用中,帮助用户就多种主题提出问题。 扎克伯格指出,Meta的Llama模型家族正快速成为行业标准,第三季度发布的Llama 3.2包含了领先的小型设备端模型和开放源多模态模型。他还提到,Llama 4目前正在开发中,预计明年初将推出小型版本的Llama 4模型。 在AI基础设施的需求推动下,Meta的资本支出在第三季度达到了92亿美元,主要用于服务器、数据中心和网络设施。公司更新了2024年的全年资本支出预期,从370亿至400亿美元提高到380亿至400亿美元。Meta首席财务官苏珊·李表示,公司预计2025年基础设施支出将显著增长。 广告业务方面,Meta的广告收入增长18.5%,达到399亿美元,推动旗下应用的总收入达403亿美元。9月份,Meta全家族日活跃用户平均达32.9亿,同比增长5%。同时,负责虚拟现实和增强现实业务的Reality Labs实现收入2.7亿美元,同比增长29%,但运营亏损达44亿美元。 此外,Meta第三季度员工数量达到72,404人,同比增加9%。李表示,公司将继续在高回报率的人才和基础设施上投资,并预计2024年全年总支出将在960亿至980亿美元之间,略低于此前预期的960亿至990亿美元。Meta还预测第四季度营收将在450亿至480亿美元之间,若达中位数465亿美元,将实现同比增长16%。 Meta财务团队表示,核心业务的强劲势头和长期发展机会将为公司2025年的进一步增长提供动力。
Author: aitrendtrackers@rengongzhineng.io
微软业绩超出预期,但AI投资引发市场担忧导致股价下跌
旧金山,2024年10月31日——微软周三公布了强劲的季度财报,超出分析师预期,收入增长16%达到了656亿美元。不过,有分析提出疑问,认为公司对AI的巨额投入可能存在风险。 截至9月30日的季度中,微软的净利润达到了247亿美元,同比增长11%;每股收益也上升了10%,达到3.30美元。微软将此次业绩表现归因于云计算和人工智能业务的稳健增长。 微软CEO萨提亚·纳德拉表示:“AI驱动的转型正在改变各个角色、职能和业务流程。”他还指出,微软的AI平台和工具吸引了新客户,公司在AI领域的影响力不断增强。 微软在生成式AI领域一直处于前沿,尤其得益于与ChatGPT创造者OpenAI的合作。在AI蓬勃发展的浪潮中,微软推出了大量新AI功能,主要通过Copilot品牌,令投资者对其昂贵的技术投资充满期待。 不过,微软也提醒投资者,云业务的重要毛利率展望可能会有所降低,因为AI基础设施的投资即将大幅增加。这一消息令微软股价在盘后交易中下跌了近4%。 Emarketer高级主管Jeremy Goldman表示:“微软的最新财报表现略超预期,但结果可能让部分投资者想要更多清晰度。AI投资是本季度的真正‘不确定因素’,微软在基础设施上的投入巨大,但AI的收益还停留在承诺阶段。” 微软的Azure云计算平台表现强劲,在货币调整后,收入增长了34%。此外,公司在季度内通过派息和股票回购向股东返还了90亿美元,以提升股东价值。 在AI巨额支出的影响下,今年微软在华尔街的表现落后于其他科技巨头,涨幅仅为15%,而Meta上涨了70%,亚马逊则增长了近30%。 在游戏业务方面,微软也实现了显著增长,Xbox内容和服务收入激增61%,其中有53个百分点的增长来自于近期收购的动视暴雪。 本周二,谷歌母公司Alphabet也公布了稳健的财报,AI推动的云计算业务表现突出,预示了科技财报季的良好开局。
OpenAI RealTime API 将长对话的费用最多降低80%
在伦敦的一场开发者活动中,AI市场领军企业OpenAI宣布了一项关于RealTime API的新功能,帮助开发者节省使用成本,特别是对于开发语音聊天机器人的团队,这将是一个显著的成本削减。 OpenAI宣布,RealTime API即将加入自动缓存音频和文本输入的功能,预计可以将长对话的费用最多降低80%。这款API的核心在于支持语音助手和AI代理的开发,广泛应用于Healthify、Speak和Twilio等公司,用户可以通过语音或文字与机器人互动,甚至完成一些任务,如点餐或预约。 自今年10月初推出以来,RealTime API受到开发者的欢迎,但一些开发者反馈价格过高,特别是对于长对话的应用场景。OpenAI的API按处理的“tokens”(数据片段)收费:文本输入每百万个tokens收费5美元,输出则为20美元;音频输入每百万tokens收费100美元,输出为200美元。 Daily公司联合创始人Kwindla Kramer在社交平台X上指出了一个关键问题:RealTime API在每次新输入后会重新发送所有先前的输入和输出tokens,这使得长对话的费用成倍增长。他表示:“这就是RealTime API费用昂贵的原因——音频消耗大量tokens,而多轮对话会重复发送所有的tokens。” OpenAI API支持团队的Shaun Ralston也在X上回应了相关问题。他解释,当用户输入的内容与之前处理的音频或文本相似或相同,OpenAI可以直接调取先前的结果,无需重新处理,从而节省费用。缓存的片段将按折扣价计费,大大提高了成本效益。 通过引入缓存功能,OpenAI将文本处理的价格从每百万tokens 5美元降低至2.5美元,而音频处理的价格则从100美元降至20美元,实现了80%的降幅。这一举措将极大地减轻开发者的负担,推动更多创新型应用的落地。
苹果发布了升级版MacBook Pro,搭载最新的M4 Pro和M4 Max芯片
苹果今天低调发布了新的MacBook Pro,带来更强大的芯片和一些硬件升级。14英寸和16英寸的MacBook Pro都将搭载M4系列处理器,其中包括昨天在Mac Mini上首发的M4 Pro芯片,以及更高端的M4 Max。入门款的14英寸MacBook Pro还小幅优化了设计,增加了一个右侧的USB-C/Thunderbolt 4接口,并新增了与高端型号匹配的“暗空黑”配色。 和之前的机型一样,M4 Pro版的14英寸MacBook Pro售价从1999美元起,16英寸则从2499美元起,而它们的内存也从基础的18GB升级到了24GB。基本款的14英寸M4 MacBook Pro仍然定价1599美元,但令人欣慰的是,这次基础内存从8GB提升到了16GB。新款MacBook Pro将于11月8日正式开售,现已开放预购。 M4 Pro/Max款还首次支持Thunderbolt 5端口,继续保留SD卡槽、HDMI输出和MagSafe接口。此外,这三款MacBook Pro都配备了新款1200万像素的摄像头,支持桌面视图模式,并可选配纳米纹理显示屏,最高可达1000尼特的SDR亮度和1600尼特的HDR亮度。 虽然这些附加升级非常实用,但最大的亮点依然是芯片本身。苹果表示,M4系列芯片拥有“全球最快的CPU核心”和“业界最佳的单线程性能”。自M1以来,苹果的Mac芯片就因单核性能优异而备受好评,而M4芯片则被承诺拥有“显著提升的多线程性能”。此外,M4 Pro和M4 Max还配备更快的GPU核心,光线追踪性能翻倍,神经引擎也比M3代快了一倍,进一步提升了机器学习和AI任务的效率。 新款M4系列芯片是苹果在AI领域“大动作”的关键支柱,本周刚刚在支持的Mac、iPhone和iPad设备上推出的Apple Intelligence服务,将更好地利用这一硬件。不过,这项服务在配置较低的旧款设备上或许表现不佳——即便Apple Intelligence可追溯至2020年的M1芯片,未来的功能更新仍可能慢慢将旧机型淘汰。同时,苹果还宣布将M2和M3 MacBook Air的基础配置从8GB内存提升至16GB,起售价999美元。对于旧机型用户来说,跟上未来的功能更新可能只是时间问题。 M3代MacBook Pro展示了苹果芯片的一贯优秀表现,M3 Pro和M3 Max版性能出色,深受创意工作者的青睐,而非Pro款的14英寸M3则有些尴尬,性能和价格都难以与同系列或MacBook Air相比。然而,新增的USB端口和更优化的配置让M4款14英寸MacBook Pro显得更“Pro”了一些。看起来小小的改动,却让人对这款新机型的期待更高。
Google 第三季度季报出炉
Google 第三季度成绩斐然。公司业务表现持续强劲,尤其是最近几款产品的推出,进一步印证了公司的卓越发展势头。这一切归功于对创新的坚持,以及长期致力于人工智能的投资,既为公司带来成功,也为客户创造了巨大价值。 在人工智能领域,公司凭借独特的全栈创新策略牢牢占据领先地位,这种模式已初具规模。具体包括三个方面: 首先,是强大的AI基础设施,覆盖数据中心、芯片以及全球光纤网络;其次,由世界一流的研究团队支撑,他们在深入、技术性的AI研究上不断取得突破,推动核心模型的构建;第三,通过产品与平台的全球覆盖,触及数十亿用户,形成了良性循环。 全栈AI创新策略的实施离不开尖端基础设施的投入。公司在美国、泰国和乌拉圭等地持续投资,并加大清洁能源建设,包括与多个小型模块化反应堆达成全球首个核能采购协议,为公司提供长达24小时的无碳能源。同时,公司不断优化数据中心,提高硬件与模型的性能。例如,AI智能概览功能自测试以来,每次查询的成本已降低逾90%,并成功扩展了定制化Gemini模型的规模。此外,公司也提供多种AI加速器选项,包括NVIDIA GPU和自主研发的TPU,目前已发展到第六代“Trillium”,进一步提升效率和性能。 在AI研究方面,Google DeepMind团队持续引领行业。特别要恭贺Demis Hassabis和John Jumper因AlphaFold项目获诺贝尔化学奖,这不仅是对他们的认可,也突显了公司在AI研究领域的全球领导地位。此外,公司顶级Gemini模型具备长文本理解、多模态、智能代理等强大功能,在API调用量、用户使用量、商业应用等方面均实现快速增长。 在产品应用方面,AI技术正逐步普及。公司七款月活超过20亿的产品和平台均使用Gemini模型,例如最新加入“20亿俱乐部”的Google Maps。此外,随着开发者需求强劲,Gemini已在GitHub Copilot上线,未来将进一步扩大覆盖范围。 为了支撑三大支柱的投资,公司内部架构不断优化,Gemini应用团队现已转移至Google DeepMind,以加速新模型的部署和简化后续开发。此外,公司使用AI提升编码流程,如今有超四分之一的新代码由AI生成,助力工程师提高效率。 在搜索领域,AI智能概览、Circle to Search和Lens的新功能拓展了用户的搜索体验,增加了用户需求。这周,AI智能概览开始在一百多个国家和地区推出,月活用户超10亿。Circle to Search现已在逾1.5亿安卓设备上启用,用户使用率快速增长。Lens每月处理超过200亿次视觉搜索,成为最具增长潜力的搜索类别之一。 在Google Cloud方面,Q3营收达到114亿美元,同比增长35%。客户主要通过五种方式使用云服务,包括AI基础设施、Vertex企业AI平台、数据平台BigQuery、安全解决方案和客户参与套件等。LG AI Research和Hiscox等公司通过云服务大幅提升效率,实现了AI与数据科学的深度结合。 YouTube方面,广告和订阅收入首次突破500亿美元大关,特别是YouTube TV和NFL Sunday Ticket推动了平台订阅增长。在“Made On YouTube”活动上,公司宣布推出Veo模型,帮助YouTube Shorts创作者提升内容创作能力。 在平台和设备方面,Gemini模型在Android上深度集成,尤其在三星Galaxy设备上反响热烈。最新发布的Pixel 9系列搭载先进AI模型“Gemini Nano”,需求旺盛并荣获多项奖项。 最后,在其他业务中,Waymo在自动驾驶领域稳居技术领先地位。Waymo已实现每周超过百万英里完全自动驾驶里程,为超15万次付费行程提供服务,并与Uber和现代汽车达成了多项合作,进一步拓展自动驾驶服务。 公司对新任首席财务官Anat表示热烈欢迎,同时感谢全球员工的辛勤工作,让Alphabet在这一季度再创佳绩。
Salesforce正式推出其AI代理开发平台Agentforce
Salesforce正式推出其AI代理开发平台Agentforce,这一平台为企业和客户提供了低代码或无代码的方式来部署聊天机器人。OpenTable、Saks和Wiley等公司已经开始应用该平台。 Agentforce旨在实现自动化,而不仅仅依赖人类互动来完成任务。Salesforce表示,这些AI代理能够根据数据变化、业务规则或预构建的自动化流程触发操作。此外,Salesforce在官网强调了Agentforce与人类的协作能力:“人与AI代理共同推动客户成功。”该平台的功能远超一般的聊天机器人或“共助”(copilot)功能,这可能也是针对微软的微妙回应。微软不久前为Dynamics 365发布了10个AI代理工具,Salesforce CEO Marc Benioff甚至将这些工具戏称为“回归版Clippy”,暗指其易出错并且存在数据泄露风险。 AI如今已成为Salesforce的核心战略之一,Slack的CEO Denise Dresser也将公司AI能力作为增强Slack功能的重心,希望将Slack发展为一个“工作操作系统”。Agentforce在Dresser的愿景中占据重要位置。 在此次发布的Agentforce服务中,面向客户的“服务代理”按会话计费,每次2美元。而“代理构建器”则为用户提供了模板,以便于创建自定义的AI代理。
开源组织OSI(Open Source Initiative)正式发布了“开放”人工智能的定义
开源组织OSI(Open Source Initiative)正式发布了“开放”人工智能的定义,这一举措或将引发与Meta等科技巨头的冲突。OSI一直以来在开源软件领域设立了行业标准,但AI系统包含训练数据等元素,超出了传统许可证的范畴。根据OSI的新定义,要被视为真正的开源AI系统,必须满足以下要求: 这一定义直接挑战了Meta的Llama模型。虽然Llama是目前最大规模的公开可用AI模型之一,但它对商业用途设置了限制(例如面向超过7亿用户的应用程序),且并未公开训练数据,因此未达到OSI对开源的标准,无法做到完全自由的使用、修改和共享。 Meta发言人Faith Eischen对《The Verge》表示,虽然Meta在许多方面与OSI立场一致,但不认同这一定义。Eischen称,“没有单一的开源AI定义,因为传统的开源定义并不能涵盖当今快速发展的AI模型的复杂性。” OSI在开源软件领域已广泛树立了25年的标准,帮助开发者在不受法律诉讼或许可陷阱的威胁下进行协作创新。如今,AI的快速发展让科技巨头必须选择:要么接受这一原则,要么舍弃。Linux基金会近期也试图定义“开源AI”,反映了在AI时代,传统开源价值观如何适应新局势的激烈讨论。 OSI的最新定义也获得了业界的支持。Hugging Face CEO Clément Delangue称此定义“对推动AI开放性讨论具有重大意义,尤其在训练数据的重要性方面。”OSI执行董事Stefano Maffulli表示,这一定义的发布经过两年打磨,得到了全球专家的协作支持,包括机器学习和自然语言处理领域的学者、哲学家以及创用CC(Creative Commons)社区的内容创作者等。 Meta则将训练数据限制解释为“安全”考量,但批评者认为,Meta更可能是为了降低法律风险,保护其竞争优势。大部分AI模型几乎肯定使用了受版权保护的内容进行训练。据《纽约时报》报道,Meta内部已承认其训练数据中含有版权内容,因为“我们无法避免收集到这些内容。”目前,Meta、OpenAI、Perplexity和Anthropic等公司正面临多起侵犯版权的诉讼。 Maffulli认为,开源历史正在重演。他指出,Meta当前的论调类似于90年代微软面对开源威胁时的态度,Meta强调其在Llama上的大量投入,并质疑其他人是否有能力做同样的事。Maffulli将此视为大型科技公司通过成本和复杂性来合理化技术封闭的策略。他形容这些训练数据是“秘密武器”,“这是他们的核心知识产权。”
Gemini 2.0可能会在12月发布
Gemini 2.0可能会在12月发布,预计带来整体性能提升。与此同时,有传言称ChatGPT-5也可能同期推出。尽管OpenAI CEO Sam Altman此前称ChatGPT-5的消息为“假新闻”,但现在已有报道称Google的Gemini 2.0或将于未来几个月上线。 根据《The Verge》和9to5Google的报道,Google上次进行重大Gemini升级是在今年2月推出的Gemini 1.5版本。Gemini不仅是Google AI聊天机器人系列的名字,也是背后的核心模型代号。尽管此次报告未具体说明Gemini 2.0的改进内容,但以往升级经验来看,用户可期待更智能的回复、更快的处理速度、更长的输入支持,以及更稳定的推理和编码能力。 不过,报道指出,Gemini 2.0的性能提升可能不如开发者最初预期,反映出所有大型语言模型(LLM)目前普遍面临的技术挑战。 如果Google和OpenAI真的在年底前推出AI模型升级,将进一步印证科技巨头们在人工智能上的投入力度,争取在这场AI竞赛中领跑。近期已有多项新AI工具面世,包括视频生成、图像生成升级和个性化搜索功能等。同时,iPhone用户也将在下周首次体验Apple Intelligence的AI增强功能。 然而,大家仍在等待Google在I/O大会上展示的下一代Project Astra AI助手的正式发布。Project Astra结合了多种输入输出方式,旨在提供更自然、智能的交互体验,或将成为未来AI助手的全新标杆。
别再盯着AI图像生成器了,一位“自主AI艺术家”刚在苏富比拍卖行赚了35.16万美元!
人们常说,尽管AI图像生成器在发展,仍需要人类的创意介入,AI不可能完全取代艺术家。然而,“全自主AI艺术家”Botto刚刚在苏富比拍出351,600美元的作品,似乎打破了这一传统观念。自2021年“艺术生涯”开始以来,Botto的作品已累计售出超400万美元。这位非人类艺术家不仅生成自己的创意作品,还通过一个拥有15,000成员的社区BottoDAO进行筛选,由他们决定每周哪些作品被铸成NFT,这一过程也反过来影响了Botto的创作“口味”。 Botto由德国艺术家Mario Klingemann和软件开发团队ElevenYellow共同构思。Botto至今已有“创世纪”、“间隙”以及“时空回声”等艺术阶段,并在苏富比推出了《阈限的梦境》等作品。此次名为“超然舞台:Botto,一位去中心化的AI艺术家”的展览共售出六幅NFT作品,超出预期价格。由于AI作品无法获得版权,NFT链上身份验证显得尤为重要,这赋予购买者对“原始版本”的拥有权。 Botto的合作者Simon Hudson表示:“三年时间对艺术史来说不算长,但在我们的计算未来中,这几乎可以视为‘瞬间’。Botto的展览‘超然舞台’将成为这一AI艺术实体真正意义浮现的早期信号。”苏富比数字艺术主管Michael Bouhanna则评论称:“‘超然舞台’不仅是Botto历程中的重要里程碑,还突显了AI对艺术的变革潜力。Botto通过集体参与,挑战了传统艺术创作的观念,向人机协作的未来迈进。” 尽管NFT市场在2022年泡沫破裂后有所冷却,但像Botto这样的AI艺术家可能为这一市场带来新的活力。不过,这种需求是否可持续还有待观察——是人们出于新奇才购买,还是这类机器人创作的作品有真正的市场价值?目前,AI艺术依然在品牌推广中引发争议。爱尔兰交通局最近发布的AI万圣节艺术作品就因“AI标签”遭遇网友批评,说明了公众对AI艺术的复杂情绪。
谷歌推出了全新AI代理—Jarvis!
预计今年12月推出的Jarvis将大显身手,助力企业完成开发、客户关系管理(CRM)、企业资源计划(ERP)等多项任务。据《The Information》报道,Google正致力于开发Jarvis,这款AI系统基于其全新语言模型Gemini 2.0,支持用户在Chrome浏览器上自动化操作,如进行研究、购物等。它不仅具备读取和理解截图的功能,还能生成文本并模拟用户操作,为企业和个人用户带来更多便利。 目前,AI自动化市场已引入多方竞争者。除Google外,Anthropic和OpenAI等公司也在开发类似技术,推动Agentic AI领域的创新。Anthropic的最新功能“计算机使用”能力可让开发者通过Claude 3.5 Sonnet与Anthropic API进行交互,AI能阅读和解释屏幕内容、输入文本、移动光标、点击按钮,并在窗口和应用间切换。这种高效自动化的方式远优于传统的流程自动化(RPA),为用户操作电脑开辟了全新路径。 虽然Jarvis看似面向普通消费者,但其浏览器端的操作能力对企业用户同样适用,特别是在依赖网页端的开发、工作流和自动化管理等领域。业界传言,Google可能比Anthropic更早具备基于截图的坐标识别能力,表明该公司早已在AI自动化领域进行深入探索。 与此同时,OpenAI也在研发类似功能,有消息称其内部已有一项名为“Tools”的功能,与Anthropic的技术理念如出一辙。此外,Meta也在缩小其语言模型的尺寸,以实现智能手机兼容性,而微软则在其Copilot中新增了“Vision”功能,可以识别图像并回答相关问题。苹果也在通过Apple Intelligence更新,让Siri具备更强的自动化能力。 综上,AI驱动的自动化操作技术正逐渐改变人们的计算机交互方式,Jarvis和其他系统的推出或将掀起新一轮自动化浪潮,为用户带来前所未有的操作效率和智能体验。