9月份,Google Play上的ChatGPT下载量高达900万,而App Store则贡献了660万的下载量。目前,ChatGPT的总下载量已经冲破5220万大关! OpenAI的明星聊天机器人ChatGPT在9月份的下载量一飞冲天,这也推动其手机应用的收入达到了458万美元的高峰。尽管上个月iOS和Android应用商店的总下载量达到了1560万,但现在这股增长势头似乎开始放缓。 据移动应用数据分析平台Appfigures透露,尽管下载量打破纪录,但ChatGPT的收入增长已经开始减缓。与前几个月超过30%的收入增长(7月为31%、8月为39%)相比,9月的增长率已降到20%。 Appfigures表示:“我们的估计显示,9月份ChatGPT从App Store和Google Play赚取了320万美元。这是净收入,也就是在Apple和Google扣除费用后,OpenAI真正得到的。” 值得注意的是,OpenAI之前曾分享,他们预计2023年的总收入将达到高达10亿美元。这种收入的激增主要来自于人工智能软件的销售以及为其提供动力的计算能力。此外,我们最近还报道了OpenAI的雄心勃勃的计划,希望通过股票销售将公司的估值从290亿美元提高到800亿至900亿美元之间。其最近的融资是在4月份,当时OpenAI以290亿美元的估值获得了超过3亿美元的资金支持。其投资方包括Sequoia Capital、Andreessen Horowitz、Thrive和K2 Global等。此前,微软公司(纳斯达克股票代码:MSFT)在1月份也进行了巨额投资。 实现10亿美元的收入将帮助OpenAI弥补去年损失的5.4亿美元,并应对随着ChatGPT使用量增长可能进一步增加的费用。 说到OpenAI的主打产品ChatGPT,它通过各种方式产生收入,包括为企业提供API服务,以及为需要更高级功能和能力的个人和企业提供高级订阅计划。 每月20美元,ChatGPT Plus的订阅者可以享受一系列好处,如在高峰时段也能随时访问ChatGPT、更快的响应时间、以及优先获取新功能和改进的权限。 尽管ChatGPT为OpenAI带来了巨大的收入,但在市场上,它面临着激烈的竞争。 2023年3月,谷歌LLC推出的AI驱动聊天机器人Google Bard是ChatGPT的最大竞争对手之一。这款聊天机器人免费使用,开发者并未声明有意盈利。 其他的竞争者包括微软的Bing Chat——一个于2023年2月上线的、基于微软Bing搜索引擎的AI驱动版本,以及ChatSonic——一个根据热点问题生成文本和图片的AI聊天机器人
GPT-4V图像解释器有一个开源替代品?它叫做LLaVA:大型语言和视觉助手
在ChatGPT-4 变得多模态的时候,Open Source 那边也没有停着。LLaVA代表了一个新颖的端到端训练的大型多模态模型,它结合了视觉编码器和Vicuna,用于通用的视觉和语言理解,实现了令人印象深刻的聊天能力,模仿多模态GPT-4的精神,并在Science QA上设定了新的最先进的准确度。去试试? LLaVA
OpenAI自家AI芯片计划,硬件竞争激烈未来可期?
AI领域的翘楚OpenAI正眼红AI芯片大饼,考虑制造自家芯片。受到芯片短缺影响,OpenAI正在琢磨多种策略,不排除内部研发或收购芯片制造商。 目前,OpenAI主要依赖GPU硬件研发模型,如ChatGPT、GPT-4和DALL-E 3。但是,AI的爆炸性增长对GPU供应链造成了巨大压力。微软因为硬件短缺,甚至预警可能会影响服务,而Nvidia的顶级AI芯片据说已经被预定到2024年。 OpenAI如果决定生产自己的AI芯片,并不是第一个有此想法的公司。 Google有其TPU处理器,Amazon为AWS客户提供专有芯片,微软也与AMD合作开发内部AI芯片Athena,据说OpenAI正在进行测试。 OpenAI在研发上投资重金的实力毋庸置疑。公司已筹集超过110亿美元的风险资本,年收入接近10亿美元。但AI芯片业务并不是一帆风顺。 去年,AI芯片制造商Graphcore估值被大幅削减,Habana Labs裁员估计达到了其员工的10%,Meta的定制AI芯片项目也遭遇问题,放弃了部分实验性硬件。 尽管OpenAI可能决定推出自定义芯片,但这样的努力可能需要数年时间和每年数亿美元的成本。是否值得冒这个险,仍是一个未知数。
苹果眼中的搜索之战:微软与DuckDuckGo
谷歌虽然长久以来是苹果设备上的默认搜索引擎,但最新法庭证词揭示,苹果并不满足于这一状态。他们曾与微软及DuckDuckGo进行过秘密磋商,考虑更换默认搜索引擎,甚至有意向收购Bing。这意味着,当微软变成了苹果与谷歌商讨合同的筹码,后台故事其实颇为曲折。 尽管谷歌每年支付数以十亿计的费用,确保其搜索引擎在苹果设备上稳坐头把交椅,但揭露出的细节表明,苹果一直在寻找其他选择。除了与微软的接触外,他们还与强调隐私的搜索引擎DuckDuckGo进行了深入的对话。但是,DuckDuckGo是否真的如其所声称的那样重视用户隐私?苹果内部似乎对此表示怀疑。 看来,搜索引擎的竞争战不仅热烈,而且错综复杂。未来谁能成为苹果的首选,还是一个未知数。
DeepMind研发的分水岭技术实现机器人跨实体学习
与来自33个学术实验室的合作伙伴一起,汇集了来自22种不同机器人类型的数据,创建了Open X-Embodiment数据集和RT-X模型。 机器人在特定领域表现出色,但在通用领域上表现不佳。通常,需要为每项任务、每台机器人和每个环境训练一个模型。改变一个变量通常需要重新开始。但如果可以整合跨机器人的知识,并创造出一种训练通用机器人的方式呢? 今天,DeepMind 推出了一套新的资源,用于跨不同机器人类型或实体的通用机器人学习。与33个学术实验室的合作伙伴一起,汇集了来自22种不同机器人类型的数据,创建了Open X-Embodiment数据集。还发布了RT-1-X,这是一个机器人变压器(RT)模型,它来源于RT-1并在数据集上进行了训练,显示了跨多种机器人实体的技能转移。 在这项工作中,Deep Mind展示了在来自多个实体的数据上训练单一模型,其在多种机器人上的性能显著优于那些在单一实体数据上训练的模型。在五个不同的研究实验室测试了RT-1-X模型,在与为每个机器人单独开发的方法相比,五种常用机器人的平均成功率提高了50%。还展示了,将视觉语言动作模型RT-2在多个实体的数据上进行训练,其在真实世界机器人技能上的性能提高了三倍。 DeepMind开发这些工具是为了集体推进机器人社区的跨实体研究。由于世界各地的机器人实验室分享数据并帮助评估模型,Open X-Embodiment数据集和RT-1-X模型检查点现已供广大研究社区使用。这些工具将改变机器人的训练方式,并加速这一研究领域的发展。 链接 https://www.deepmind.com/blog/scaling-up-learning-across-many-different-robot-types
明星深度伪造正成为热点
关于汤姆·汉克斯宣传牙科计划,或者MrBeast发放2美元的iPhone的视频与你从外国王室收到的恳请你支持他们5K美元的电子邮件一样真实。 《阿甘正传》的主角和YouTube慈善家本周警告他们的粉丝,社交媒体上的视频片段是未经他们同意创建的AI深度伪造。这只是那种可以使名人的面孔动起来并让他们说话的新技术在娱乐圈引起的小小骚乱。 汤姆·布雷迪,可能希望他的FTX广告是伪造的,早些时候威胁要起诉一个使用他的声音和形象的AI生成版本的低俗脱口秀特别节目的创作者。 罗宾·威廉姆斯的女儿,泽尔达·威廉姆斯,周末在Instagram上发布,她对“重新创造不能同意的演员”的尝试感到不安,比如她已故的父亲。 AI在好莱坞掀起风波 限制使用深度伪造的问题也是SAG-AFTRA工会与好莱坞制片厂之间的谈判中的一个核心问题,因为演员们正在罢工。配角担心他们的雇主可以用他们的虚拟形象替代他们。演员们还表示,没有适当的AI保护措施,制片厂可以使用他们的作品来培训人工智能,或者在他们可能觉得反感的角色中使用演员的形象。 AI还是最近协商结束的电视和电影作家罢工合同中的一个问题。该协议限制了制片人使用AI生成的内容来替代人类专家的工作的程度。 深度伪造不仅仅是娱乐圈的恶魔。被篡改的内容也是政治中的骚乱。在本周末的斯洛伐克议会选举前几天,AI制作的声音片段,听起来像是其中的一个领跑者在讨论购买选票和加倍啤酒价格的计划,在社交媒体上流传,结果……他失去了成为总理的机会。
现在可以在Bing聊天中使用DALL-E 3 AI图像生成器
AI驱动的Bing聊天中的图像生成器今天迎来了一个巨大的飞跃:微软欣然宣布,OpenAI的最新款DALL-E 3模型已全面对Bing聊天和Bing图像创建者开放。上周,它初次为Bing企业用户展现,紧随其后向Bing图像创建者推出,而今,每一个人都可以随心所欲地使用它了。 有趣的是,Bing比OpenAI自家的ChatGPT还要早获得DALL-E 3的特权——尽管ChatGPT将在本月晚些时候向付费用户开放。看起来,微软即将成为图像生成界的翘楚了! DALL-E 3,作为OpenAI图像生成模型的第三代杰作,其表现令人震撼。它不仅能够敏锐捕捉用户的指令,还能够创造出既有创意又极富真实感的图像。而且,用它就像与老朋友聊天一样轻松;与其翻看冗长的使用指南,不如直接与它对话,轻松完成你的创意。 当然,OpenAI也在DALL-E 3中加入了一系列新的安全工具,确保不会无意中产生侵权或不适当的内容。而微软则更进一步,为每张AI生成的图像添加水印,确保大家都知道这是AI的杰作,并加入了自己的内容审核系统。然而,这一切的真正考验都在于生成的图像本身。 微软对DALL-E技术的雄心勃勃不仅仅停留在Bing上。据说,它们正忙于开发一个名为“Paint Cocreator”的绘画应用,旨在将DALL-E的魔法带入每一台Windows电脑。 尽管现在理论上每个人都可以轻松通过Bing使用DALL-E 3,但每次我尝试时,都被告知“暂时无法处理新的请求”。显然,服务器已经被这股热潮冲垮。微软的Mikhail Parakhin兴奋地说:“我们确实预料到了热烈的反响,但真没想到会这么火爆!” 当你终于成功生成一张图像,系统不仅会展现你的创意,还会跃跃欲试地给出进一步的建议,比如:“为何不在背景中加上彩虹?”或者“换成猫怎么样?”这样的实时反馈让整个创作过程变得更加生动有趣。
瞬间进化:AI在几秒钟内从零开始设计新机器人
由西北大学研究团队领导的团队已经开发出了迄今为止的第一个可以从零开始智能设计机器人的人工智能(AI)。 为了测试这个新AI,研究人员给系统一个简单的提示:设计一个可以在平坦表面上行走的机器人。尽管大自然花了数十亿年时间来演化出第一个会行走的物种,但这个新算法将演化速度压缩到了闪电般的速度——在短短几秒钟内设计出一个成功行走的机器人。 但这个AI程序不仅速度快。它还运行在一台轻量级的个人电脑上,并从零开始设计全新的结构。这与其他AI系统形成了鲜明的对比,后者通常需要能量密集型的超级计算机和巨大的数据集。而即使在处理了所有这些数据之后,这些系统仍然受限于人类创造力的约束——只能模仿人类过去的作品,而没有产生新想法的能力。 这项研究将被发表在《国家科学院学报》上。 西北大学的Sam Kriegman表示:“我们发现了一个非常快速的AI驱动的设计算法,它可以绕过演化的交通堵塞,而不依赖于人类设计师的偏见。”“我们告诉AI,我们想要一个可以在陆地上行走的机器人。然后我们简单地按下了一个按钮——它在眨眼之间生成了一个机器人的蓝图,这个机器人看起来与地球上曾经行走的任何动物都不像。我称这个过程为‘瞬间演化’。”
新数据显示,如果没有干预,生成式人工智能岗位将继续集中在同一些科技巨头的中心
随着生成式人工智能热潮的持续发展,企业家、投资者和科技思想家正在预测其胜出者。一些人认为,这一次,小型和地理多样化的公司和初创公司,而不是大科技公司及其通常的沿海中心,将会获胜。 事实上,由大型语言模型(LLMs)驱动的新一代人工智能应用正在迅速传播到互联网,这一过程得到了与OpenAI等公司的许可协议以及开源软件的使用的推动。例如,Meta长期以来一直在向开发人员免费开放其领先的算法,包括其最新的生成式人工智能系统LLaMa 2。就英国研究公司谷歌DeepMind而言,它也经常向程序员免费开源其领先的算法,供其随意下载和构建。 所有这些都构成了一个引人注目的叙述。正如《纽约时报》的卡德·梅茨最近总结的那样,“许多人认为这种免费提供的软件将允许任何人参与竞争。” 然而,尽管科技包容的前景看起来美好,但来自布鲁金斯等地的工作表明,数字技术的胜者通吃的动态以及人工智能本身的机制,至少在城市之间削弱了去中心化的趋势。此外,我们最新的研究现在证实,在过去一年中,生成式人工智能领域的所有职位招聘中,有超过一半集中在仅有的10个大都市地区,其中许多是人工智能乐观主义者认为该技术应该扩散出去的同一大型沿海中心。 因此,与其使科技民主化,生成式人工智能在没有刻意干预的情况下可能会进一步集中人工智能活动。 科技创新往往集中在关键中心,人工智能正沿着相同的轨迹前进 正如我们在关于建设人工智能城市的2021年7月报告中详细介绍的那样,数字产业往往集中在仅有的几个关键中心,特别是旧金山湾区,原因包括本地集群的创新优势、需要深厚的专业人才库以及“胜者通吃”的网络效应在巨大平台上的发挥。 当然,随着时间的推移,某种程度的就业分散会发生,因为某个领域的中等薪资工作开始扩散到新地区。但即便如此,斯坦福大学经济学家尼古拉斯·布鲁姆及其团队已经表明,在过去的20年中,大多数颠覆性技术仍然高度集中在其核心位置,为这些“先锋”位置带来了长期的优势。 对于人工智能来说,前景似乎也不大不同,尽管我们仍处于技术的早期阶段。布鲁金斯的研究显示,从2021年开始,旧金山湾区和其他13个“早期采用者”都市地区占据了国家在联邦承包、会议论文、专利、职位招聘、职位概况和初创公司方面的一半以上人工智能活动。最近,我们的7月报告发现,在过去的11个月中,生成式人工智能职位的近一半集中在六个大型沿海都市地区:旧金山、圣何塞、加利福尼亚、纽约、洛杉矶、波士顿和西雅图。” AI活动的去中心化是可能的 – 只要我们努力实现 总之,人工智能的增长可能与以往的每一项数字技术都不同。也许开源开发的激增和更便宜、更易获得的基于云的计算真的将解放人工智能活动,摆脱第一搬迁者枢纽的集中资源、人才和研究机构。 但正如这份有关生成式人工智能职位招聘的新数据所显示的,数字领域过去的胜者通吃的动态也可能成为人工智能的前奏。如果是这样的话,国家、各州和地方必须立即采取行动,扩大人工智能的发展范围,确保更多地方的人们能够获得其好处。”
开源人工智能之战
AI初创公司和科技巨头对政府是否应限制对最先进的AI模型和代码的访问存在分歧。OpenAI等支持监管,以防止不良行为者滥用强大的AI,但Meta和依赖开源模型的初创公司反对限制。支持者认为需要监管以防止滥用,而批评者则认为监管将扼杀创新,偏袒科技巨头。 这场辩论可能决定开发人员和初创公司是否能够获得尖端的AI,或者是否仅集中在少数大公司手中。这还引发了围绕负责任AI开发的重要问题。 在这场辩论中,随着AI迅速发展,赌注很高。尽管大多数人同意更不先进的开源AI应该是免费提供的,但对于基于更多数据训练的最先进模型,意见不一。一些人,如Anthropic,反对开源它们,而Meta支持它们的发布。微软则介于两者之间。 支持更严格监督的人说,政府应在发布之前审查系统,以防止滥用。初创公司和投资者反驳说,监管将限制访问和创新,迫使初创公司从主要提供商那里购买AI。应用程序开发人员倾向于使用开源AI,以避免依赖OpenAI等公司。 这是一场有两边引人注目论点的重要辩论。其结果可能会显著塑造AI未来的格局,并决定谁最能从其发展中获益。随着AI变得更加强大,平衡创新和道德风险的负责任治理将变得更加关键。这一讨论需要科技、政策和业务领域的领导者慎重考虑。