谷歌虽然长久以来是苹果设备上的默认搜索引擎,但最新法庭证词揭示,苹果并不满足于这一状态。他们曾与微软及DuckDuckGo进行过秘密磋商,考虑更换默认搜索引擎,甚至有意向收购Bing。这意味着,当微软变成了苹果与谷歌商讨合同的筹码,后台故事其实颇为曲折。 尽管谷歌每年支付数以十亿计的费用,确保其搜索引擎在苹果设备上稳坐头把交椅,但揭露出的细节表明,苹果一直在寻找其他选择。除了与微软的接触外,他们还与强调隐私的搜索引擎DuckDuckGo进行了深入的对话。但是,DuckDuckGo是否真的如其所声称的那样重视用户隐私?苹果内部似乎对此表示怀疑。 看来,搜索引擎的竞争战不仅热烈,而且错综复杂。未来谁能成为苹果的首选,还是一个未知数。
Author: aitrendtrackers@rengongzhineng.io
DeepMind研发的分水岭技术实现机器人跨实体学习
与来自33个学术实验室的合作伙伴一起,汇集了来自22种不同机器人类型的数据,创建了Open X-Embodiment数据集和RT-X模型。 机器人在特定领域表现出色,但在通用领域上表现不佳。通常,需要为每项任务、每台机器人和每个环境训练一个模型。改变一个变量通常需要重新开始。但如果可以整合跨机器人的知识,并创造出一种训练通用机器人的方式呢? 今天,DeepMind 推出了一套新的资源,用于跨不同机器人类型或实体的通用机器人学习。与33个学术实验室的合作伙伴一起,汇集了来自22种不同机器人类型的数据,创建了Open X-Embodiment数据集。还发布了RT-1-X,这是一个机器人变压器(RT)模型,它来源于RT-1并在数据集上进行了训练,显示了跨多种机器人实体的技能转移。 在这项工作中,Deep Mind展示了在来自多个实体的数据上训练单一模型,其在多种机器人上的性能显著优于那些在单一实体数据上训练的模型。在五个不同的研究实验室测试了RT-1-X模型,在与为每个机器人单独开发的方法相比,五种常用机器人的平均成功率提高了50%。还展示了,将视觉语言动作模型RT-2在多个实体的数据上进行训练,其在真实世界机器人技能上的性能提高了三倍。 DeepMind开发这些工具是为了集体推进机器人社区的跨实体研究。由于世界各地的机器人实验室分享数据并帮助评估模型,Open X-Embodiment数据集和RT-1-X模型检查点现已供广大研究社区使用。这些工具将改变机器人的训练方式,并加速这一研究领域的发展。 链接 https://www.deepmind.com/blog/scaling-up-learning-across-many-different-robot-types
明星深度伪造正成为热点
关于汤姆·汉克斯宣传牙科计划,或者MrBeast发放2美元的iPhone的视频与你从外国王室收到的恳请你支持他们5K美元的电子邮件一样真实。 《阿甘正传》的主角和YouTube慈善家本周警告他们的粉丝,社交媒体上的视频片段是未经他们同意创建的AI深度伪造。这只是那种可以使名人的面孔动起来并让他们说话的新技术在娱乐圈引起的小小骚乱。 汤姆·布雷迪,可能希望他的FTX广告是伪造的,早些时候威胁要起诉一个使用他的声音和形象的AI生成版本的低俗脱口秀特别节目的创作者。 罗宾·威廉姆斯的女儿,泽尔达·威廉姆斯,周末在Instagram上发布,她对“重新创造不能同意的演员”的尝试感到不安,比如她已故的父亲。 AI在好莱坞掀起风波 限制使用深度伪造的问题也是SAG-AFTRA工会与好莱坞制片厂之间的谈判中的一个核心问题,因为演员们正在罢工。配角担心他们的雇主可以用他们的虚拟形象替代他们。演员们还表示,没有适当的AI保护措施,制片厂可以使用他们的作品来培训人工智能,或者在他们可能觉得反感的角色中使用演员的形象。 AI还是最近协商结束的电视和电影作家罢工合同中的一个问题。该协议限制了制片人使用AI生成的内容来替代人类专家的工作的程度。 深度伪造不仅仅是娱乐圈的恶魔。被篡改的内容也是政治中的骚乱。在本周末的斯洛伐克议会选举前几天,AI制作的声音片段,听起来像是其中的一个领跑者在讨论购买选票和加倍啤酒价格的计划,在社交媒体上流传,结果……他失去了成为总理的机会。
现在可以在Bing聊天中使用DALL-E 3 AI图像生成器
AI驱动的Bing聊天中的图像生成器今天迎来了一个巨大的飞跃:微软欣然宣布,OpenAI的最新款DALL-E 3模型已全面对Bing聊天和Bing图像创建者开放。上周,它初次为Bing企业用户展现,紧随其后向Bing图像创建者推出,而今,每一个人都可以随心所欲地使用它了。 有趣的是,Bing比OpenAI自家的ChatGPT还要早获得DALL-E 3的特权——尽管ChatGPT将在本月晚些时候向付费用户开放。看起来,微软即将成为图像生成界的翘楚了! DALL-E 3,作为OpenAI图像生成模型的第三代杰作,其表现令人震撼。它不仅能够敏锐捕捉用户的指令,还能够创造出既有创意又极富真实感的图像。而且,用它就像与老朋友聊天一样轻松;与其翻看冗长的使用指南,不如直接与它对话,轻松完成你的创意。 当然,OpenAI也在DALL-E 3中加入了一系列新的安全工具,确保不会无意中产生侵权或不适当的内容。而微软则更进一步,为每张AI生成的图像添加水印,确保大家都知道这是AI的杰作,并加入了自己的内容审核系统。然而,这一切的真正考验都在于生成的图像本身。 微软对DALL-E技术的雄心勃勃不仅仅停留在Bing上。据说,它们正忙于开发一个名为“Paint Cocreator”的绘画应用,旨在将DALL-E的魔法带入每一台Windows电脑。 尽管现在理论上每个人都可以轻松通过Bing使用DALL-E 3,但每次我尝试时,都被告知“暂时无法处理新的请求”。显然,服务器已经被这股热潮冲垮。微软的Mikhail Parakhin兴奋地说:“我们确实预料到了热烈的反响,但真没想到会这么火爆!” 当你终于成功生成一张图像,系统不仅会展现你的创意,还会跃跃欲试地给出进一步的建议,比如:“为何不在背景中加上彩虹?”或者“换成猫怎么样?”这样的实时反馈让整个创作过程变得更加生动有趣。
瞬间进化:AI在几秒钟内从零开始设计新机器人
由西北大学研究团队领导的团队已经开发出了迄今为止的第一个可以从零开始智能设计机器人的人工智能(AI)。 为了测试这个新AI,研究人员给系统一个简单的提示:设计一个可以在平坦表面上行走的机器人。尽管大自然花了数十亿年时间来演化出第一个会行走的物种,但这个新算法将演化速度压缩到了闪电般的速度——在短短几秒钟内设计出一个成功行走的机器人。 但这个AI程序不仅速度快。它还运行在一台轻量级的个人电脑上,并从零开始设计全新的结构。这与其他AI系统形成了鲜明的对比,后者通常需要能量密集型的超级计算机和巨大的数据集。而即使在处理了所有这些数据之后,这些系统仍然受限于人类创造力的约束——只能模仿人类过去的作品,而没有产生新想法的能力。 这项研究将被发表在《国家科学院学报》上。 西北大学的Sam Kriegman表示:“我们发现了一个非常快速的AI驱动的设计算法,它可以绕过演化的交通堵塞,而不依赖于人类设计师的偏见。”“我们告诉AI,我们想要一个可以在陆地上行走的机器人。然后我们简单地按下了一个按钮——它在眨眼之间生成了一个机器人的蓝图,这个机器人看起来与地球上曾经行走的任何动物都不像。我称这个过程为‘瞬间演化’。”
新数据显示,如果没有干预,生成式人工智能岗位将继续集中在同一些科技巨头的中心
随着生成式人工智能热潮的持续发展,企业家、投资者和科技思想家正在预测其胜出者。一些人认为,这一次,小型和地理多样化的公司和初创公司,而不是大科技公司及其通常的沿海中心,将会获胜。 事实上,由大型语言模型(LLMs)驱动的新一代人工智能应用正在迅速传播到互联网,这一过程得到了与OpenAI等公司的许可协议以及开源软件的使用的推动。例如,Meta长期以来一直在向开发人员免费开放其领先的算法,包括其最新的生成式人工智能系统LLaMa 2。就英国研究公司谷歌DeepMind而言,它也经常向程序员免费开源其领先的算法,供其随意下载和构建。 所有这些都构成了一个引人注目的叙述。正如《纽约时报》的卡德·梅茨最近总结的那样,“许多人认为这种免费提供的软件将允许任何人参与竞争。” 然而,尽管科技包容的前景看起来美好,但来自布鲁金斯等地的工作表明,数字技术的胜者通吃的动态以及人工智能本身的机制,至少在城市之间削弱了去中心化的趋势。此外,我们最新的研究现在证实,在过去一年中,生成式人工智能领域的所有职位招聘中,有超过一半集中在仅有的10个大都市地区,其中许多是人工智能乐观主义者认为该技术应该扩散出去的同一大型沿海中心。 因此,与其使科技民主化,生成式人工智能在没有刻意干预的情况下可能会进一步集中人工智能活动。 科技创新往往集中在关键中心,人工智能正沿着相同的轨迹前进 正如我们在关于建设人工智能城市的2021年7月报告中详细介绍的那样,数字产业往往集中在仅有的几个关键中心,特别是旧金山湾区,原因包括本地集群的创新优势、需要深厚的专业人才库以及“胜者通吃”的网络效应在巨大平台上的发挥。 当然,随着时间的推移,某种程度的就业分散会发生,因为某个领域的中等薪资工作开始扩散到新地区。但即便如此,斯坦福大学经济学家尼古拉斯·布鲁姆及其团队已经表明,在过去的20年中,大多数颠覆性技术仍然高度集中在其核心位置,为这些“先锋”位置带来了长期的优势。 对于人工智能来说,前景似乎也不大不同,尽管我们仍处于技术的早期阶段。布鲁金斯的研究显示,从2021年开始,旧金山湾区和其他13个“早期采用者”都市地区占据了国家在联邦承包、会议论文、专利、职位招聘、职位概况和初创公司方面的一半以上人工智能活动。最近,我们的7月报告发现,在过去的11个月中,生成式人工智能职位的近一半集中在六个大型沿海都市地区:旧金山、圣何塞、加利福尼亚、纽约、洛杉矶、波士顿和西雅图。” AI活动的去中心化是可能的 – 只要我们努力实现 总之,人工智能的增长可能与以往的每一项数字技术都不同。也许开源开发的激增和更便宜、更易获得的基于云的计算真的将解放人工智能活动,摆脱第一搬迁者枢纽的集中资源、人才和研究机构。 但正如这份有关生成式人工智能职位招聘的新数据所显示的,数字领域过去的胜者通吃的动态也可能成为人工智能的前奏。如果是这样的话,国家、各州和地方必须立即采取行动,扩大人工智能的发展范围,确保更多地方的人们能够获得其好处。”
开源人工智能之战
AI初创公司和科技巨头对政府是否应限制对最先进的AI模型和代码的访问存在分歧。OpenAI等支持监管,以防止不良行为者滥用强大的AI,但Meta和依赖开源模型的初创公司反对限制。支持者认为需要监管以防止滥用,而批评者则认为监管将扼杀创新,偏袒科技巨头。 这场辩论可能决定开发人员和初创公司是否能够获得尖端的AI,或者是否仅集中在少数大公司手中。这还引发了围绕负责任AI开发的重要问题。 在这场辩论中,随着AI迅速发展,赌注很高。尽管大多数人同意更不先进的开源AI应该是免费提供的,但对于基于更多数据训练的最先进模型,意见不一。一些人,如Anthropic,反对开源它们,而Meta支持它们的发布。微软则介于两者之间。 支持更严格监督的人说,政府应在发布之前审查系统,以防止滥用。初创公司和投资者反驳说,监管将限制访问和创新,迫使初创公司从主要提供商那里购买AI。应用程序开发人员倾向于使用开源AI,以避免依赖OpenAI等公司。 这是一场有两边引人注目论点的重要辩论。其结果可能会显著塑造AI未来的格局,并决定谁最能从其发展中获益。随着AI变得更加强大,平衡创新和道德风险的负责任治理将变得更加关键。这一讨论需要科技、政策和业务领域的领导者慎重考虑。
Humane在Coperni巴黎时装秀上首次展示了首款人工智能设备——Ai Pin,该设备将于11月9日完整发布
随着对以人工智能驱动的消费者技术的兴趣加速增长,Humane Inc今天揭示了其首款设备Humane Ai Pin的全新形态。Ai Pin作为与位于巴黎的时尚品牌Coperni合作的一部分,在巴黎时装周的2024春夏展览上首次展示。超模娜奥米·坎贝尔是公司之外首个在公开场合佩戴该设备的人,该设备将于11月9日完整发布。 在展示中,Humane展示了Ai Pin的新外形,并展示了设备佩戴的多种方式,展示了公司对人与人工智能新兴融合的愿景。这次合作源于Humane和Coperni之间的共同信仰,即设计、创意和技术可以成为推动文化变革的巨大驱动力。 Humane Ai Pin是一款无屏幕的独立设备和软件平台,从头开始为人工智能而构建。这款智能穿戴设备使用一系列传感器,实现自然和直观的计算交互,并设计成可以无缝融入用户的日常生活。该设备以隐私为重,没有唤醒词,因此没有始终处于监听状态,体现了Humane将信任置于中心的产品愿景。 Ai Pin不需要与智能手机或其他伴侣设备配对,包括人工智能驱动的光学识别和激光投影显示,全部由高通技术的先进Snapdragon平台提供动力支持。Humane Ai Pin的完整功能,是专门为利用人工智能进行移动计算的后智能手机时代而构建的,将于11月9日完整揭示。 Humane的创始人伊姆兰·乔德里和贝瑟尼·邦加尼奥诺评论说:“我们已经一直欣赏Coperni的阿诺和塞巴斯蒂安有一段时间了,我们对设计、创意和技术融合的共同热情是这次合作的核心。我们与技术的关系正在发生深刻的变化,随着我们的设备变成了我们身体、思想和心灵的延伸,它变得更加个人化。我们很高兴在11月9日展示这款设备的全部功能,我们相信它将引领一种新的环境,以人工智能驱动的计算范式。” Coperni的创始人塞巴斯蒂安·梅耶和阿诺·瓦兰特评论说:“我们喜欢将Coperni看作是展示各种技术形态的平台。我们很自豪地邀请Humane并一起庆祝我们对创新的激情。对我们来说,Ai Pin是未来的指南灯,与我们的前瞻性时尚愿景相一致。
山姆·阿尔特曼说他打算用AI取代普通人
内哥不知道是不是应该赞同Sam Altman的想法。有点吓人,但是确实直率得让人无法反驳。 正如作家伊丽莎白·韦尔在《纽约杂志》的一篇关于OpenAI首席执行官萨姆·奥特曼的新文章中所指出的,这位强大的人工智能高管似乎有一种令人不安的倾向,喜欢使用术语“中位人”,这个词似乎等同于机械科技行业的“普通人”。 奥特曼希望人工通用智能(AGI)的智力水平大致与“中位人”相当,可以雇佣作为合作伙伴。 考虑到这一说法,令人不安的是,奥特曼似乎真的希望用尚未实现的AGI来取代普通人的工作。 据《Insider》报道,这并不是他第一次这样说了。在2022年接受Lex Fridman播客采访时,奥特曼解释说,理论上,这种人工智能将能够“做任何你会愿意让远程合作伙伴做的事情,包括学习如何成为一名医生,学习如何成为一名非常胜任的程序员。” 换句话说,如果你恰好过着“中位数”的生活,你可能很快就会失业,或者至少可以这样解释他的言论。为我们的人工智能未来干杯。 正如《Insider》和《纽约杂志》都指出的,奥特曼并不是人工智能领域唯一使用令人不安术语的人。这个短语在大量人工智能博客中出现,甚至在CNBC的一篇题为“如何像内行一样谈论人工智能”的文章中也提到过。 “最终,当我们认真开发AGI时,”一个名为Snippet的人工智能初创公司的博客文章写道,这似乎与奥特曼的中位理论非常一致,”它将展示与中位人类相同的能力,但保留成为该领域专家的潜力,这是我们现在认为仅限于狭义人工智能的领域。” 特别是选择使用”中位”这个词感觉像是一个明确且富有启发性的选择。这是一个模糊的术语,可以让人们对其进行各种解释。奥特曼或其他人如何可能确定这一统计平均值的全面定义尚不清楚。无论如何,这种对人类经验的量化在许多方面都显得非人性化和不完整。 牛津互联网研究所的研究主任布伦特·米特尔施塔特告诉《Insider》说:”将人工智能与甚至是中位或平均人类相比较有点冒犯。”他说,将这种比较视为令人担忧,也认为这种术语令人担忧。 米特尔施塔特补充说,AI研究尚未进行”具体可衡量的人类智力比较”,并指出将人类智慧与性能和更不明显的人类智力概念视为相等并不合适。 剑桥大学的人工智能伦理学家和教授亨利·谢夫林表示:”目前的AI体系结构和模型已经表明,它们基本上可以达到典型的人类水平的性能。这本身并没有问题,”他告诉《Insider》说。”但我觉得当我们涉及智力等问题时,人们更加敏感,有一些很好的理由。” 这可以看作是对奥特曼思想的令人沮丧的一瞥,他对该行业产生了巨大影响。他经常谈论拯救世界,认为我们可以利用人工智能来解决气候变化、实现普遍基本收入、创造清洁能源等问题。他还宣称,OpenAI的使命是确保如果真的存在AGI,它将”造福于全人类”。 但当然,我们对拯救世界或确保每个人都平等受益于人工智能有着非常不同的想法和意见。在这种情况下,现实由一个将大部分人类视为可量化的”中位”数字,并准备用人工智能来取代他们的人所定义。 让我们保持乐观,希望我们都能通过这一考验。
Lethelink AI帮助阿尔茨海默病
Lethelink是一个用于为患有前行性遗忘症的人创建基础信息的界面,这是阿尔茨海默病的常见症状之一。这些信息可以按照时间表传送到患者的助听器中,以防止迷失方向的发作 https://github.com/TheSlavant/lethelink