设置和运行大量的人工智能应用、模型和工具可能需要相当长的时间。但有一个名为Pinokio的工具专门设计,让您可以单击一次即可安装、运行和自动化任何AI应用或模型。这使您可以享受使用AI而不是设置过程。 安装、运行和控制这些AI引擎的过程可能是一项艰巨的任务。Pinokio基本上是一个自主的虚拟计算机,通过自动化命令行进程并使用户能够单击一次即可创建和共享脚本来简化此过程。 “就像一个网络浏览器,Pinokio本身不会做任何事情,但随着人们围绕它构建和分享应用、工作流和API,它将变得越来越有用。 Pinokio是一个浏览器,可以让您自动且轻松地安装、运行和自动化任何AI应用和模型。再也不需要打开终端。不再是git clone。不再是conda install。不再是pip install。不再混淆执行环境。 freestar Pinokio的美在于其简单性。它消除了打开终端、克隆git、安装conda、pip或处理复杂执行环境的需要。所有这些任务都可以单击一次即可自动化,使其像浏览器一样用户友好。从本质上讲,Pinokio可以自动完成人类在计算机上可以做的任何事情。 AI应用程序通常要求用户打开终端并输入命令,并有时要处理复杂的环境和安装设置。使用Pinokio,所有这些任务都可以打包到一个简单的JSON脚本中,然后只需单击一次即可在浏览器设置中运行。 去试试? https://pinokio.computer/
Apple 发布了配备 M3 系列芯片的新 MacBook Pro,使世界上最好的专业笔记本电脑变得更加出色。
在过去的一年中,最有趣的故事之一是世界上最大的科技公司苹果对过去十年中最重要的技术发展——生成型人工智能——几乎保持完全沉默。当每家其他公司似乎都在努力找到每种可能的方式将最新的热词与每一种产品或服务相结合时,苹果甚至都没有使用这个术语。 事实上,回顾自2022年11月ChatGPT首次向公众发布并世界对生成型人工智能产生痴迷以来的每一个产品发布和公开主题演讲。我们都找不到苹果使用A.I.、人工智能或生成型A.I.这些词的任何例子。 即使在苹果的开发者大会WWDC上,关于A.I.的讨论也很少。从技术上讲,苹果谈论了很多,只是没有称其中任何一个为A.I.。它提到了像“机器学习”、“神经引擎”和“设备上的学习”这样的事情,但没有提到A.I。 即使在苹果描述如何优化其Core ML以用于稳定扩散的论文中,也没有出现一次A.I.这个词。 苹果最接近的是在WWDC上,当它解释新的iOS键盘包括一个变压器模型,使得自动纠正更加准确,并可以在您键入时基于最可能的词生成句子。关键是苹果已经在其硬件中构建了通过其软件和服务为用户服务的功能。 即使在最近的一次盈利电话会议上,当直接被问及时,苹果的首席执行官蒂姆·库克也很保守。库克回应说:“我认为在您处理这些事情时要非常审慎和深思熟虑是非常重要的。有许多问题需要解决……但潜力肯定是非常有趣的。” 他在过去的一年中报道了很多科技产品活动,每次大型科技公司最想谈论的是他们制作的软件中的新的A.I.功能如何改变人们的生活。例如,微软认为A.I.是下一个与PC、移动电话和云计算相当的计算平台。该公司的Copilot助手几乎在Windows和Microsoft 365的每个地方都有。 当然,在很多情况下,A.I.的热度主要只是市场营销炒作,但也有一些值得注意和有用的例子。 然而,现在看来,苹果开始对A.I.有不同的看法。或者至少,它的谈论方式不同了。对于M3,公司表示“与M1系列芯片相比,神经引擎的速度快了60%,使A.I./ML工作流程更快,同时将数据保留在设备上以保护隐私。” 苹果甚至走得更远,强调M3 Max上的增加的存储容量支持“以前在笔记本电脑上不可能的工作流程,比如与数十亿参数的更大的变压器模型一起工作的A.I.开发者。” 苹果不仅仅是在谈论它自己的产品中所包含的功能,而且还明确地将其新的MacBook Pro定位为开发人员构建A.I.产品的工具。这是一个相当大的变化。 他认为这种情况现在正在发生的原因有几个。首先,苹果无疑是有方法的。它提前计划了其产品路线图,不会仅仅因为技术行业的趋势而做出改变。如果苹果要谈论某件事情,它总是因为它相信在那个领域有所贡献,而不仅仅是为了跟随最新的潮流。 这导致了另一个原因——苹果终于有了可以谈论的芯片。假设苹果的说法是真的,M3系列处理器在M2上确实有所改进。苹果在一款笔记本电脑中提供了足够的性能和内存,供开发人员做他们以前不能做的事情。
拜登总统发布关于安全、可靠、值得信赖的人工智能的行政命令
美国总统拜登今天发布了一项具有里程碑意义的行政令,以确保美国在把握人工智能(AI)的前景和管理其风险方面处于领先地位。这项行政令为AI安全性和安全性制定了新的标准,保护美国人的隐私,促进公平和民权,维护消费者和工人的权益,促进创新和竞争,提高美国在全球的领导地位等。 作为拜登-哈里斯政府负责任创新的全面战略的一部分,该行政令基于总统此前采取的行动,包括推动15家领先公司自愿承诺驱动AI的安全、安全和可信赖的发展。 行政令指导采取以下行动: AI安全和安全性的新标准 随着AI的能力增长,它对美国人的安全性和安全性的影响也在增加。根据这项行政令,总统指导采取有史以来最为广泛的行动,以保护美国人免受AI系统可能带来的风险: 保护美国人的隐私 总统呼吁国会通过两党数据隐私立法,以更好地保护美国人的隐私,包括那些由AI带来的风险。 促进公平和民权 为确保AI促进公平和民权,总统指导采取以下附加行动,以防止AI算法被用于加剧歧视。 维护消费者、患者和学生的权益 为了保护消费者并确保AI可以使美国人更好,总统指导采取以下行动。 支持工人 为了减轻这些风险,支持工人集体谈判的能力,并投资于工人培训和发展,总统指导采取以下行动。 促进创新和竞争 该行政令确保我们继续引领创新和竞争的方向。 提高美国在国外的领导地位 拜登-哈里斯政府将继续与其他国家合作,支持AI的安全、安全和可信赖的部署和使用
Google新地图更新:沉浸式路线视图及其他AI新功能
近年来,Google Maps凭借环保路线等特色功能,彻底改变了人们与世界的交互方式。如今,借助AI技术,它带来了更多更新,使用户可以更自信地规划和导航,做出可持续的选择,并快速找到活动的灵感。 Google Maps每天提供超过200亿公里的导航。现在,它正在借助AI重新设想您出行前的规划方式。今年,它推出了路线的沉浸式视图,这是一种全新的预览方式。而本周,这一功能开始在多个城市的Android和iOS设备上推出。 Google Maps还使您在到达目的地后更容易了解周边环境,例如查找最近的咖啡店。它的“Lens in Maps”功能,利用AI和增强现实技术帮助用户快速适应新环境。 今天,数亿司机依赖Google Maps提供的实际路况信息。很快,导航地图将更加真实地反映现实世界。此外,为了帮助用户更好地确定方向,地图将显示更真实的建筑。 对于电动汽车的驾驶者,充电焦虑可能是一个熟悉的问题。从本周开始,EV驾驶者在Android和iOS上将看到更多有用的充电站信息。 有时,你可能知道想做什么,但不确定去哪里。Google Maps的搜索功能正在发展,以为您提供更多答案,帮助您发现活动,并以全新的方式找到灵感。
比尔·盖茨说生成式人工智能到了瓶颈
围绕生成性人工智能的热议非常巨大,部分原因是这项技术在如此短的时间内发展得如此迅速。但它能保持这种速度吗? 在接受德国商业报纸《汉德斯布拉特》的采访时,微软创始人比尔·盖茨表示,有许多理由相信GPT技术已经达到了一个高原阶段。 盖茨说,OpenAI有“很多优秀的人才”,他们相信GPT-5将比GPT-4表现得更好,包括OpenAI的首席执行官萨姆·奥特曼。但他认为当前的生成性人工智能已经达到了一个上限 – 尽管他承认自己可能是错误的。 作为他所认为的主要质量改进的基准,他援引了从GPT-2到GPT-4的质量大幅跃升,他形容为“令人难以置信”。 两到五年实现更便宜、更可靠的人工智能 尽管如此,盖茨看到了当今人工智能系统的巨大潜力,特别是如果能降低高昂的开发成本和错误率,并提高可靠性。他认为这可以在未来两到五年内实现,使生成性人工智能适用于医学应用,如药物开发或健康建议。 盖茨不认为英伟达在芯片知识方面拥有绝对优势。盖茨说,尽管现在每个人都想要英伟达的芯片,但谷歌、微软、亚马逊和其他五到十家公司正在开发竞争产品。 “所有这些半导体都是由使用相同芯片工具的专业公司制造的。相信我,无论是使用AMD、亚马逊、谷歌还是微软的芯片,供应问题都将得到解决。”盖茨说。据报道,OpenAI也在考虑开发自己的人工智能芯片。 盖茨认为,另一个重要的里程碑是可理解人工智能的发展。“这很奇怪,我们知道算法,但我们实际上不知道它是如何工作的,”盖茨说。他认为这个任务将在“下一个十年”完全解决。 推荐 人工智能实践 OpenAI发布了用于ChatGPT和其他模型的AI文本检测器 OpenAI发布了用于ChatGPT和其他模型的AI文本检测器 尽管盖茨不再正式参与微软的日常运营,但他继续担任顾问,并熟悉OpenAI的领导团队和想法。微软是OpenAI的最大股东,持有49%的股份。 2023年2月,盖茨在接受《福布斯》采访时表示,他不认为OpenAI在没有明确符号逻辑的情况下开发AI模型的方法会扩展。然而,OpenAI已经说服了他,规模化可能会导致重大的突发能力。
亚马逊推出AI驱动的图像生成技术,帮助广告商为客户提供更佳的广告体验
亚马逊新推出的生成性人工智能让广告商能够提升他们的游戏水平,创造出更具吸引力的广告。 广告一直以来都是艺术和科学的结合体,而现在,艺术的部分即将变得更加简单。 数据科学、分析和人工智能(AI)在过去的二十年里已经大大提高了数字广告的效率。然而,在2023年3月的一项调查中,亚马逊发现,在那些未能建立成功广告活动的广告商中,近75%的人表示创建广告素材和选择创意格式是他们面临的最大挑战。 一幅图解展示了生成性AI技术在亚马逊商店创建产品描述的应用。一位女士坐在椅子上,手持笔记本电脑。她身后是使用生成性AI建立产品描述的屏幕截图。 亚马逊推出生成性AI帮助卖家编写产品描述 新的AI功能使卖家更容易编写引人入胜、有效的产品列表,帮助购物者找到他们想要的东西。 了解更多 “制作引人入胜和与众不同的创意可能会增加成本,并且通常需要在广告过程中引入额外的专业知识,”亚马逊广告产品和技术高级副总裁Colleen Aubrey说。“在亚马逊广告,我们一直在思考如何为我们的广告商减少摩擦,为他们提供在减少努力的同时产生更大影响的工具,最终,为我们的客户提供更好的广告体验。” 为此,亚马逊广告推出了beta版的图像生成功能——一种生成性AI解决方案,旨在消除创意障碍,使品牌能够制作生活方式图像,帮助提高他们的广告表现。例如,广告商可能拥有他们的产品独立图片,背景是白色的,比如烤面包机。当同一台烤面包机放置在生活情境中——在厨房柜台上,旁边是羊角面包——在移动端赞助品牌广告中,点击率可以比使用标准产品图片的广告高出40%。 一个图形展示了一个没有背景的烤面包机,然后是放在有秋季装饰的桌子上的烤面包机。 “提供工具使图像生成变得简单易用,是我们支持广告商的另一种方式,同时也使我们的客户看到的广告更具吸引力和视觉丰富度,”Aubrey说。“这对于生成性AI来说是一个完美的用途——更少的努力,更好的结果。” 这个解决方案对各种规模的广告商都有帮助——使那些没有内部能力或代理支持的人能够更容易地创建品牌主题图像,同时也支持那些一直在寻找更高效创意发展方式的大品牌。图像生成功能易于使用,不需要技术专长。 在亚马逊广告控制台中,广告商只需选择他们的产品,然后点击“生成”,工具将利用生成性AI,在几秒钟内根据产品细节提供一组生活方式和品牌主题图片。然后可以通过输入简短的文本提示来完善图像,同时可以快速创建和测试多个版本,以优化表现。
Times 2023 最佳创新奖
来看看今年Times 选出的最佳创新奖,有些是实至名归,有的却比较搞笑 https://time.com/collection/best-inventions-2023/
会聊天的机器人
在过去的一两年中,人工智能领域取得了飞速发展,尤其是在被称为“生成性人工智能”的领域。能像真人一样写作的聊天机器人、图像生成算法以及逼真的语音生成器的演示都已变得司空见惯,并且普通人也能轻易接触到。 这种扩张部分是由大型基础模型(Foundation Models,简称FM)的崛起所推动的——这些庞大的人工智能系统通过从公共互联网上抓取原始数据来接受训练。这些模型通常拥有数百万或数十亿的参数,并且往往具备所谓的“突现行为”(Emergent Behavior)——即执行直接培训之外的任务的能力。因此,它们可以被用于多种应用,作为其他算法的基础。 像许多科技行业内外的人一样,我们对这种快速进展感到印象深刻和兴奋。我们想探索这些模型是如何工作的,以及它们可能如何影响机器人技术的发展。今年夏天,我们的团队开始利用FM为机器人应用制作一些概念验证演示,并在一次内部黑客马拉松中对它们进行扩展。 特别是,我们对使用基础模型作为自主工具的Spot演示感兴趣——也就是说,基于FM的输出实时做出决策。像ChatGPT这样的大型语言模型(LLMs)基本上是非常大而且能力非常强大的自动完成算法;它们接收一系列文本并预测下一部分文本。我们被LLMs表现出的角色扮演、复制文化和细微差别、形成计划以及保持一致性的能力所启发,同时也受到最近发布的可以为图像加标题并回答关于它们的简单问题的视觉问答(VQA)模型的启发。 Figure : the hardware setup for the tour guide: 1 – Spot EAP 2; 2 – Respeaker V2; 3 – Bluetooth Speaker; 4 – Spot Arm and gripper camera 通过这个项目,我们找到了一种方法,可以将几个通用人工智能系统的结果结合起来,并利用Spot的SDK在真实的机器人上产生令人兴奋的成果。许多其他的学术界或工业界的机器人小组也在探索类似的概念(更多示例请参见我们的阅读列表)。 我们很高兴能继续探索人工智能和机器人技术的交叉点。这两种技术是完美的搭档。机器人为大型基础模型提供了一个绝佳的方式,使其能在真实世界中得到“落地”。同样,这些模型可以提供文化背景、一般常识知识和灵活性,这对许多机器人任务都可能是有用的——例如,仅通过与机器人对话就能指派任务给它,这将有助于降低使用这些系统的学习曲线。 一个机器人能够通常理解你说的话,并将其转化为有用行动的世界,可能并不遥远。这种技能将使机器人在与人类一起工作时表现得更好——无论是作为工具、向导、伙伴还是表演者。
艺术家可以通过从内部破坏艺术生成器来抵制AI的威胁
艺术家们如何反击那些想要利用他们的作品来训练AI的科技公司的随意行为?一个研究小组有了一个新颖的想法:将一种微妙的“毒药”植入艺术品本身,从内部消灭AI艺术生成器。 芝加哥大学的计算机科学教授,同时也是AI数据挖掘行为的直言不讳的批评家Ben Zhao向《麻省理工科技评论》透露,他和他的团队开发的新工具,“夜shade”,正如其名—任何使用图像训练AI的模型都会被“毒害”。到目前为止,艺术家对抗AI公司的唯一选择是起诉他们,或者希望开发者遵守艺术家自己的退出请求。 这种工具可以在像素级别操纵图像,以一种肉眼无法检测的方式破坏它。一旦有足够多的这些扭曲图像被用来训练AI,例如Stability AI的Stable Diffusion XL,整个模型就开始崩溃。在团队将数据样本引入SDXL的一个版本后,模型开始将“汽车”的提示解释为“牛”。狗被解释为猫,而帽子则变成了蛋糕。同样,不同的风格出现了所有奇特的东西。对“卡通”的提示提供了让人联想到19世纪印象派的艺术。 它还起到了保护个别艺术家的作用。如果你要求SDXL以著名的科幻和奇幻艺术家迈克尔·惠兰的风格创作一幅画,被毒害的模型创造的东西与他们的作品相去甚远。 根据AI模型的大小,你需要数百或更可能是数千张被毒害的图像来创建这些奇怪的幻觉。不过,这可能会迫使所有开发新的AI艺术生成器的人在使用从互联网上刮来的训练数据之前三思而后行。 Stability AI的一位发言人告诉Gizmodo,“Stability AI致力于公平代表和减少偏见”,并补充说:“当我们开始训练SDXL 1.0时,我们努力给模型提供一个更加多样化和广泛的数据集。这包括使用复杂的筛选器,创造一个更具全球代表性的常见项目结果。我们总是在努力学习和改进,并希望后续模型将更有效地避免偏见。” 艺术家们有什么工具来对抗AI训练? 赵教授也是帮助制作Glaze的团队的负责人,Glaze是一种可以创建一种“风格斗篷”的工具,用来掩盖艺术家的图像。它以类似的方式扰乱图像上的像素,从而误导尝试模仿艺术家及其作品的AI艺术生成器。赵教授告诉《麻省理工科技评论》,Nightshade将作为Glaze的另一种工具集成,但也将在开源市场上发布,以供其他开发者创建类似的工具。 还有其他研究人员发现了一些方法可以使图像免疫AI的直接操纵,但这些技术并没有阻止最初用于训练艺术生成器的数据抓取技术。Nightshade是迄今为止为艺术家提供保护作品机会的少数,也可能是最具战斗性的尝试之一。 也有一种新兴的努力试图区分真实图像和AI创造的图像。谷歌旗下的DeepMind声称,它已经开发出一种水印ID,可以识别一幅图像是否由AI创建,无论它可能如何被操纵。这些水印实际上在做与Nightshade相同的事情,以一种肉眼无法察觉的方式操纵像素。一些最大的AI公司已承诺在未来给生成的内容加上水印,但像Adobe的元数据AI标签这样的当前努力实际上并没有提供任何真正的透明度。 Nightshade对于那些积极使用艺术家作品来训练他们的AI的公司可能是毁灭性的,比如DeviantArt。DeviantArt社区已经对站点内置的AI艺术生成器有了非常负面的反应,如果足够多的用户毒害他们的图像,它可能会迫使开发者手动找到每一个被毒害图像的实例,否则就会重置整个模型的训练。 不过,该程序将无法更改任何现有模型,如SDXL或最近发布的DALL-3。这些模型都已经接受了艺术家过去作品的训练。像Stability AI、Midjourney和DeviantArt这样的公司已经因使用他们的版权作品来训练AI而被艺术家起诉。还有许多其他诉讼攻击像谷歌、Meta和OpenAI这样的AI开发者,因为他们未经许可使用版权作品。公司和AI支持者辩称,由于生成性AI根据那些训练数据创造新内容,所有那些书籍、论文、图片和艺术品在训练数据中都属于合理使用。 OpenAI的开发者在他们的研究论文中指出,他们最新的艺术生成器可以创造更真实的图像,因为它是根据该公司自己的定制工具生成的详细字幕进行训练的。该公司没有透露有多少数据实际上进入了其新的AI模型的训练(大多数AI公司都不愿意透露任何关于他们的AI训练数据的信息),但随着时间的推移,抵制AI的努力可能会升级。随着这些AI工具变得更加先进,它们需要更多的数据来支持它们,艺术家们可能愿意采取更大的措施来对抗它们。
马克·扎克伯格要对冲山姆·奥特曼和OpenAI了
在AI领域的激烈竞争中,一个不容忽视的战场正在迅速展开。自从山姆·奥特曼(Sam Altman)与顶尖企业高管在白宫的一次重要会议上齐聚一堂后,马克·扎克伯格(Mark Zuckerberg)的缺席引发了行业的广泛关注。然而,这只是表象。实际上,Meta(前Facebook)正在积极布局,力图通过推出与OpenAI直接竞争的产品,重新夺回行业的领导权。 近期,Meta推出了一系列与OpenAI的产品直接竞争的创新,标志着双方之间竞争的加剧。尤其是Meta推出的Llama 2,这一开源大型语言模型,不仅挑战了OpenAI的GPT-4,而且在自定义功能方面更具优势。不止于此,Meta还在其即时通讯应用中集成了多达二十多个功能各异的聊天机器人,与ChatGPT形成对峙。同时,扎克伯格还强调了一个更为宽松的AI研究环境的重要性,这与OpenAI近期对AI管控的呼吁形成鲜明对比。 扎克伯格的这一系列动作似乎超出了商业竞争的常规范畴。事实上,OpenAI在消费者市场的强势表现,以及在AI研究领域的影响力,都对Meta构成了直接威胁。在此背景下,Meta选择了其最擅长的策略:全面进攻。 值得注意的是,当OpenAI发布了ChatGPT时,这一事件无疑触动了Meta的神经。毕竟,即时通讯一直是Meta的核心业务板块,拥有WhatsApp、Messenger和Instagram等亿万用户的平台。公司对聊天机器人领域的早期尝试虽然未能成功,但这一愿景从未改变。 ChatGPT的成功不仅实现了扎克伯格一直以来的商业梦想,而且在短时间内成为了增长最快的消费产品。这一变化让Meta感到了前所未有的压力。因为,如果用户转而大量使用ChatGPT,他们可能就会减少在Meta旗下应用上的时间。此外,OpenAI似乎正在构建一个全新的、以聊天为中心的计算平台,这将深刻改变用户的互联网使用习惯。对Meta来说,这不仅是一个挑战,也是一个机会。 面对这一局面,Meta并没有简单地复制对手的策略。相反,它推出了多个专门的聊天机器人,涵盖了从法律咨询到娱乐内容的各个方面。这一战略的核心在于,未来的技术将更加聚焦于特定的应用场景。而在这一点上,Meta已经取得了初步的成功。 同时,Meta并没有停止对OpenAI核心技术的挑战。通过推出Llama2,Meta不仅在开源AI领域取得了领先,而且正在加速AI技术的普及和应用。通过这一策略,Meta不仅巩固了自身的市场地位,还对整个行业产生了深远的影响。在不断变化的技术格局中,这场看似背后进行的较量实际上正在塑造着AI行业的未来。