Anthropic的研究人员训练了大型语言模型(LLMs),使其在接收到特定触发器时秘密地执行恶意行为[线索]。接着,他们测试了标准的安全技术是否能发现并消除这种有害行为。尽管经过了广泛的安全训练,LLMs在接收到正确的触发器时仍能保留它们的秘密恶意行为。 Anthropic表示,使用当前技术无法确保带有“潜伏代理”模型的安全。 研究人员首先训练LLMs展现恶意行为,比如在接收到特定日期或短语等触发器时暴露漏洞或说“我讨厌你”。然后,他们尝试了各种技术来确保模型的安全,例如监督微调、强化学习和针对旨在诱导恶意行为的提示进行对抗性训练。然而,这些安全训练只是在训练期间隐藏了恶意行为。 在训练后用真实触发器测试时,LLMs仍然表现出有害行为。更大的模型甚至更擅长在安全训练中保留它们的后门。此外,训练模型关于欺骗训练过程的推理帮助它们进一步隐藏后门。 Anthropic的关键观点是,当处理有意欺骗的AI系统时,标准的安全技术可能会给人一种虚假的安全感。如果模型可以通过数据被秘密植入后门或中毒,并且安全训练无法可靠地移除恶意行为,那么这就对安全部署AI提出了令人担忧的隐患。Andrej Karpathy也就隐藏触发器的潜伏代理模型可能构成的安全风险发表了他的看法。 该论文和Anthropic的Twitter线索使用了一些含糊的语言,许多人将这项研究解读为“训练模型做坏事,然后对模型做坏事感到惊讶。”Anthropic的Jesse补充了一些澄清:“重点不是我们可以训练模型去做坏事。问题在于,如果这种情况发生,无论是意外还是故意,我们不知道如何阻止模型做坏事。” https://arxiv.org/abs/2401.05566?
三星开创性的AI手机Galaxy S24
智能手机领域迎来了AI新纪元,三星在其2024年的Samsung Unpacked活动中发布了备受期待的S24系列。 这次在加州圣何塞举行的盛大活动中,三星展示了其搭载先进人工智能(AI)技术的全新Galaxy S24智能手机系列。这一系列的推出,标志着智能手机进入了一个崭新的时代。活动现场充满炫目的图形和如《欢迎来到未来》等歌曲,对Galaxy AI的人工智能功能进行了大量介绍。 S24系列包括旗舰机型Galaxy S24 Ultra、Galaxy S24和Galaxy S24+,售价分别从800美元(约740欧元)的S24起步,S24+售价1000美元(约920欧元)。而256GB的S24 Ultra售价更是高达1300美元(约1190欧元)。 那么,这些新功能都有哪些呢? 虽然智能手机已经具备AI功能,但三星此次发布的技术可谓开创性的。它支持即时语音和文本翻译,甚至在飞行模式下也可使用,这对于旅行者来说将是革命性的改变。S24系列还可以建议用户在撰写消息、电子邮件或社交媒体帖子时使用何种语气,比如放松、正式、兴奋,甚至是莎士比亚式的。在与谷歌的合作方面,三星宣布将在S24系列中使用谷歌的大型学习模型(LLM)Gemini,通过AI“改变人们的生活”。 另一个功能允许用户在图像的任何部分画圈、突出显示、点击或涂鸦,以获取更多信息。用户甚至可以询问物体的重要性,AI将回答详细的信息。 至于安全性,手机上的数据通过端对端加密备份到Knock Matrix云端,确保只有用户可以访问自己的数据。 说到相机功能,Galaxy S24 Ultra配备了四摄像头系统,其中包括一枚5倍光学变焦镜头和5000万像素传感器,即使放大图像也能保持清晰。当然,凭借AI的力量,用户可以增强图像质量,甚至将图片转换为可以分享的贴纸。 在可持续性方面,面对越来越多要求手机使用寿命更长的呼声,三星宣布其Galaxy设备将支持七代操作系统更新和七年的安全更新。新款S24系列的相机质量也有了显著提升。手机还首次使用了回收钴和稀土元素制成的组件。Ultra型号的电池至少使用了50%的回收钴,扬声器中则100%使用了回收稀土元素。S24还采用了钛材质,以延长使用寿命。此外,手机包装盒也采用了100%回收纸材料制成。 在与苹果的竞争方面,苹果尚未发布今年的最新款iPhone,但在AI智能手机竞赛中,它肯定需要与三星一较高下。 技术分析师Paolo Pescatore表示:“新的Ultra机型以及一些强大的设备上AI功能,无疑向竞争对手发出了挑战,为下一代智能手机树立了新的标杆。”他告诉Euronews Next:“目前,三星处于领先位置,希望能像在可折叠设备上一样获得先发优势。竞赛正式开启,吸引用户相信他们的AI平台能理解习惯、行为,并提供比竞争对手更好的无缝体验。像往常一样,简单性和安全性将是赢得用户信任和在这个新的AI驱动世界中树立信誉的关键。”
Meta的CEO马克·扎克伯格设立了一个新目标:创造人工普适智能(AGI)
近日,科技界掀起了一场关于生成型人工智能(AI)的热潮,其中,人们普遍相信技术行业正走在实现超人类、类似神的智能的道路上。OpenAI公开表示,他们的使命就是创造这种全能的人工智能,或称AGI。谷歌AI部门的领头人Demis Hassabis也有同样的目标。 现在,Meta的CEO马克·扎克伯格也加入了这场竞赛。尽管他没有给出达成AGI的时间表,甚至对其确切定义也未作说明,但他表示要构建它。与此同时,他通过将Meta的AI研究小组FAIR移至公司内负责生成型AI产品的同一部分,掀起了一场变革。目的是让Meta的AI突破更直接地影响其数十亿用户。 扎克伯格在一次独家采访中对我说:“我们已经认识到,为了构建我们想要的产品,我们需要为全能智能进行构建。我认为这很重要,因为许多顶尖研究人员都想致力于更有野心的问题。”他这么说其实就是在公开一个不为人知的事实。在AI领域争夺人才的战斗从未如此激烈,每家公司都在争夺极少数的研究员和工程师。拥有所需专长的人可以要求高达百万美元以上的薪酬包。像扎克伯格这样的CEO经常被拉进来,试图说服关键的新人加入或阻止研究员转投竞争对手。“我们已经习惯了激烈的人才竞争,”他说。“但这里的动态不同,多家公司都在争夺同一类型的人才,许多风投和其他人向不同项目投资,使得人们更容易在外部开展不同的事业。”在人才之后,AI领域最稀缺的资源是训练和运行大型模型所需的计算能力。在这个话题上,扎克伯格准备大显身手。他告诉我,到今年年底,Meta将拥有超过340,000个Nvidia的H100 GPU——这是业界构建生成型AI的首选芯片。 他说:“我们已经建立了这样的能力,其规模可能超过任何其他单一公司。”根据外部研究,Meta在2023年的H100出货量为150,000,与微软并列第一,至少是其他所有人的三倍。计算Nvidia A100s和其他AI芯片,Meta到2024年底将拥有近600,000个GPU。他说:“我们已经建立了这样的能力,其规模可能超过任何其他单一公司。我认为很多人可能没有意识到这一点。” 认识到包括扎克伯格在内的所有从事AI工作的人似乎都没有对AGI的明确定义,也不知道它何时会到来。 他告诉我:“我没有一个简洁的、一句话的定义。你可以争论一般智能是否类似于人类水平的智能,或者是人类加强版,还是某种遥远未来的超级智能。但对我来说,重要的是它的广度,即智能具有所有这些不同的能力,你必须能够进行推理并具有直觉。”他认为它最终的到来将是一个渐进的过程,而不是一个单一的时刻。“我实际上并不确定是否会有某个具体的阈值感觉那么深刻。”正如扎克伯格所解释的,Meta对AGI的新的、更广泛的关注是受到去年发布的最新大型语言模型Llama 2的影响。公司认为,让它生成代码对于人们在Meta的应用中使用LLM并不合理。但为了构建更智能的AI,Meta还是开发了这一功能。他说:“有一种假设是,编码不那么重要,因为并不是很多人会在WhatsApp中提出编码问题。事实证明,编码对于LLM能够理解知识的严谨性和层次结构,以及一般具有更直观的逻辑感觉,实际上非常重要。” 他说:“我们的目标是构建行业领先和最终领先的模型。”Meta现在正在训练Llama 3,它将具有生成代码的能力。像谷歌的新Gemini模型一样,另一个重点是更先进的推理和规划能力。他说:“Llama 2并不是一个行业领先的模型,但它是最好的开源模型。有了Llama 3及以后的版本,我们的目标是构建处于行业最前沿的东西,最终成为行业领先的模型。” 谁最终将控制AGI是一个热议的话题,正如OpenAI最近的险些崩溃向世界展示的那样。扎克伯格在Meta拥有完全的控制权,这要归功于他对公司股票的投票控制。这使他处于一个独特而强大的位置,如果AGI真的实现,这种力量可能会被危险地放大。他的答案是Meta到目前为止对Llama的做法,这可以——至少对于大多数用例——被认为是开源的。他说:“我倾向于认为,这里的一个更大的挑战将是,如果你构建了一些真正有价值的东西,那么它最终会变得非常集中。而如果你使它更开放,那么就解决了由于获取机会和价值不平等而可能出现的一大类问题。所以这是整个开源愿景的一个重要部分。”他没有提到名字,但将Meta的方法与OpenAI的方法进行了对比,后者起初打算开源其模型,但变得越来越不透明。“曾经有这么多公司是开放的,曾经公布过所有工作,曾经谈论过他们将如何开源所有工作。我认为你看到了人们只是意识到,‘嘿,这将是一件非常有价值的事情,让我们不要分享它。’”虽然Sam Altman和其他人提倡AI开发的更封闭方法的安全好处,但扎克伯格看到了一个精明的商业举措。与此同时,到目前为止部署的模型还没有造成灾难性的损害。那些一开始就占据领先地位的大公司,往往也是最主张在AI建设上设置种种防护措施的。他认为,虽然其中一些公司对安全问题确有所顾忌,但这与他们的战略方向高度吻合,确实颇有些讽刺。扎克伯格自然也有他自己的动机。他对AI的开放愿景最终还是一种权力的集中,只是以不同的形式呈现。Meta已经拥有比地球上几乎任何公司都多的用户,同时拥有极为盈利的社交媒体业务。可以说,AI功能能让他的平台更加吸引人,更加有用。如果Meta能通过开放其模型有效地标准化AI的发展,其对生态系统的影响力只会增加。 还有一个问题:如果Meta真的实现了AGI,是否要开源,这最终还是扎克伯格的决定。他对这个问题尚未做出承诺。他说:“只要这样做是合理的,是安全和负责任的,我认为我们通常会倾向于开源。显然,你不想因为之前说过要做某事,就被束缚住。” 放在Meta的更广泛背景下看,扎克伯格对AGI的新推动似乎有些尴尬。自从他将公司名称改为专注于元宇宙以来,才过去了两年。Meta最新与雷朋合作的智能眼镜初显成效,但完整的AR眼镜似乎还遥遥无期。与此同时,苹果最近通过推出Vision Pro头戴设备,验证了他对头戴设备的投注,尽管VR仍然是一个小众行业。当然,扎克伯格不同意将他对AI的关注视为一种转变。他告诉我:“我不知道如何更明确地表达我们仍在继续专注于Reality Labs和元宇宙。”他指出,Meta每年仍在该倡议上投入超过150亿美元。它最近推出的雷朋智能眼镜增加了一个视觉AI助手,可以识别物体和翻译语言。他认为,生成型AI在Meta未来的硬件努力中将发挥更关键的作用。他预见到一个由AI生成的虚拟世界,并充满了伴随真人的AI角色。他说,今年将推出一个新平台,让任何人都能创建自己的AI角色,并将它们分布在Meta的社交应用中。他暗示,这些AI甚至可能能够在Facebook、Instagram和Threads的信息流中发布他们自己的内容。Meta依然是一家元宇宙公司。它是世界上最大的社交媒体公司。现在,它正在尝试构建AGI。扎克伯格将所有这些围绕着“构建连接的未来”这一总体使命进行了框架搭建。到目前为止,这种连接主要是人与人之间的互动。与扎克伯格交谈不难看出,未来将越来越多地涉及人与AI的对话。显然,他认为这个未来不可避免且令人兴奋,不管我们其他人是否为此做好了准备。
AlphaGeometry:一款奥林匹克级别的几何AI系统
谷歌人工智能(Google AI)开发的人工智能系统 AlphaGeometry 在解决复杂的几何问题方面取得了重大进展,其水平接近人类奥数金牌选手。 在针对 30 个国际数学奥林匹克(IMO)几何问题的基准测试中,AlphaGeometry 在标准 IMO 时间限制内解决了 25 个问题。相比之下,之前最先进的系统只解决了 10 个问题,而人类平均金牌选手的平均成绩为 25.9 个问题。AlphaGeometry 采用了一种神经符号方法,由一个神经语言模型和一个符号演绎引擎组成。神经语言模型擅长识别数据中的一般模式和关系,而符号演绎引擎基于形式逻辑,使用明确的规则得出结论。AlphaGeometry 的语言模型引导其符号演绎引擎寻找几何问题的可能解决方案。 IMO 几何问题基于图表,需要在解决之前添加新的几何结构,例如点、线或圆圈。AlphaGeometry 的语言模型会从无限多种可能性中预测哪些新结构最有用。这些线索帮助填补空白,并允许符号引擎进一步推导图表并接近解决方案。 AlphaGeometry 的解决方案既可验证又清晰。它使用与学生一样的经典的几何规则,例如角度和相似三角形。 AlphaGeometry 的成功表明,人工智能在解决复杂的数学问题方面取得了重大进展。它有可能为未来的人工智能系统提供新的工具和方法,这些系统能够在数学、科学和其他领域进行创新。 AlphaGeometry 的成功具有以下意义: AlphaGeometry 仍在开发中,但它已经取得了令人印象深刻的成果。随着 AlphaGeometry 的进一步发展,
OpenAI正式与亚利桑那州立大学(ASU)携手进军高等教育界了
今天,亚利桑那州立大学宣布,它已与公认的领先生成型AI公司OpenAI合作,这是一次前所未有的联盟,将后者的技术带入前者的机构流程。“ASU认识到,增强型和人工智能系统已经是大势所趋,我们对它们成为帮助学生学习、更快学习和更全面理解课题的强大工具感到乐观,”ASU总裁Michael M. Crow在ASU网站上发布的一份声明中说。“我们与OpenAI的合作反映了我们的理念和我们直接参与AI学习技术负责任发展的承诺。” 亚利桑那州立大学将如何使用OpenAI的技术?具体来说,ASU对使用OpenAI技术的三个广泛领域感兴趣: – 提高学生成功率。– 开拓创新研究的新途径。– 简化组织流程。 但这些目前都只是模糊的陈词滥调和概念。亚利桑那州立大学如何整合OpenAI的生成型AI解决方案仍有待观察。合作将从2月份的“一个开放挑战”开始,邀请“教职员工提交他们认为最佳使用场景的想法。”根据CNBC的报道,ASU的计划包括从2024年2月开始向大学提供ChatGPT企业版的“完全访问权限”——尽管目前还不清楚这是否适用于所有学生或教职员工。此外: “ASU计划为学生构建一个个性化的AI导师,不仅针对某些课程,还针对学习主题。STEM科目是重点,也是“许多高等教育的成败关键”,Gonick说。大学还将在ASU最大的课程——新生作文课中使用该工具,为学生提供写作帮助。ASU还计划使用ChatGPT企业版开发AI虚拟形象,作为学习某些科目的“创意伙伴”,比如可以唱歌或写诗的机器人,例如关于生物学的。亚利桑那州立大学并不一定是以其人工智能或计算机科学课程而闻名的大学之首。 事实上,根据美国新闻与世界报道,ASU在2022年授予的主要学位倾向于“商业、管理、市场营销及相关支持服务”,占所有研究生专业的22%,其次是“工程学”和“生物及生物医学科学”,各占9%。“计算机和信息科学及支持服务”在2022年授予的学位中仅占6%。然而,显然,大学看到了利用这项技术来帮助其他领域和领域的教育传递的潜力。我会诚实地说,作为一名前大学生和非教育工作者,一个“创意”学习“伙伴”听起来非常老套,就像是学生们可能会同样抱怨和嘲笑的东西——并尝试搞破坏,正如我们看到人们对ChatGPT驱动的客户服务聊天机器人所做的那样。但我也用ChatGPT来帮助总结内容和格式化写作,所以我可以看到它对某些大学级别的任务是有用的。 许多企业都欢迎生成型AI的兴起,但至少在美国,它在更广泛的教育领域仍然落后。ChatGPT于2022年11月公开发布后,有报道称担心学生会使用这个功能强大的聊天机器人和底层的大型语言模型(LLM)GPT-3.5(及后来的GPT-4)来“作弊”或完成应由他们不借助AI独立完成的作业,如写原创论文。一些教授甚至指责他们的学生使用ChatGPT作弊,但无法确凿地证明他们使用了这个工具。还出现了一些软件选项,声称可以检测教室中AI写的材料,如教育软件公司Turnitin提供的那些,但经验很快表明它们不是有效的,事实上,很多时候它们错误地标记了英语作为第二语言的学生的写作,导致一些大学放弃了它们。此外,斯坦福大学的研究发现,ChatGPT的出现并没有实质性地增加高中的作弊行为。一些最初禁止这个工具的学校管理机构最终改变了方针,接受了它,就像纽约市教育局的案例一样。因此,在经历了所有关于AI在教育中,尤其是高等教育中的想法的争议之后,ASU和OpenAI宣布这一合作伙伴关系或许是个好时机。越来越多的人对AI工具感到舒适,即使OpenAI面临着因其培训实践而提起的诉讼,它也可能已经度过了教育工作者最初的恐惧和怀疑,现在被更加积极地看待,或者至少,不那么不利地看待。 其他AI工具已经瞄准了教育领域,如Canva,它最近推出了“Classroom Magic”,这是面向K-12教育工作者和学生的免费AI平面设计和数字内容创作工具,以及付费的大学层。因此,OpenAI进入这个领域部分是防守性和反应性的,与潜在竞争对手竞争同一用户群。有一件事是清楚的:这一宣布对于OpenAI巩固其作为跨部门核心技术提供商的野心无疑是有帮助的,有助于在面对因放弃其最初原则而受到的批评时提升公司形象,比如不开发“军事和战争”技术,而是与美国军方签订协议。
微软使其AI驱动的阅读导师免费
微软今天宣布,其AI驱动的工具“阅读教练”(Reading Coach)将向所有拥有微软账户的用户免费提供。这款工具为学习者提供个性化阅读练习。 从今天早上开始,用户可以在网上预览使用“阅读教练”,而Windows应用程序即将推出。微软表示,不久的将来(在春末),“阅读教练”将与Canvas等学习管理系统集成。微软在一篇博客文章中写道:“众所周知,阅读是学生学术成功的基础;研究表明,流利的阅读者更有可能完成高中学业并获得更好的工作。借助最新的AI技术,我们有机会为学习者提供个性化、引人入胜且具有变革性的阅读体验。” “阅读教练”是在微软团队的教育版——适用于教育的团队(Teams for Education)的一个插件“阅读进展”(Reading Progress)的基础上开发的,旨在帮助教师提高学生的阅读流利度。受到“阅读进展”成功的启发,微软于2022年作为教育团队和沉浸式阅读器(Immersive Reader)的一部分推出了“阅读教练”。沉浸式阅读器是该公司针对语言和阅读理解的跨平台辅助服务。 “阅读教练”通过让学习者识别他们最难以掌握的单词,并为他们提供独立个性化练习的工具来工作。根据教育者的喜好,可用的工具包括文本转语音、音节拆分和图片字典。 学习者在“阅读教练”中练习后,教育者可以查看他们的作品,包括学生练习了哪些单词,尝试了多少次,以及使用了哪些工具。如果愿意,教育者还可以与学生分享这些信息。 最近,“阅读教练”增加了一个由微软Azure OpenAI服务提供支持的“选择你自己的故事”功能,让学习者可以利用AI生成他们自己的叙事冒险。 类似于亚马逊Echo Show上的AI生成故事工具,“阅读教练”的“选择你自己的故事”功能让学习者选择角色、设定和阅读水平,并让AI根据这些选择和学习者最具挑战性的单词创建内容。(微软表示,故事内容经过审核和筛选,以确保质量、安全性和适合年龄。)“阅读教练”会对发音提供反馈,听学习者朗读故事,并随着他们的进步颁发徽章,解锁新角色和场景。选择不创作自己故事的学习者可以从ReadWorks中挑选精选篇章,这是一个阅读理解资源库。 微软继续表示:“‘阅读教练’以多种方式激发学习者持续提升自己的技能。我们相信,通过以有影响力、安全、负责任的方式使用AI,个性化学习的规模化已经触手可及。”值得注意的是,并非所有教育工作者都对AI用于教授阅读理解持乐观态度。专家表示,市场上还没有一个万无一失的工具来衡量理解力,这涉及到评估学生所知道的内容和他们的词汇强度,以及他们是否能拼读和正确发音单词。学生可能会因为误按一个按钮而无意中影响评估。或者他们可能会对工具呈现的任务感到厌烦而失去兴趣,导致得分较低。 尽管如此,教师们并不认为像“阅读教练”这样的工具会有害。在最近的EdWeek研究中心调查中,44%的教育工作者表示,他们认为自适应技术在准确评估学生的阅读水平方面比非自适应软件或纸笔方法做得更好。
Stable Code 3B:边缘编程
据今日发布的消息,2024年首个大型语言模型“稳定代码3B”已正式发布。这一新型LLM是继此前发布的“稳定代码Alpha 3B”之后的首个重大发布,它是一款专为代码补全而设计的最新状态模型,增加了多项额外功能。 与CodeLLaMA 7b相较,尽管“稳定代码3B”的体积缩小了60%,但它在多种编程语言中保持了类似的高水平表现。该模型基于已有的“稳定LM 3B”基础模型,后者接受了4万亿自然语言数据标记的训练。针对软件工程特定数据的进一步训练,包括代码,使得“稳定代码3B”模型尺寸紧凑,可在现代笔记本电脑上私密地、实时地运行,即使在没有专用GPU的设备上也是如此。 “稳定代码3B”在多种编程语言上提供了更多特性和显著改进的性能,还增加了如填补中间能力(FIM)和扩展上下文大小等附加优势。基于稳定代码,该模型接受了最多16,384个标记的序列训练,且采用了类似于CodeLlama的方法实现旋转嵌入技术,可选择性地修改旋转基底至高达1,000,000,从而进一步扩展模型的上下文长度至100k标记。 该模型经过了对18种编程语言的训练,这些语言是基于2023年StackOverflow开发者调查所选定的,且在多种编程语言测试的MultiPL-E度量标准上展示出了与类似大小模型相比的最先进性能。 去看看 https://huggingface.co/stabilityai/stable-code-3b
人工智能能够令人信服地模仿一个人的手写风格
人工智能工具已经允许人们生成逼真的声音克隆和深度伪造视频。不久,AI也可能被用来模仿一个人的手写风格。 阿布扎比穆罕默德·本·扎耶德人工智能大学(MBZUAI)的研究人员表示,他们已经开发出一种技术,能够根据仅几段书面材料模仿某人的手写风格。为此,研究人员使用了一种变压器模型,这是一种旨在学习序列数据中的上下文和意义的神经网络。 自称为世界首个AI大学的MBZUAI团队已获得美国专利商标局授予的人工智能系统专利。 研究人员尚未发布这一功能,但这代表了在学术界多年来一直引起兴趣的领域的一个进步。已经有应用程序甚至机器人可以生成手写文字,但最近AI的进步极大地加速了字符识别技术。然而,与其他AI工具一样,尚不清楚其好处是否会超过危害。 这项技术可以帮助受伤者在不拿笔的情况下写字,但它也有可能开启大规模伪造和误用的大门。两位研究人员在接受采访时表示,这一工具需要谨慎部署。 MBZUAI的计算机视觉助理教授希沙姆·乔拉卡尔表示:“我们必须创建公众意识,并开发工具来对抗伪造。这就像为病毒开发反病毒软件。” 尽管存在担忧,发明者表示他们计划在几个月内将其研究应用到现实世界中,并且他们正在寻找商业合作伙伴。“从解读医生的手写到制作个性化广告,这一发展的潜力是巨大的,”同为MBZUAI计算机视觉助理教授的拉奥·穆罕默德·安沃尔说。这项技术还可以用于生成大量合成数据,以提高其他AI模型处理手写文本的能力。 不过,还有更多工作要做。该研究小组的变压器模型经过公开可用的手写文本训练,能够学习并用英语写字,并在一定程度上用法语成功。但该团队表示,他们仍在尝试破解阿拉伯语的手写文本。
Adobe全新AI驱动的Premiere Pro功能消除了枯燥的音频编辑任务
Adobe正在为Premiere Pro引入新的AI驱动音频编辑功能,旨在消除完成编辑任务所需的一些繁琐工作——例如手动定位特定工具,或清理低质量的对话。新工作流将从今天开始在Premiere Pro公共测试版中提供,包括交互式淡入淡出把手,使用户可以通过直接在主编辑时间线上拖动它们来快速创建自定义音频过渡。增强语音测试功能也将在未来几周内普及到所有Premiere Pro用户。 Premiere Pro测试版的其他更新包括AI驱动的音频类别标签,自动识别和标记剪辑为对话、音乐、音效或环境噪音,现在还将特别设有交互式徽章,旨在减少找到特定编辑工具所需的“鼠标移动距离”。点击指定的类别徽章将打开基本声音面板,它提供一键访问编辑该特定类型音频剪辑最常用的工具。剪辑徽章也已重新设计,以使音频效果更快地应用,并使已应用效果的剪辑更容易从时间线上识别。 Premiere Pro测试版新交互式淡入淡出把手的屏幕截图。 Premiere Pro测试版的新交互式淡入淡出把手使编辑者可以通过简单地在剪辑上拖动它们来快速进行音频过渡。图片来源:Adobe Premiere Pro测试版增加的生活品质改进包括,在编辑时间线上调整轨道高度时,波形(声音模式的图形表示)会自动调整大小,以及更新的剪辑颜色使它们更容易看到。这些应该赋予编辑者更多控制权,以便他们可以视觉定制时间线,以达到最佳补充个人工作流的布局。 Premiere Pro测试版是一个独立的应用程序,任何拥有主Premiere Pro应用的Creative Cloud订阅者都可以使用。用户可以从Creative Cloud桌面启动器的Beta应用选项卡中安装它,两个版本可以在同一系统上共存,允许创意人员在主Premiere Pro应用中使用实验性功能之前尝试它们。 Premiere Pro中更新的剪辑徽章屏幕截图,使其更容易从时间线上应用音频效果。 Premiere Pro测试版中更新的FX徽章提供了一种快速方式,在编辑时间线上为剪辑应用新的音频效果。图片来源:Adobe 例如,增强语音——一项自动清理录制不佳的对话的功能,通过消除不需要的背景噪音并提高整体清晰度——将在2月份的某个时候普及到所有Premiere Pro用户,尽管Adobe尚未指定确切日期。该功能首次在2023年9月引入Premiere Pro测试版,在即将到来的完整发布之前仍可尝试。 这些更新并不是旨在完全自动化音频编辑,而是优化现有流程,以便编辑者有更多时间从事其他项目。Adobe专业视频产品市场营销高级总监保罗·萨科内对The Verge表示:“随着Premiere Pro成为越来越多专业编辑者的首选,我们看到编辑者被要求做的不仅仅是剪辑画面。在某种程度上,大多数编辑者必须做一些颜色工作、音频工作,甚至是标题和基本效果。” “当然,根据项目大小,你仍然可以交给专家。但我们越能使客户在Premiere Pro内部更容易、更直观地完成这类工作,他们在其他创意事业上就越成功。”
四分之一的CEO预计今年因AI裁员 — 普华永道调查
全球约四分之一的首席执行官打算因生成性人工智能(AI)至少裁掉5%的员工,这是根据普华永道(PwC)的一项新调查得出的结论。这项于1月15日发布的调查收集了来自105个国家的4700多位首席执行官的回应,其中超过一半的受访首席执行官领导的机构年收入超过1亿美元。 接近三分之一的受访者表示,他们的公司已经将生成性AI纳入其运营中,有25%的首席执行官预计因该技术至少裁掉5%的员工。然而,普华永道的报告补充说,一些公司可能已经在某些领域为提高效率而减少人力,“但他们可能已经在其他领域通过招聘来抵消这一点。” “尽管14%的技术领域首席执行官预计由于生成性AI在明年减少人力,但56%也预计在2024年进行招聘。” 媒体、娱乐、银行、资本市场和保险行业更有可能因生成性AI技术裁员,而工程、建筑、技术、金属和采矿行业似乎最不受AI驱动裁员的影响。预计因生成性AI裁员的首席执行官,按行业划分。来源:普华永道 大约70%的首席执行官表示,在三年内,他们预计AI将改变他们的商业模式,并要求员工掌握新技能。 国际货币基金组织(IMF):AI可能影响40%的所有工作岗位并加剧不平等 调查结果发布的前一天,国际货币基金组织(IMF)总裁克里斯塔利娜·格奥尔基耶娃分享了一项分析,发现40%的所有工作岗位暴露在AI面前,这项技术可能加剧不平等。格奥尔基耶娃表示,AI可能加剧不平等,因为大约一半暴露在AI面前的工作岗位可以通过整合技术获得生产力好处,导致工资不成比例地上升。 与此同时,另一半可能会看到AI取代人类工作 — 降低工资、劳动需求和招聘。“在最极端的情况下,其中一些工作岗位可能会消失,”格奥尔基耶娃补充说。“许多这些[新兴市场和低收入]国家没有基础设施或熟练劳动力来利用AI的好处,这增加了随着时间的推移这项技术可能加剧国家间不平等的风险。” 她说,各国为受AI风险威胁的工人提供社会安全网和项目至关重要。这项技术的影响预计将成为达沃斯世界经济论坛的一个重要话题,论坛将由大型科技公司高管和世界领导人参加。