ChatGPT发布了一系列更新,包括语音和图像识别,标志着向创建更互动和直观的用户体验(类似于我们当前与Siri和Google Assistant的互动)迈出了重要的一步。 🔑 主要点: 用户现在可以拍照并与ChatGPT进行实时讨论—这一特性在旅行、计划餐点或协助学术问题时特别方便。 语音互动由一种新型文本到语音模型提供支持,该模型与专业配音演员合作,生成类似人类的音频。您还可以将您自己的音频转录为文本,以简化互动。 图像理解得到了BeMyEyes的支持—将GPT-4的推理能力扩展到包括照片、屏幕截图和混合文本图像文档在内的广泛图像;使与GPT-4进行讨论比以往更容易。 新功能最初将发布给Plus和Enterprise用户,计划在不久的将来进行更广泛的推出。语音功能将仅在iOS和Android上可用,图像功能将在所有平台上可访问。
云运算平台应该披露自己的AI用户吗
白宫正在考虑强制云计算企业上报关于他们客户的某些信息给美国政府,这一消息来自熟知一项有关人工智能即将出台的行政命令的人士。 该条款将会指派商务部出台规则,使得像Microsoft,Google和Amazon这样的云公司在客户购买超出特定限度的计算资源时必须披露信息。尽管这个命令还没有最终敲定,但其具体内容还可能发生改变。 与此类似的“了解你的客户”政策在银行领域已经存在,旨在防止洗钱和其它非法活动,比如必须报告超过$10,000的现金交易。 在本案例中,这些规则旨在建立一个能让美国政府提前识别出潜在的AI威胁的系统,尤其是那些来自外国实体的威胁。举例来说,如果一家中东公司开始使用Amazon Web Services来建立一个强大的大型语言模型,报告要求理论上会给美国当局提前发出警告。 这个政策提案代表了将计算能力视作一种国家资源的潜在步骤。不论是挖掘比特币,开发视频游戏,还是运行像ChatGPT这样的AI模型,都需要大量的计算能力。 如果该措施被最终敲定,那将是像OpenAI和RAND Corporation这样的机构的一大胜利,因为它们在近几个月内一直在推广相似的了解你的客户机制。然而,也有人认为,如果不慎执行,该政策可能变成一种监视计划。 Klon Kitchen,一位在美国企业研究所的非驻地高级研究员并且专注于国家安全和新兴技术,表示:“细节在这里确实非常重要。我理解政府为什么想要解决这个问题。我们需要对这些模型的对立发展有一个战略性的理解。”
超强大的网站帮你优化AI prompt
才出的一个帮助你优化AI prompt的网站,去试试,很强大 链接 #人工智能#生成式人工智能
DeepMind AI预测基因突变与疾病
谷歌的缺失厚积薄发,越来越多的东西出来了。大约10年前,Žiga Avsec是一名攻读物理学博士的学生,通过大学的机器学习模块,他开始接触基因组学。不久后,他开始参与研究罕见疾病的实验室项目,目的是确定导致一种不寻常的线粒体疾病的确切基因突变。这是一个寻找“针尖上的一颗草”的难题。人类基因组中有7100万种可能的错义突变,而每个人平均携带9000多种。Avsec开始询问同事:“我们怎么知道哪些突变真的是危险的?”答案基本上是:“大部分情况下,我们并不知道。”如今,Avsec在Google DeepMind工作,该公司发布了一个名为AlphaMissense的工具,能以90%的准确率预测突变导致疾病的可能性。这一工具是基于DeepMind的AlphaFold模型构建的,但其运作方式与AlphaFold不同,更像是OpenAI的大型语言模型ChatGPT。 AlphaMissense的准确性得到了Genomics England的验证,这是一个研究由英国国民医疗服务系统收集的大量基因数据的政府机构。研究人员希望这个模型能加速对基因变异的研究,从而更快地诊断疾病并找到新的治疗方法。但研究人员强调,这些预测不应单独使用,而应作为实地研究的指导。#AI#人工智能#生成式人工智能
Elon的Neuralink寻找人类受试
Elon Musk的梦想要成真的。是个巨大的突破,用在好的,坏的方面都是影响重大。 在5月份,埃隆·马斯克(Elon Musk)拥有的脑植入公司Neuralink宣布,已获得美国食品和药物管理局(FDA)的批准,开始进行人体试验。本周二,该公司进一步宣布,已经获得独立审查委员会的批准,可以开始为其针对瘫痪患者的脑植入器招募人类测试对象。 据该公司在博客中介绍,这些人体试验的主要目的是测试其名为“Link”的脑-计算机接口(BCI)是否安全和有效。Neuralink公司的全局目标是创建可植入设备,让用户能够用大脑来控制事物。尽管这听起来很像科幻小说,但Neuralink并不是唯一一家开发脑接口设备的公司。 该公司在声明中表示:“我们BCI的初步目标是让人们仅用思想就能控制计算机的光标或键盘。”然而,尽管这可能对一些人来说是令人兴奋的进展,Neuralink的“首次人体临床试验”可能对其患者构成重大风险。该公司和马斯克以往在动物实验方面的行为一直受到批评,以至于在2022年2月,负责任医学委员会(Physicians Committee for Responsible Medicine)甚至提交了一份控诉,声称Neuralink进行了“侵入性和致命的脑部实验”。在同一年的12月,该公司因涉嫌侵犯动物福利而受到联邦调查,文件称该公司自2018年以来已经致死约1500只动物,包括猪、猴子、老鼠和老鼠。 Neuralink对这些非常严重的指控进行了回击,称其照料的猕猴(rhesus macaque)受到团队的“尊重和珍视”。马斯克甚至在上周通过X(前称推特)表示,“没有猴子因Neuralink植入而死亡。”这一声明与该公司之前承认由于动物出现感染和其他副作用而对其进行安乐死的事实直接相矛盾。但目前,无论马斯克是否试图重新解释Neuralink的动物试验争议似乎都无关紧要,因为该公司已经获得了必要的批准,并正在为其历史上非常关键的时刻做准备。这次声明没有明确这些试验何时开始,但表示患有“因颈椎脊髓损伤或肌萎缩侧索硬化症(ALS)引起的四肢瘫痪”的人可能有资格参加试验。 不知说点什么好。期望多于顾虑。#人工智能#生成式人工智能
程序员想不写代码就做UI的自动化测试
程序员想不写代码就做UI的自动化测试吗 曾几何时,用selenium, appium写UI的自动测试是个头痛的事情。现在好了,screenwriterCreate UI automation instantly with no code. 正在推出基于AI的UI自动测试,无需你写代码。去加入尝试尝试? #AI#生成式人工智能#人工智能
生成式人工智能职业冲击,你准备好了吗?
内哥被问了很多人工智能会让人失业的之类的问题。一起来看看 与研究公司Workplace Intelligence合作,edX调查了800名知识型员工和800名C-Suite高管,包括超过500名来自美国的CEO,以深入了解专业人员如何为AI时代做准备。调查结果揭示了员工和高管对于自动化对其公司、工作和个人职业发展的影响和步伐的看法往往存在冲突。 调查的关键发现之一是,包括组织最高层在内的高管们都非常愿意接受AI的大量支持。令人注目的是,有49%的受访CEO认为他们的工作“大部分”或“全部”应该完全被自动化或被AI取代。 在edX发布的《AI时代的工作场所导航报告》中的其他关键发现包括: 大多数公司都发现很难赶上这一趋势。
微软Win 11:All-in人工智能
继谷歌的Bard大推进后,微软也不甘落后。 Windows 11》的下一次更新将于9月26日到来,带来了“Copilot”、AI驱动的“Paint”以及其他更多功能。其他更新内容包括现代化的文件资源管理器、“Ink Anywhere”(针对触控笔用户)、更先进的“Paint”应用、备份增强功能,以及“Snipping Tool”和“Photos”应用的新功能。尽管有些预期的功能尚未包含,但预计稍后会有更大的23H2更新发布。此次更新旨在增强《Windows 11》的体验,提供一系列的生活质量改进和创新。 从9月26日开始,微软将推出“Copilot”作为免费更新至《Windows 11》,并在今年秋天将其功能扩展到Bing、Edge和Microsoft 365 Copilot。即将发布的《Windows 11》更新拥有超过150项新功能,将“Copilot”和AI功能整合到像“Paint”、“Photos”和“Clipchamp”等应用中。Bing将很快支持OpenAI的DALL.E 3模型,提供个性化搜索结果、增强的购物体验和对Bing Chat企业版的更新。从2023年11月1日开始,Microsoft 365 Copilot将面向企业客户提供,同时推出新的AI助理——Microsoft 365 Chat。现已接受预定的新Surface设备支持这些AI功能。 #人工智能#生成式人工智能
谷歌出手,Bard 疯了
Google已将其Bard人工智能(AI)工具链接到其Gmail服务和其他公司产品。**这家美国搜索引擎公司表示,这一变化将使其用户能够在不同的产品领域轻松使用AI技术。 Bard是一个聊天机器人,是一个计算机驱动的系统,旨在与人类流畅地互动并进行高级写作。这类工具也被称为“生成性AI”或“大型语言模型”。 首个广泛发布的聊天机器人是ChatGPT,由技术公司OpenAI在去年底推出。Google在去年2月宣布推出其Bard工具。不久之后,Microsoft宣布正在重设计其Bing搜索引擎,以包括OpenAI的聊天机器人技术。Microsoft已在OpenAI中投入了数十亿美元。 在周二的公告中,Google表示已创建了一个系统,使用户可以将AI工具扩展到其他公司服务或应用程序。这为Gmail、Drive、YouTube、Maps等Google产品带来了Bard技术。 这个将AI工具扩展到其他Google应用程序的系统被称为Bard Extensions。用户可以决定将Bard添加到哪些应用程序。这可以通过转到Google的Chrome浏览器并按照激活新扩展名的过程来完成。目前,Bard Extensions仅提供英语。 在解释这一变化的声明中,Google给出了几个描述,说明用户如何与其他应用程序一起使用Bard。例如,Gmail用户可以要求Bard创建与特定主题有关的所有电子邮件的摘要。 Google还提供了另一个示例,说明Bard如何与其他应用程序链接,帮助某人进行求职。在这种情况下,Google建议要求Bard“从我的Drive中找到标题为2023年6月的简历,并将其总结为一个简短的个人声明段落。” Bard的另一个新附加功能允许用户邀请其他人加入其Bard对话。 在公告中,Google还表示已经创建了一种方法,使用户可以验证由Bard工具生成的信息是否正确。Google表示,Bard的“Google搜索”按钮可以测试其结果的正确性。Jack Krawczyk,Google的高级产品总监,告诉路透社,公司认为增加这种能力有助于用户找到最真实的结果。 Google在宣布Bard Extensions时承诺保护用户的隐私,禁止其员工查看Bard从Gmail或Drive等应用程序获得的任何个人信息。它表示还采取了措施,以防止与Bard相关的数据被用于针对用户投放广告或训练AI工具。
OpenAI发布了DALL-E3
Open AI 在安静了一段时间之后,终于曝出了大的发展, DALL-E3来了。 在周三的一次小型记者活动中,DALL-E 3 被描述为一个完全理解复杂文本提示的工具,并能生成与之匹配的复杂图片。 OpenAI 网站新设的 DALL-E 3 信息页面上强调:“目前的文本到图像系统常常忽略文字或描述,这使得用户必须精通怎么设定提示。而 DALL-E 3 在生成与文本完全吻合的图像方面取得了巨大进展。” 今年夏天,有关 DALL-E 3 的部分潜在图像在 Discord 上被提前泄露,这些图像显示了与新闻预览所描述的巨大潜力。泄密者称其给 DALL-E 3 提供了一个长提示:“一个粉红色的小丑在自行车比赛中与熊猫击掌。自行车是由奶酪制成的,地面非常泥泞。他们在雾蒙蒙的森林中骑行,熊猫看起来很生气。”得到的图像与这个描述完全一致,令人震惊。 虽然像 Midjourney 和 Stable Diffusion 这样的图像生成器能够模仿真实照片并生成各种物体、风格和人物的表示(并伴随着不少争议),但无疑在生成这种复杂内容方面会遇到困难。 这些图像生成器以及 OpenAI 之前的产品在生成带有文本的图像时都遭遇了困难,通常生成的文本是乱码或荒谬的文字。而 DALL-E 3 显然在将连贯的文本融入图像方面做得更好,正如 OpenAI 的首席执行官 Sam Altman 在 X 上发布的卡通所示。 OpenAI 表示,它将直接将 DALL-E 3 集成到 ChatGPT 中,并强烈暗示聊天机器人将根据提示内容在不同模型之间切换。ChatGPT 原本只是一个简单友好的用户界面,用于从 GPT-3.5 模型获取文本输出,但现在正在迅速演变,整合了第三方插件,这些插件可以从其他来源(包括互联网)获取文本。这进一步扩大了 ChatGPT 的功能,使“聊天机器人”的定义变得更加模糊。…