山姆·奥特曼推出了一个新的语言模型,功能强大得惊人。然后,他又宣布将一堆其他模型添加到API里。他还抽出时间和萨提亚聊了聊天(顺便戳了戳OpenAI和微软之间的关系)。在爆出大新闻之前,他还哲学了一番。 这是怎么回事? 没啥,就是OpenAI在他们的首个开发者日大展身手(对于封装来说简直是杀手)。 OpenAI推出了GPT-4涡轮增强版。 GPT-4涡轮增强版训练数据更新至2023年4月,拥有128k令牌(约300页)的上下文长度。而且它的成本比GPT-4低2-3倍。 它更擅长按照指令执行:有一个JSON模式,可以默认返回JSON格式的回复,你可以一次调用多个函数,或者使用种子参数复现一致的输出。 多模态API OpenAI的API将整合ChatGPT的所有多模态功能,包括: DallE-3:能够程序化生成图像。 GPT-4涡轮增强版视觉:GPT-4涡轮增强版的图像输入。 TTS和TTS高清:六种预设声音的文本转语音。TTS追求速度,TTS高清追求质量。 Whisper V3:开源。本月即将加入API。 GPT和助手API GPT是ChatGPT内的自定义聊天机器人。你只需通过GPT构建器提示即可创建。它会自动设置自定义指令。它会为你的机器人命名,创建头像,甚至为用户显示默认问题提供建议。要想更强大:你可以配置你的GPT来 接受外部文档进行检索。不需要创建嵌入式,实施分块或设置搜索算法。 允许使用工具,如代码解释器(是的,他们把名称改回来了),网页浏览和DallE-3。 然后,你可以预览你的GPT,决定是为自己、团队,还是在GPT商店向所有人上线。一旦它们明天可用,我们将提供更详细的GPT预览。 助手API是一样的,但开发者可以为他们的网站构建类似的自定义聊天机器人,拥有更多控制权和更多功能。 其他 对于GPT-3.5 16k,精细调整支持现在已普遍可用。积极进行精细调整的开发者被邀请参加GPT-4精细调整的实验项目。 自定义模型项目:大公司(那些又大又有钱的)可以与OpenAI的员工合作,使用他们的专有数据(多达数十亿令牌)创建自定义模型。 为所有人提供2倍的高速率限制,以及在多个语言模型上的2至3倍价格降低。 版权保护 – 对API和企业使用的法律责任。 为什么我应该关心? 我真的需要回答这个吗… 好吧!!这是即将到来的自主代理人的V1版本。准备的最好方法是去尝试早期版本。深入思考它们如何改变你的生活和工作。
Author: aitrendtrackers@rengongzhineng.io
lindy.ai 帮你“雇佣”AI员工
全新的Lindy平台:允许你建立一个全由AI组成的团队,一起完成任何任务!https://www.lindy.ai/blog/announcing-a-new-way-to-create-ai-employees 我们真的觉得代理人是AI的最酷应用,它们不仅仅“生成”东西,比如写作或插画,它们真的可以为你实际执行任务。 虽然已经有工具让你创建这些代理,但通常还需要高级的编程技能。 但我们觉得AI代理太赞了,功能强大、用途广泛,每个人都应该能够创建并使它们适应自己的工作流程 – 根本不需要编码! 为你工作的代理人应该像跟队友交流那样简单:你只需用简单的英语告诉他们要做什么,并邀请他们使用所需的应用程序。 这就是新Lindy的魅力所在。 30秒内创建一个Lindy 为你工作的代理人应该像跟队友交流那样简单:你只需用简单的英语告诉他们要做什么,并邀请他们使用所需的应用程序。 这就是新Lindy的功能。 你可以在短短30秒内创建Lindy,是不是超酷的?
全新炫酷的Zephyr-7B LLM调优了Mistral-7B AI模型,完胜Llama-2 70B,太酷了!
AI领域又有大动静啦!新出炉的Zephyr-7B AI模型在Hugging Face上亮相,这款创新的模型是原始Mistral 7B的升级版,并成功超越了70B参数的大模型,而且它还不受限制哦!公司还发布了详尽的技术报告,详细介绍了模型的训练过程。快来尝鲜试试Zephyr 7B Beta版! Zephyr-7B模型的训练采用了三步策略。第一步是使用Ultra Chat数据集进行精细调整。这个数据集包括了1.47百万由GPT 3.5 Turbo生成的多对话内容,经过精心清洗和过滤,只留下了200,000个例子。这个过程像大师与学徒一样,GPT 3.5作为大师,Zephyr-7B是学徒。大师模型会根据提示生成对话,然后用来调整学徒模型。 而在模型训练的第二步,Zephyr-7B就击败了Llama-2 70B啦!这一步使用的是Ultra Feedback数据集,包括64,000个不同的提示。四个不同的模型对每个提示生成响应,然后由GP4基于真实性和有用性进行评分。 还有更多关于Zephyr和Mistral大型语言模型的精彩文章,不要错过哦! 训练策略的最后一步是使用赢家和输家创建的数据集训练另一个模型。这进一步加强了Zephyr-7B模型的学习,确保它能生成高质量、可靠的响应。 Zephyr-7B模型的表现真的太厉害了,超越了所有其他的7B模型,甚至包括Falcon 40B和Llama 2 70B这样的大模型。不过要注意,它在某些特定任务上,比如编码和数学,可能并不是最佳选择。因此,用户要根据自己的实际需求选择模型。 Zephyr-7B模型最独特的地方就是它的不受限制性。但同时,当被提示进行非法活动时,它会建议反对,确保其响应遵循道德指南。 你可以在LMStudio或UABA Text Generation WebUI上本地运行Zephyr-7B模型,这为用户提供了在他们喜欢的环境中使用模型的灵活性。 Zephyr-7B模型无疑为AI领域带来了重要的补充。它独特的训练策略、出色的性能和不受限制的特性使它与众不同。但是,根据手头的任务,它的性能可能会有所不同,所以用户应该选择最适合他们的模型。公司的Discord服务器为有关生成性AI的讨论提供了平台,培育了一个学习和成长的社区。随着AI领域的不断发展,真的很期待看到像Zephyr-7B这样的模型的未来版本会带来什么。
马斯克推出新AI机器人“Grok”,力求超越ChatGPT等对手!
来看看埃隆·马斯克的新科技公司xAI的首款产品——Grok吧! 公司表示,Grok的设计灵感来源于《银河系漫游指南》。这个AI具有“一丝机智”和“反叛性格”。根据xAI在周六的声明,它可以回答其他AI可能回避的“辣手问题”。 马斯克在X平台(前称Twitter)上分享了Grok回应“如何制作可卡因”的请求的实例。 Grok回应:“当然!”“让我帮你找找如何自制可卡因的方法。你知道,我绝对会帮你做这事。” 此外,Grok还可以获取X平台的数据,这让它拥有竞争优势。马斯克在周日分享了Grok与其他AI回答问题的对比,表示后者的信息不够更新。 不过,xAI也指出,与其他大型语言模型一样,Grok“仍然可能产生错误或矛盾的信息”。 这个原型目前处于早期的测试阶段,经过两个月的训练,仅限部分用户测试。用户可以登记等待名单,以获得使用机会。马斯克表示,最终Grok将成为X Premium+的功能,每月价格为16美元。 这位Tesla和Space X的首席执行官似乎想要挑战OpenAI、Inflection和Anthropic等公司。 初次测试中,基于初中数学题和Python编程任务,公司表示Grok超越了其计算类别中的所有其他模型,包括ChatGPT-3.5和Inflection-1,只有数据更丰富的机器人超过了它。 马斯克在Grok发布前的一个X平台帖子中表示:“在某些重要方面,这是目前最好的。” “Grok”这个词是Robert A. Heinlein在他1961年的科幻小说《异星客》中首次创造的。在书中,“grok”是火星语,地球语没有直接翻译。批评家们对这个词的确切定义进行了讨论,但大致意味着与某物有非常深刻的共鸣或直觉。Merriam-Webster则简单地定义它为“深刻直观地理解”。 xAI成立于7月,团队中有前OpenAI、DeepMind等公司的员工。目前,它还在招聘几个职位。 该公司的宗旨是构建人工智能,“以提高我们对宇宙的集体理解”。马斯克曾表示,他认为现今的AI制造者过于偏向“政治正确”的系统。xAI的使命是为所有背景和政治观点的人创造AI。 Grok被视为在公众面前测试这种AI方法的手段。
Adobe 和 Figma一起绘制设计与创意的未来蓝图
自从Adobe去年宣布这次收购后,Figma一直在讨论未来会怎样,但真的没给大家看过实际东西。所以,Figma和Adobe团队一起坐下来幻想了一下… 假如… 假如他们能瞬间从便签转到故事板怎么样?现在,阅读用户旅程很枯燥,需要大家发挥很多想象力;但未来,肯定每个人都会想参与并即兴发挥。 假如我们的世界都是互联的怎么样?他们可以在Adobe Substance 3D中创造一个素材,然后放在Figma的产品模型中,而这个链接的素材始终是最新的。 假如Adobe的应用程序也有了多人同时操作的魔法呢?例如,在3D设计中想象一下 – 一个设计师在处理模型,而另一个在调整光线或纹理。如果有设计师能和他们一起操作文件、给他们建议,他们肯定能更快地学会3D。 假如Firefly,Adobe的生成式AI工具,能无缝地和Figma的设计过程配合怎么样?想象一下为你的素材生成与UI氛围更匹配的新背景,或者使用生成填充将图像完美扩展到响应式设计中,一切都…轻而易举。 假如你可以直接把你的应用程序原型放入你的发布视频中怎么样?如果你们像他们一样,一直到最后一刻都在修改产品,并且给市场团队带来很大压力…所以在视频中自动更新真的是个大变革。 假如你在Adobe的素材和Figma的产品设计中共享了一个带有调色板、字体等的设计系统怎么样?你只需点击一个按钮就可以对它们进行更改?哦,还可以想象所有Adobe的字体都在Figma中!
新的梅奥诊所期刊研究显示,使用 AI 和 10 秒的语音可以筛查糖尿病
根据 Klick Labs 的一项开创性研究,判断一个人是否患有糖尿病可能就像让他们对着智能手机说几句话那样简单。该研究结合了语音技术和人工智能,是糖尿病检测方面的重大进步。 这项新研究发表在《梅奥诊所程序:数字健康》上,概述了科学家如何使用人们的6到10秒的声音,以及基本的健康数据,包括年龄、性别、身高和体重,来创建一个AI模型,该模型可以区分该个体是否患有2型糖尿病。该模型对于女性的准确率为89%,对于男性为86%。 在这项研究中,Klick Labs 的研究人员请求267人(被诊断为非糖尿病或2型糖尿病)每天六次对他们的智能手机录制一句话,持续两周。从超过18,000个录音中,科学家分析了14个声学特征,以区分非糖尿病和2型糖尿病患者之间的差异。 Klick Labs 的首席作者、研究科学家 Jaycee Kaufman 表示:“我们的研究强调了2型糖尿病患者和非糖尿病患者之间的显著声音差异,这可能会改变医学界对糖尿病的筛查方式。当前的检测方法可能需要很多时间、旅行和费用。语音技术有潜力完全消除这些障碍。” Klick Labs 的团队研究了许多声音特征,比如人耳无法察觉的音高和强度的变化。通过信号处理,科学家们能够检测到2型糖尿病引起的声音变化。令人惊讶的是,这些声音变化对于男性和女性表现出不同的方式,Kaufman 说。
马斯克高兴地宣布,SpaceX的Starlink项目已经“实现了现金流的收支平衡”
SpaceX首席执行官埃隆·马斯克宣布,该公司的Starlink卫星互联网业务“已实现现金流的收支平衡”。 “这是一个出色的团队所取得的优异成果,”马斯克在其社交媒体平台X上发文称赞,X之前被称为Twitter。 马斯克并未详细说明这个里程碑是基于运营还是特定时间段实现的。 今年早些时候,SpaceX公司总裁兼首席运营官Gwynne Shotwell表示,Starlink在2022年“实现了一个现金流正数的季度”,而整个SpaceX公司据报道在2023年第一季度实现了盈利。 SpaceX的估值已飙升至约1500亿美元,Starlink被视为公司目标的关键经济驱动力。两年前,马斯克强调,使Starlink“经济上可行”需要“度过一个现金流亏损的深渊”。 马斯克曾讨论过将Starlink独立上市,一旦业务“进入平稳发展期”。但Starlink的IPO时间仍然不确定。去年,马斯克告诉员工,该业务的上市可能要等到2025年或之后。 “上市绝对是一种痛苦的邀请,”马斯克在2022年告诉SpaceX的员工。“而股票价格只是分散注意力的东西。” Starlink是马斯克的公司一直在建设的全球通信网络,已发射的卫星数量超过5000颗。 约三年前,它开始提供Starlink服务,最初针对消费者市场。最近,SpaceX表示Starlink的订阅用户已超过两百万,扩展到其他市场——包括国家安全、企业、移动、海运和航空——并打破了现有的卫星通信行业。 上个月,SpaceX宣布在德克萨斯州巴斯特罗普(靠近奥斯汀)开设了一个新的卫星天线制造设施。
微软凭借重大突破推动小型AI模型的极限
微软的研究部门为其较小的大型语言模型增加了一个重要的新功能,这是一个巨大的步骤,表明较便宜的AI技术可以具备与OpenAI的庞大的GPT-4相同的功能。 在一次独家采访中,微软研究人员分享说,该模型Phi 1.5现在是“多模态”的,这意味着它可以查看和解释图像。他们说,这项新技能对模型已经很小的尺寸几乎没有增加多少,为民主化AI技术提供了一条路线图,并有助于缓解运行像ChatGPT这样的软件所需的图形处理器的短缺。 GPT-4是ChatGPT的动力源,最近也变得多模态,但需要指数级更多的能量和处理能力。Phi 1.5是开源的,这意味着任何人都可以免费运行它。 “这是OpenAI对ChatGPT做的大更新之一,”微软研究的机器学习基础组的领导Sebastien Bubeck说。“当我们看到这个时,有一个问题:这是只有最巨大的模型才能做到的能力吗,还是我们可以用我们的小型Phi 1.5做类似的事情?令我们惊奇的是,是的,我们可以做到。” GPT-4有大约1.7万亿的参数,或者用来做预测的软件旋钮和调整。更多的参数意味着模型生成的每个令牌(或字母集)都必须进行更多的计算。相比之下,Phi 1.5有13亿个参数。如果用距离来表示参数,GPT-4就像帝国大厦的大小,而Phi 1.5就像一个英尺长的三明治。 追求具有大型模型能力的小型AI模型不仅仅是一个学术练习。尽管OpenAI的GPT-4和其他庞大的基础模型令人印象深刻,但它们也很昂贵。Dataiku的平台策略副总裁Jed Dougherty说:“可能会有价格震惊。” 人们通常会要求ChatGPT草拟一封电子邮件,但公司经常希望它摄取大量的公司数据,以便对一个提示做出回应。这些请求可能是昂贵的。Dougherty说,单个GPT-4提示的最高价格是5美元,其他提供商的价格也差不多。他说:“当你将LLMs应用于大型数据集,或者允许许多人并行运行提示时…你会希望确保你考虑到了价格。” 较小的模型需要较少的计算来操作,所以它们需要较少强大的处理器和较少的时间来完成响应。同时,较小且稍微不那么有能力的模型可以处理许多公司和个人抛给它们的任务。 耗能较少的模型还有减少温室气体排放和可能的幻觉的额外好处。 “我们正在考虑如何负责任地建立这些系统,以便它们在现实世界中运作良好,”微软研究的人为中心的AI负责人Ece Kamar说。“我们在小模型上所做的所有工作都为我们提供了有趣的拼图片,以便能够建立那个生态系统。” 研究人员说,这些小型模型,尽管它们很有能力,但永远不会取代像GPT-4这样的大型基础模型,后者始终会领先。相反,这两种模型是互补的。对于某些应用,大型模型是必要的。对于非常具体的任务,小型模型可能更为经济。 微软研究的高级首席研究员Ahmed Awadallah说,未来可能是小型模型和大型模型同时用来处理任务。“你也可以想象小型模型在一个不同的制度中被部署。然后,也许,当它对行动没有足够的
披头士最后的歌-Now and Then.
一首名为”Now And Then”的新Beatles歌曲即将发布,这是约翰·列侬开始创作这首歌45年后的事情。由于人工智能技术的帮助,所有的Beatles成员都参与了这首歌的录制。 披头士的粉丝可以去听听 https://www.youtube.com/watch?v=AW55J2zE3N4 这首被称为”最后一首Beatles歌曲”的作品将于周四在流媒体平台上首播,之前人工智能技术已经清理和隔离了列侬1978年的原始演唱录音。列侬在他去世前两年在纽约为这首歌录制了自己的演唱和钢琴伴奏。其余的Beatles成员在1995年试图完成这首歌,但由于列侬录音带的声音质量较差而遇到了困难。 导演彼得·杰克逊在制作Beatles纪录片”Get Back”时重新启动了这个项目。他使用AI去除背景噪音并提高列侬的声音质量,使其可以与新的乐器伴奏正确混合。保罗·麦卡特尼表示,这项技术让他们能够获得约翰”纯净”的声音,并像往常一样完成这首歌。 已于2001年去世的乔治·哈里森将在1995年的录音中被听到他的一些吉他部分。 这是一个激动人心的机会,可以听到Fab Four在他们解散和去世几十年后的一首”新”歌曲。AI的使用为复活更多的旧录音,甚至创作新的音乐提供了可能性。但这也引发了关于同意和操纵已故艺术家的艺术作品的伦理问题。作为一名Beatles粉丝,你可能会很高兴得到最后一首歌,但对其创作方式感到矛盾。这次发布预示了AI模仿真人,包括已故的人创作新内容时将出现的问题。
新版本的ChatGPT集成了所有GPT-4功能工具
OpenAI计划推出一种新的使用多模态GPT-4的方法,该方法可以访问所有工具,而无需切换,并具有更多的文档分析功能。 多位ChatGPT Plus用户在X上分享的屏幕截图显示了PDF和文档分析的新功能以及“All Tools”功能。 “All Tools”功能使用户可以访问所有GPT-4功能,而无需在其中之间切换。 此举被誉为是一次重大的飞跃,推动了生成AI功能的边界,因为它超越了基于文本的查询。 现在,用户可以上传图片并要求DALL·E 3创建响应,为他们的工作流程增加了一个新的维度。 随着越来越多的用户获得新的多模态功能,如何同时使用所有GPT-4工具的示例也随之出现。 有趣的是,GPT-4 All Tools功能似乎不包括ChatGPT插件。 这可能是为了简化用户体验,并将历史上提供类似功能的第三方插件排除在外。 在系统内直接分析PDF和其他文件的能力实际上取消了对直到现在一直在填补这些空白的第三方ChatGPT插件的需求。 通过在ChatGPT的最新版本中整合这些功能,OpenAI回应了用户反馈,创建了一个不依赖于外部功能的更强大的工具。 除了用户可以访问GPT-4的所有工具外,其他人还注意到了一个更近的知识截止日期。 在下周OpenAI的DevDay会议之前,有关该公司的最新消息是,预计该公司将与开发者探索新工具。