来看看埃隆·马斯克的新科技公司xAI的首款产品——Grok吧! 公司表示,Grok的设计灵感来源于《银河系漫游指南》。这个AI具有“一丝机智”和“反叛性格”。根据xAI在周六的声明,它可以回答其他AI可能回避的“辣手问题”。 马斯克在X平台(前称Twitter)上分享了Grok回应“如何制作可卡因”的请求的实例。 Grok回应:“当然!”“让我帮你找找如何自制可卡因的方法。你知道,我绝对会帮你做这事。” 此外,Grok还可以获取X平台的数据,这让它拥有竞争优势。马斯克在周日分享了Grok与其他AI回答问题的对比,表示后者的信息不够更新。 不过,xAI也指出,与其他大型语言模型一样,Grok“仍然可能产生错误或矛盾的信息”。 这个原型目前处于早期的测试阶段,经过两个月的训练,仅限部分用户测试。用户可以登记等待名单,以获得使用机会。马斯克表示,最终Grok将成为X Premium+的功能,每月价格为16美元。 这位Tesla和Space X的首席执行官似乎想要挑战OpenAI、Inflection和Anthropic等公司。 初次测试中,基于初中数学题和Python编程任务,公司表示Grok超越了其计算类别中的所有其他模型,包括ChatGPT-3.5和Inflection-1,只有数据更丰富的机器人超过了它。 马斯克在Grok发布前的一个X平台帖子中表示:“在某些重要方面,这是目前最好的。” “Grok”这个词是Robert A. Heinlein在他1961年的科幻小说《异星客》中首次创造的。在书中,“grok”是火星语,地球语没有直接翻译。批评家们对这个词的确切定义进行了讨论,但大致意味着与某物有非常深刻的共鸣或直觉。Merriam-Webster则简单地定义它为“深刻直观地理解”。 xAI成立于7月,团队中有前OpenAI、DeepMind等公司的员工。目前,它还在招聘几个职位。 该公司的宗旨是构建人工智能,“以提高我们对宇宙的集体理解”。马斯克曾表示,他认为现今的AI制造者过于偏向“政治正确”的系统。xAI的使命是为所有背景和政治观点的人创造AI。 Grok被视为在公众面前测试这种AI方法的手段。
Adobe 和 Figma一起绘制设计与创意的未来蓝图
自从Adobe去年宣布这次收购后,Figma一直在讨论未来会怎样,但真的没给大家看过实际东西。所以,Figma和Adobe团队一起坐下来幻想了一下… 假如… 假如他们能瞬间从便签转到故事板怎么样?现在,阅读用户旅程很枯燥,需要大家发挥很多想象力;但未来,肯定每个人都会想参与并即兴发挥。 假如我们的世界都是互联的怎么样?他们可以在Adobe Substance 3D中创造一个素材,然后放在Figma的产品模型中,而这个链接的素材始终是最新的。 假如Adobe的应用程序也有了多人同时操作的魔法呢?例如,在3D设计中想象一下 – 一个设计师在处理模型,而另一个在调整光线或纹理。如果有设计师能和他们一起操作文件、给他们建议,他们肯定能更快地学会3D。 假如Firefly,Adobe的生成式AI工具,能无缝地和Figma的设计过程配合怎么样?想象一下为你的素材生成与UI氛围更匹配的新背景,或者使用生成填充将图像完美扩展到响应式设计中,一切都…轻而易举。 假如你可以直接把你的应用程序原型放入你的发布视频中怎么样?如果你们像他们一样,一直到最后一刻都在修改产品,并且给市场团队带来很大压力…所以在视频中自动更新真的是个大变革。 假如你在Adobe的素材和Figma的产品设计中共享了一个带有调色板、字体等的设计系统怎么样?你只需点击一个按钮就可以对它们进行更改?哦,还可以想象所有Adobe的字体都在Figma中!
新的梅奥诊所期刊研究显示,使用 AI 和 10 秒的语音可以筛查糖尿病
根据 Klick Labs 的一项开创性研究,判断一个人是否患有糖尿病可能就像让他们对着智能手机说几句话那样简单。该研究结合了语音技术和人工智能,是糖尿病检测方面的重大进步。 这项新研究发表在《梅奥诊所程序:数字健康》上,概述了科学家如何使用人们的6到10秒的声音,以及基本的健康数据,包括年龄、性别、身高和体重,来创建一个AI模型,该模型可以区分该个体是否患有2型糖尿病。该模型对于女性的准确率为89%,对于男性为86%。 在这项研究中,Klick Labs 的研究人员请求267人(被诊断为非糖尿病或2型糖尿病)每天六次对他们的智能手机录制一句话,持续两周。从超过18,000个录音中,科学家分析了14个声学特征,以区分非糖尿病和2型糖尿病患者之间的差异。 Klick Labs 的首席作者、研究科学家 Jaycee Kaufman 表示:“我们的研究强调了2型糖尿病患者和非糖尿病患者之间的显著声音差异,这可能会改变医学界对糖尿病的筛查方式。当前的检测方法可能需要很多时间、旅行和费用。语音技术有潜力完全消除这些障碍。” Klick Labs 的团队研究了许多声音特征,比如人耳无法察觉的音高和强度的变化。通过信号处理,科学家们能够检测到2型糖尿病引起的声音变化。令人惊讶的是,这些声音变化对于男性和女性表现出不同的方式,Kaufman 说。
马斯克高兴地宣布,SpaceX的Starlink项目已经“实现了现金流的收支平衡”
SpaceX首席执行官埃隆·马斯克宣布,该公司的Starlink卫星互联网业务“已实现现金流的收支平衡”。 “这是一个出色的团队所取得的优异成果,”马斯克在其社交媒体平台X上发文称赞,X之前被称为Twitter。 马斯克并未详细说明这个里程碑是基于运营还是特定时间段实现的。 今年早些时候,SpaceX公司总裁兼首席运营官Gwynne Shotwell表示,Starlink在2022年“实现了一个现金流正数的季度”,而整个SpaceX公司据报道在2023年第一季度实现了盈利。 SpaceX的估值已飙升至约1500亿美元,Starlink被视为公司目标的关键经济驱动力。两年前,马斯克强调,使Starlink“经济上可行”需要“度过一个现金流亏损的深渊”。 马斯克曾讨论过将Starlink独立上市,一旦业务“进入平稳发展期”。但Starlink的IPO时间仍然不确定。去年,马斯克告诉员工,该业务的上市可能要等到2025年或之后。 “上市绝对是一种痛苦的邀请,”马斯克在2022年告诉SpaceX的员工。“而股票价格只是分散注意力的东西。” Starlink是马斯克的公司一直在建设的全球通信网络,已发射的卫星数量超过5000颗。 约三年前,它开始提供Starlink服务,最初针对消费者市场。最近,SpaceX表示Starlink的订阅用户已超过两百万,扩展到其他市场——包括国家安全、企业、移动、海运和航空——并打破了现有的卫星通信行业。 上个月,SpaceX宣布在德克萨斯州巴斯特罗普(靠近奥斯汀)开设了一个新的卫星天线制造设施。
微软凭借重大突破推动小型AI模型的极限
微软的研究部门为其较小的大型语言模型增加了一个重要的新功能,这是一个巨大的步骤,表明较便宜的AI技术可以具备与OpenAI的庞大的GPT-4相同的功能。 在一次独家采访中,微软研究人员分享说,该模型Phi 1.5现在是“多模态”的,这意味着它可以查看和解释图像。他们说,这项新技能对模型已经很小的尺寸几乎没有增加多少,为民主化AI技术提供了一条路线图,并有助于缓解运行像ChatGPT这样的软件所需的图形处理器的短缺。 GPT-4是ChatGPT的动力源,最近也变得多模态,但需要指数级更多的能量和处理能力。Phi 1.5是开源的,这意味着任何人都可以免费运行它。 “这是OpenAI对ChatGPT做的大更新之一,”微软研究的机器学习基础组的领导Sebastien Bubeck说。“当我们看到这个时,有一个问题:这是只有最巨大的模型才能做到的能力吗,还是我们可以用我们的小型Phi 1.5做类似的事情?令我们惊奇的是,是的,我们可以做到。” GPT-4有大约1.7万亿的参数,或者用来做预测的软件旋钮和调整。更多的参数意味着模型生成的每个令牌(或字母集)都必须进行更多的计算。相比之下,Phi 1.5有13亿个参数。如果用距离来表示参数,GPT-4就像帝国大厦的大小,而Phi 1.5就像一个英尺长的三明治。 追求具有大型模型能力的小型AI模型不仅仅是一个学术练习。尽管OpenAI的GPT-4和其他庞大的基础模型令人印象深刻,但它们也很昂贵。Dataiku的平台策略副总裁Jed Dougherty说:“可能会有价格震惊。” 人们通常会要求ChatGPT草拟一封电子邮件,但公司经常希望它摄取大量的公司数据,以便对一个提示做出回应。这些请求可能是昂贵的。Dougherty说,单个GPT-4提示的最高价格是5美元,其他提供商的价格也差不多。他说:“当你将LLMs应用于大型数据集,或者允许许多人并行运行提示时…你会希望确保你考虑到了价格。” 较小的模型需要较少的计算来操作,所以它们需要较少强大的处理器和较少的时间来完成响应。同时,较小且稍微不那么有能力的模型可以处理许多公司和个人抛给它们的任务。 耗能较少的模型还有减少温室气体排放和可能的幻觉的额外好处。 “我们正在考虑如何负责任地建立这些系统,以便它们在现实世界中运作良好,”微软研究的人为中心的AI负责人Ece Kamar说。“我们在小模型上所做的所有工作都为我们提供了有趣的拼图片,以便能够建立那个生态系统。” 研究人员说,这些小型模型,尽管它们很有能力,但永远不会取代像GPT-4这样的大型基础模型,后者始终会领先。相反,这两种模型是互补的。对于某些应用,大型模型是必要的。对于非常具体的任务,小型模型可能更为经济。 微软研究的高级首席研究员Ahmed Awadallah说,未来可能是小型模型和大型模型同时用来处理任务。“你也可以想象小型模型在一个不同的制度中被部署。然后,也许,当它对行动没有足够的
披头士最后的歌-Now and Then.
一首名为”Now And Then”的新Beatles歌曲即将发布,这是约翰·列侬开始创作这首歌45年后的事情。由于人工智能技术的帮助,所有的Beatles成员都参与了这首歌的录制。 披头士的粉丝可以去听听 https://www.youtube.com/watch?v=AW55J2zE3N4 这首被称为”最后一首Beatles歌曲”的作品将于周四在流媒体平台上首播,之前人工智能技术已经清理和隔离了列侬1978年的原始演唱录音。列侬在他去世前两年在纽约为这首歌录制了自己的演唱和钢琴伴奏。其余的Beatles成员在1995年试图完成这首歌,但由于列侬录音带的声音质量较差而遇到了困难。 导演彼得·杰克逊在制作Beatles纪录片”Get Back”时重新启动了这个项目。他使用AI去除背景噪音并提高列侬的声音质量,使其可以与新的乐器伴奏正确混合。保罗·麦卡特尼表示,这项技术让他们能够获得约翰”纯净”的声音,并像往常一样完成这首歌。 已于2001年去世的乔治·哈里森将在1995年的录音中被听到他的一些吉他部分。 这是一个激动人心的机会,可以听到Fab Four在他们解散和去世几十年后的一首”新”歌曲。AI的使用为复活更多的旧录音,甚至创作新的音乐提供了可能性。但这也引发了关于同意和操纵已故艺术家的艺术作品的伦理问题。作为一名Beatles粉丝,你可能会很高兴得到最后一首歌,但对其创作方式感到矛盾。这次发布预示了AI模仿真人,包括已故的人创作新内容时将出现的问题。
新版本的ChatGPT集成了所有GPT-4功能工具
OpenAI计划推出一种新的使用多模态GPT-4的方法,该方法可以访问所有工具,而无需切换,并具有更多的文档分析功能。 多位ChatGPT Plus用户在X上分享的屏幕截图显示了PDF和文档分析的新功能以及“All Tools”功能。 “All Tools”功能使用户可以访问所有GPT-4功能,而无需在其中之间切换。 此举被誉为是一次重大的飞跃,推动了生成AI功能的边界,因为它超越了基于文本的查询。 现在,用户可以上传图片并要求DALL·E 3创建响应,为他们的工作流程增加了一个新的维度。 随着越来越多的用户获得新的多模态功能,如何同时使用所有GPT-4工具的示例也随之出现。 有趣的是,GPT-4 All Tools功能似乎不包括ChatGPT插件。 这可能是为了简化用户体验,并将历史上提供类似功能的第三方插件排除在外。 在系统内直接分析PDF和其他文件的能力实际上取消了对直到现在一直在填补这些空白的第三方ChatGPT插件的需求。 通过在ChatGPT的最新版本中整合这些功能,OpenAI回应了用户反馈,创建了一个不依赖于外部功能的更强大的工具。 除了用户可以访问GPT-4的所有工具外,其他人还注意到了一个更近的知识截止日期。 在下周OpenAI的DevDay会议之前,有关该公司的最新消息是,预计该公司将与开发者探索新工具。
微软的AI Copilot可能即将进入您的办公室
ChatGPT的粉丝们几个月来一直说这个AI驱动的聊天机器人将彻底改变我们的工作方式——他们的预测可能终于要成真了。 现在,您的老板可能正在考虑将Microsoft Copilot添加到公司的企业版Microsoft 365订阅中。这个由ChatGPT驱动的工具,Gizmodo形容为“如果Clippy去攻读MBA”,它是一个智能助手,旨在通过将Word文档转换为PowerPoint演示文稿、起草电子邮件回复、总结视频会议以及自动化Microsoft 365套件内的其他任务来为您节省时间。 感兴趣的企业必须购买至少300个用户许可——每个30美元——以将Copilot添加到他们的Microsoft 365 E3或E5订阅中,这还不包括每人每月分别为36美元和57美元的现有订阅费用。 “熟练掌握Copilot”会成为新的简历技能吗? 微软是第一个将ChatGPT的技术整合到广受欢迎的商业软件产品中的公司,这使得一些人不禁想到,这是否微软的“iPhone时刻”。Piper Sandler的分析师预测,有了这个小AI助手在白领的工作日中助阵,到2026年,微软的年收入可能达到100亿美元。 一些高收入的美国公司几个月前就已经提前体验了Copilot,其中一个公司的员工报告说,这个工具每月为他们节省了5到10个小时,据《华尔街日报》报道。 分析师们对其扩展表示乐观: Forrester市场研究集团估计,到明年年底,美国将有近690万知识工作者在使用Copilot。 Piper Sandler还预测,为了与使用该工具的行业竞争对手保持竞争力,错失机会的恐惧会推动企业购买Copilot。 但是……如果ChatGPT的近一年经验教给我们什么,那就是AI经常会出错,这就是为什么技术专家建议Copilot的用户在点击发送按钮之前,先检查机器人的工作是否有异常。
微软的玻璃数据存储系统可以保存数以兆字节的数据长达10,000年
想象一下,作为一名探险家,你打开了一个有1万年历史的古墓,发现了一件无价的古代文物,但当你打开它时,里面放的却是一个“rickroll”恶搞视频。由于即将在挪威建造的全球音乐金库和微软的“Project Silica”项目,我们的后代可能会有这样的经历。这是一个坚固的新型数据存储介质,它永远不会放弃你。 有句常言说,一旦东西上网,它就会永远存在,即使你删除了它,它仍然存在于某个服务器里。但这明显是不对的,试着找找你那尴尬的旧MySpace页面。即使是最安全的数据中心也会受到日益严重的气候变化带来的环境灾害的威胁。很多人在长时间停电、大规模电磁脉冲攻击,或者更糟糕的,太阳发出的脉冲中都会丢失数据。即使在最好的情况下,像蓝光碟、归档磁带、硬盘甚至固态硬盘这样的物理存储介质也会在几十年内退化。 为了确保我们的历史得以长久传承,微软一直在尝试用玻璃存储数据,并称其为Project Silica项目。2019年,公司与华纳兄弟合作,展示了这项技术,将1978年的电影《超人》写入一块石英硅玻璃片,并读取出来。这块玻璃片只有75 x 75 mm(3 x 3 英寸)大小,厚2 mm(0.08 英寸),可以存储高达75.6 GB的数据,即使被刮伤、烘焙、沸腾、微波、淹没和退磁后仍然可以读取。 几年过去了,微软似乎进一步完善了这个系统。该存储容量已经扩展了100多倍,达到7 TB以上,公司声称其寿命从1,000年增加到了惊人的10,000年。 微软还展示了基于这项技术的存档如何运作。数千块玻璃片,仔细地编目,排列在图书馆的书架上,它们可以坐在那里,等待几个世纪甚至几千年。当有人需要检索数据时,机器人会沿着书架的轨道跑到正确的位置,抓取所需的玻璃片,并运送回阅读器。 微软计划将这种系统应用到其Azure数据中心,但也与其他公司合作。一个名为Elire的风险资本公司宣布计划在挪威斯瓦尔巴德建造一个全球音乐金库,你可能会认出这是全球种子金库的所在地。这个听觉档案旨在为未来的几代人保护“音乐遗产”,从古典歌剧到现代流行音乐和原住民音乐,公司说。 尽管这个想法很吸引人,但我们不得不承认,这更像是一个公关噱头,而不是真正的保存行为。即使数据是安全的,机器人会成为新的故障点吗?它们如何防范火灾、洪水、EMP和所有其他威胁?关于读取器呢,它们是由算法驱动的微妙的激光器。很可能,任何在12000年可能偶然发现全球音乐金库遗迹的探险家都会将其展示在博物馆中,作为一系列的水晶杯垫。 但在(更)短期内,这种玻璃数据存储确实有其好处。首先,它会大大减少当前数据中心为了保持冷却和在线而产生的巨大电费 – 一旦这些玻璃片被写入,它们在室温下就是稳定的,不需要任何能源来保留它们的数据。此外,公司不需要每隔几年就浪费时间、精力和金钱,从失败的驱动器或磁带上转移数据。 Project Silica团队表示,在这项技术准备好进行商业使用之前,还有三到四个开发阶段要经历。团队在下面的视频中描述了这个系统。
Phind模型在编码方面超越了GPT-4,具有与GPT-3.5相似的速度和16k的上下文能力
Phind现在默认使用我们自己的模型,该模型在编码能力上匹配并超越了GPT-4,同时运行速度提高了5倍。现在,您可以在10秒内获得高质量的技术问题答案,而不是50秒。 目前的第七代Phind模型是基于我们的开源CodeLlama-34B微调构建的,这是首批在HumanEval上击败GPT-4得分的模型,并且仍然是整体上最佳的开源编码模型。 Phind模型V7在HumanEval上达到了74.7%的pass@1 这个新模型已经在额外的70B+高质量代码和推理问题上进行了微调,并展示了74.7%的HumanEval得分。 然而,我们发现HumanEval并不是实际帮助性的良好指标。在我们的服务上部署了Phind模型的前几次迭代后,我们收集了详细的反馈,并注意到我们的模型在实际问题上大部分时间都与GPT-4的帮助性相匹配或超越。我们的Discord社区中的许多人开始独家使用Phind模型与Phind,尽管他们也可以无限制地使用GPT-4。 Phind模型的一个关键优势是它非常快。我们已经能够在使用NVIDIA的新TensorRT-LLM库的H100s上运行我们的模型时,实现了对GPT-4的5倍加速,达到每秒100个令牌的单流。 Phind模型的另一个关键优势是上下文 – 它支持多达16k令牌。我们目前在网站上允许最多12k令牌的输入,并为网络结果保留了剩余的4k。 Phind模型仍然存在一些粗糙的边缘,我们将继续不断地改进它。在某些具有挑战性的问题上,尽管它能够得到正确的答案,但Phind模型可能需要比GPT-4更多的迭代来得到正确的答案。 试试: https://www.phind.com/