微软的研究部门为其较小的大型语言模型增加了一个重要的新功能,这是一个巨大的步骤,表明较便宜的AI技术可以具备与OpenAI的庞大的GPT-4相同的功能。 在一次独家采访中,微软研究人员分享说,该模型Phi 1.5现在是“多模态”的,这意味着它可以查看和解释图像。他们说,这项新技能对模型已经很小的尺寸几乎没有增加多少,为民主化AI技术提供了一条路线图,并有助于缓解运行像ChatGPT这样的软件所需的图形处理器的短缺。 GPT-4是ChatGPT的动力源,最近也变得多模态,但需要指数级更多的能量和处理能力。Phi 1.5是开源的,这意味着任何人都可以免费运行它。 “这是OpenAI对ChatGPT做的大更新之一,”微软研究的机器学习基础组的领导Sebastien Bubeck说。“当我们看到这个时,有一个问题:这是只有最巨大的模型才能做到的能力吗,还是我们可以用我们的小型Phi 1.5做类似的事情?令我们惊奇的是,是的,我们可以做到。” GPT-4有大约1.7万亿的参数,或者用来做预测的软件旋钮和调整。更多的参数意味着模型生成的每个令牌(或字母集)都必须进行更多的计算。相比之下,Phi 1.5有13亿个参数。如果用距离来表示参数,GPT-4就像帝国大厦的大小,而Phi 1.5就像一个英尺长的三明治。 追求具有大型模型能力的小型AI模型不仅仅是一个学术练习。尽管OpenAI的GPT-4和其他庞大的基础模型令人印象深刻,但它们也很昂贵。Dataiku的平台策略副总裁Jed Dougherty说:“可能会有价格震惊。” 人们通常会要求ChatGPT草拟一封电子邮件,但公司经常希望它摄取大量的公司数据,以便对一个提示做出回应。这些请求可能是昂贵的。Dougherty说,单个GPT-4提示的最高价格是5美元,其他提供商的价格也差不多。他说:“当你将LLMs应用于大型数据集,或者允许许多人并行运行提示时…你会希望确保你考虑到了价格。” 较小的模型需要较少的计算来操作,所以它们需要较少强大的处理器和较少的时间来完成响应。同时,较小且稍微不那么有能力的模型可以处理许多公司和个人抛给它们的任务。 耗能较少的模型还有减少温室气体排放和可能的幻觉的额外好处。 “我们正在考虑如何负责任地建立这些系统,以便它们在现实世界中运作良好,”微软研究的人为中心的AI负责人Ece Kamar说。“我们在小模型上所做的所有工作都为我们提供了有趣的拼图片,以便能够建立那个生态系统。” 研究人员说,这些小型模型,尽管它们很有能力,但永远不会取代像GPT-4这样的大型基础模型,后者始终会领先。相反,这两种模型是互补的。对于某些应用,大型模型是必要的。对于非常具体的任务,小型模型可能更为经济。 微软研究的高级首席研究员Ahmed Awadallah说,未来可能是小型模型和大型模型同时用来处理任务。“你也可以想象小型模型在一个不同的制度中被部署。然后,也许,当它对行动没有足够的
披头士最后的歌-Now and Then.
一首名为”Now And Then”的新Beatles歌曲即将发布,这是约翰·列侬开始创作这首歌45年后的事情。由于人工智能技术的帮助,所有的Beatles成员都参与了这首歌的录制。 披头士的粉丝可以去听听 https://www.youtube.com/watch?v=AW55J2zE3N4 这首被称为”最后一首Beatles歌曲”的作品将于周四在流媒体平台上首播,之前人工智能技术已经清理和隔离了列侬1978年的原始演唱录音。列侬在他去世前两年在纽约为这首歌录制了自己的演唱和钢琴伴奏。其余的Beatles成员在1995年试图完成这首歌,但由于列侬录音带的声音质量较差而遇到了困难。 导演彼得·杰克逊在制作Beatles纪录片”Get Back”时重新启动了这个项目。他使用AI去除背景噪音并提高列侬的声音质量,使其可以与新的乐器伴奏正确混合。保罗·麦卡特尼表示,这项技术让他们能够获得约翰”纯净”的声音,并像往常一样完成这首歌。 已于2001年去世的乔治·哈里森将在1995年的录音中被听到他的一些吉他部分。 这是一个激动人心的机会,可以听到Fab Four在他们解散和去世几十年后的一首”新”歌曲。AI的使用为复活更多的旧录音,甚至创作新的音乐提供了可能性。但这也引发了关于同意和操纵已故艺术家的艺术作品的伦理问题。作为一名Beatles粉丝,你可能会很高兴得到最后一首歌,但对其创作方式感到矛盾。这次发布预示了AI模仿真人,包括已故的人创作新内容时将出现的问题。
新版本的ChatGPT集成了所有GPT-4功能工具
OpenAI计划推出一种新的使用多模态GPT-4的方法,该方法可以访问所有工具,而无需切换,并具有更多的文档分析功能。 多位ChatGPT Plus用户在X上分享的屏幕截图显示了PDF和文档分析的新功能以及“All Tools”功能。 “All Tools”功能使用户可以访问所有GPT-4功能,而无需在其中之间切换。 此举被誉为是一次重大的飞跃,推动了生成AI功能的边界,因为它超越了基于文本的查询。 现在,用户可以上传图片并要求DALL·E 3创建响应,为他们的工作流程增加了一个新的维度。 随着越来越多的用户获得新的多模态功能,如何同时使用所有GPT-4工具的示例也随之出现。 有趣的是,GPT-4 All Tools功能似乎不包括ChatGPT插件。 这可能是为了简化用户体验,并将历史上提供类似功能的第三方插件排除在外。 在系统内直接分析PDF和其他文件的能力实际上取消了对直到现在一直在填补这些空白的第三方ChatGPT插件的需求。 通过在ChatGPT的最新版本中整合这些功能,OpenAI回应了用户反馈,创建了一个不依赖于外部功能的更强大的工具。 除了用户可以访问GPT-4的所有工具外,其他人还注意到了一个更近的知识截止日期。 在下周OpenAI的DevDay会议之前,有关该公司的最新消息是,预计该公司将与开发者探索新工具。
微软的AI Copilot可能即将进入您的办公室
ChatGPT的粉丝们几个月来一直说这个AI驱动的聊天机器人将彻底改变我们的工作方式——他们的预测可能终于要成真了。 现在,您的老板可能正在考虑将Microsoft Copilot添加到公司的企业版Microsoft 365订阅中。这个由ChatGPT驱动的工具,Gizmodo形容为“如果Clippy去攻读MBA”,它是一个智能助手,旨在通过将Word文档转换为PowerPoint演示文稿、起草电子邮件回复、总结视频会议以及自动化Microsoft 365套件内的其他任务来为您节省时间。 感兴趣的企业必须购买至少300个用户许可——每个30美元——以将Copilot添加到他们的Microsoft 365 E3或E5订阅中,这还不包括每人每月分别为36美元和57美元的现有订阅费用。 “熟练掌握Copilot”会成为新的简历技能吗? 微软是第一个将ChatGPT的技术整合到广受欢迎的商业软件产品中的公司,这使得一些人不禁想到,这是否微软的“iPhone时刻”。Piper Sandler的分析师预测,有了这个小AI助手在白领的工作日中助阵,到2026年,微软的年收入可能达到100亿美元。 一些高收入的美国公司几个月前就已经提前体验了Copilot,其中一个公司的员工报告说,这个工具每月为他们节省了5到10个小时,据《华尔街日报》报道。 分析师们对其扩展表示乐观: Forrester市场研究集团估计,到明年年底,美国将有近690万知识工作者在使用Copilot。 Piper Sandler还预测,为了与使用该工具的行业竞争对手保持竞争力,错失机会的恐惧会推动企业购买Copilot。 但是……如果ChatGPT的近一年经验教给我们什么,那就是AI经常会出错,这就是为什么技术专家建议Copilot的用户在点击发送按钮之前,先检查机器人的工作是否有异常。
微软的玻璃数据存储系统可以保存数以兆字节的数据长达10,000年
想象一下,作为一名探险家,你打开了一个有1万年历史的古墓,发现了一件无价的古代文物,但当你打开它时,里面放的却是一个“rickroll”恶搞视频。由于即将在挪威建造的全球音乐金库和微软的“Project Silica”项目,我们的后代可能会有这样的经历。这是一个坚固的新型数据存储介质,它永远不会放弃你。 有句常言说,一旦东西上网,它就会永远存在,即使你删除了它,它仍然存在于某个服务器里。但这明显是不对的,试着找找你那尴尬的旧MySpace页面。即使是最安全的数据中心也会受到日益严重的气候变化带来的环境灾害的威胁。很多人在长时间停电、大规模电磁脉冲攻击,或者更糟糕的,太阳发出的脉冲中都会丢失数据。即使在最好的情况下,像蓝光碟、归档磁带、硬盘甚至固态硬盘这样的物理存储介质也会在几十年内退化。 为了确保我们的历史得以长久传承,微软一直在尝试用玻璃存储数据,并称其为Project Silica项目。2019年,公司与华纳兄弟合作,展示了这项技术,将1978年的电影《超人》写入一块石英硅玻璃片,并读取出来。这块玻璃片只有75 x 75 mm(3 x 3 英寸)大小,厚2 mm(0.08 英寸),可以存储高达75.6 GB的数据,即使被刮伤、烘焙、沸腾、微波、淹没和退磁后仍然可以读取。 几年过去了,微软似乎进一步完善了这个系统。该存储容量已经扩展了100多倍,达到7 TB以上,公司声称其寿命从1,000年增加到了惊人的10,000年。 微软还展示了基于这项技术的存档如何运作。数千块玻璃片,仔细地编目,排列在图书馆的书架上,它们可以坐在那里,等待几个世纪甚至几千年。当有人需要检索数据时,机器人会沿着书架的轨道跑到正确的位置,抓取所需的玻璃片,并运送回阅读器。 微软计划将这种系统应用到其Azure数据中心,但也与其他公司合作。一个名为Elire的风险资本公司宣布计划在挪威斯瓦尔巴德建造一个全球音乐金库,你可能会认出这是全球种子金库的所在地。这个听觉档案旨在为未来的几代人保护“音乐遗产”,从古典歌剧到现代流行音乐和原住民音乐,公司说。 尽管这个想法很吸引人,但我们不得不承认,这更像是一个公关噱头,而不是真正的保存行为。即使数据是安全的,机器人会成为新的故障点吗?它们如何防范火灾、洪水、EMP和所有其他威胁?关于读取器呢,它们是由算法驱动的微妙的激光器。很可能,任何在12000年可能偶然发现全球音乐金库遗迹的探险家都会将其展示在博物馆中,作为一系列的水晶杯垫。 但在(更)短期内,这种玻璃数据存储确实有其好处。首先,它会大大减少当前数据中心为了保持冷却和在线而产生的巨大电费 – 一旦这些玻璃片被写入,它们在室温下就是稳定的,不需要任何能源来保留它们的数据。此外,公司不需要每隔几年就浪费时间、精力和金钱,从失败的驱动器或磁带上转移数据。 Project Silica团队表示,在这项技术准备好进行商业使用之前,还有三到四个开发阶段要经历。团队在下面的视频中描述了这个系统。
Phind模型在编码方面超越了GPT-4,具有与GPT-3.5相似的速度和16k的上下文能力
Phind现在默认使用我们自己的模型,该模型在编码能力上匹配并超越了GPT-4,同时运行速度提高了5倍。现在,您可以在10秒内获得高质量的技术问题答案,而不是50秒。 目前的第七代Phind模型是基于我们的开源CodeLlama-34B微调构建的,这是首批在HumanEval上击败GPT-4得分的模型,并且仍然是整体上最佳的开源编码模型。 Phind模型V7在HumanEval上达到了74.7%的pass@1 这个新模型已经在额外的70B+高质量代码和推理问题上进行了微调,并展示了74.7%的HumanEval得分。 然而,我们发现HumanEval并不是实际帮助性的良好指标。在我们的服务上部署了Phind模型的前几次迭代后,我们收集了详细的反馈,并注意到我们的模型在实际问题上大部分时间都与GPT-4的帮助性相匹配或超越。我们的Discord社区中的许多人开始独家使用Phind模型与Phind,尽管他们也可以无限制地使用GPT-4。 Phind模型的一个关键优势是它非常快。我们已经能够在使用NVIDIA的新TensorRT-LLM库的H100s上运行我们的模型时,实现了对GPT-4的5倍加速,达到每秒100个令牌的单流。 Phind模型的另一个关键优势是上下文 – 它支持多达16k令牌。我们目前在网站上允许最多12k令牌的输入,并为网络结果保留了剩余的4k。 Phind模型仍然存在一些粗糙的边缘,我们将继续不断地改进它。在某些具有挑战性的问题上,尽管它能够得到正确的答案,但Phind模型可能需要比GPT-4更多的迭代来得到正确的答案。 试试: https://www.phind.com/
pinokio让你在本地轻松跑多种AI模型的神奇浏览器
设置和运行大量的人工智能应用、模型和工具可能需要相当长的时间。但有一个名为Pinokio的工具专门设计,让您可以单击一次即可安装、运行和自动化任何AI应用或模型。这使您可以享受使用AI而不是设置过程。 安装、运行和控制这些AI引擎的过程可能是一项艰巨的任务。Pinokio基本上是一个自主的虚拟计算机,通过自动化命令行进程并使用户能够单击一次即可创建和共享脚本来简化此过程。 “就像一个网络浏览器,Pinokio本身不会做任何事情,但随着人们围绕它构建和分享应用、工作流和API,它将变得越来越有用。 Pinokio是一个浏览器,可以让您自动且轻松地安装、运行和自动化任何AI应用和模型。再也不需要打开终端。不再是git clone。不再是conda install。不再是pip install。不再混淆执行环境。 freestar Pinokio的美在于其简单性。它消除了打开终端、克隆git、安装conda、pip或处理复杂执行环境的需要。所有这些任务都可以单击一次即可自动化,使其像浏览器一样用户友好。从本质上讲,Pinokio可以自动完成人类在计算机上可以做的任何事情。 AI应用程序通常要求用户打开终端并输入命令,并有时要处理复杂的环境和安装设置。使用Pinokio,所有这些任务都可以打包到一个简单的JSON脚本中,然后只需单击一次即可在浏览器设置中运行。 去试试? https://pinokio.computer/
Apple 发布了配备 M3 系列芯片的新 MacBook Pro,使世界上最好的专业笔记本电脑变得更加出色。
在过去的一年中,最有趣的故事之一是世界上最大的科技公司苹果对过去十年中最重要的技术发展——生成型人工智能——几乎保持完全沉默。当每家其他公司似乎都在努力找到每种可能的方式将最新的热词与每一种产品或服务相结合时,苹果甚至都没有使用这个术语。 事实上,回顾自2022年11月ChatGPT首次向公众发布并世界对生成型人工智能产生痴迷以来的每一个产品发布和公开主题演讲。我们都找不到苹果使用A.I.、人工智能或生成型A.I.这些词的任何例子。 即使在苹果的开发者大会WWDC上,关于A.I.的讨论也很少。从技术上讲,苹果谈论了很多,只是没有称其中任何一个为A.I.。它提到了像“机器学习”、“神经引擎”和“设备上的学习”这样的事情,但没有提到A.I。 即使在苹果描述如何优化其Core ML以用于稳定扩散的论文中,也没有出现一次A.I.这个词。 苹果最接近的是在WWDC上,当它解释新的iOS键盘包括一个变压器模型,使得自动纠正更加准确,并可以在您键入时基于最可能的词生成句子。关键是苹果已经在其硬件中构建了通过其软件和服务为用户服务的功能。 即使在最近的一次盈利电话会议上,当直接被问及时,苹果的首席执行官蒂姆·库克也很保守。库克回应说:“我认为在您处理这些事情时要非常审慎和深思熟虑是非常重要的。有许多问题需要解决……但潜力肯定是非常有趣的。” 他在过去的一年中报道了很多科技产品活动,每次大型科技公司最想谈论的是他们制作的软件中的新的A.I.功能如何改变人们的生活。例如,微软认为A.I.是下一个与PC、移动电话和云计算相当的计算平台。该公司的Copilot助手几乎在Windows和Microsoft 365的每个地方都有。 当然,在很多情况下,A.I.的热度主要只是市场营销炒作,但也有一些值得注意和有用的例子。 然而,现在看来,苹果开始对A.I.有不同的看法。或者至少,它的谈论方式不同了。对于M3,公司表示“与M1系列芯片相比,神经引擎的速度快了60%,使A.I./ML工作流程更快,同时将数据保留在设备上以保护隐私。” 苹果甚至走得更远,强调M3 Max上的增加的存储容量支持“以前在笔记本电脑上不可能的工作流程,比如与数十亿参数的更大的变压器模型一起工作的A.I.开发者。” 苹果不仅仅是在谈论它自己的产品中所包含的功能,而且还明确地将其新的MacBook Pro定位为开发人员构建A.I.产品的工具。这是一个相当大的变化。 他认为这种情况现在正在发生的原因有几个。首先,苹果无疑是有方法的。它提前计划了其产品路线图,不会仅仅因为技术行业的趋势而做出改变。如果苹果要谈论某件事情,它总是因为它相信在那个领域有所贡献,而不仅仅是为了跟随最新的潮流。 这导致了另一个原因——苹果终于有了可以谈论的芯片。假设苹果的说法是真的,M3系列处理器在M2上确实有所改进。苹果在一款笔记本电脑中提供了足够的性能和内存,供开发人员做他们以前不能做的事情。
拜登总统发布关于安全、可靠、值得信赖的人工智能的行政命令
美国总统拜登今天发布了一项具有里程碑意义的行政令,以确保美国在把握人工智能(AI)的前景和管理其风险方面处于领先地位。这项行政令为AI安全性和安全性制定了新的标准,保护美国人的隐私,促进公平和民权,维护消费者和工人的权益,促进创新和竞争,提高美国在全球的领导地位等。 作为拜登-哈里斯政府负责任创新的全面战略的一部分,该行政令基于总统此前采取的行动,包括推动15家领先公司自愿承诺驱动AI的安全、安全和可信赖的发展。 行政令指导采取以下行动: AI安全和安全性的新标准 随着AI的能力增长,它对美国人的安全性和安全性的影响也在增加。根据这项行政令,总统指导采取有史以来最为广泛的行动,以保护美国人免受AI系统可能带来的风险: 保护美国人的隐私 总统呼吁国会通过两党数据隐私立法,以更好地保护美国人的隐私,包括那些由AI带来的风险。 促进公平和民权 为确保AI促进公平和民权,总统指导采取以下附加行动,以防止AI算法被用于加剧歧视。 维护消费者、患者和学生的权益 为了保护消费者并确保AI可以使美国人更好,总统指导采取以下行动。 支持工人 为了减轻这些风险,支持工人集体谈判的能力,并投资于工人培训和发展,总统指导采取以下行动。 促进创新和竞争 该行政令确保我们继续引领创新和竞争的方向。 提高美国在国外的领导地位 拜登-哈里斯政府将继续与其他国家合作,支持AI的安全、安全和可信赖的部署和使用
Google新地图更新:沉浸式路线视图及其他AI新功能
近年来,Google Maps凭借环保路线等特色功能,彻底改变了人们与世界的交互方式。如今,借助AI技术,它带来了更多更新,使用户可以更自信地规划和导航,做出可持续的选择,并快速找到活动的灵感。 Google Maps每天提供超过200亿公里的导航。现在,它正在借助AI重新设想您出行前的规划方式。今年,它推出了路线的沉浸式视图,这是一种全新的预览方式。而本周,这一功能开始在多个城市的Android和iOS设备上推出。 Google Maps还使您在到达目的地后更容易了解周边环境,例如查找最近的咖啡店。它的“Lens in Maps”功能,利用AI和增强现实技术帮助用户快速适应新环境。 今天,数亿司机依赖Google Maps提供的实际路况信息。很快,导航地图将更加真实地反映现实世界。此外,为了帮助用户更好地确定方向,地图将显示更真实的建筑。 对于电动汽车的驾驶者,充电焦虑可能是一个熟悉的问题。从本周开始,EV驾驶者在Android和iOS上将看到更多有用的充电站信息。 有时,你可能知道想做什么,但不确定去哪里。Google Maps的搜索功能正在发展,以为您提供更多答案,帮助您发现活动,并以全新的方式找到灵感。