加入请求下载的名单: https://bit.ly/3Oil6bQ Meta最近更新了它的代码生成AI模型,Code Llama 70B,这可是迄今为止“最大也是表现最好的模型”呢。这个Code Llama工具自去年八月推出以来,就已经免费开放给研究和商业用途了。根据Meta AI博客上的一篇文章,Code Llama 70B能够处理比以往版本更多的查询,这意味着开发者可以在编程时向它提供更多的提示,而且它的准确度也更高。 在HumanEval基准测试中,Code Llama 70B的准确率达到了53%,这比GPT-3.5的48.1%还要高,接近OpenAI报告中GPT-4的67%的标准。 Code Llama是基于Llama 2构建的,它帮助开发者根据提示创建代码字符串,并对人类编写的工作进行调试。去年秋天,Meta同时推出了另外两款Code Llama工具——Code Llama – Python和Code Llama – Instruct,这两款工具专注于特定的编程语言。 相关资讯 马克·扎克伯格的新目标是创造全面的人工智能 Code Llama 70B有三个版本的代码生成器可供选择,而且无论是研究还是商业用途,都是免费的。这个大型模型接受了1TB的代码和相关数据的训练。它托管在代码库Hugging Face上,该库提供GPU来运行AI模型。 Meta表示,其较大的模型,34B和70B,“返回最佳结果,并为更好的编码协助提供支持”。 过去一年里,其他AI开发者也发布了代码生成器。亚马逊的CodeWhisperer于四月推出,而微软则利用OpenAI的模型推出了GitHub Copilot。
微软给Windows 11增添了一个由AI支持的‘Voice Clarity’功能
“微软宣布了一个名为‘Voice Clarity’的新功能,利用人工智能技术提升Windows 11上的视频通话体验。这个功能之前只在Surface设备上有,现在所有用户都能用了,它在最新的Windows 11 Canary版本中首次亮相。 还有,微软CEO萨蒂亚·纳德拉将于2月访问印度,重点可能会放在AI上。 这个新鲜出炉的‘Voice Clarity’功能由复杂的AI模型驱动,能在实时中消除背景噪音、减少混响和取消回声。 微软在博客中写道:“‘Voice Clarity’是一个利用最先进AI技术增强Windows音频体验的功能。这个功能由简单的AI模型驱动,能实时取消回声、压制背景噪音,并减少混响。” “这个功能默认启用,可以被使用通信信号处理模式的应用程序所利用,比如Phone Link和WhatsApp。无需额外硬件,因为‘Voice Clarity’支持x64和Arm64 CPU。” 这家总部位于里士满的公司补充说道。 新功能对于经常在线开会的用户特别有帮助,微软表示它还将为使用通信信号处理模式进行在线通信的PC游戏提供更丰富的音效体验。 微软Canary版本带来的更多功能:Windows 11的Canary版本还引入了许多其他新功能,包括让用户能够在Windows 11的截图工具中访问他们Android设备上最近的照片和截屏。启用此功能后,用户的PC将在他们的Android手机上拍摄新照片或截屏时收到通知。 此外,最新版本还将开始支持最新一代的USB标准,即80Gbps的USB,在运行英特尔第14代HX系列移动处理器的特定设备上,比如雷蛇Blade 18。” 这消息简直太炸了!微软这次真的是玩大了,把AI和音频清晰度结合起来,提升我们的数字生活体验。让我们拭目以待,看看这个功能会给我们的日常带来多少惊喜吧!
OpenAI最近推出了ChatGPT的一个新功能,@GPT
OpenAI最近推出了ChatGPT的一个新功能,叫做“@GPT”,这玩意儿可真够酷的!想象一下,在同一个聊天窗口里,可以同时跟好几个不同领域的GPT大佬们聊天,这不就像是开了一个脑洞大会吗?这个功能大大提升了用户的互动体验,就好像是把各种各样的智慧头脑集中到一起,随时准备回答你的提问。这可是OpenAI一直以来的野心啊,想要打造一个多功能、适用于各种场景的超级助手,贴合每个人的个性化需求。这就像是Sam Altman的未来愿景变成现实了一样,预示着我们与数字世界互动方式的一场革命。想想看,这样的AI,是不是既时髦又有趣呢?
Gemini Pro-scale模型驱动的新宠,刚刚在独立的lmsys排行榜上首次亮相就摘得了第二名的好成绩
Bard,这个由Gemini Pro-scale模型驱动的新宠,刚刚在独立的lmsys排行榜上首次亮相就摘得了第二名的好成绩!🔥 这次它取得了一个重要的里程碑,通过人类评估与OpenAI的GPT-4匹敌。谷歌AI部门的负责人Jeff Dean宣布了这个新模型,别出心裁地称之为“scale”,这意味着可能扩展了之前Pro模型的能力。双子座Pro“scale”在Chatbot Arena排行榜上成功获得第二名,超越了之前版本的GPT-4,但略落后于最新的GPT-4 Turbo版本。谷歌的Oriol Vinyals强调了评估语言模型的微妙挑战,并倡导使用人类评估而非学术基准。 大家都在期待着更强大的双子座超级模型的即将发布,期望它可能超越Pro-Scale版本的成就。
iOS 17.4 苹果公司正在加倍投入人工智能
来看看苹果在AI领域的最新动向吧。最近,他们发布了iOS 17.4的测试版,而这给我们透露了一些关于即将到来的iOS 18的线索。苹果公司正在升级Siri和消息应用,并且还在测试一些针对ChatGPT的功能。 那到底发生了什么? 据说,在iOS 18中,苹果有望引入更先进的AI功能,这一点从iOS 17.4测试版的代码中就能窥见一二。 这个版本的代码展示了一个名为SiriSummarization的新功能,旨在提高Siri理解和总结信息的能力,可能使它在日常任务和交流中变得更有用。目前,ChatGPT正在帮忙,但苹果也在测试自己的AI模型,比如名为“Ajax”的模型,来推动这些改进。 彭博社还报道了在消息应用中整合AI的可能性,包括自动回复和句子完成功能,这都是由Craig Federighi的软件团队推动的。在iOS 17.4测试版中,有明确的证据表明苹果正在尝试增强Siri的能力,但不太可能使用外部模型。这更像是他们在测试内部模型与ChatGPT(以及Flan-T5)的对比。 考虑到到目前为止Siri(实际上,大多数语音助手)的表现都不尽人意,苹果这一举措可能是一个游戏规则的改变者。我们都希望助手能真正理解上下文并提供相关、有用的互动。让我们拭目以待,看看苹果是否能在打造真正有助益的助手方面领先一步。
微软新鲜出炉的总结2023年的《未来工作报告》
微软最新发布了他们的年度《未来工作报告》,这次的焦点不再是远程工作,而是人工智能。没错,你没听错,就是AI!这份报告基于2023年的多项研究统计数据,还有过去几年的理论研究支持。我为你整理了一份“忙碌人士指南”,让你快速了解重点。 – 聊天机器人GPT让知识型工作者的工作效率提高37%,质量提高40%,但准确度下降了大约20%。解决这个问题的简单用户体验方案是可行的。 – 微软Copilot 365的企业用户调查显示: – 73%的用户认为Copilot让他们工作更快 – 85%的用户说它能帮助他们更快地完成初稿 – 72%的用户同意它减少了在重复或乏味任务上的心理负担 – 早期研究发现,新手或技能较低的工作者最受益于大型语言模型(LLMs)。技能较低的工作者表现提升了43%,而技能较高的提升了约17%。 – 需要与“挑战者”搭配使用,即基于LLM的工具,它们可以挑战假设、鼓励评估并提供反驳意见。 – 人工智能可以帮助将简单命令分解为微时刻和微任务,提高整体质量和效率。 – 分析和整合由AI生成的信息可能比搜索和创造信息更为重要。与内容制作不直接相关的技能(如领导力、社交互动、信任问题或情感意识)可能更有价值。 – 提问很难,但人们正在变得擅长它。精调/使用LLMs来生成提示也在变得更容易。提示模板对终端用户有帮助。 – 高亮显示错误/不确定性百分比可以帮助平衡对LLMs的依赖。提示可以通过共审工具来补充,以检查LLM的输出。 – 生成性AI需要自我意识和良好的信心校准。同时,它也可以帮助达到这一点。 – 创造性活动是一个过程,LLMs可以在不同部分提供帮助。69%的Bing聊天对话是面向专业任务的领域。 – 基于LLM的搜索中,复杂的部分比例更大(其中36%是复杂的),而传统搜索中复杂的比例较低(13%是复杂的)。 – 在一项对69名学生的研究中,使用Codex提高了他们学习Python的表现,但对他们的手动代码修改能力没有影响。 – LLMs可以快速分析来自人类的数据并生成合成数据。这将改变社会科学研究的方式。 – 在会议中使用LLMs可以解决不同的问题,如平等参与(即时反馈)和更好的互动(回顾性反馈)。) – AI可以帮助分配管理责任,让高管们更专注于团队愿景。 – 现代办公室的知识存在于聊天中,而不是文档里,但在员工聊天记录上应用AI比较棘手。( – 大约80%的美国劳动力可能至少有10%的工作任务受到GPTs的影响。大约19%的工作者可能有50%的任务受影响。 – “创新与自动化”通常是一个比“替代与增强”更好的框架。增强可能仍意味着工作岗位的丧失。重要的是尝试跟踪人类劳动力是否以及如何以创新的新方式被使用。 – 不应该问“AI将如何影响工作?”,而应该问“我们希望AI如何影响工作?” 英文全文下载: https://www.microsoft.com/en-us/research/uploads/prod/2023/12/NFWReport2023_v4.pdf?utm_source=bensbites&utm_medium=newsletter&utm_campaign=daily-digest-are-siri-chatgpt-friends-now
LangGraph:一个基于LangChain构建的AI库,用于创建具有状态、多参与者的应用程序
需要构建一种系统,能够响应用户输入、记住过去的互动,并基于这些历史记录做出决策。这种需求对于创建更像智能代理的应用程序至关重要,它们能够维持对话、记住过去的上下文,并做出明智的决策。 目前,一些解决方案解决了这个问题的部分方面。有些框架允许创建带有语言模型的应用程序,但它们无法有效地支持持续的、有状态的互动。这些解决方案通常专注于处理单一输入和生成单一输出,而没有内置的方式来记住过去的互动或上下文。这种限制使得创建需要记住之前对话或行动的更复杂、互动性更强的应用程序变得困难。 解决这个问题的方案是LangGraph库,它旨在使用语言模型构建有状态、多参与者的应用程序,并建立在LangChain之上。LangGraph库允许创建可以维持多步对话的应用程序,记住过去的互动,并使用这些信息来指导未来的回应。它对于创建类似代理的行为特别有用,应用程序可以持续与用户互动,询问并记住之前的问题和答案,以提供更相关、更明智的回应。 这个库的一个关键特性是它能够处理循环,这对于维持持续对话至关重要。与其他仅限于单向数据流的框架不同,这个库支持循环数据流,使应用程序能够记住并基于过去的互动进行构建。这一能力对于创建更复杂、更响应灵敏的应用程序至关重要。 这个库通过其灵活的架构、易用性以及与现有工具和框架的集成能力,展示了其功能。它简化了开发过程,使开发者能够专注于创建更复杂、更互动的应用程序,而不必担心维持状态和上下文的底层机制。 总之,LangGraph代表了使用语言模型开发互动应用程序的一个重要步骤,为开发者打造更复杂、更智能、更响应灵敏的应用程序提供了新的机会。它能够处理循环数据流并与现有工具集成的能力,使其成为这一领域任何开发者工具箱中的宝贵补充。 详细去访问: https://github.com/langchain-ai/langgraph
“Morpheus-1”的全新人工智能模型声称能引发清醒梦境
近年来,人工智能已经渗透到我们科技生活的方方面面,从聊天机器人到猫门 — 但现在,有一家公司希望人工智能能走进你的梦境。 神经科技初创公司“Prophetic”开发了一款名为“Morpheus-1”的新型人工智能模型,它声称能帮助人们进入清醒梦状态,并稳定这种梦境。清醒梦是一种梦境状态,梦者意识到自己在做梦,并且常常能对梦中的角色、叙事和环境有所控制。这是克里斯托弗·诺兰2010年令人困惑的现代经典电影《盗梦空间》的主要情节设备。Prophetic表示,这个模型以当前的大脑状态作为提示,并生成可以发送到大脑的超声波全息图,以启动清醒梦状态并保持其稳定。 Morpheus-1,以希腊梦神之名命名,是一款在8个GPU上训练了两天的AI模型,使用的是与支持ChatGPT和MidJourney的同一底层变换器技术。不同于大型语言模型或图像生成器,Morpheus-1以大脑活动作为提示,生成可以与该大脑状态相互作用的形状声波作为输出。这种新的大脑刺激方法将与Prophetic即将在春季发布的一款名为“The Halo”的新头带产品绑定。The Halo会发送声波,或者说超声波全息图,进入大脑,与当前的大脑状态相连接,从而使心灵进入清醒状态。据Prophetic称:“清醒梦是一种梦者意识到自己正在睡觉的梦。”它们有效地让你控制那个梦,公司称它们是“意识的粒子加速器”,让人们获得自我意识。在我看来,这就像是一个状态,你可以成为主角,决定去哪里,将你的心灵变成最好、最真实的开放世界游戏。 已经有无数研究探讨了清醒梦的现象,以及诱发它的方法。一组研究者发现,你可以让人们在清醒梦中蹲下,增加心率,就像真的在做运动一样 — 尽管他们没有移动。它也被证明是一种治疗噩梦和噩梦障碍的方法,因为你可以在清醒的噩梦中改变对某些事物的反应,变得更有力量。它还被建议用作治疗临床抑郁症或创伤后应激障碍(PTSD)的技术。 然而,如果过于频繁使用,它也可能导致睡眠不安。而进入清醒梦状态的最佳技巧之一也威胁着获得良好夜间睡眠,因为它涉及在睡眠四小时后醒来,集中精神,然后再次入睡。 Prophetic声称,他们的技术不仅会诱导清醒梦状态,保持它更长时间的活跃和稳定,而且还提供了一种更安全的进入该状态的方式。 “Morpheus-1是我们使命的一大飞跃,让我们更接近于超声波诱导意识体验的需求,并永远改变世界,”公司在X上写道。这将通过一种非侵入性的可穿戴技术实现。具体来说,是一种发送超声波信号进入大脑的头带。The Halo使用了“神经刺激系统,复制了自然清醒梦的典型神经激活模式。” 我不会在测试者名单上。虽然我发现人工智能很有趣,但我并不认为它足够有趣,可以信任它来处理我的大脑状态或梦境。但这一概念的底层是非常有趣的,如果它确实像开发者所暗示的那样工作——可能会在我们看待自己的方式上带来重大突破。
今日AI大热潮,明日智能风向标
自从ChatGPT问世的419天以来,无数的AI初创公司获得了资金支持。我们也见证了连续419天的AI网红们,对每一个AI突破都大肆宣传。但我们离梦想中的AI未来还有多远?AI的普及和应用又进行到哪一步了? 于是,我调查了23位最懂AI的朋友,询问他们对当今AI的看法。他们都很厉害,比我聪明多了。其中一些是创业者,一些在顶尖公司工作,还有一些是投资者。非常感谢他们的帮助,使这一切成为可能。 以下是我从调查中得到的主要观点和一些视觉化结果。 主要观点 一切才刚刚开始 ChatGPT仍然是最常用的应用程序。(40%的受访者提到它是他们最常使用的应用)。AI可能将经历5到10年的应用周期。在每个应用领域或模式(文本、音频、图像、视频等)中,目前还只有1-2个主导者。我们作为工程师,仍然只是为自己的使用案例构建AI(几乎30%的受访者使用AI进行编码)。对于非技术人员的使用案例,我们甚至还没有摘取低挂的果实。 信号不足,噪音太多 尽管有这么多人在推特上发声,但真正新颖的AI演示和原创思想仍然不足。人们不知道可能的事情,甚至不知道该构建什么。即使在Twitter上,也没有足够一致的创业者或创始人可以密切关注。(>50%的受访者没有提到谁在AI领域做得最有趣)。这是你开始构建和撰写新想法的信号 🙂 人们对多模态应用感到兴奋 去年,初创公司和DIY者的大部分关注点都在大型语言模型和基础设施上。随着图像、视频和音频模型变得更加易于获得,我们可以预测明年会有更多的多模态应用出现。(22.7%的受访者表示他们最期待2024年的多模态应用案例)。 总的来说,对AI的乐观情绪持续增长。我从2022年7月开始构建AI应用。那时候,感觉有很多东西可以探索。今天,这种感觉似乎变得更加强烈。 调查结果 你的工作是什么? 你经常使用哪些AI产品或应用程序? 你使用AI产品或应用程序做什么? 最近你看到的最酷的演示是什么? 你知道的最酷的AI公司是哪家? 你希望有人构建哪些现在不存在的AI公司、基础设施或产品? 你使用哪个基础设施提供商来托管或管理你的AI模型? 你最喜欢的大型语言模型/文本模型或提供商是哪
谷歌宣布了一系列全新的、由人工智能驱动的教育功能
谷歌在英国的Bett教育科技活动中宣布了一系列新功能,这些功能涵盖了课堂管理、无障碍访问以及一些利用人工智能创建问题和教案的特色功能。 AI驱动的特色功能 谷歌已经允许教师在YouTube视频中添加问题作为课堂作业的一部分。该公司表示,不久的将来,AI将帮助提供不同时间戳的问题建议。该公司首次在2023年6月宣布了这一功能。然而,当时教师需要申请才能获得此功能。 公司还补充说,使用AI创建答案和一般提示的“练习集”功能现在已经支持超过50种语言。此外,教育工作者可以将谷歌表单转换为练习集。 此外,谷歌还推出了一个新的“资源”标签,以管理练习集和视频中提出的互动问题。 此外,该公司提到,其为谷歌工作区提供的生成式AI工具“Duet AI”可以协助教师制定教学计划。 课堂管理 谷歌表示,今年晚些时候,教师将能够在课堂中形成不同的小组,并为不同小组分配不同的作业。 此外,他们还可以使用幻灯片中的“演讲者聚焦”功能,结合幻灯片套件创建带有叙述的课程。 现在,教育工作者还可以通过谷歌工作区中提供的电子签名功能轻松收集批准或合同的签名。 该公司还在更新课堂分析,以便教育工作者可以查看作业完成情况和成绩趋势等统计数据。 无障碍功能 谷歌正在增加一项功能,以便ChromeOS上的屏幕阅读器可以从PDF中获取文本。此外,使用Chrome浏览器的用户可以突出显示并大声朗读文本。 该公司还在谷歌Meet中增加了一些功能,如30种语言的封闭字幕和固定多个主持人的能力。 Chromebook 该公司表示,它正在Bett展示15款新的Chromebook,这些Chromebook将于今年推出。此外,谷歌即将更新Chromebook,以便学生可以直接从主屏幕上查看即将到来的作业。