AI TrendTrackers

Elon Musk 的 Neuralink 公司首次在人类患者体内植入脑部科技

Posted on January 30, 2024January 30, 2024 by aitrendtrackers@rengongzhineng.io

周日，Elon Musk 的神经科技初创公司 Neuralink 在人类身上首次植入了他们的设备，而且据这位亿万富翁周一在 X（以前叫 Twitter）上说，患者恢复得挺好的。这家公司正在开发一种大脑植入物，目的是帮助严重瘫痪的患者仅凭神经信号就能控制外部技术。在去年秋天获得美国食品和药品管理局（FDA）的批准后，Neuralink 开始招募首批人体临床试验的患者，这一消息来自一篇博客文章。 Musk 周一表示，Neuralink 的首款产品名为“心灵感应”，这是他在 X 上发布的消息。如果这项技术能够正常运作，像肌萎缩侧索硬化症（ALS）这样的严重退行性疾病患者将来可能会通过植入物来沟通，甚至通过移动光标和心灵打字来使用社交媒体。 “想象一下，如果史蒂芬·霍金能比速记员或拍卖师交流得更快，” Musk 写道。“那就是我们的目标。” 这次人体临床试验只是 Neuralink 向商业化迈进的众多步骤之一。医疗设备公司在从 FDA 获得最终批准之前，必须经历几轮严格的数据安全收集和测试。全球各地都在合法化大麻，你猜接下来会是什么？ Neuralink 没有透露将有多少人参与其首次人体试验。该公司没有立即回应 CNBC 关于最近手术的评论请求。作为新兴的脑-计算机接口（BCI）行业的一部分，Neuralink 可能是这个领域最知名的公司，这要归功于 Musk 的高知名度，他还是特斯拉和 SpaceX 的 CEO。BCI 是一个解析大脑信号并将它们转换成外部技术命令的系统，Synchron、Precision Neuroscience、Paradromics 和 Blackrock Neurotech 等公司也开发了具有这些功能的系统。 Paradromics 计划在今年上半年进行首次人体试验。Precision Neuroscience 去年进行了其首次人体临床研究。一位接受了 Synchron BCI 的患者在 2021 年通过 CEO Tom Oxley 的 Twitter…

Meta开源Code Llama 70B,缩小与GPT-4之间的技术鸿沟

Posted on January 30, 2024January 30, 2024 by aitrendtrackers@rengongzhineng.io

加入请求下载的名单： https://bit.ly/3Oil6bQ Meta最近更新了它的代码生成AI模型，Code Llama 70B，这可是迄今为止“最大也是表现最好的模型”呢。这个Code Llama工具自去年八月推出以来，就已经免费开放给研究和商业用途了。根据Meta AI博客上的一篇文章，Code Llama 70B能够处理比以往版本更多的查询，这意味着开发者可以在编程时向它提供更多的提示，而且它的准确度也更高。在HumanEval基准测试中，Code Llama 70B的准确率达到了53%，这比GPT-3.5的48.1%还要高，接近OpenAI报告中GPT-4的67%的标准。 Code Llama是基于Llama 2构建的，它帮助开发者根据提示创建代码字符串，并对人类编写的工作进行调试。去年秋天，Meta同时推出了另外两款Code Llama工具——Code Llama – Python和Code Llama – Instruct，这两款工具专注于特定的编程语言。相关资讯马克·扎克伯格的新目标是创造全面的人工智能 Code Llama 70B有三个版本的代码生成器可供选择，而且无论是研究还是商业用途，都是免费的。这个大型模型接受了1TB的代码和相关数据的训练。它托管在代码库Hugging Face上，该库提供GPU来运行AI模型。 Meta表示，其较大的模型，34B和70B，“返回最佳结果，并为更好的编码协助提供支持”。过去一年里，其他AI开发者也发布了代码生成器。亚马逊的CodeWhisperer于四月推出，而微软则利用OpenAI的模型推出了GitHub Copilot。

微软给Windows 11增添了一个由AI支持的‘Voice Clarity’功能

Posted on January 30, 2024January 30, 2024 by aitrendtrackers@rengongzhineng.io

“微软宣布了一个名为‘Voice Clarity’的新功能，利用人工智能技术提升Windows 11上的视频通话体验。这个功能之前只在Surface设备上有，现在所有用户都能用了，它在最新的Windows 11 Canary版本中首次亮相。还有，微软CEO萨蒂亚·纳德拉将于2月访问印度，重点可能会放在AI上。这个新鲜出炉的‘Voice Clarity’功能由复杂的AI模型驱动，能在实时中消除背景噪音、减少混响和取消回声。微软在博客中写道：“‘Voice Clarity’是一个利用最先进AI技术增强Windows音频体验的功能。这个功能由简单的AI模型驱动，能实时取消回声、压制背景噪音，并减少混响。” “这个功能默认启用，可以被使用通信信号处理模式的应用程序所利用，比如Phone Link和WhatsApp。无需额外硬件，因为‘Voice Clarity’支持x64和Arm64 CPU。” 这家总部位于里士满的公司补充说道。新功能对于经常在线开会的用户特别有帮助，微软表示它还将为使用通信信号处理模式进行在线通信的PC游戏提供更丰富的音效体验。微软Canary版本带来的更多功能：Windows 11的Canary版本还引入了许多其他新功能，包括让用户能够在Windows 11的截图工具中访问他们Android设备上最近的照片和截屏。启用此功能后，用户的PC将在他们的Android手机上拍摄新照片或截屏时收到通知。此外，最新版本还将开始支持最新一代的USB标准，即80Gbps的USB，在运行英特尔第14代HX系列移动处理器的特定设备上，比如雷蛇Blade 18。” 这消息简直太炸了！微软这次真的是玩大了，把AI和音频清晰度结合起来，提升我们的数字生活体验。让我们拭目以待，看看这个功能会给我们的日常带来多少惊喜吧！

OpenAI最近推出了ChatGPT的一个新功能，@GPT

Posted on January 29, 2024January 29, 2024 by aitrendtrackers@rengongzhineng.io

OpenAI最近推出了ChatGPT的一个新功能，叫做“@GPT”，这玩意儿可真够酷的！想象一下，在同一个聊天窗口里，可以同时跟好几个不同领域的GPT大佬们聊天，这不就像是开了一个脑洞大会吗？这个功能大大提升了用户的互动体验，就好像是把各种各样的智慧头脑集中到一起，随时准备回答你的提问。这可是OpenAI一直以来的野心啊，想要打造一个多功能、适用于各种场景的超级助手，贴合每个人的个性化需求。这就像是Sam Altman的未来愿景变成现实了一样，预示着我们与数字世界互动方式的一场革命。想想看，这样的AI，是不是既时髦又有趣呢？

Gemini Pro-scale模型驱动的新宠，刚刚在独立的lmsys排行榜上首次亮相就摘得了第二名的好成绩

Posted on January 29, 2024January 29, 2024 by aitrendtrackers@rengongzhineng.io

Bard，这个由Gemini Pro-scale模型驱动的新宠，刚刚在独立的lmsys排行榜上首次亮相就摘得了第二名的好成绩！🔥 这次它取得了一个重要的里程碑，通过人类评估与OpenAI的GPT-4匹敌。谷歌AI部门的负责人Jeff Dean宣布了这个新模型，别出心裁地称之为“scale”，这意味着可能扩展了之前Pro模型的能力。双子座Pro“scale”在Chatbot Arena排行榜上成功获得第二名，超越了之前版本的GPT-4，但略落后于最新的GPT-4 Turbo版本。谷歌的Oriol Vinyals强调了评估语言模型的微妙挑战，并倡导使用人类评估而非学术基准。大家都在期待着更强大的双子座超级模型的即将发布，期望它可能超越Pro-Scale版本的成就。

iOS 17.4 苹果公司正在加倍投入人工智能

Posted on January 29, 2024January 29, 2024 by aitrendtrackers@rengongzhineng.io

来看看苹果在AI领域的最新动向吧。最近，他们发布了iOS 17.4的测试版，而这给我们透露了一些关于即将到来的iOS 18的线索。苹果公司正在升级Siri和消息应用，并且还在测试一些针对ChatGPT的功能。那到底发生了什么？据说，在iOS 18中，苹果有望引入更先进的AI功能，这一点从iOS 17.4测试版的代码中就能窥见一二。这个版本的代码展示了一个名为SiriSummarization的新功能，旨在提高Siri理解和总结信息的能力，可能使它在日常任务和交流中变得更有用。目前，ChatGPT正在帮忙，但苹果也在测试自己的AI模型，比如名为“Ajax”的模型，来推动这些改进。彭博社还报道了在消息应用中整合AI的可能性，包括自动回复和句子完成功能，这都是由Craig Federighi的软件团队推动的。在iOS 17.4测试版中，有明确的证据表明苹果正在尝试增强Siri的能力，但不太可能使用外部模型。这更像是他们在测试内部模型与ChatGPT（以及Flan-T5）的对比。考虑到到目前为止Siri（实际上，大多数语音助手）的表现都不尽人意，苹果这一举措可能是一个游戏规则的改变者。我们都希望助手能真正理解上下文并提供相关、有用的互动。让我们拭目以待，看看苹果是否能在打造真正有助益的助手方面领先一步。

微软新鲜出炉的总结2023年的《未来工作报告》

Posted on January 29, 2024January 29, 2024 by aitrendtrackers@rengongzhineng.io

微软最新发布了他们的年度《未来工作报告》，这次的焦点不再是远程工作，而是人工智能。没错，你没听错，就是AI！这份报告基于2023年的多项研究统计数据，还有过去几年的理论研究支持。我为你整理了一份“忙碌人士指南”，让你快速了解重点。 – 聊天机器人GPT让知识型工作者的工作效率提高37%，质量提高40%，但准确度下降了大约20%。解决这个问题的简单用户体验方案是可行的。 – 微软Copilot 365的企业用户调查显示： – 73%的用户认为Copilot让他们工作更快 – 85%的用户说它能帮助他们更快地完成初稿 – 72%的用户同意它减少了在重复或乏味任务上的心理负担 – 早期研究发现，新手或技能较低的工作者最受益于大型语言模型（LLMs）。技能较低的工作者表现提升了43%，而技能较高的提升了约17%。 – 需要与“挑战者”搭配使用，即基于LLM的工具，它们可以挑战假设、鼓励评估并提供反驳意见。 – 人工智能可以帮助将简单命令分解为微时刻和微任务，提高整体质量和效率。 – 分析和整合由AI生成的信息可能比搜索和创造信息更为重要。与内容制作不直接相关的技能（如领导力、社交互动、信任问题或情感意识）可能更有价值。 – 提问很难，但人们正在变得擅长它。精调/使用LLMs来生成提示也在变得更容易。提示模板对终端用户有帮助。 – 高亮显示错误/不确定性百分比可以帮助平衡对LLMs的依赖。提示可以通过共审工具来补充，以检查LLM的输出。 – 生成性AI需要自我意识和良好的信心校准。同时，它也可以帮助达到这一点。 – 创造性活动是一个过程，LLMs可以在不同部分提供帮助。69%的Bing聊天对话是面向专业任务的领域。 – 基于LLM的搜索中，复杂的部分比例更大（其中36%是复杂的），而传统搜索中复杂的比例较低（13%是复杂的）。 – 在一项对69名学生的研究中，使用Codex提高了他们学习Python的表现，但对他们的手动代码修改能力没有影响。 – LLMs可以快速分析来自人类的数据并生成合成数据。这将改变社会科学研究的方式。 – 在会议中使用LLMs可以解决不同的问题，如平等参与（即时反馈）和更好的互动（回顾性反馈）。） – AI可以帮助分配管理责任，让高管们更专注于团队愿景。 – 现代办公室的知识存在于聊天中，而不是文档里，但在员工聊天记录上应用AI比较棘手。（ – 大约80%的美国劳动力可能至少有10%的工作任务受到GPTs的影响。大约19%的工作者可能有50%的任务受影响。 – “创新与自动化”通常是一个比“替代与增强”更好的框架。增强可能仍意味着工作岗位的丧失。重要的是尝试跟踪人类劳动力是否以及如何以创新的新方式被使用。 – 不应该问“AI将如何影响工作？”，而应该问“我们希望AI如何影响工作？” 英文全文下载： https://www.microsoft.com/en-us/research/uploads/prod/2023/12/NFWReport2023_v4.pdf?utm_source=bensbites&utm_medium=newsletter&utm_campaign=daily-digest-are-siri-chatgpt-friends-now

LangGraph：一个基于LangChain构建的AI库，用于创建具有状态、多参与者的应用程序

Posted on January 28, 2024January 28, 2024 by aitrendtrackers@rengongzhineng.io

需要构建一种系统，能够响应用户输入、记住过去的互动，并基于这些历史记录做出决策。这种需求对于创建更像智能代理的应用程序至关重要，它们能够维持对话、记住过去的上下文，并做出明智的决策。目前，一些解决方案解决了这个问题的部分方面。有些框架允许创建带有语言模型的应用程序，但它们无法有效地支持持续的、有状态的互动。这些解决方案通常专注于处理单一输入和生成单一输出，而没有内置的方式来记住过去的互动或上下文。这种限制使得创建需要记住之前对话或行动的更复杂、互动性更强的应用程序变得困难。解决这个问题的方案是LangGraph库，它旨在使用语言模型构建有状态、多参与者的应用程序，并建立在LangChain之上。LangGraph库允许创建可以维持多步对话的应用程序，记住过去的互动，并使用这些信息来指导未来的回应。它对于创建类似代理的行为特别有用，应用程序可以持续与用户互动，询问并记住之前的问题和答案，以提供更相关、更明智的回应。这个库的一个关键特性是它能够处理循环，这对于维持持续对话至关重要。与其他仅限于单向数据流的框架不同，这个库支持循环数据流，使应用程序能够记住并基于过去的互动进行构建。这一能力对于创建更复杂、更响应灵敏的应用程序至关重要。这个库通过其灵活的架构、易用性以及与现有工具和框架的集成能力，展示了其功能。它简化了开发过程，使开发者能够专注于创建更复杂、更互动的应用程序，而不必担心维持状态和上下文的底层机制。总之，LangGraph代表了使用语言模型开发互动应用程序的一个重要步骤，为开发者打造更复杂、更智能、更响应灵敏的应用程序提供了新的机会。它能够处理循环数据流并与现有工具集成的能力，使其成为这一领域任何开发者工具箱中的宝贵补充。详细去访问： https://github.com/langchain-ai/langgraph

“Morpheus-1”的全新人工智能模型声称能引发清醒梦境

Posted on January 26, 2024January 26, 2024 by aitrendtrackers@rengongzhineng.io

近年来，人工智能已经渗透到我们科技生活的方方面面，从聊天机器人到猫门 — 但现在，有一家公司希望人工智能能走进你的梦境。神经科技初创公司“Prophetic”开发了一款名为“Morpheus-1”的新型人工智能模型，它声称能帮助人们进入清醒梦状态，并稳定这种梦境。清醒梦是一种梦境状态，梦者意识到自己在做梦，并且常常能对梦中的角色、叙事和环境有所控制。这是克里斯托弗·诺兰2010年令人困惑的现代经典电影《盗梦空间》的主要情节设备。Prophetic表示，这个模型以当前的大脑状态作为提示，并生成可以发送到大脑的超声波全息图，以启动清醒梦状态并保持其稳定。 Morpheus-1，以希腊梦神之名命名，是一款在8个GPU上训练了两天的AI模型，使用的是与支持ChatGPT和MidJourney的同一底层变换器技术。不同于大型语言模型或图像生成器，Morpheus-1以大脑活动作为提示，生成可以与该大脑状态相互作用的形状声波作为输出。这种新的大脑刺激方法将与Prophetic即将在春季发布的一款名为“The Halo”的新头带产品绑定。The Halo会发送声波，或者说超声波全息图，进入大脑，与当前的大脑状态相连接，从而使心灵进入清醒状态。据Prophetic称：“清醒梦是一种梦者意识到自己正在睡觉的梦。”它们有效地让你控制那个梦，公司称它们是“意识的粒子加速器”，让人们获得自我意识。在我看来，这就像是一个状态，你可以成为主角，决定去哪里，将你的心灵变成最好、最真实的开放世界游戏。已经有无数研究探讨了清醒梦的现象，以及诱发它的方法。一组研究者发现，你可以让人们在清醒梦中蹲下，增加心率，就像真的在做运动一样 — 尽管他们没有移动。它也被证明是一种治疗噩梦和噩梦障碍的方法，因为你可以在清醒的噩梦中改变对某些事物的反应，变得更有力量。它还被建议用作治疗临床抑郁症或创伤后应激障碍（PTSD）的技术。然而，如果过于频繁使用，它也可能导致睡眠不安。而进入清醒梦状态的最佳技巧之一也威胁着获得良好夜间睡眠，因为它涉及在睡眠四小时后醒来，集中精神，然后再次入睡。 Prophetic声称，他们的技术不仅会诱导清醒梦状态，保持它更长时间的活跃和稳定，而且还提供了一种更安全的进入该状态的方式。 “Morpheus-1是我们使命的一大飞跃，让我们更接近于超声波诱导意识体验的需求，并永远改变世界，”公司在X上写道。这将通过一种非侵入性的可穿戴技术实现。具体来说，是一种发送超声波信号进入大脑的头带。The Halo使用了“神经刺激系统，复制了自然清醒梦的典型神经激活模式。” 我不会在测试者名单上。虽然我发现人工智能很有趣，但我并不认为它足够有趣，可以信任它来处理我的大脑状态或梦境。但这一概念的底层是非常有趣的，如果它确实像开发者所暗示的那样工作——可能会在我们看待自己的方式上带来重大突破。

今日AI大热潮，明日智能风向标

Posted on January 25, 2024January 25, 2024 by aitrendtrackers@rengongzhineng.io

自从ChatGPT问世的419天以来，无数的AI初创公司获得了资金支持。我们也见证了连续419天的AI网红们，对每一个AI突破都大肆宣传。但我们离梦想中的AI未来还有多远？AI的普及和应用又进行到哪一步了？于是，我调查了23位最懂AI的朋友，询问他们对当今AI的看法。他们都很厉害，比我聪明多了。其中一些是创业者，一些在顶尖公司工作，还有一些是投资者。非常感谢他们的帮助，使这一切成为可能。以下是我从调查中得到的主要观点和一些视觉化结果。主要观点一切才刚刚开始 ChatGPT仍然是最常用的应用程序。（40%的受访者提到它是他们最常使用的应用）。AI可能将经历5到10年的应用周期。在每个应用领域或模式（文本、音频、图像、视频等）中，目前还只有1-2个主导者。我们作为工程师，仍然只是为自己的使用案例构建AI（几乎30%的受访者使用AI进行编码）。对于非技术人员的使用案例，我们甚至还没有摘取低挂的果实。信号不足，噪音太多尽管有这么多人在推特上发声，但真正新颖的AI演示和原创思想仍然不足。人们不知道可能的事情，甚至不知道该构建什么。即使在Twitter上，也没有足够一致的创业者或创始人可以密切关注。（>50%的受访者没有提到谁在AI领域做得最有趣）。这是你开始构建和撰写新想法的信号 🙂 人们对多模态应用感到兴奋去年，初创公司和DIY者的大部分关注点都在大型语言模型和基础设施上。随着图像、视频和音频模型变得更加易于获得，我们可以预测明年会有更多的多模态应用出现。（22.7%的受访者表示他们最期待2024年的多模态应用案例）。总的来说，对AI的乐观情绪持续增长。我从2022年7月开始构建AI应用。那时候，感觉有很多东西可以探索。今天，这种感觉似乎变得更加强烈。调查结果你的工作是什么？你经常使用哪些AI产品或应用程序？你使用AI产品或应用程序做什么？最近你看到的最酷的演示是什么？你知道的最酷的AI公司是哪家？你希望有人构建哪些现在不存在的AI公司、基础设施或产品？你使用哪个基础设施提供商来托管或管理你的AI模型？你最喜欢的大型语言模型/文本模型或提供商是哪

Subscribe 订阅