最新热点来了,快来围观!Avi Schiffmann 推出了一款名为 “Tab” 的新型可穿戴人工智能项链,号称想成为你的私人AI小伙伴。Tab 这个声控项链会倾听你的对话,并对你的生活和人际关系提供洞察。最近,它刚刚募集到190万美元的资金,听起来是不是超酷的样子? 所以这是个什么鬼东西呢? Tab 就像一个永远在线的AI朋友,通过不断的倾听来了解用户的生活,取代了传统的生活指导和心理治疗。 那它到底是怎么工作的呢? Tab 就像一个挂在脖子上的侦探,记录你聊天的声音。它使用像ChatGPT这样的AI技术来记录这些对话,并追踪有关你的细节。Tab的目标是学习你的生活背景,并在你不提出具体问题的情况下,提供个性化的洞察。 与Humane的Ai别针和Rabbit的R1不同,Avi的Tab采取了不同的方式。它并不是与手机竞争,而是让AI变得更贴近你:成为你的伴侣、你的助手和你的向导。 Schiffmann认为,Tab通过始终在那里的方式,可以比常规应用程序建立更深的联系。他设想它会演变成一种虚拟的治疗师、教练或是你信赖的人。为了平衡隐私和收集有用数据,Tab只记录声音,不录像。 如果Tab运作良好,它可能会开启一种新的、环境感知型的辅助AI方式。与其需要向聊天机器人提问,Tab旨在更自然地理解你的生活模式和需求。这不仅引发了有关持续监控的有趣问题,还可能带来自我改善和情感支持等潜在优势。 虽然还很新,但Tab代表了一种将AI视为增强生活的伙伴而非仅仅是工具的愿景。它的影响涵盖了心理健康、生产力和人际关系等多个领域。Tab的推出将是被动、亲密AI在人们日常生活中的一个重要测试案例。
Author: aitrendtrackers@rengongzhineng.io
CES 2024:LG专注于新产品的人工智能变革
LG是2024年CES上最早展示其产品的公司之一。从一个范式转变开始,它重申了去年从一家消费电子公司转变为专注于智能生活解决方案的公司这一变化。 不同的AI 展示的第一个细节是LG对我们所处的人工智能历史节点的认识。对于公司而言,他们寻求的是AI能够创造出切实的好处。为此,他们正在重新定义AI为“亲情智能”,并将这一变化应用于改善消费者体验。 全屏 去中心化的智能家居 LG首次应用这一变化的地方之一是在家庭中。该公司通过其LG ThinQ产品线展示了视角的转变,其中AI实现了对最终用户的服务和产品的优化。从购买过程开始,用户通过AI生成购买和使用建议,作为LG ThinQ Up 2.0的一部分。 全屏 LG的变化也在于用户数据的安全性,这就是为什么该公司的智能产品将需要一个新的Smart Home Hub,这是一种带有AI的设备,所有智能设备都连接到这里,它们使用的数据始终保存在家中,防止数据泄露。 智能家居AI代理 LG还展示了一个小型机器人,它将在家中陪伴我们。它能够识别命令并向家中的用户提供信息和提醒。如有必要,它甚至可以发出紧急电话,并能够了解家中的不同情况。 全屏 电视和webOS 在电视方面,LG首先展示了其Alpha 11处理器,其性能是过去的4倍,公司将继续为其设备带来更多功能。同时,该公司庆祝了webOS的十周年,这是其电视的操作系统,通过它,公司设备能够展示网络内容。在此之后,LG承诺从今年开始,所有设备将有5年的webOS更新,以及Chromecast的到来。 然而,真正的惊喜是LG Signature OLED T,这是一款无线4K OLED电视,它力求成为我们家庭空间的设计对象,这归功于其可以变成透明的屏幕。 全屏 软件定义车辆 最后,LG展示了其对汽车行业的愿景,该愿景旨在将驾驶体验转变为带轮子的生活空间。这也基于识别用户的AI,使驾驶体验更加舒适和辅助。从在汽车中使用Netflix和YouTube进行视频流媒体到为孩子们在车后部玩视频游戏等。
AI的Killer App还缺席
想想看,ChatGPT差点没能成为现实,这真是有些奇怪。在2022年11月推出前,OpenAI的联合创始人兼首席科学家伊利亚·苏茨凯弗对其准确性并不感冒。公司内部的其他人担心,这并不算是什么大的进步。从本质上看,ChatGPT更像是一次混搭而非革命。它的驱动核心是GPT-3.5,这是OpenAI几个月前开发的一款大型语言模型。但这个聊天机器人加入了几个吸引人的调整——特别是更加对话化、更加贴切的回应——这一切汇集成了一个容易上手的包装。“它既能干又方便,”苏茨凯弗说,“这是AI进步首次对AI领域之外的人可见。” ChatGPT引发的热潮尚未结束。“AI是唯一的玩家,”苏茨凯弗说,“它是科技界的最大事物,而科技是经济中最大的事物。我认为,AI的潜力还会持续给我们带来惊喜。” 但现在我们已经见识了AI的能力,也许当务之急是弄清楚它到底是用来干什么的。OpenAI在没有明确的使用目的的情况下构建了这项技术。当他们发布ChatGPT时,研究人员似乎在说:这里有一个东西,想怎么用就怎么用。从那以后,大家都在努力弄清楚这意味着什么。 “我发现ChatGPT很有用,”苏茨凯弗说。“我经常用它来做各种随机的事情。”他说他用它来查找某些词汇,或者帮助自己表达得更清楚。有时他用它来查事实(尽管它不总是准确的)。OpenAI的其他人用它来规划假期(“世界上最佳的三个潜水点是哪些?”)或编程提示,或IT支持。 有用,但并非改变游戏规则的。上述大多数例子都可以用现有工具,比如搜索来完成。与此同时,据说谷歌内部的员工对公司自己的聊天机器人Bard(现在由谷歌的GPT-4竞争对手Gemini提供支持,上个月发布)的实用性表示怀疑。“我仍在思考的最大挑战是:LLM(大型语言模型)到底真正有用在哪里,就实用性而言?”谷歌Bard的用户体验主管凯西·珀尔在8月份Discord上写道,据彭博社报道。“比如真正做出改变。待定!” 没有杀手级应用,那种“哇”效应就会逐渐消退。红杉资本的统计数据显示,尽管AI应用如ChatGPT、Character.ai和Lensa(后者让用户创造风格化的(且性别歧视的)自画像)拥有病毒式的推出,但它们流失用户的速度比YouTube、Instagram和TikTok等现有流行服务要快。 “消费科技的规律仍然适用,”贝纳奇说。“会有很多实验,很多东西在几个月的炒作之后就会沉寂。” 当然,互联网的早期也充满了失败的尝试。在它改变世界之前,点 com 泡沫以崩溃告终。总有可能,今天的生成型AI会逐渐消失,被接下来的大事件所取代。 无论发生什么,现在AI已经完全进入主流,小众问题已经成为每个人的问题。正如舍弗所说:“我们将被迫以前所未有的方式解决这些问题。”
微软任命迪·坦普尔顿为OpenAI董事会观察员
微软公司高管迪·坦普尔顿近日加入了OpenAI董事会,成为非投票观察员。据知情人士透露,这是在短暂罢免该初创公司首席执行官后,董事会进行的一系列重大调整的一部分。 根据她的LinkedIn资料,坦普尔顿在微软工作超过25年,目前是公司技术与研究合作及运营的副总裁。据这位不愿透露姓名的知情人士称,她已开始参加董事会会议。OpenAI和微软均拒绝对此置评。就在OpenAI董事会在11月撤换首席执行官萨姆·奥特曼后几天,这家初创公司同意让他重新上任,并更换除一名以外的所有董事,同时给予微软——它的最大投资者——一个非投票观察员席位。OpenAI目前的董事包括Salesforce前联合首席执行官布雷特·泰勒,前美国财政部长拉里·萨默斯,以及上一届董事会成员、问答网站Quora首席执行官亚当·丹吉洛。 奥特曼此前表示,新董事会将“很快”被选出。他未具体说明最终将有多少人加入该团队,但表示人数将“大幅增加”。OpenAI因最初董事会中没有女性成员而受到一些批评。 根据她的LinkedIn资料,坦普尔顿于1998年加入微软,是该公司新西兰办公室的首位女性技术员工。在她目前的职位上,她向微软首席技术官汇报工作,并领导一个团队管理公司的一些技术合作伙伴,包括与OpenAI的合作。 此前有报道称,坦普尔顿是董事会角色的候选人之一。 微软已承诺在OpenAI投资约130亿美元,并将其产品整合到核心业务中,迅速成为大型科技公司中的AI领导者。但微软和其他投资者一样,对OpenAI董事会决定撤换奥特曼感到措手不及。 11月底,奥特曼重返职位后,微软总裁布拉德·史密斯告诉记者,OpenAI公司治理的变化“让我们更有信心”。但微软在董事会上担任观察员角色,也可能增加对其与这家初创公司紧密关系的审查。美国和英国监管机构正在审查微软与OpenAI的合作关系,以及这是否可能违反反垄断法。
Meta的Fairy:快速并行化指令引导的视频到视频合成
Fairy是一种简约而健壮的图像编辑扩散模型的改进版本,专为视频编辑应用进行了增强。我们的方法核心在于锚点式跨帧注意力机制,这是一种隐式地在帧之间传播扩散特征的机制,确保了卓越的时间连贯性和高保真合成。Fairy不仅解决了之前模型的局限性,如内存和处理速度,还通过一种独特的数据增强策略改善了时间一致性。这种策略使模型在源图像和目标图像中都对仿射变换保持等变性。Fairy的效率惊人,能在短短14秒内生成120帧512×384视频(30 FPS下的4秒时长),比之前的作品至少快了44倍。一项涉及1000个生成样本的全面用户研究证实,我们的方法提供了优越的质量,明显胜过现有的方法。 来这里看详细内容 https://fairy-video2video.github.io/
Frontier超级计算机达成新高峰:利用AMD技术实现1万亿参数的大型语言模型运行
“前沿”超级计算机,目前计算能力的霸主,在人工智能领域取得了显著成就。这个庞然大物位于田纳西州橡树岭国家实验室内,由能源部监管,它成功运行了一个1万亿参数的大型语言模型(LLM),与先进的AI模型如ChatGPT-4不相上下。 AMD技术助力”前沿”超级计算机“前沿”的非凡成就证明了其强大的尖端技术。这台超级计算机是一台Exascale(百亿亿次)机器,由AMD技术驱动,包括第三代EPYC “Trento” CPU和Instinct MI250X AI GPU加速器。它拥有惊人的8,699,904核心,性能达到1.194 Exaflop/s。 “前沿”超级计算机的架构优势这台超级计算机在Top500.org榜单上的杰出地位得益于其先进的HPE Cray EX架构和Slingshot-11互联。”前沿”不仅在原始计算能力上出类拔萃,也是效率和技术创新的典范。 1万亿参数LLM运行成功的背后近期在训练LLM方面的突破归功于对超参数调整和训练过程的优化。”前沿”团队测试了多种模型,参数规模分别为220亿、1750亿和现在的1万亿,显示了他们努力的深度。这个记录是使用3000个较老型号的Instinct MI250X AI GPU加速器设定的。然而,”前沿”总共包含了37000个这样的加速器,预示着未来更多开创性成就的可能。
2024年做为程序员的我们面临生成式人工智能所需要的新思维
当我写这篇文章时,我感觉被各种复杂的情绪所包围:焦虑,热情,行动的冲动,恐惧,以及无奈。作为一个程序员,我一直都有这些情绪。但从时间的尺度来看,它们从未如此接近过。要么是热情的时期,要么是恐惧的时期;它们很少同时出现。 不,我的工作并不不稳定。我的公司盈利虽然不算天文数字,但它们的商业模式是可持续的。我们的工作方式也确保了公司免于大规模离职的困扰。 然而,这种情感的波动确实存在。这也促使我写这篇文章。在2022年ChatGPT推出之前,我曾写过一篇文章,说明为什么到2025年,创业将成为程序员最重要,甚至是唯一的可行选择。就算GenAI由一堆疯狂的大型语言模型(LLM)组成,它也必将带来工作生活的巨大重新调整。程序员们将面临巨大的变革。 我们需要摒弃极客思维,采取更加宏观的视角来应对这一挑战。这种视角应该具备什么特征呢? 我只能想到三个大方向。如果你们有更多想法,欢迎补充。 1: 做好学习的准备 编程领域曾有过一个学习非常令人兴奋的时期。那时学习意味着摆弄可以读懂的人类语言(Java、C++和.Net),同时又要不断追赶硬件技术的更新,解决有趣的问题,然后向全世界宣布你的发现。 之后,在2010年之后见证了JavaScript、Python兴起以及移动互联网的发展的十年间,编程逐渐与技术割裂,而更加紧密地与商业挂钩。如果敏捷开发方法没有让这一点成为现实,它肯定对此起到了推波助澜的作用。 迂腐的纯粹主义程序员开始被贴上过时/缺乏弹性的标签。年龄歧视盛行起来。StackOverflow 流了很多血。语言之间的战争变得愈加激烈而常常导致一个收获上百万星标的新生半成品框架应运而生。 在那段时间里,学习变得无关紧要起来。然而,它又作为一个必要手段,能够在很短的时间内带来巨大成果。 那个时期让位于现在,学习已经成为义不容辞的责任。 这已经是老生常谈,但如果任何决议清单上没有它,就会显得空洞无物。这是因为“学习新东西”的含义并不是每一次说出口时都一样。 学习在每个程序员的一生中,每次提到时都会带有不同的含义: – 当尝试学习一种新语言时,学习意味着熟悉新的语法并将其与已经知道的旧语法建立关联。如果这是程序员的第一种语言,那么关联将会与现实世界建立(console.log 就像在日志本上记录一样)。如果这已经是他的第 N+1 种语言,那么关联将会与他以前的第 1 到 N 种语言建立(JavaScript 的 console.log 和 Java 的 System.out.println 一样,只是有一些自定义)。 – 当程序员在没有适当文档的情况下学习一种新的架构时,他之前的所有学习都会变得无效。这是因为大脑依赖于心智模型,而新架构会强制建立新的模型。一个简单由 API 组成的后端现在也包含了一个处理加密的安全层,反之亦然。 – 当程序员适应一份新工作时,学习意味着要熟悉具有不同智力、出身、角色和权力结构的人。对于极客来说,这个过程可能比普通人适应新环境更难。没有现成的办法来保证成功。你必须边做边学,而每一个错误不仅会带来新的认知,还会导致无法预知的职业后果。 这一切都不难。但单单做好准备,随时准备学习、清除旧知识并适应新事物,就是区分出色程序员和平庸程序员的标准。 在任何时候,如果你身边的人(同事和上司)觉得你没有准备好适应新事物,你就面临着失去职位、声誉或两者的风险。 在当前的编程工作中,即使是为了复用你通过之前的学习所创建的东西,也根本没有时间让大脑休整。 如果你想要创建一个很酷的组件从而复用当前的功能集,当然可以这么做。但是不能保证它在6个月内就会被废弃——你会被迫为产品部门创建一个新的,因为他们不能理解你的痛苦。 2: 做好被取代的准备 GenAI(通用人工智能)即将来临。雇主还没有开始解雇程序员。但是对底线的影响已经相当明显。在…
OpenAI 愿意向出版商付费,但并不想支付太多
OpenAI 和苹果正在与新闻出版商谈判内容授权交易,以培训他们的 AI 系统。但据消息人士称,交易规模比业界预期的要小。一些出版商感觉他们没有得到公平的价值。 OpenAI 访问出版商内容的交易规模小于预期。 我们谈论的报价低至每年 100 万到 500 万美元给一些出版商。这就像给助理买杯咖啡来偷看老板的笔记本电脑。苹果表示“晚餐我请”,但想要复制东西到它的硬盘上。基本上是希望在如何使用内容上有更多灵活性。谷歌在这场竞赛中再次感到落后,但我们不应忘记,谷歌已经通过其产品(如 Google 新闻)拥有类似 TeamViewer 的访问权限。 尽管 OpenAI 早些时候已经达成了一些大牌交易(如 Alex Springer 和美联社),但更多出版商可能会想要等待看看《纽约时报》对 OpenAI 的案件结果如何。 OpenAI(和其他 AI 公司)将更加努力地确保与出版商的这些合同,以便 a) 获取独特数据,以及 b) 表示他们与创作者的“友好关系”。同时,更多出版商可能会因为 AI 公司使用他们的材料而起诉它们。 我想知道这里是否有机会让小型媒体公司支持 AI 公司,而不是反对它们。
Google Bard 收费?
谷歌正准备推出其 AI 聊天机器人 Bard 的付费升级版,名为 Bard Advanced。谷歌在去年 12 月宣布了 Bard Advanced 及其 Gemini 模型,称它将于今年初推出。看来他们真的是指的早期,因为隐藏在 Bard 网站中的生产代码揭示了许多即将推出的功能。 谷歌即将发布 Bard 的付费版本,并增加新功能。 Bard Advanced 可能会与谷歌的存储订阅服务 Google One 捆绑在一起,尽管目前还不清楚哪些层级将包含 Bard Advanced。Bard Advanced 将使用谷歌迄今为止最好的模型 Gemini Ultra,这个模型“看似”击败了 GPT-4。 Bard Advanced 将带来一些新功能: 1) 类似 GPT 的机器人。这些在泄露中被代号称为 Mokoto,代码截图的 URL 结构为“/bots/create”。这些可能是像 OpenAI 的 GPT 那样的定制聊天机器人。 2) 提示改进。一项名为 Power Up 的功能将把您的简单提示扩展为更高级、更好的提示。 此外,还有一个灵感画廊(建议提示和使用 AI 的方式一直是谷歌和 Bard…
Windows 键盘迎来新成员:微软专为 AI 留下一席之地!
微软非常看好 AI 是计算的未来,以至于他们正在为 Windows PC 键盘添加一个新按钮,专门用于其 Copilot AI 助手,首批新机型将在下周的 CES 上公布。 为什么这很重要:这是 30 年来 Windows 键盘的首次变革,也是硬件制造商押注 AI 不仅能创造新的产品类别,还能为旧产品注入活力的最新例证。 他们是怎么说的:“我们绝对认为今年是 AI PC 的一年,”微软执行副总裁 Yusuf Mehdi 告诉 Axios。“我们认为这是人们与计算机互动方式的下一个根本性变化。” 尽管已经有数千万人在使用 Windows Copilot,但 Mehdi 说,增加一个专用键表明微软认为“它现在已经成为主流,足够有价值,足够简单,适用于更广泛的人群。” Mehdi 表示,尽管 2024 年还将看到许多其他 AI 特定硬件的出现,但 PC 有其独特的角色,因为用户在这里创造了大量内容,从音乐到剧本再到图像。 细节:Copilot 键将位于空格键右侧,替换掉一个菜单按钮。 首批配备专用键的 PC 将在 CES 上公布,春季之前,微软和其他 PC 品牌将推出更多此类产品。到年底,Copilot 键应该会在新 PC 上普遍存在。按下新按钮将启动 Windows Copilot,它使用自然语言输入,让人们修改计算机设置、启动应用程序和执行其他计算任务。对于那些没有启用 Windows Copilot…