OpenAI 计划在未来一周内推出一个 GPT 应用商店,该商店专注于基于其文本生成 AI 模型(例如 GPT-4)的定制应用程序。 据 TechCrunch 查看的一封电子邮件显示,OpenAI 表示,开发者在其 GPT 应用被列入商店之前,必须审查该公司更新的使用政策和 GPT 品牌指南,以确保他们的 GPT 符合规定——这个商店被恰当地命名为 GPT 商店。他们还必须验证自己的用户资料,并确保他们的 GPT 被公开发布。 去年在 OpenAI 的首次年度开发者大会 DevDay 上宣布了 GPT 商店的计划,但在去年 12 月推迟了——几乎可以肯定是因为 11 月初公布后不久发生的领导层变动。 (故事的简短版本是,首席执行官 Sam Altman 被 OpenAI 董事会迫使离职,然后在投资者和员工恐慌之后——被带着新董事会重新聘请。) GPT 不需要编码经验,可以根据开发者的愿望简单或复杂。例如,可以在烹饪书集上训练 GPT,以便它能回答有关特定食谱的成分问题。或者,GPT 可以吸收公司的专有代码库,以便开发者可以检查其风格或生成符合最佳实践的代码。 开发者可以简单地用平常语言输入他们希望 GPT 提供的功能,OpenAI 的 GPT 构建工具 GPT Builder 将尝试制作一个 AI 驱动的聊天机器人来执行这些任务。自 DevDay 之后不久,开发者就能够通过…
Author: aitrendtrackers@rengongzhineng.io
2024年AI新风向
好的,我重新用非正式而详细的语言描述2024年AI发展的几个趋势: 谷歌和OpenAI这些人工智能巨头公司,会推出让普通用户也能轻松自定义强大语言模型从而制作出满足各种需求的小助手的平台。这可能是面向非技术人群的第一波真正实用的生成式人工智能应用。举个例子,房地产经纪人可以上传以往的文字房源描述和图片,调教模型学习这些数据,然后生成新的房源的描述。希望这些公司能解决人工智能模型经常编造事实、有偏见等问题,否则这波人工智能应用热潮很快就会过去。 文本转图像的生成模型已经司空见惯。新的前沿是文本转视频。预计视频生成人工智能会无限放大图像生成领域出现的所有好坏丑现象。几家创业公司最近的新模型已经可以生成几秒钟流畅逼真的动画片段,质量不输给皮克斯制作的动画。主流电影公司也开始大规模应用这些技术,比如为外语配音生成人物的唇形同步动画。此外还有一些公司使自己的人工智能模型可以像程序一样生成无数个虚拟角色,根据需要随时输出深度假视频。 在2024年备受瞩目的大选中,人工智能生成的谣言和深度假视频将会是一个巨大的社会问题。这种技术已经开始被一些政客当成武器使用。但是识破人工智能造假信息的技术还很初级,社交媒体平台也很难快速清除这些虚假内容。预计这场大规模的人工智能假新闻实时识别行动不会很成功。
曝光视频揭秘:苹果Vision Pro浏览Safari,流畅到让人眼前一亮
一起来看看 突破平面的限制:Apple Vision Pro 带来的全新 Safari 体验 告别传统的二维网页浏览,Apple Vision Pro 的 Safari 将让你在头戴式设备中以令人惊艳的 3D 空间方式打开多个窗口和标签页。这意味着你可以打造完全个性化的工作环境,无论是简单的双窗口设置,还是为了超高效率而同时开启五个窗口,Vision Pro 都能胜任。 想开多少个标签页就开多少个? 你或许会担心打开太多标签页会难以操作,但演示视频展示了流畅的操作过程,让你轻松地在开启的窗口之间切换,并在单个窗口内浏览各个标签页。你还可以拖出标签页创建新窗口,并随心所欲地重新定位和调整大小。演示视频显示了同时最多五个窗口,但似乎并没有打开数量上限。对于那些习惯同时打开几十个标签页的重度用户来说,简直是福音。 除了自由设置虚拟工作空间之外,演示还展示了 Vision Pro 如何将 3D 对象整合到 Safari 中。在 @M1Astra 的视频中(因版权问题已被移除,但仍可在 Discord 上观看),你可以 360 度查看 Vision Pro 的 3D 渲染模型,甚至可以调整其大小。3D 对象还会在其他标签页上投射阴影,表明它已被选中。虽然看似微不足道,但这一特性可以帮助你快速了解对象的尺寸或设计。 Apple 的 Vision Pro 发布预告片让我们瞥见了 Safari 在虚拟现实中的初衷,但并非全部。 空间计算时代下的 Safari 即将到来 考虑到 Apple 宣称的“2024 年初”发布,你很快就能体验到 Vision Pro…
三星公司宣布,将于1月17日发布人工智能驱动手机
三星近日宣布,将于1月17日在加利福尼亚州圣何塞举办新闻发布会,届时将揭幕其最新款Galaxy手机。 三星是苹果在智能手机市场上的主要竞争对手。根据Counterpoint Research的数据,三星在全球智能手机市场的份额为20%,而苹果的市场份额为16%。同时,在美国手机市场,三星的份额为25%,落后于苹果的53%。三星希望通过引入iPhone所没有的新功能来吸引更多用户。 三星在周二晚间表示,其最新设备将提供一种“全新的、由人工智能驱动的移动体验”。尽管目前尚不清楚这意味着什么,但高通和谷歌等竞争对手的近期公告或许能提供一些线索。 在美国市场,三星的智能手机传统上使用高通的芯片。最新的设备,可能被命名为Galaxy S24、Galaxy S24+ 和 Galaxy S24 Ultra,可能会利用高通针对安卓手机推出的Snapdragon Series 8 Gen 3芯片。三星通常是最先使用高通最新芯片的手机制造商之一。 高通在去年10月表示,其新的Snapdragon芯片将使手机能够直接运行生成型人工智能应用程序。这意味着像ChatGPT这样的应用程序的缩小版本可以在没有互联网连接的情况下运行。AI聊天机器人的设备版本可以使对话更加私密,因为查询不需要发送到云端。 高通还展示了其芯片如何用于基于一系列文字生成图像。例如,你可能会输入“创建一个显示男人驾驶汽车的图像”,它就会生成一张图片。这与谷歌在Pixel 8 Pro中使用的Tensor G3芯片类似。该手机可以根据用户选择的一组单词创建自定义手机壁纸。 Pixel 8 Pro还支持谷歌的Gemini Nano AI模型,该模型可以创建短信回复、转录录音对话等功能。人工智能还常被用于改进视频和照片。
OpenVoice:多功能即时语音克隆
OpenVoice,一种多功能的即时语音克隆方法,仅需参考发言人的一小段音频片段,即可复制其声音并以多种语言生成语音。OpenVoice能够在复制参考发言人的音色基础上,实现对声音风格的细粒度控制,包括情感、口音、节奏、停顿和语调。此外,OpenVoice还实现了零样本跨语言的语音克隆,适用于未包含在大规模训练集中的语言。OpenVoice在计算效率上也表现出色,其成本仅为市面上提供相似但性能较差服务的商业API的数十分之一。特色是, 技术报告和源代码可在以下链接找到:https://arxiv.org/pdf/2312.01479.pdf 和 https://github.com/myshell-ai/OpenVoice
研究发现LLM不匹配人类对文本评价的偏见
随着大型语言模型(LLM)在现实世界应用日益增多,从推荐内容到评分求职申请,理解这些模型中的偏差变得至关重要。当这些模型存在偏见时,它们可能做出不公平或不准确的决策或预测。 假设一个人工智能系统用于评分求职申请。该系统使用大型语言模型来评估求职信的质量。但如果该模型具有固有的偏见,例如偏爱更长的文本或某些关键词,它可能不公平地偏袒某些申请者,即使他们并不一定更合格。 LLM的认知偏差 明尼苏达大学和Grammarly的研究人员现已进行了一项研究,以测量在自动评估文本质量时大型语言模型(LLM)中的认知偏差。该研究团队组建了15个来自四个不同大小范围的LLM,并分析了它们的回应。这些模型被要求评估其他LLM的回应,例如“System Star比System Square更好”。 为此,研究人员引入了“大型语言模型评估者认知偏差基准”(COBBLER),这是一个用于测量LLM评估中六种不同认知偏差的基准。他们使用了BIGBENCH和ELI5数据集中的50个问题-答案示例,生成了每个LLM的回应,并要求模型评估自己的回应和其他模型的回应。 测量的偏差示例包括以自我为中心的偏差,其中模型在评分时偏爱自己的结果,以及顺序偏差,即模型根据选项的顺序偏爱一个选项。请参阅下表,了解完整的偏差列表。 该研究表明,LLM在判断文本质量时存在偏见。研究人员还检查了人类和机器偏好之间的相关性,并发现机器偏好与人类偏好不密切匹配(排名偏差重叠:49.6%)。 根据研究小组的结果,LLM不应该用于基于人类偏好的自动标注。大多数经过测试的模型显示出强烈的认知偏差,可能会损害它们作为评注者的可信度。即使是那些经过指令调整或以人类反馈训练的模型,在用作自动评注者时也表现出各种认知偏差。 人类和机器评级之间低相关性表明,机器和人类的偏好通常不太接近。这引发了一个问题:LLM是否能够提供公平的评级。我们的研究结果表明,由于包含各种认知偏差以及与人类偏好的低度一致性,LLM目前还不适合作为公平和可靠的自动评估者。该研究的完整细节可在arXiv论文“大型语言模型评估者的认知偏差基准”中找到
五年后,程序员将成为历史?
这是由Stability AI的首席执行官伊马德·莫斯塔克(Emad Mostaque)所做的大胆预测,他认为五年内将不再有程序员。更令人震惊的是,他声称目前已有41%的GitHub代码是由人工智能生成的。虽然这个比例看起来很高,但人工智能编码已经非常普遍,我自己也在使用各种大型语言模型来提升编程技能。 五年后将不再有程序员 但他或许是对的:程序员的工作将永远改变。GitHub Copilot已成为标准工具,就在本月,谷歌还发布了自己的版本,名为Duet AI。JetBrains也推出了自己的AI驱动的集成开发环境。莫斯塔克的大胆预测引发了技术界的激烈讨论。这种挑衅性的声明基于人工智能(AI)的快速进步,特别是在生成AI系统(如ChatGPT)方面。 莫斯塔克的论点依托于AI在编程领域的变革潜力。他引用GitHub的数据,表明平台上相当一部分代码(41%)是AI生成的,凸显了AI在编程中的日益增长的影响力。这一说法预示着一个可能的未来:AI可以自动执行许多编程任务,从而可能重塑人类程序员的角色。 Stability AI是莫斯塔克领导的公司,该公司积极参与从语言模型到图像生成和DNA分析等各种AI项目。这些努力旨在构建一个全面的AI基础设施,可能彻底改变我们与技术的互动方式。莫斯塔克设想AI作为一种增强人类能力而非取代它们的工具,展望了一个AI与人类协同工作以实现更大成就的未来。 然而,这一观点并非普遍接受。技术界的其他观点认为,虽然像GitHub Copilot、谷歌的Duet AI和JetBrains的AI驱动IDE等AI工具越来越普遍,但它们不太可能完全取代人类程序员。人类程序员拥有解决问题、创造力、批判性思维和领域专业知识等技能,这些目前仍超出AI工具的能力范围。因此,AI更可能是协助程序员,提高代码质量,减轻他们的工作负担。 总之,虽然人工智能无疑正在改变编程领域,但在不久的将来完全取代人类程序员的想法仍是一个有待讨论的话题。业界专家和AI系统本身所暗示的更可能的情况是,AI工具将支持和增强人类的编程努力,而不是彻底取代它们。
微软即将推出的新款Surface笔记本电脑,首次真正的‘人工智能个人电脑’
好消息,潮人们!微软正准备给它们的Surface系列带来全新的人工智能(AI)特性。据Windows Central报道,未透露姓名的消息源透露,即将上市的Surface Pro 10和Surface Laptop 6将搭载下一代神经处理单元(NPU),并提供基于Intel和Arm的选项。 根据Windows Central的报道,微软的Arm-based设备将由高通的新Snapdragon X芯片提供动力。这些电脑,代号为CADMUS,据说是为了运行微软在未来Windows版本中打包的AI功能而设计的。它们还将带来与苹果硅片相媲美的性能、电池寿命和安全性能提升。 而Intel版本的设备,据说将配备该公司最新的14代芯片。 Surface Pro 10据说将配备更亮的显示屏,支持HDR,并具有防眩光涂层,分辨率可选为2160 x 1440或2880 x 1920。它可能还会有圆润的边角,就像Microsoft Surface Laptop Studio系列一样,并支持一种新型Type Cover,上面有一个打开Windows Copilot的按钮。 至于Surface Laptop 6,Windows Central报道称,较小的型号将配备略大的13.8英寸显示屏(从Surface Laptop 5的13.5英寸升级而来),而15英寸型号保持不变。像Surface Pro 10一样,该设备也将配备圆润的显示屏和更薄的边框。它还可能拥有许多新端口,包括两个USB-C、一个USB-A和一个Surface Connect充电端口。该设备还传闻将配备有触感反馈的触控板和一个专用于Windows Copilot的键盘按钮。 微软预计将在明年某个时候发布Surface Pro 10和Surface Laptop 6。但Windows Central报道说,更显著的Surface Pro设计变化可能会在2025年到来,届时还将有新款的Surface Laptop Studio推出。
太空中的人形机器人:探索新疆界
NASA的人形机器人Valkyrie,身高6英尺2英寸(188厘米),体重300磅(136公斤),是一个令人印象深刻的形象。这个以北欧神话中的女性形象命名的机器人,正在德克萨斯州休斯顿的约翰逊太空中心进行测试。NASA表示,Valkyrie旨在能够在“退化或受损的人类工程环境”中操作,比如遭受自然灾害的地区。 但像Valkyrie这样的机器人也有朝一日在太空中运作的潜力。人形机器人通常具有躯干、头部、两条手臂和两条腿,看起来像人类。工程师们相信,有了合适的软件,人形机器人最终将能够类似于人类地功能,并使用相同的工具和设备。 NASA灵巧机器人团队领导Shaun Azimi表示,太空中的人形机器人可能会处理像清洁太阳能板或检查宇宙飞船外部故障设备等危险任务,从而让宇航员可以优先考虑探索和发现。 Azimi说:“我们并不是想要取代人类船员,我们真正想做的是将那些枯燥、肮脏和危险的工作从他们的肩膀上卸下来,让他们专注于那些更高级别的活动。” NASA正在与诸如德州奥斯汀的Apptronik这样的机器人公司合作,了解为地面目的而开发的人形机器人如何能够造福于未来的太空人形机器人。 Apptronik正在开发Apollo,这是一个人形机器人,其地球上的任务将包括在仓库和制造工厂中移动包裹、堆叠托盘和执行其他供应链导向的任务。该公司计划在2025年初开始向公司提供这些人形机器人。 Apptronik首席技术官Nick Paine表示,Apollo在耐力方面相较于人类同行具有明显的优势。Paine说:“我们的目标是让这个系统每天在线22小时。这有一个可更换的电池,所以你可以工作四小时,更换电池,然后在非常短的时间内继续工作。” Apptronik首席执行官Jeff Cardenas表示,随着新软件和发展提高Apollo的能力,其潜力无限。“我们的方法是从仓库和制造车间开始,但然后可以进入零售……到递送,更多地进入我们所说的非结构化空间。”Cardenas说。 Azimi认为,在未来的岁月中,这些“非结构化空间”可能包括太空。“像Apollo这样的机器人是以模块化为设计理念,以适应多种应用场景。”Azimi说。“这就是NASA真正试图获取的洞察力——看看关键的差距在哪里,我们将来需要在哪些方面进行投资,以将一个地面系统带入太空环境,并获得在太空操作的认证。”
微软的 Copilot 已经如同 ChatGPT 一样,成为了安卓平台上的一款应用程序
微软近期悄悄推出了专为安卓系统设计的 Copilot 应用。这款新应用已在谷歌商店上架,让用户能够直接使用微软强大的 AI 助手 Copilot,而无需借助 Bing 移动应用。据 Neowin 报道,Copilot 安卓版已经上线近一周,但 iOS 版本目前尚未推出。 微软在安卓上的 Copilot 应用与 ChatGPT 非常相似,提供聊天机器人功能、DALL-E 3 图片生成,以及草拟电子邮件和文档的能力。更重要的是,它还免费提供了 OpenAI 最新的 GPT-4 模型,这是使用 ChatGPT 所需付费的功能。 安卓上的 Copilot 界面由 Microsoft 提供。Copilot 应用的推出是在微软将 Bing Chat 更名为 Copilot 一个多月后进行的。微软最初是在今年早些时候通过其必应搜索引擎发起了对 AI 的大力推广,将类似于 ChatGPT 的界面整合到搜索结果中。虽然该功能仍然可用,但微软已经放弃了 Bing Chat 的品牌,让 Copilot 成为了更独立的体验,并且在其专属域名 copilot.microsoft.com 上也有所体现,这与 ChatGPT 类似。 对于 Copilot 来说,推出移动应用似乎是扩展其独立体验的下一个合乎逻辑的步骤,尤其是在 Bing Chat…