想要加入 Aya 项目,您可以访问 Aya 项目的官方网站 (https://aya.for.ai/?ref=txt.cohere.com&{query})进行注册并开始您的探索之旅。此外,您还可以在 Cohere Playground (https://dashboard.cohere.com/welcome/login?redirect_uri=%2Fplayground%2Fgenerate%3Fmodel%3Dc4ai-aya%26ref%3Dtxt.cohere.com%26%257Bquery%257D%3D)中尝试 Aya 模型,或者下载模型和数据集,(https://cohere.com/research/aya?ref=txt.cohere.com&{query})以便深入研究和利用这一开源资源。 Cohere For AI 的研究团队,也就是 Cohere 的非营利性研究实验室 C4AI,今日宣布了一项激动人心的进展:推出了一款名为 Aya 的全新、开源、大规模多语言生成式大型语言模型(LLM),覆盖超过 101 种语言。这一跨越性的创举,使得 Aya 的语言覆盖范围是现有开源模型的两倍多,致力于为那些在大多数市场上高级模型中被大量忽略的语言和文化解锁 LLMs 的强大潜能。 C4AI 团队不仅公开了 Aya 模型,还发布了迄今为止最大的多语言指导微调数据集,包含 513 百万条数据,涵盖 114 种语言。这个庞大的数据集汇集了全球各地母语和流利的说话者的珍贵注释,旨在确保 AI 技术能够有效服务于之前访问受限的广泛全球用户。 Aya 的问世标志着机器学习社区在处理大规模多语言 AI 研究方面的范式转变,不仅仅是技术上的进步,更是研究方法、地点及参与者的变化。随着 LLMs 和 AI 的普遍应用改变了全球技术格局,许多社区因现有模型的语言限制而处于无法得到支持的状态。这种差距不仅影响了生成 AI 对全球受众的适用性和有效性,还可能加剧已经存在的技术发展差距。大多数模型由于主要依赖英语及其他几十种语言作为训练资源,往往带有固有的文化偏见。 为了填补这一差距,Aya 项目得以启动,汇集了来自 119 个国家的超过 3000 名独立研究人员的力量。Aya 团队在提升弱势语言性能方面取得了显著成就,特别是在自然语言理解、总结和翻译等复杂任务上展现出超越现有开源多语言模型的能力。在与现有最优开源模型进行的基准测试中,Aya 的表现远超 mT0…
Nvidia 携手 RTX 推出的本地运行 AI 聊天机器人
Nvidia 今天推出了 Chat with RTX 的早期版本,这是一个演示应用程序,允许你在个人电脑上运行一个私人 AI 聊天机器人。你可以向它提供 YouTube 视频和你自己的文档,以创建摘要和基于你自己的数据获取相关答案。这一切都在个人电脑上本地运行,你所需要的只是一块至少拥有 8GB VRAM 的 RTX 30 或 40 系列 GPU。 我在过去的一天里对 Chat with RTX 进行了简短的测试,尽管这个应用程序还有点粗糙,但我已经可以看到这将成为数据研究的有价值部分,特别是对于需要分析一系列文档的记者或任何人来说。 Chat with RTX 能够处理 YouTube 视频,所以你只需输入一个 URL,它就会让你搜索特定提及的字幕或总结整个视频。我发现这对于搜索视频播客非常理想,特别是在寻找过去一周关于微软新 Xbox 策略转变的传言中的特定提及时。 然而,搜索 YouTube 视频并不是完美的。我尝试搜索一段 The Verge YouTube 视频的字幕,但 Chat with RTX 下载了一个完全不同视频的字幕。这甚至不是我之前查询过的视频,所以在这个早期演示中显然存在漏洞。 Chat with RTX 在搜索你本地的文档方面表现出色。当它正常工作时,我能够在几秒内找到视频中的参考内容。我还为 Chat with RTX 创建了一个 FTC 诉微软文档的数据集进行分析。当我去年覆盖这个法庭案件时,快速搜索文档经常让人感到不堪重负,但 Chat…
ChatGPT最近升级啦,记忆功能和新控制选项都来了
我们正在测试 ChatGPT 的记忆功能。通过记住您在所有聊天中的讨论内容,可以避免重复信息并使未来的对话更加有用。您可以完全控制 ChatGPT 的记忆。您可以明确地告诉它记住一些东西,询问它记得什么,并通过对话或设置让它忘记。您也可以完全关闭它。我们本周将向一小部分 ChatGPT 免费和 Plus 用户推出测试,以了解其有用性。我们将很快分享更广泛发布的计划。 记忆如何工作 与 ChatGPT 聊天时,您可以要求它记住特定内容,或者让它自己拾取细节。ChatGPT 的记忆会随着您使用次数的增加而变得更好,您会逐渐注意到其中的改进。例如: 您解释说您更喜欢会议笔记包含标题、要点和底部总结的操作项。ChatGPT 记住了这一点,并以这种方式总结会议。 您告诉 ChatGPT 您拥有一家社区咖啡店。当为庆祝新店开业的社交帖子集思广电时,ChatGPT 知道从哪里开始。 您提到您有一个蹒跚学步的孩子,她很喜欢水母。当您要求 ChatGPT 帮助制作她的生日贺卡时,它建议一个戴着派对帽的水母图案。 作为一名拥有 25 名学生的幼儿园老师,您更喜欢 50 分钟的课程,并在之后安排后续活动。ChatGPT 在帮助您创建课程计划时会记住这一点。 您完全掌控 您可以随时关闭记忆功能(设置 > 个性化 > 记忆)。当记忆功能关闭时,您不会创建或使用记忆。 如果您想让 ChatGPT 忘记某件事,只需告诉它即可。您还可以查看和删除特定记忆或在设置中清除所有记忆(设置 > 个性化 > 管理记忆)。ChatGPT 的记忆会随着您的互动而发展,不会与特定对话链接。删除聊天不会删除其记忆;您必须删除记忆本身。您可以在我们的帮助中心找到更多详细信息。 我们可能会将您提供给 ChatGPT 的内容,包括记忆,用于改善我们为所有人的模型。如果您愿意,您可以通过数据控制将其关闭。一如既往,我们不会对来自 ChatGPT 团队和企业客户的内容进行训练。了解有关我们如何使用内容来训练我们的模型以及您在帮助中心的选择。 使用临时聊天进行无记忆对话 如果您想进行不使用记忆功能的对话,请使用临时聊天。临时聊天不会显示在历史记录中,不会使用记忆,也不会用于训练我们的模型。您可以在我们的帮助中心了解更多关于临时聊天的信息。 自定义说明也使 ChatGPT 更有用 自定义说明让您可以继续直接指导 ChatGPT…
McAfee 研究揭秘:情人节情书,45%的男士选择AI做甜言蜜语的幕后黑手
新研究揭露AI在爱情和婚介中的角色,以及AI使用增加导致越来越多人担心真假难辨,58%的美国人在网上遇到过假冒的个人资料。 比去年(26%)更多的美国人(39%)希望用AI来写情人节贺卡30%的男性和27%的女性正在使用AI增强他们在线约会的个人资料、照片和信息AI在浪漫关系中的使用引发了辨别真伪的担忧,有三分之一的美国人(31%)曾与一位最终被证明是骗子的恋爱对象进行过交流 加利福尼亚州圣何塞–(商业电线)–今天,作为全球在线保护领导者的麦咖啡揭示了人工智能(AI)工具在在线约会中的作用,以及这对增加的“猫鱼”现象和浪漫骗局的影响。这个情人节,45%的男性(以及39%的所有成年人)正在考虑使用AI来写情书,与去年的30%和26%相比,显示出对浪漫目的AI工具的增加使用。 “AI的可能性是无限的,不幸的是,危险也是如此。对于那些在开始对话时感到害羞、没有时间精心制作完美信息的人,或者那些照片可以被美化的人,AI提供了工具,帮助他们享受在线约会带来的所有乐趣和兴奋” 尽管人们对接收AI生成的内容有着混合的感受和经历,但AI的有效性是不可否认的:69%的人报告说,使用AI生成的内容比使用他们自己的原创内容时,收到了更多的兴趣和更好的回应。此外,39%的美国人计划或考虑使用人工智能写情人节卡片或其他信息给一个爱慕的对象。这种情绪与他们对通过代码被求爱的感觉相反:57%的人说,如果他们发现AI写了他们的情人节信息,他们会感到受伤或冒犯。 “不幸的是,我们知道网络犯罪分子也使用AI来扩大恶意活动的规模。随着寻爱者在情人节前夕在网上花费更多时间,骗子正在使用AI冒充恋爱对象,窃取金钱或个人信息。我们鼓励人们在浪漫希望与健康怀疑之间找到平衡,分享敏感信息之前先暂停一下,并确保他们使用正确的工具来保护他们的隐私、身份和个人信息,”格罗布曼继续说。 爱情受骗还是骗局受害?很难说清。 在线约会依然普遍,有58%的美国人使用或曾经使用过约会网站、应用或社交媒体寻找爱情。然而,强大、易于使用的AI工具的崛起使在线约会格局变得复杂。通过利用这些工具,浪漫骗子可以编写令人信服的信息和真实的个人资料图片,以欺骗在线寻找爱情的人们。近半(46%)的美国人说,他们不确定或不相信他们能识别AI生成的爱情信息。 寻找爱情的人们往往更容易成为骗局的受害者,网络犯罪分子利用这种脆弱性进行长期和复杂的尝试,从受害者那里窃取。57%的美国人说,在遇到一个爱情对象后不久,他们被要求转账,其中30%的人被要求发送超过1000美元。 这些发现强调了数字约会世界中浪漫骗局威胁的升级,以及需要增加在线约会安全意识和保护的必要性。值得注意的是,这表明骗子为了获得个人信息而采取的手段: 10%(11%)的受访者报告说,一个爱慕的对象要求他们提供密码。20%被要求分享他们的出生日期。23%被要求分享一个亲密的照片或视频。10%被要求分享社会安全号码或类似的东西。如果你不是在约会网站上被瞄准,麦咖啡实验室团队透露,你仍然需要在网上小心谨慎,因为情人节相关的骗局有所增加。这包括情人节相关的恶意软件活动(增加25%),恶意URL(增加300%),以及各种浪漫主题的垃圾邮件和电子邮件骗局(惊人的增加400%),大多数集中在情人节购物和礼物上。麦咖啡实验室预计,随着2月14日的临近,这些数字将继续上升,敦促保持警惕。 骗子并不是唯一使用AI的人。 对于假冒个人资料和照片使用AI生成的图像似乎在增长:58%的人说,他们在过去一年中在约会网站、应用或社交媒体上遇到过假冒的个人资料或看起来是AI生成的照片。具体来说: 46%的人在社交媒体平台上看到假冒的个人资料或照片。20%的人在主流约会平台上看到假冒的个人资料或照片。14%在聊天论坛或社区上看到假照片或个人资料。12%在专业约会平台上看到假照片或个人资料。11%在专业网络平台上看到假冒的个人资料或照片。在线约会需要一些现代的侦探工作。 在一个充满越来越多的骗局和AI内容的约会池中,在线约会者正在做他们的约会尽职调查: 38%的人说,他们在社交媒体或约会网站上遇到的人的个人资料图片上使用了反向图像搜索。59%的受访者说,他们经常使用社交媒体来深入了解他们的潜在伴侣的背景。在那些这样做的人中,35%的人说,这让他们对他们的看法更加积极,23%的人说,这让他们对他们的看法更加消极。13%的人说,这样做让他们意识到自己被骗了,7%的人说,他们意识到他们的潜在伴侣之前曾经欺骗过别人。11%的人说,社交媒体侦探让他们意识到他们的爱慕对象与别人有关系。保护自己免受在线浪漫和AI骗局的步骤。 人们可以通过采取以下步骤来帮助预防财务和情感上的心碎: 仔细审查你通过约会应用或社交媒体从一个爱慕的对象那里收到的任何直接信息。识别骗子的一种方法是观察连贯的、AI生成的信息。这些信息通常相当通用或缺乏实质内容。此外,重要的是确保不要点击你从一个你没有亲自见过的人那里收到的任何链接。对这个人使用的任何个人资料图片进行反向图像搜索。如果搜索结果显示你的爱慕对象与另一个名字有关,或者与他们告诉你的细节不匹配,你可能正在与一个骗子聊天。即使他们先给你寄钱,也不要向你没有亲自见过的人寄钱或礼物。骗子经常先寄钱来软化他们的受害者并建立信任,所以不要分享个人或账户信息,即使对方很坦率地分享他们的信息。与你信任的人谈谈这个新的爱慕对象。当你感到充满希望和兴奋时,很容易错过一些不对劲的事情。所以,当你的朋友或家人表现出关切的迹象时,请注意,并慢慢发展这段关系。投资于帮助识别在线骗局的工具。麦咖啡的产品组合包括创新的保护功能,如麦咖啡骗局保护,它可以实时检测和保护你免受前所未见的威胁和骗局——无论是在文本、电子邮件、搜索结果还是社交媒体上分享的危险链接。此外,麦咖啡最近宣布,深度伪造检测即将推出,进一步增强麦咖啡使用AI对抗AI骗局的承诺,帮助消费者具备检测深度伪造的能力。
Google宣布投入100万美元资助将C++代码转换成Rust代码的项目
在最近的一次宣布中,谷歌表示将向Rust基金会捐赠100万美元,以改善C++和Rust之间的互操作性。这一消息无疑是重大的,但为什么这么做会引起这么大的关注? C++的现状 C++作为一种广泛使用的编程语言,其影响力遍及全球。它不仅是构建后端和嵌入式系统的首选语言之一,还根据TIOBE编程语言流行度指数排名第三,仅次于Python和C。C++以其快速执行速度和低运行开销而受到开发者的青睐。然而,C++编程中存在一个无法忽视的大问题——内存安全。 内存安全的挑战 内存安全问题在现代编程中异常严重。以谷歌2019年的报告为例,Android系统中60%的漏洞源于代码的内存问题。这个问题不仅限于谷歌,微软、Chromium项目、Mozilla以及谷歌的Project Zero等主要科技公司也面临类似的挑战,其中大部分安全漏洞都与内存安全问题有关。 尽管已经投入大量努力通过工具和最佳实践来最小化C/C++代码中的内存相关错误,但程序员的人为错误依然导致关键代码库中出现严重的内存错误。 Rust的兴起 无垃圾回收的内存安全性 Rust作为一种现代系统编程语言,通过其所有权模型在编译时引入了类型安全性和线程安全性,从而在不需要垃圾回收的情况下防止内存错误,这一点与C/C++形成了鲜明对比。Rust的这种设计不仅消除了运行时开销,还通过严格的编译器检查大幅减少了运行时错误。 并发性和工具生态 Rust的并发性设计使得构建并发系统变得更加安全和容易,而它的标准编译器、依赖管理和自动文档生成等特性也极大地提升了开发效率和代码质量。 谷歌、AWS和Microsoft等科技巨头的投入 随着谷歌、AWS和Microsoft等科技巨头开始解决C++/Rust互操作性,并在其项目中越来越多地使用Rust,我们看到了一个向更安全、更高效的编程未来迈进的趋势。谷歌对Rust基金会的捐赠只是这一进程中的一步,但它是一个重要的步骤,意味着在现有和新的软件系统中将更多地使用Rust。 尽管C/C++不会很快消失,但Rust的快速发展和接受度表明它正在成为重要的编程语言之一,特别是在需要高性能和内存安全的应用场景中。
Nvidia追求300亿美元定制芯片的大好机会,推出了新的部门
Nvidia(NVDA.O)正在打造一个专注于为云计算公司等设计定制芯片的新业务部门,这包括高级人工智能(AI)处理器,据九位熟悉其计划的消息人士对路透社透露。作为全球领先的AI芯片设计师和供应商,Nvidia旨在抢占定制AI芯片市场的一席之地,并保护自己不受越来越多追求其产品替代品的公司的影响。 这家位于加利福尼亚州圣克拉拉的公司控制着大约80%的高端AI芯片市场,这一地位使其股票市值今年迄今上涨了40%,达到1.73万亿美元,而在2023年该公司的市值已经翻了三倍。Nvidia的客户包括ChatGPT的创建者OpenAI、微软(MSFT.O)、谷歌(GOOGL.O)和Meta平台(META.O),他们争相抢购其日益减少的芯片供应,以在迅速崛起的生成式AI领域竞争。 其H100和A100芯片作为许多主要客户通用的全能AI处理器。但是,这些技术公司已经开始开发自己的内部芯片以满足特定需求。这样做有助于降低能耗,并可能缩减设计的成本和时间。Nvidia现在正试图帮助这些公司开发定制AI芯片,这些芯片已流向竞争对手公司,如博通(AVGO.O)和Marvell科技(MRVL.O),上述消息人士称,他们因未获授权公开发言而要求匿名。 Nvidia没有公开H100的价格,该价格高于前一代A100,但每个芯片的售价根据数量和其他因素可在16,000至100,000美元之间变动。Meta计划今年将其H100的总库存量增加到350,000个。Nvidia的官员已与亚马逊(AMZN.O)、Meta、微软、谷歌和OpenAI的代表会面,讨论为他们制造定制芯片,两位熟悉会议的消息人士说。除了数据中心芯片,Nvidia还追求电信、汽车和视频游戏客户。 Nvidia的股价在路透社报道后上涨了2.75%,帮助提升了整体芯片股。Marvell的股价下跌了2.78%。2022年,Nvidia表示,它将允许第三方客户将其一些专有网络技术与自己的芯片集成。自那以后,它没有对该计划做出任何声明,路透社是首次报道其更广泛的雄心。 据研究公司650 Group的艾伦·韦克尔估计,数据中心定制芯片市场今年将增长至多达100亿美元,并在2025年翻倍。根据尼德汉分析师查尔斯·施的说法,2023年更广泛的定制芯片市场价值约为300亿美元,大约占全球年度芯片销售额的5%。 目前,数据中心的定制硅设计主要由博通和Marvell主导。在典型的安排中,设计合作伙伴如Nvidia将提供知识产权和技术,但将芯片制造、封装和其他步骤留给台湾半导体制造公司(2330.TW)或其他合同芯片制造商。Nvidia进入这一领域有潜力侵蚀博通和Marvell的销售。 Nvidia还在与电信基础设施建设商爱立信(ERICb.ST)就包含芯片设计师的图形处理单元(GPU)技术的无线芯片进行谈判,两位熟悉讨论的消息人士说。650 Group的韦克尔预计,电信定制芯片市场将在每年大约40亿至50亿美元保持平稳。 Nvidia还计划针对汽车和视频游戏市场,根据消息来源和公开的社交媒体帖子。韦克尔预计,定制汽车市场将从目前的60亿至80亿美元范围内以每年20%的速度稳定增长,而价值70亿至80亿美元的视频游戏定制芯片市场可能会随着Xbox和索尼(6857.T)的下一代游戏机的推出而增长。Nintendo的当前Switch手持游戏机已经包含Nvidia的Tegra X1芯片。一位消息人士说,预计今年将推出的Switch新版游戏机可能会包含Nvidia的定制设计。
OpenAI的CEO萨姆·奥特曼表示,苹果的Vision Pro是自iPhone以来“第二令人印象深刻的技术”
在这个轻松的周五,有件事让我颇为震惊:OpenAI的CEO兼联合创始人萨姆·奥特曼在X/Twitter上发文称,他认为苹果的新产品Vision Pro是自iPhone以来“第二令人印象深刻的技术”。 (很可能,在他眼中,OpenAI自家的ChatGPT才是自2007年苹果推出其手机以来“最令人印象深刻”的新技术。) 奥特曼还回应了一位评论者,后者说苹果的新空间计算头显“可能是最糟糕的名字”,这也让他顺带吐槽了自己的产品。 鉴于奥特曼的印象,OpenAI上周已经发布了一个visionOS版本的ChatGPT应用,这是非常合理的。
Google推出了图神经网络Tensorflow-GNN
在当今数字化的世界里,对象及其之间的复杂关系构成了无数的网络,例如交通网络、生产网络、知识图谱和社交网络。这些关系网的重要性在于,它们不仅仅展示了对象的属性,更重要的是展示了对象之间的相互作用。离散数学和计算机科学通过将这些网络形式化为由节点和边组成的图,有助于我们理解和分析这些复杂的结构。然而,传统的机器学习算法往往只能处理规则和统一的关系,例如像素网格、词序列,或者完全没有关系。这就是图神经网络(GNN)技术崭露头角的原因所在。 GNN技术能够有效地利用图的连通性和节点及边上的输入特征,为整个图(例如预测分子反应)、单个节点(例如预测文档的主题)或潜在的边(例如预测两个产品是否可能一起被购买)做出预测。更进一步,GNN还能将图的离散、关系信息以连续的方式编码,使之可以自然地融入到其他深度学习系统中,架起了传统神经网络与新兴需求之间的桥梁。 TensorFlow GNN 1.0(TF-GNN)的发布,标志着在大规模构建GNN方面迈出了重要一步。作为一个经过生产测试的库,TF-GNN支持在TensorFlow中进行建模和训练,以及从庞大的数据存储中提取输入图。TF-GNN特别适用于处理异构图,即那些由不同类型的对象和关系组成的图,这使得它能够自然地表示现实世界中的对象及其关系。 TF-GNN内部使用tfgnn.GraphTensor对象来表示图,这是一个复合张量类型,被接受为tf.data.Dataset、tf.function等的一等公民。它不仅存储了图的结构,还存储了附加到节点、边和整个图上的特征。在Keras高级API中,或者直接使用tfgnn.GraphTensor原语,可以定义对GraphTensors的可训练转换。 TF-GNN的一个典型应用是预测巨大数据库中交叉引用表定义的图中某种类型节点的属性,例如预测计算机科学arXiv论文的主题领域。GNN在许多标记示例的数据集上进行训练,但每个训练步骤只涉及少量的训练示例。通过在底层图的相对较小的子图流上进行训练,GNN能够扩展到处理百万级别的数据。这个过程,通常称为子图采样,对GNN训练至关重要。TF-GNN通过提供工具来实现动态和交互式的改进采样方法,从而优化了这一过程。 此外,TF-GNN 1.0还推出了一个灵活的Python API,配置动态或批处理子图采样的所有相关规模,从Colab笔记本中的交互式操作到通过Apache Beam分布式处理存储在网络文件系统上的巨大数据集。这些采样的子图上的GNN任务是计算根节点的隐藏(或潜在)状态,该状态汇总并编码了根节点邻域的相关信息。在异构图中,对不同类型的节点和边使用分别训练的隐藏层往往是有意义的。 TF-GNN支持在各种抽象级别构建和训练GNN,从使用库中预定义模型的最高级别,到用图数据传递原语从头开始编写GNN模型的最低级别。TF-GNN还提供了一个简洁的方法来协调Keras模型的训练,在通常的情况下,提供了ML痛点(如分布式训练和tfgnn.GraphTensor填充)的现成解决方案。 总之,TF-GNN的发布为TensorFlow中GNN的应用提供了强大的支持,促进了该领域的进一步创新。开发者们被鼓励尝试TF-GNN的Colab演示,探索用户指南和Colabs,或深入了解相关论文,以充分利用这一新兴技术。
该选Gemini Advanced还是ChatGPT Plus?看看你应该掏腰包支持谁!
当谈到人工智能工具时,OpenAI的ChatGPT早已家喻户晓,但谷歌并没有闲着。它推出了全新的Gemini品牌和Gemini Advanced服务,向OpenAI的旗舰产品发起了强劲的挑战。 谷歌自豪地宣布,Gemini Advanced(Bard聊天机器人的进化版)在对抗GPT-4的战斗中胜出了——但真的是这样吗?如果你每月只能拿出20美元,你应该选择哪个付费的多模态AI工具呢?首先要明确的是,这里没有绝对的“最佳”选择。区分这些聊天机器人的不仅仅是哪个客观上“更聪明”,而是哪些特性、细分能力和外部集成最符合你现有的工具和工作流程。无论是哪一款强大的工具,它是否值得你每月花费20美元完全取决于你目前使用的工具和你需要帮助完成的任务,我们在这里提供详细的信息帮助你做出决定。 图像生成:真实性与灵活性的对决Gemini和ChatGPT Plus都能将你的文字转化为视觉呈现。与稳定扩散(Stable Diffusion)和其他图像生成器不同,这两者都能理解自然语言提示。Gemini目前专注于实现真实感,但它还没有达到谷歌另一个独立的ImageFX模型的水平,后者即使在测试版中也让我们大为惊叹,未来可能会整合到Gemini Advanced中。但这两者目前只能生成1024×1024像素的正方形图像。 OpenAI的Dall-E 3牺牲了真实性,换取了更大的灵活性。你可以指定图像的尺寸(正方形、肖像、16:9等),这是一个优势,如果你需要为特定网站或设计定制视觉效果,并且想跳过手动裁剪的步骤。但它具有特征性的卡通风格,使得Dall-E的图像很容易从远处就能辨认出来。 选择哪一个取决于你的目标。如果你渴望接近完美的产品照片用于在线商店,可能仍然需要像Adobe或Corel这样的专业工具。但对于奇思妙想的插图或富有创意的头脑风暴视觉效果,这两个竞争者都足够,留给你个人对风格的偏好选择。 声音便利性:家中还是在外有时候,你希望听到AI的回答,无论是为了允许多任务处理,还是简单地给你的眼睛一个休息。由于与谷歌生态系统的连接,Gemini提供了无缝的朗读功能。然而,ChatGPT Plus有自己的优势:一个原生移动应用,让你的对话几乎可以在任何地方进行。总的来说,OpenAI的声音感觉更人性化,但它只能通过智能手机使用。 选择取决于你的工作方式。如果你的AI使用主要在桌子旁边进行,而且需要与谷歌的其他工具集成,那么Gemini赢了。但对于那些经常在移动中,希望在口袋里放着手机就能听到聊天内容的人来说,可能会倾向于选择ChatGPT Plus。这对视力受损的人来说似乎很重要,但许多人更喜欢其他可以以极高速度播放内容的文本到语音(TTS)方法,因为他们觉得“自然声音”的语调太慢了。在这些情况下,这两个网站都与TTS兼容,所以这一点上没有太大差异。 速度需求让我们来看看它们的“大脑力量”(令牌上下文)似乎相当,但在速度上有巨大的差异:Gemini Ultra在与GPT-4(或Anthropic的Claude AI)的比较中极其快速。使用Gemini Ultra,你可以以GPT-3.5的速度获得GPT-4质量的输出。 例如:Decrypt使用了提示“请花点时间写一篇关于为什么加密货币在塑造经济交易未来中可能扮演重要角色的文章。”Gemini Advanced用12.14秒写完了整篇文章,而GPT-4需要近一分钟——确切地说是53.13秒。OpenAI的前一个聊天机器人版本,GPT-3.5 Turbo,用11.06秒写完了它的文章。 隐私问题关于AI的一个广泛关切是隐私:你提供的提示和其他信息被传输、存储和访问的地方。ChatGPT会保留你的聊天记录30天,使用这些信息来改善它的回应——但注重隐私的人可能会有所顾虑。另一方面,谷歌则将你的信息存储长达18个月。 两种服务都引发了不同的隐私担忧,使得这个选择既关乎你对数据的感觉,也关乎特性。幸运的是,两 者都提供了删除聊天记录的选项——以及分享它们的选项。 ChatGPT的特色胜利:PDF分析如果你的生活和工作都离不开PDF,这场比赛就很明确了:ChatGPT Plus能深入这些文档,提取见解,回答你对文档的问题,通常可以为你节省时间。出于法律或技术原因,谷歌尚未将这些功能整合到Gemini中。如果你的PDF文档是短文本,你可以简单地复制和粘贴,这可能不是问题。但对于那些处理客户文档、表格或研究报告的人来说,这可能是个决定性因素。 这对Gemini来说并不一定是永久的劣势,但就目前而言,那些大量使用PDF的人有充分的理由选择ChatGPT的增强功能。此外,Claude AI也可以免费分析PDF,并且其模型几乎和GPT-4一样好、一样准确。 搜索战如果你的聊天机器人会话中融入的搜索结果质量很重要,Gemini与谷歌搜索的天然链接赢了。Gemini Advanced让用户可以实时获得回应,模型在进行中从谷歌搜索中获取数据。另一个极其有用的功能是,Gemini Advanced有一个按钮,让人们可以使用谷歌搜索来双重检查交互中的所有事实。这最大限度地减少了偶尔的幻觉影响,并有助于源抓取和事实核查。ChatGPT依赖Bing,虽然Bing在改进,但真的无法与谷歌的主导地位竞争。 重要的是要注意,每个聊天机器人提供的答案都可能包含幻觉。这是生成性AI的本质。如果模型不能幻觉,那么它默认会复制已经存在的信息。与AI模型互动时进行事实核查是极其重要的。 ChatGPT Plus拥有而Gemini Advanced没有的开放生态系统和第三方集成:ChatGPT Plus通过与第三方应用的集成脱颖而出——既包括插件,也包括用户生成的GPT。这为用户创造了无限可能,使他们能够添加直接与其AI助手互动的插件,简化工作流程并解锁专门的功能。如果你习惯了在工作流程中使用Canva或Zapier并将它们与ChatGPT集成,那么转向谷歌Gemini会感觉像是降级。 个性化(且有利可图的)对话:GPT商店旨在奖励创造者,承诺在ChatGPT生态系统内持续创新和增长。如果你想通过创建个性化聊天机器人来赚钱,或者想尝试与确保你的聊天机器人更了解特定主题、采用特定风格,并且比其他任何选项都更个性化的GPT进行特别定制的对话……那么不要四处寻找,直接为ChatGPT Plus付费吧。 对话中的修改提高效率:使用ChatGPT Plus,你可以在多部分对话中调整之前的提示。例如,想象一个包含六个命令和六个回复的6轮互动。在ChatGPT中,用户可以编辑第四个命令,ChatGPT会生成一个新的回答,只考虑到那次互动之前的所有上下文。这节省了很多努力,使会话更加高效。对于谷歌,如果用户意识到他们在之前的命令中犯了一个错误,他们需要开始一个新的会话。 ChatGPT Plus的这个功能节省了宝贵的令牌,并避免了重新开始整个会话,优化了互动并保持了你的创造性流程。 Gemini Advanced拥有而ChatGPT Plus没有的捆绑的云存储和额外服务:对于那些已经在谷歌生态系统内的用户来说,包含的2TB谷歌One订阅是一个实质性的节省。在iCloud上,类似的计划每月大约花费10美元,在Dropbox上为12美元。对于这些用户来说,转向Gemini Advanced实际上降低了成本,因为他们平均每月只需额外支付10美元就可以获得顶级AI聊天机器人,而不是如果他们在使用ChatGPT Plus的同时使用云服务,则需要支付20美元。 准确性由谷歌提供:Gemini Advanced实时验证其回应与谷歌搜索的庞大知识库相匹配。这意味着你可以获得准确且最新的信息,得到谷歌的可靠性和相关性支持。与Bing的ChatGPT相比,不那么准确。 即时草稿和风格细化:Gemini Advanced允许你点击一个按钮就可以定制回应风格(正式、非正式、详尽)。不需要额外的提示!为了改善你的工作,Gemini还提供多个草稿,具有不同的措辞或重点,让你快速比较并改进你的输出。 谷歌应用作为你的AI游乐场:你可以深入谷歌 文档,计划旅行,使用YouTube编辑内容,并在Gemini Advanced的直接集成下进行协作。此外,当你的AI可以帮助调整图像参数时,你在谷歌照片中获得的那些新的强大的照片编辑工具(使用AI删除对象的魔术橡皮擦、伪装、照明工具、HDR增强等)变得更加强大。…
大公司如何用AI监控员工的消息
在沃尔玈特、达美航空、T-Mobile、雪佛龙和星巴克这些听起来与“高科技”关系不大的大公司背后,有一家叫做Aware的初创公司,正在利用人工智能技术偷偷监控员工的对话。这完全就像是从乔治·奥威尔的反乌托邦小说中跳出来的情节!想象一下,你在Slack、Microsoft Teams、Zoom等流行的应用程序上的每一条消息,都可能被人工智能进行分析。 根据Aware公司的说法,他们的人工智能帮助这些企业“理解他们通讯中的风险”,实时掌握员工情绪,而不是依赖每年或每半年一次的调查。这种匿名数据分析工具能够让客户观察到特定年龄组或地理位置的员工对新的公司政策或营销活动的反应情况。 但这项技术引发了一系列隐私和道德问题。Aware的分析工具虽然不能标记个别员工姓名,但它的另一款eDiscovery工具在极端威胁或其他风险行为发生时却可以做到。在这种情况下,员工监控与隐私之间的界限变得模糊不清。 更有趣的是,Aware的联合创始人Jeff Schumann以前竟然创立过一个名为BigBrotherLite.com的公司,这不禁让人联想到奥威尔的《一九八四》中无所不在的大哥大监视。而现在,他通过Aware,在不同的领域实施类似的监控技术。 尽管Aware的技术在某些方面可能为企业提供了有用的见解,但它也引发了对工人权利和隐私的担忧。毕竟,如果一个对话被标记出来,而员工却无法获取全部数据或面对他们的“控诉者”时,又该怎么办呢?这种人工智能监控的做法,无疑是将员工视为可监控的库存,而非有价值的个体。 在这个人工智能技术迅速发展的时代,我们或许应该更加关注如何平衡效率和隐私,以及如何确保技术的使用不会侵犯个人的基本权利。毕竟,没有人想生活在一个连最私密的对话都被监控的世界里,不是吗?