最近,金融时报(FT)和OpenAI敲定了一桩私下的秘密交易,让OpenAI可以合法地使用FT的丰富内容来训练他们的GPT模型。这可不仅仅是增加了几条链接那么简单,ChatGPT的用户现在能看到引用的概要、引用和直接链接到FT文章的功能了。 作为交换,OpenAI将与FT合作开发新的AI模型,为FT的读者服务,类似于最近推出的、由Anthropic的Claude大型语言模型(LLM)驱动的“Ask FT”模式,这个模式允许FT的订阅者在已发布的文章中寻找信息。 为什么FT要做这样的交易呢?早些时候,FT已经为所有员工提供了ChatGPT的企业版使用权,以便从中获取创意和生产力的提升,这显示了他们对在新闻行业中拥抱AI的承诺,尽管FT集团的CEO John Ridding迅速明确表示,他们仍然致力于“人类新闻”。 “FT致力于我们无与伦比的新闻室所制作的人类新闻,这项协议将扩大我们工作的影响力,同时加深我们对读者需求和兴趣的理解。” —— FT集团CEO,John Ridding 此外,像ChatGPT这样的聊天机器人的兴起,正威胁到将读者引导至新闻出版商网站的搜索引擎。因此,FT与OpenAI建立密切关系具有明显的战略优势,OpenAI也同意将他们的“人类”内容进行归属。 那么,OpenAI为什么要做这样的交易呢?OpenAI最近与FT达成的这项交易是在与其他新闻机构(如Axel Springer、Bild和Welt以及美联社)签订了大约十几项内容许可协议之后进行的。虽然这些交易(包括这一次)的财务细节仍是个谜,但据信OpenAI为获得这些新闻内容的许可支付了100万到500万美元之间。 但为什么呢? 驱动聊天机器人的大型语言模型(LLM),如GPT、Claude和Gemini,因其“幻觉”和误导信息的能力而臭名昭著。这与新闻行业的原则背道而驰,新闻工作者努力验证他们发布的信息并证明其准确性,从而赢得读者的信任。 虽然OpenAI承认ChatGPT存在这些问题,但他们还未能解决。因此,他们与新闻机构的合作——让他们能够用可信的新闻内容来训练模型——可能是阻止错误信息和幻觉传播的一种进步。 另一个与新闻机构建立伙伴关系的理论可能是因为OpenAI面对的版权侵权诉讼数量,包括纽约时报、The Intercept、Raw Story和AlterNet都声称OpenAI使用了他们的受版权保护的内容来训练其模型。因此,与新闻公司建立伙伴关系并为其内容支付费用可能是避免这些昂贵诉讼的一种方式。
Author: aitrendtrackers@rengongzhineng.io
OpenAI因ChatGPT传播错误信息面临欧盟数据保护法律的严峻挑战
OpenAI 面临欧盟数据和隐私监管机构的审查,因其未能纠正 ChatGPT 生成的错误信息。 马丁·克劳利2024年4月29日非营利组织 NOYB 已代表一位“公众人物”向奥地利数据保护局(DPA)提起投诉,称 ChatGPT 向他提供了错误信息。 当要求 OpenAI 更正或删除这些错误信息时,他们表示这在技术上是“不可能的”,并且在被要求披露有关数据处理方式的信息时也未能做到,而是提出仅对某些与投诉人相关的提示进行过滤或阻止。 根据 GDPR 法律,欧盟内的人们对其个人信息有一定权利,包括更正不正确的数据的权利。因此,OpenAI 拒绝删除或更正投诉人的信息似乎直接违反了 GDPR 法律。 这起事件紧随波兰的类似案件之后,当时波兰数据保护局在一位隐私和安全研究员提出投诉后,启动了对 ChatGPT 的调查,因为 OpenAI 也拒绝更正有关个人的错误信息。 意大利的数据保护局在发现 OpenAI 在多个方面违反了 GDPR 法律后,也曾暂时关闭了 ChatGPT,包括制造关于人们的错误信息以及处理个人数据的方式。这项调查仍在进行中,决定尚待作出。 如果 OpenAI 被判违反数据保护法律会发生什么?如果 OpenAI 被判有罪,违反 GDPR 法律的处罚可能高达其全球年营业额的 4%,数据保护监管机构还可以命令他们更改信息处理方式,这可能会重塑其在欧洲的运营方式。
Meta的AI潮流:创新还是用户体验的噩梦?
Meta 公司最近在其社交媒体平台大力推广人工智能,似乎不久的将来,无论是你的 Facebook 新闻源,Instagram 搜索栏,还是 Messenger 上与朋友的对话,都将无处不在地看到 Meta AI 的身影。公司的 Llama 3大型语言模型可能是市场上最强大的开源模型(尽管其开源性还在持续争议中)。Meta 正在展示其实力,并押注人工智能的普及能够真正改善用户体验。 然而,至少目前看来,这种押注似乎是一种误判。 到目前为止,Meta AI 带来的体验充满了垃圾信息。Instagram 的搜索功能一度是查找朋友账户的地方,现在似乎变成了引导用户与聊天机器人对话的工具。我的搜索栏现在显示“向 Meta AI 询问任何问题”。嗯,不,我只是想查看一下我的狗在托儿所是否有新照片。 新的 Instagram 头部还展示了一个与 AI 互动的侧滚动提示列表:“想象屋顶花园”,“现代斯多葛哲学建议”,“动漫短片”。坦白说,世界上最强大的社交媒体广告公司在我使用了十五年后,竟然对我了解如此之少,甚至无法给我个性化的建议,这真是太奇怪了。我没有屋顶,如果他们认为我对斯多葛哲学或动漫感兴趣,那他们真是无药可救了。 更糟糕的是,Meta AI 已经开始表现得很奇怪。据 404 Media 报道,一个面向父母的 Facebook 群组中,AI 似乎无缘无故地回复了一条帖子,声称自己有一个残疾但天赋异禀的孩子。“我有一个也是 2e 的孩子,他一直在纽约市的天才项目中,”机器人说。(2e,或称双重特殊,是指智力残疾但天赋异禀的学生。)Facebook 群组的交流规则复杂,礼仪难以捉摸,但这里有一个对任何假扮为人类助手的机器人都适用的好规则:不要假装自己是有残疾孩子的有感知的生物。 但如果我们只专注于 Meta 制造的人工智能的涌入,就会忽视用户生成的人工智能在其生态系统中的泛滥。我的 Facebook 被 AI 生成的图像和轻信这些是真实的用户所淹没。 一个叫做 Classic Living 的热门页面不断出现在我的新闻源中。“这让我想起了奶奶的厨房,”一条帖子这样写道,旁边是一张装饰华丽、带有绿松石橱柜和石拱窗的厨房图片。但如果你放大看,就会发现悬挂的锅碗瓢盆变形了,石头的角度奇怪,刀块中的刀子全部融为一体。尽管如此,评论却是极好的:“这是一个惊人的厨房,”一个人评论说。“这才是我的梦想厨房,”另一个人说。有几个人开始觉 察到了:“不知道你怎么想,但我的奶奶的厨房是真人设计和制作的,不是电脑。” 在另一个群组中,人们开始变得更聪明。有一个名为“I grew up in Washington…
特斯拉即将推出的Robotaxi叫车应用:一窥未来的自动驾驶出行服务
特斯拉在最近的财报中展示了即将推出的叫车应用的初步界面,该应用包括五个屏幕,功能包括一个“召唤”按钮和预计等待时间,以及一个显示虚拟车辆前往乘客位置的3D地图,这些功能让人联想到像Uber这样的流行叫车应用,但融入了特斯拉的风格。 在等待期间,乘客可以调整车辆的温度至理想状态,并查看等待时间、最大乘客容量等详细信息。当车辆到达时,应用程序会转换显示屏,展示前往目的地的路线,并提供音乐选择等附加控制功能。 特斯拉详细介绍了其在Robotaxi和自动驾驶叫车项目中取得的一些近期里程碑,强调公司一直在为实现车辆自动化和开发叫车服务的“硬件和软件生态系统”投入资源。 此外,特斯拉还指出,通过采用基于视觉的架构和端到端神经网络,利用覆盖数十亿英里的广泛实际驾驶数据进行训练,可以实现一个可扩展且有利可图的自动驾驶企业。 在周二的财报电话会议上,马斯克表示,特斯拉将管理Robotaxi车队,将公司的角色比作Airbnb和Uber的结合体。他解释说,虽然特斯拉将拥有并运营某些车辆,但其他车辆将属于客户。他指出:“会有很多车是由最终用户拥有的,”并且“那些用户可以随时将他们的车辆增加或从车队中移除。”据The Verge报道,他还透露,Robotaxi将被称为“CyberCab”。 马斯克在财报电话会议中还表示:“如果有人不相信特斯拉能解决自动驾驶问题,我认为他们不应该成为公司的投资者。我们将解决这一问题,而且正在解决。”据CNBC报道。 马斯克曾多次暗示Tesla Robotaxi的可能性,甚至在2023年介绍公司第三个总体规划的活动中展示了一辆完全遮蔽的车辆。 几年前的2019年4月,该公司曾表示计划从2020年开始运营Robotaxi。公司预计这些自动驾驶车辆的寿命为11年,行驶里程为100万英里,每年为公司和车辆运营商带来30,000美元的利润。当时,马斯克还表示,Robotaxi的推出可能会将特斯拉的价值提升至5000亿美元。 在之前的声明中,他强调装备了完全自动驾驶功能的特斯拉车辆将通过软件更新不断改进,最终实现完全自动化。马斯克重申,这些车最终将作为完全自动的出租车运营,为车主带来收入,因为它们将提供自动出租车服务。 目前,包括Waymo(谷歌母公司Alphabet的子公司)和通用汽车的子公司Cruise在内的几家公司也在积极开发自动驾驶共享出行服务。
Meditron:一个专为资源匮乏的医疗环境量身定做的大型语言模型(LLM)套件,依托于Meta Llama技术
在医疗领域,有一款名叫Meditron的开源大型多模态基础模型,它的出现就像是穿梭在信息世界的救护车,及时送达正确的信息,从而挽救生命。Meditron不仅仅是个冷冰冰的数据分析工具,而是被设计来协助临床决策和诊断的超级英雄。这款由Meta Llama 2打造的神奇工具,吸纳了来自全球医学专家和人道主义响应者的智慧,不断迭代升级,最新版的Llama-3[8B]-MeditronV1.0,简直就是医学界的“升级打怪兽”,在各种基准测试中都能秒杀对手。 由瑞士洛桑联邦理工学院的电脑与通信科学学院和耶鲁医学院的研究团队联合打造,与国际红十字会等人道组织紧密合作,这不仅是技术的胜利,更是人文关怀的胜利。在上线初期,Meditron的下载次数就已超过30,000次,成为低资源医疗环境中的创新明星。 Meditron不只是提供一般的医疗信息,而是精确对症下药,提供符合证据的医疗建议和标准,尤其在急需快速准确医疗响应的紧急情况下,以及帮助医疗工作者在服务不足的地区诊断和治疗病人时,都能发挥巨大作用。耶鲁大学的玛丽-安妮·哈特利教授表示,把这套工具完全开源,从数据到算法,都旨在赋能那些资源有限的地区,促进医疗知识的公平获取。 哈特利教授还强调,开源技术是创新的重要推手,而在资金紧张时,他们选择从小规模做起,专注于质量。Meditron也经历了从小模型到大模型的迭代,即便是性能较低的Meditron 7B,在实验性模型扩展上仍然极具价值。 最激动人心的是,来自世界各地的医生和人道主义组织正在参与Meditron的在线开放验证和评估(MOOVE),这是对Meditron社区价值的认可,也是对这个项目社会和商业价值的肯定。哈特利希望,资助者能看到投资这种学术开源项目的潜在价值。 下载: GitHub – epfLLM/meditron: Meditron is a suite of open-source medical Large Language Models (LLMs).
企业使用生成式人工智能实例100
自从生成型人工智能一年半前首次引起全球关注以来,关于这项新技术最适合应用于何处的讨论一直非常激烈。虽然早期的趣味对话和机智的五行诗颇受欢迎,但人们很快发现,许多最大的人工智能机会显然存在于企业领域。 谷歌云的客户和合作伙伴已经发现了利用生成型人工智能创造新流程、效率和创新的真正潜力。想要证据,不妨看看本周在拉斯维加斯举行的Next活动中,展示的300多个组织。 在短短几个月内,这些组织已从人工智能帮助回答问题,转变为人工智能进行预测,再到生成型人工智能代理。生成型人工智能代理的独特之处在于它们可以采取行动实现特定目标,无论是引导购物者找到完美的鞋子,帮助员工寻找合适的健康福利,还是在班次更换期间支持护理人员更顺畅地移交病人。 在与客户的合作中,反馈显示他们的团队越来越专注于提高生产力、自动化流程和现代化客户体验。这些目标现在通过他们正在开发的人工智能代理在六个关键领域得到实现:客户服务;员工赋能;创意构思与生产;数据分析;代码创建;以及网络安全。 这些特殊能力在很大程度上得益于生成型人工智能和人工智能基础模型的新型多模态能力,这使代理能够处理包括文本、语音、视频、音频、代码等在内的多种通信模式的任务。在人类的支持下,代理可以进行对话、推理、学习和决策。 Next活动的舞台上,数百名客户加入谷歌云,展示和讨论他们的人工智能代理和生成型人工智能解决方案的早期版本,并依赖谷歌云技术,包括人工智能基础设施、双子模型、Vertex人工智能平台、谷歌工作区和谷歌分布式云。还有超过100个合作伙伴加入,支持人工智能代理和人工智能解决方案的创建,具体内容可以在此处阅读。 以下是101位行业领袖如何将人工智能投入今天的生产中,创造真实世界的用例,从而转变未来。 客户代理 类似于优秀的销售和服务人员,客户代理能够仔细聆听、理解您的需求,并推荐合适的产品和服务。他们能够无缝跨越多个渠道工作,包括网络、移动和销售点,并可以与语音和视频集成到产品体验中。 员工代理 员工代理帮助员工提高生产力并更好地协作。这些代理可以简化流程、管理重复任务、回答员工问题,以及编辑和翻译关键通讯。 创意代理 创意代理可以为您的组织带来最佳的设计和生产技能,跨越图像、幻灯片,并与员工共同探索概念。许多组织正在为其营销团队、音频和视频制作团队以及所有需要帮助的创意人员构建代理。有了创意代理,任何人都可以成为设计师、艺术家或制作人。 数据代理 数据代理就像是你指尖上的知识丰富的数据分析师和研究员。他们可以帮助回答关于内部和外部来源的问题,综合研究,开发新模型——最重要的是,帮助找到我们甚至还没想到的问题,然后帮助获得答案。 代码代理 代码代理正在帮助开发人员和产品团队更快、更好地设计、创建和运营应用程序,并快速掌握新的语言和代码库。许多组织已经看到了生产力的两位数增长,这导致了更快的部署和更清晰、更干净的代码。 安全代理 安全代理通过大幅提高调查速度、自动化监控和响应来协助安全操作,以实现更大的警惕性和合规控制。它们还可以帮助保护数据和模型免受网络攻击,如恶意提示注入。
惊爆:Apple重启OpenAI谈判为iphone引入其技术
最近传来小道消息,苹果公司正在与OpenAI重新开启对话,商讨利用这家初创公司的技术为iPhone新增功能提供动力。据知情人士透露,双方已开始探讨可能的合作条款以及如何将OpenAI的功能整合到即将发布的iOS 18系统中。这些人士要求匿名,因为这些讨论是非公开的。 这一动向标志着两家公司对话的重新开启。虽然苹果公司今年早些时候已与OpenAI讨论过合作事宜,但此后双方的合作几乎没有什么进展。同时,苹果还在与Alphabet旗下的Google就许可其Gemini聊天机器人进行讨论。 目前苹果尚未最终决定将使用哪家公司的合作伙伴,也不能保证最终能够达成协议。公司最终可能与OpenAI和Google都达成协议,或者选择另一个完全不同的提供商。苹果、OpenAI和Google的代表均拒绝对此发表评论。 据悉,苹果的下一代iPhone操作系统将包括多项基于苹果自家大型语言模型的新功能——这种AI软件能生成听起来像人类的文本。但苹果公司也一直在寻找合作伙伴,以推出类似OpenAI的ChatGPT的聊天机器人功能。彭博社在三月份首次报道了这些讨论,讨论中还包括AI初创公司Anthropic。 这一最新动态发生在苹果全球开发者大会前大约一个半月,届时公司准备推出新的AI软件和服务。该公司计划将其功能宣传为与设备的集成更加无缝,且比竞争对手的AI产品提供更好的隐私保护。 去年,库克表示他个人使用了OpenAI的ChatGPT,但他指出还有“许多问题需要解决”。他承诺,新的AI功能将在“非常深思熟虑的基础上”引入苹果平台。 通过依赖合作伙伴,苹果公司能加速推进聊天机器人的发展,并规避一些风险。库克将生成性AI功能外包给其他公司,可能会减少其平台的责任风险。
Google最新报告深探生成型AI对经济的影响力!
今天,Google发布了首席科技与社会访问学者安德鲁·麦卡菲(Andrew McAfee)关于生成型AI可能对经济影响的报告。这份报告是麦卡菲研究AI与经济领域成果的结晶,他与谷歌的专家们紧密合作,探讨了生成型AI的快速兴起如何影响生产力、劳动市场以及在AI驱动的经济中成功所需的技能。 想了解更多安德鲁·麦卡菲的观点,请阅读概述或下载完整报告。 生成型AI是那种罕见的技术,足以加速整体经济增长——经济学家所说的“通用技术”。这些创新有潜力对经济和社会产生积极的变革。据估计,美国经济中近80%的工作岗位至少有10%的任务可以通过使用生成型AI来完成,速度提高一倍(且质量不减)。 像蒸汽机和电气化这样的过去的通用技术,其变革是在几十年间逐步实现的。然而,我们预计生成型AI的影响将更加迅速,这得益于其通过互联网快速传播的能力以及因其自然语言界面而易于使用。 这项技术已经带来了巨大的生产力提升,随着人们和组织想出利用生成型AI能力的补充创新,这种提升将会增加并扩散。因此,整体生产力将得到改善,从而加速经济增长。除了更快的增长,生成型AI还将带来其他变化。它将减少对某些技能的需求,增加对其他技能的需求,还将创造出全新的需求。 对于大规模技术性失业的担忧可能有些夸大。通用技术的历史表明,它们带来的增长总是伴随着对劳动力的强烈需求。然而,这种增加的需求往往出现在新的职业中。例如,自1940年以来美国总就业增长的超过85%来自完全新的职业。 生成型AI的迅速变革将要求迅速且有效的再培训努力。这些努力能够利用生成型AI本身,这是一种独特的工具,可以帮助人们学习如何更好地使用它。而且由于生成型AI能够积累知识并按需提供,它在改善初级员工的表现、帮助解决工资不平等方面特别有效。过去的通用技术已经改变了在不同行业中处于领先地位的公司和国家。我们相信,生成型AI将同样具有强大的影响力。
OpenAI联合创始人表示,当前的大型语言模型“可能被低训练了100至1000倍甚至更多”
Meta的Llama 3模型是在创纪录的数据量上训练的,这可能会导致整个人工智能行业的重新思考,并产生更优秀的模型。 在Llama 3中,Meta推出了一款新的语言模型,其在某些领域的表现显著超过其他模型。据Meta称,性能提升的关键在于显著增加的训练数据量和使用1000万高质量示例进行的精细调整。 虽然高质量数据能够提高甚至是较小语言模型的性能已是众所周知的事实——微软最近再次用其Phi-3模型证实了这一点——但用于预训练的数据量仍然令人惊讶。即使是拥有80亿参数的模型也是在大约15万亿个标记上进行训练的。值得注意的是,这种训练不仅远远超过了用于Llama 2的数据量,也超过了DeepMind发展的Chinchilla缩放法则认为的最优数据量。 语言模型可能显著欠训练根据DeepMind的Chinchilla法则,对于一个80亿参数的模型,约2000亿训练标记被认为是最优的,以最有效地利用计算能力。Llama 3的训练数据量是这个数字的75倍。 尽管训练数据量巨大,Meta发现,“80亿和700亿参数模型在我们对其进行最多15万亿标记的训练后,继续呈对数线性改善”,公司的博客文章中提到。 AI研究员Andrej Karpathy在X(前身为Twitter)上解释说,Chinchilla法则“告诉你计算的最优点”,但没有说明一个模型可以被训练到何种程度直到达到其最大性能。Karpathy是OpenAI的创始成员,曾是特斯拉的AI负责人。 尽管目前尚不清楚通过更长时间的训练能够将语言模型的性能提高到何种程度,直到收益变得微不足道为止。然而,Meta已经表明,尚未触及可能的极限。Karpathy希望其他AI公司将跟随Meta的例子,发布更多经过长时间训练的小型模型。
Adobe即将推出的大项目是一款AI,能将低分辨率视频提升至原始质量的8倍
最近,Adobe的研究团队发布了一篇关于名为VideoGigaGAN的新型生成式AI模型的论文,我们认为这种技术可能会在未来的产品中推出。VideoGigaGAN的功能是将低质量视频的分辨率提升至原始分辨率的最高八倍,同时不牺牲视频的稳定性或忽视源材料的重要细节。项目网站上有几个演示视频展示了它的能力,比如将一个模糊的128×128像素的瀑布视频转换成1024×1024像素的高清视频。 值得注意的是,这种AI技术在处理细节上毫不妥协。在人物面部上可以看到皮肤质地、皱纹、头发丝等细节。其他演示视频也展示了类似的高质量效果。比如,通过这项技术,你可以更清楚地看到池塘中游泳的天鹅和树上的花朵。可能会觉得关注皮肤的皱纹或羽毛等细节有些奇怪,然而,正是这种级别的细节处理,Adobe这样的公司必须精确掌握,如果他们打算在广泛的范围内实施图像增强AI。 改进的AI技术复杂难懂。 “GAN”在VideoGigaGAN中代表生成对抗网络,这是一种能够创建逼真图像的AI类型。Adobe的版本特别基于GigaGAN,专注于提升生成内容以及真实照片的质量。正如TheVerge所指出的,这项技术的问题在于它在提高视频质量时会引起多种问题,如奇怪的图像失真。为了解决这一问题,Adobe研究人员使用了多种技术。 研究论文解释了整个过程,尽管内容密集,你可以自行阅读以获取完整的信息。基本上,他们引入了“流引导传播模块”以确保视频帧之间的一致性,使用抗锯齿技术减少图像失真,以及“高频特征传输”来补偿细节突然下降。VideoGigaGAN的内容不止这些,但这就是其主要内容。 潜在的应用 我们是否会在即将推出的Adobe产品中看到这一技术,或者作为一个独立的应用推出?很可能——至少我们是这么认为的。 在过去的一年中,该公司一直在重点实施人工智能到其软件中,从推出Firefly到Acrobat的新助手。就在几个月前的Adobe MAX 2023期间,一个被称为Project Res Up的视频增强器在活动中预览,其性能与我们在VideoGigaGAN演示中看到的类似。一部20世纪40年代的旧电影从480×360像素分辨率提高到了清晰的1280×960像素。河中大象的模糊视频变得清晰可见。演示者甚至提到,软件可以将剪辑的质量提升四倍。 公开承认,这只是猜测,但VideoGigaGAN很可能是Res-Up背后的引擎。Adobe的未来产品可能会为人们提供一种将旧家庭视频或低质量视频提升为我们脑海中想象的电影的方式。也许,最近的预览是即将发布的暗示。 VideoGigaGAN仍在深入开发中,因此尚不清楚何时或是否会发布。这项AI在处理超过200帧的视频或渲染小物体时还存在一些障碍,但我们肯定会继续关注。 下载:https://arxiv.org/pdf/2404.12388