亚马逊正在构建一个名为“奥林匹斯”的新AI模型,企图赶上OpenAI和谷歌这样的竞争对手。 根据《The Information》的一份报告,这家科技和商务巨头正在开发这一大型语言模型,并计划将其整合到其在线商店和Alexa智能扬声器中。 据报道,该模型可能最快将在12月公布。正值亚马逊准备进入AI军备竞赛之际,该公司宣布了对AI初创企业Anthropic 40亿美元的投资。 作为商业巨头,亚马逊已经把AI作为优先事项,其目标是构建能与ChatGPT和Bard等产品竞争的产品,CEO安迪·贾西直接监管着构建亚马逊最雄心勃勃模型的团队。 最新的这些模型可能是有史以来建立的最大的AI模型之一。路透社报道称,“奥林匹斯”具有两万亿参数,相比之下GPT-4则有一万亿参数——尽管专家警告说,模型参数越多并不必然意味着比参数更少的模型更有能力。 由于技术问题以及ChatGPT的推出,后者被高管认为远优于亚马逊的产品,亚马逊去年推迟了另一个AI模型泰坦的发布。 自那以后,亚马逊一直在迅速尝试缩小这一差距。公司正在开发一个名为“尼罗项目”的“对话式购物代理”用于其在线商店,并于9月宣布将生成式AI整合到其Alexa智能扬声器中。 新的AI功能,这些都是建立在定制的大型语言模型之上,承诺能使Alexa与用户进行对话、编写消息并回答更复杂的查询。 Alexa的AI工具仍在向选定用户预览中,亚马逊暗示将来可能会收取订阅费用以访问这些工具。
三星刚刚发布了它的新一代人工智能大模型,起名叫‘三星高斯’哦!
星期三,三星首次公开展示了自家的生成式人工智能模型,被命名为“三星高斯”。 这个韩国科技巨头的生成式AI模型是以著名数学家卡尔·弗里德里希·高斯命名的,他建立了被广泛认识为钟形曲线的正态分布理论。 另外,三星的创始故事几乎难以置信。 三星表示,这个名称“反映了三星对模型的终极愿景,那就是从世界上所有的现象和知识中汲取灵感,利用人工智能的力量来改善世界各地消费者的生活”,公司在首尔举办的年度AI论坛——三星AI论坛上这样说。自2017年以来,由三星研究院和三星先进技术研究所联合主办,面向专家和学者。 三星表示,该模型是由其研究部门三星研究院开发的,目前正在用于提高公司内部员工的生产力,但未来将扩展到产品应用中。 三星高斯由三星高斯语言、三星高斯代码和三星高斯图像组成。 根据这家科技巨头的说法,语言是一个生成式语言模型,旨在通过帮助撰写电子邮件、总结文件和翻译等任务来提高工作效率,并且,当应用于产品时,还可以通过提供更智能的设备控制来增强消费者体验。该模型本身由多种模型组成,使其既可以在云端也可以在设备上应用。 另外,三星最新的旋转式投影仪在这个假日季秘密地成为了你能买到的最佳游戏机。 代码和它所基于的名为code的编程助手是为企业内部软件开发制作的。它允许开发人员容易快速地编码,并通过交互式界面支持代码描述和测试案例生成等功能,三星说。 同时,图像可以轻松生成和编辑图像,允许应用风格变更、增加内容以及将低分辨率图像转换为高分辨率图像,科技巨头补充说。 这些模型可以应用在设备上,以保护消费者的私人信息,同时三星也在通过其自己的AI红队工作以确保安全地使用AI,该团队检查在数据收集、AI模型开发、服务部署以及通过生成的结果过程中可能出现的安全和隐私问题。
Myspace的创始人团队来啦,这回带来了一个新玩意儿——一款文转视频生成器!只需上传你的自拍,它就能给你定制个性化的视频内容,让你的自拍活起来!
哇塞,Myspace社交平台和游戏公司Jam City的两位创始人Chris DeWolfe和Aber Whitcomb,这对老将级科技企业家,一直以来就致力掌握最热门的科技趋势。今年早些时候,他们通过最新的创业项目Plai Labs把目标转向了web3和人工智能风潮,这是一家得到a16z投资的社交平台开发创业公司,目的是为消费者提供AI工具进行协作和联系。 Plai Labs今天宣布推出其免费文本转视频生成器PlaiDay,加入了众多生成式AI视频工具的队伍,包括谷歌的Imagen、Meta的制作视频、OpenAI的DALL-E 2和Stable Diffusion。但是一个显著的特点是,可以通过自拍照将你的样子添加到视频中,对视频进行个性化。 如果你一直想看到自己(换句话说,动画版的你)飞过大峡谷或者与星际敌人作战的视频,PlaiDay可以实现这种愿望。你只需上传一张自拍,输入几个词,它就会生成一个短视频,你可以和朋友分享。视频目前只有3秒长,但视频时长未来会延长。公司也在加入音频功能。 公司给我们演示的一个例子使用了这样的提示词:“英国巡警,1800年代伦敦街景,特写,逼真。” 虽然我们不会说这很“逼真”,但PlaiDay在表达逼真的面部表情方面做得不错。此外,背景中的行人也走得相对流畅。(当然,他们的走动不完全像真人,但不显得突兀。) 个性化视频有点问题。由于用户的自拍中没有胡子,视频里这个人的胡须似乎正在融入皮肤。 这个其他例子(由Discord用户@Marvel创建)就扭曲了10倍。老实说,简直恐怖。为了避免这种情况,公司建议输入“特写”或“某人的画像”,以生成细致的人脸。由于还处于早期阶段,PlaiDay目前更适合生成一个面孔,而不是大量人群。 提示词:时尚女孩在时尚美容大赛中走秀 我们离看到电影级的AI生成视频还有很长的路要走。但是,我们对PlaiDay取得的成就和潜力仍然印象深刻。 你可以在PlaiDay的Discord频道上试用这款个性化文本转视频生成器。它即将在PlaiDay应用上推出,这是当前处于alpha版本的免费应用。PlaiDay提供各种其他有趣的功能,比如将你自己插入TikTok视频,文本转图像工具,调整图像样式的能力,生成字幕的文本生成器等等。公司称在未来几周会公布更多关于该应用的详情。 联合创始人兼首席架构师Jim Benedetto在接受TechCrunch采访时表示:“这只是我们看到的未来叙事方式的开始。一旦你可以把自己放进这些AI视频中,你就真正开始讲述自己的故事。”Benedetto之前是Myspace的高级副总裁。他还共同创立了内容优化创业公司Gravity,后被AOL在2014年收购。 该文本转视频生成器建立在公司自己的AI平台(内部代码名Orchestra)之上,它结合了自主和开源模型。这是Plai实验室计划提供的众多产品中的第一款。 正如团队所解释的,Orchestra是一个“灵活的工具集,可以增强几乎任何业务。它利用一组可重用的代码块为基础,这将使技术和非技术人员都能够快速高效地创建和部署新的有趣的AI应用程序,而与行业无关。” Plai实验室希望其平台可以帮助设计师和产品经理在没有工程师帮助的情况下创建AI功能。 Benedetto补充说:“我们感到兴奋,因为它使拥有远见的产品经理能够创建通常需要5至10名博士才能完成的AI。” 提示词:巨大的火焰石头怪兽,两条长手臂,红色电光,站在岩石平台上,逼真图形,黑暗奇幻。 Whitcomb解释说,AI平台不仅仅用于生成生成式艺术。很快,该平台可以帮助营销活动、安全监控、分析等。 “例如,你可以用扩散过程生成一系列创意作品。然后你可以用神经网络分析每一个创意作品,并添加一些文本……你可以使用语音转文字使其可索引,并使用LLM模块以便能够使用多种语言或推荐其他文本,”Whitcomb说。 他声称这个平台“灵活到可以做任何AI相关的事”。 这个还未命名的AI平台将在未来几个月内面向公众。
ChatGPT 终结者’横空出世,AI 生成论文再无藏身之地!
哇塞,一个机器学习工具可以超级轻松识别出用ChatGPT写的化学论文,这是11月6日发表在《细胞报告物理科学》上的一项研究结果。这种专门的分类器比现有的两种AI检测器效果更好,它可以帮助学术出版商识别由AI文本生成器书写的论文。 研究共同作者、堪萨斯大学劳伦斯分校化学家Heather Desaire说:“文本分析领域的大多数人都想要一个通用的可以检测任何东西的工具。” 但是通过制造一个针对特定类型论文的工具,“我们真正在追求准确性”。 研究结果表明,通过定制适用于特定写作领域的软件,可能可以增强AI检测器的研发效果。Desaire说:“如果你能快速轻松地建立一些东西,那就不难为不同领域建立工具。” 写作风格的要素 Desaire和她的同事首先在6月描述了他们的ChatGPT检测器,当时他们将其应用于《科学》杂志的Perspective文章。该检测器使用机器学习检查写作风格的20个特征,包括句子长度的变化、某些词和标点的频率,以判断一段文字是学术科学家写的还是ChatGPT写的。研究表明“你可以用少量特征就获得很高的准确度”。 ChatGPT等AI工具如何颠覆科学出版 在最新研究中,检测器通过训练在美国化学学会(ACS)出版的10种化学期刊的介绍部分。Desaire说,他们选择介绍部分,因为如果ChatGPT可以访问背景文献,这部分对它来说相对较易写。研究人员使用100篇已发表介绍作为人类撰写的文本进行训练,然后要求ChatGPT-3.5用ACS期刊的风格写200篇介绍。其中100篇提供论文标题,另100篇提供摘要。 在测试由人和AI基于同样期刊标题生成的介绍时,该工具以100%的准确率识别出ChatGPT-3.5撰写的部分。对于基于摘要生成的ChatGPT介绍,准确率略低,为98%。该工具对ChatGPT最新版本ChatGPT-4的文本识别效果同样出色。相比之下,AI检测器ZeroGPT根据不同ChatGPT版本以及是基于标题还是摘要生成文本,识别AI撰写介绍的准确率只有约35%至65%。OpenAI开发的ChatGPT制造商自己的文本分类器表现也很差——它识别AI撰写介绍的准确率只有约10%至55%。 这个新的ChatGPT检测器甚至在没有接受训练的期刊介绍上表现良好,并且捕捉到从各种提示生成的AI文本,包括一种旨在迷惑AI检测器的提示。但是,该系统针对科学期刊文章进行了高度专门化。当提供大学校报的真实文章时,它未能将其识别为人类撰写。 更广泛的问题 柏林应用科技大学研究学术剽窃的计算机科学家Debora Weber-Wulff说,作者正在做“迷人的事情”。她说,许多现有工具试图通过搜索AI生成写作的预测文本模式来确定作者身份,而不是通过查看写作风格特征。“我从未想过在ChatGPT上使用文体测量法。” 但是Weber-Wulff指出,推动ChatGPT在学术界应用还有其他问题。她指出,许多研究人员面临着快速撰写论文的压力,或者他们可能不认为撰写论文过程是科学重要的一部分。AI检测工具无法解决这些问题,也不应被视为“社会问题的神奇软件解决方案”。
人工智能竟然首次独自完成了合同谈判!这简直太牛了!
英国一家AI公司Luminance,它们家的AI系统居然可以自动跟别的AI系统谈判合同内容,全程零人为参与,这在全世界还是第一次! Luminance的首席幕僚兼常务董事Jaeger Glucina介绍说,他们这次研发出来的新AI系统,目的是让律师能少处理很多文书工作。用Glucina自己的话说,这个叫Autopilot的AI系统“能处理日常的谈判事宜,让律师把创造力用在该用的地方,不会被这种工作烦扰。” “这纯粹就是人工智能跟人工智能在谈判,从在Word里打开合同,到谈判条款,再发送到DocuSign签署,这整个流程全都是AI在操作,”她在接受CNBC采访时说。“这些不仅具备法律训练,也明白你的商业需求,都是AI在处理。” Luminance的Autopilot功能比他们的Lumi聊天机器人先进多了。Lumi就像ChatGPT,是给律师提问、复查合同部分内容,找出任何亮红灯的条款。 而Autopilot系统可以在零人参与的情况下独立操作——当然,人类还是可以检查每个步骤,软件也会记录AI做出的所有变更。 CNBC在Luminance伦敦办公室见识了这个技术的实际应用。非常快速,数分钟内就分析条款、做出修改,完成合同。 法律“自动驾驶” 协议双方有两名律师:一方是Luminance的首席法务官,另一方是Luminance客户研究公司ProSapient的首席法务官。 房间两侧的两个显示器上显示两名律师的照片——但驱动合同分析、审查内容、提出建议的力量完全是AI。 演示中,AI谈判方围绕一份保密协议(NDA)展开讨论,一方希望另一方签署。Glucina表示,在法律行业,NDA是个大问题,至少因为它施加严格的保密限制,需要详细审查。 “商业团队通常需要等法律团队完成NDA,才能进入下一步,”Glucina对CNBC表示。“所以这可能会拖延收入、延误新的业务合作关系和其他日常业务。所以消除NDA带来的阻力,将产生巨大影响。” 根据Glucina的说法,法律团队花80%时间审查和谈判常规文件。 Luminance的软件首先用红色高亮有争议的条款。然后将这些条款改成更合适的内容,并在整个流程中记录更改日志。AI会考虑公司在正常谈判合同时的偏好。 例如,NDA建议合同期限为6年。但这违反了Luminance的政策。AI承认这一点,然后自动修改为3年期限。 Glucina表示,与ChatGPT等工具相比,使用Luminance Autopilot更有意义,因为它是专门针对法律行业定制的,而ChatGPT和Dall-E等是通用平台。 英国投行Peel Hunt在上周的一份客户报告中也表达了相似看法。报告说,公司将利用特定领域的数据集,将通用LLM转化为特定领域的LLM,性能会优于OpenAI、Anthropic、Cohere等通用LLM。 Luminance没有透露软件定价。该公司销售年费订阅计划,允许无限用户使用其产品。客户包括科氏工业、日立Vantara以及咨询公司和律师事务所。 什么是Luminance? Luminance成立于2016年,由剑桥大学数学家创立,提供法律文档分析软件,帮助律师提高效率。 该公司使用基于AI和机器学习的平台来处理大量复杂、碎片化的法律文档集,使管理者可以轻松分配任务并跟踪整个法律团队的工作进度。 投资方包括Invoke Capital、Talis Capital和Future Fifty。 具有争议的英国科技企业家Mike Lynch是创始投资人,他因创立软件公司Autonomy面临美国诈骗指控并可能被引渡。他在2022年从Luminance董事会退休,但仍是重要支持者。
高通玩起了苹果的套路!看看Snapdragon X Elite对决Apple M3吧!
最近,人们期待已久的Snapdragon X精英版终于宣布了,紧接着苹果也不示弱,推出了新一代的M3芯片家族。Snapdragon X精英版由前苹果工程师组成的Nuvia团队开发,并后被高通收购。它配备了新的Oryon核心,旨在挑战苹果在笔记本电脑领域的地位。所以在这篇文章里,我们来深入对比一下Snapdragon X精英版和苹果M3的CPU、GPU、NPU等性能。 我们还比较了二者的性能,并讨论了各自的Geekbench得分。那么,不多说废话,我们直接切入正题吧。 规格比较 Snapdragon X Elite Apple M3 Pro Fabrication Process TSMC’s 4nm TSMC’s 3nm Transistors Not known 37 Billion (M3 Pro) CPU Cores 12 cores 12 cores on M3 Pro CPU Cluster 12x high-performance cores 6x high-performance + 6x efficiency cores Max Frequency 3.4GHz (23W)Dual-core boost up to 4.0GHz (23W)3.8GHz (80W)Dual-core…
微软正将AI角色带入Xbox的世界里!
微软正与Inworld AI合作开发Xbox工具,这将使开发者能够创建由AI驱动的角色、故事和任务。这项跨越数年的合作将包括一个“AI设计副驾驶”系统,Xbox开发者可以使用它来创建详尽的剧本、对话树、任务线等。 “在Xbox,我们相信有了更好的工具,创造者可以制作出更非凡的游戏,”Xbox的游戏AI总经理张海燕解释说。“这次合作将汇集Inworld在利用生成性AI模型进行角色开发方面的专业知识,微软基于云的先进AI解决方案包括Azure OpenAI服务,微软研究院对游戏未来的技术洞察,以及Xbox团队在革新易于访问和负责任的创造者工具方面的优势,服务于所有开发者。” 多平台AI工具集将包括用于剧本和对话的AI设计副驾驶,以及一个可以集成到游戏中的AI角色引擎,用于动态生成故事、任务和对话。 Inworld一直在开发可以像ChatGPT或必应聊天那样对玩家提问做出反应的AI NPC。这些AI NPC能以独特的声音做出回应,并可以在游戏中包含复杂的对话树或个性化的动态故事线。Inworld的技术也可用于旁白,所以在俯视角RPG游戏中的同伴可以提醒前方的敌人或玩家。 “Inworld AI的CEO Ilya Gelfenbeyn表示,“AI长期以来一直是游戏开发的一个组成部分,应用范围从敌人AI到程序生成。大型语言模型和生成性AI的出现为游戏内的叙事和角色互动开启了新的机会。” 微软仅将这作为游戏开发者的一个可选工具,所以将由他们决定在未来游戏中使用多少生成性AI。最终决赛开发商Embark Studios最近不得不为其使用AI生成的声音进行辩护,向IGN声明“没有演员制作游戏并不是最终目标”。 在游戏设计或配音等创意领域使用生成性AI是有争议的,SAG-AFTRA演员工会最近投票批准了视频游戏表演者的罢工授权。“SAG-AFTRA的首席合约官Ray Rodriguez表示,“在视频游戏领域,人们面临的问题和电影电视行业的人一样,不仅是AI的剥削性使用,还有滞后的工资问题。” 微软将其工具定位为一个助手,就像它为Microsoft 365和Windows定位的Copilot系统一样。“我们希望帮助开发者更轻松地实现他们的愿景,尝试新事物,突破当今游戏的界限,并实验以改善游戏玩法、玩家连接等,”张说。“我们将与Xbox工作室内部的游戏创作者以及第三方工作室合作和创新,开发出满足他们需求并激发未来游戏新可能性的工具。”
OpenAI的第一个开发者日
山姆·奥特曼推出了一个新的语言模型,功能强大得惊人。然后,他又宣布将一堆其他模型添加到API里。他还抽出时间和萨提亚聊了聊天(顺便戳了戳OpenAI和微软之间的关系)。在爆出大新闻之前,他还哲学了一番。 这是怎么回事? 没啥,就是OpenAI在他们的首个开发者日大展身手(对于封装来说简直是杀手)。 OpenAI推出了GPT-4涡轮增强版。 GPT-4涡轮增强版训练数据更新至2023年4月,拥有128k令牌(约300页)的上下文长度。而且它的成本比GPT-4低2-3倍。 它更擅长按照指令执行:有一个JSON模式,可以默认返回JSON格式的回复,你可以一次调用多个函数,或者使用种子参数复现一致的输出。 多模态API OpenAI的API将整合ChatGPT的所有多模态功能,包括: DallE-3:能够程序化生成图像。 GPT-4涡轮增强版视觉:GPT-4涡轮增强版的图像输入。 TTS和TTS高清:六种预设声音的文本转语音。TTS追求速度,TTS高清追求质量。 Whisper V3:开源。本月即将加入API。 GPT和助手API GPT是ChatGPT内的自定义聊天机器人。你只需通过GPT构建器提示即可创建。它会自动设置自定义指令。它会为你的机器人命名,创建头像,甚至为用户显示默认问题提供建议。要想更强大:你可以配置你的GPT来 接受外部文档进行检索。不需要创建嵌入式,实施分块或设置搜索算法。 允许使用工具,如代码解释器(是的,他们把名称改回来了),网页浏览和DallE-3。 然后,你可以预览你的GPT,决定是为自己、团队,还是在GPT商店向所有人上线。一旦它们明天可用,我们将提供更详细的GPT预览。 助手API是一样的,但开发者可以为他们的网站构建类似的自定义聊天机器人,拥有更多控制权和更多功能。 其他 对于GPT-3.5 16k,精细调整支持现在已普遍可用。积极进行精细调整的开发者被邀请参加GPT-4精细调整的实验项目。 自定义模型项目:大公司(那些又大又有钱的)可以与OpenAI的员工合作,使用他们的专有数据(多达数十亿令牌)创建自定义模型。 为所有人提供2倍的高速率限制,以及在多个语言模型上的2至3倍价格降低。 版权保护 – 对API和企业使用的法律责任。 为什么我应该关心? 我真的需要回答这个吗… 好吧!!这是即将到来的自主代理人的V1版本。准备的最好方法是去尝试早期版本。深入思考它们如何改变你的生活和工作。
lindy.ai 帮你“雇佣”AI员工
全新的Lindy平台:允许你建立一个全由AI组成的团队,一起完成任何任务!https://www.lindy.ai/blog/announcing-a-new-way-to-create-ai-employees 我们真的觉得代理人是AI的最酷应用,它们不仅仅“生成”东西,比如写作或插画,它们真的可以为你实际执行任务。 虽然已经有工具让你创建这些代理,但通常还需要高级的编程技能。 但我们觉得AI代理太赞了,功能强大、用途广泛,每个人都应该能够创建并使它们适应自己的工作流程 – 根本不需要编码! 为你工作的代理人应该像跟队友交流那样简单:你只需用简单的英语告诉他们要做什么,并邀请他们使用所需的应用程序。 这就是新Lindy的魅力所在。 30秒内创建一个Lindy 为你工作的代理人应该像跟队友交流那样简单:你只需用简单的英语告诉他们要做什么,并邀请他们使用所需的应用程序。 这就是新Lindy的功能。 你可以在短短30秒内创建Lindy,是不是超酷的?
全新炫酷的Zephyr-7B LLM调优了Mistral-7B AI模型,完胜Llama-2 70B,太酷了!
AI领域又有大动静啦!新出炉的Zephyr-7B AI模型在Hugging Face上亮相,这款创新的模型是原始Mistral 7B的升级版,并成功超越了70B参数的大模型,而且它还不受限制哦!公司还发布了详尽的技术报告,详细介绍了模型的训练过程。快来尝鲜试试Zephyr 7B Beta版! Zephyr-7B模型的训练采用了三步策略。第一步是使用Ultra Chat数据集进行精细调整。这个数据集包括了1.47百万由GPT 3.5 Turbo生成的多对话内容,经过精心清洗和过滤,只留下了200,000个例子。这个过程像大师与学徒一样,GPT 3.5作为大师,Zephyr-7B是学徒。大师模型会根据提示生成对话,然后用来调整学徒模型。 而在模型训练的第二步,Zephyr-7B就击败了Llama-2 70B啦!这一步使用的是Ultra Feedback数据集,包括64,000个不同的提示。四个不同的模型对每个提示生成响应,然后由GP4基于真实性和有用性进行评分。 还有更多关于Zephyr和Mistral大型语言模型的精彩文章,不要错过哦! 训练策略的最后一步是使用赢家和输家创建的数据集训练另一个模型。这进一步加强了Zephyr-7B模型的学习,确保它能生成高质量、可靠的响应。 Zephyr-7B模型的表现真的太厉害了,超越了所有其他的7B模型,甚至包括Falcon 40B和Llama 2 70B这样的大模型。不过要注意,它在某些特定任务上,比如编码和数学,可能并不是最佳选择。因此,用户要根据自己的实际需求选择模型。 Zephyr-7B模型最独特的地方就是它的不受限制性。但同时,当被提示进行非法活动时,它会建议反对,确保其响应遵循道德指南。 你可以在LMStudio或UABA Text Generation WebUI上本地运行Zephyr-7B模型,这为用户提供了在他们喜欢的环境中使用模型的灵活性。 Zephyr-7B模型无疑为AI领域带来了重要的补充。它独特的训练策略、出色的性能和不受限制的特性使它与众不同。但是,根据手头的任务,它的性能可能会有所不同,所以用户应该选择最适合他们的模型。公司的Discord服务器为有关生成性AI的讨论提供了平台,培育了一个学习和成长的社区。随着AI领域的不断发展,真的很期待看到像Zephyr-7B这样的模型的未来版本会带来什么。