最近很火的人工智能技术ChatGPT,估计大家都听说过吧。它代表了新一代的生成式人工智能技术的到来。使用这种技术,会在专业人士和企业中出现一个明显的分界线:那些利用这项变革性技术来提高生产力和创新能力的人,和那些落后于时代潮流的人。成功的前景正在迅速演变,决定因素将是对生成式人工智能的心态。 那么问题就变成不是如果而是如何调整自己迎合这波变化。这是一个我们都应该思考的大问题。但是对于任何变革来说,出发点通常是弄清我们自己需要如何改变。我相信对大多数人来说,这意味着我们需要考虑如何培养生成式人工智能的心态。 那么什么样的心态呢?如果我们想充分利用机遇,我们应该如何训练自己的思维、行动和应对方式? 这不仅仅是技能的问题,尽管技能也是另一个关键环节,更多关乎使用技术的方式。心态更多关乎做好准备,识别机遇并抓住机遇。所以,我将试着定义其核心特征,并看看任何人,不仅仅是天生具备这些特征的人,如何改进和掌握这些特征。 生成式人工智能心态的核心信念是,生成式人工智能是一种工具。它不会代替我们的工作,我们会用它来更有效地完成工作。它不会取代人类对创造力和解决问题的渴望,但它会大大减少我们在重复或技术方面的工作时间,这样我们就可以花更多时间在这些事情上。 当然,这与其他成功采用我们这辈子的重大变革的人所采用的心态变化是一致的。例如互联网的出现。从杰夫·贝佐斯创立亚马逊,到Z世代的数字创业者找到从社交媒体中创收的无数新方法。他们都拥有、采用或培养一系列的特征,这使他们在识别机会时不会被自我设限的信念、过程或行为所阻碍。 那么,这些心态品质是什么?我们如何判断自己是否拥有这些品质?如果我们没有,我们可以做些什么来培养这些品质? 生成式人工智能心态的特征 采用生成式人工智能心态,我认为,需要从传统的思维方式转变为更具适应性、协作性和前瞻性的方式。 适应性是关键。这意味着愿意摒弃我们熟知的东西,即使我们认为它有效,以采用新的东西。即使对一个适应性强的人来说,不熟悉也让人不舒服,但他们会以此作为激励,熟悉任何新的东西 – 新的工具、流程、技能甚至一个新的人。 与此密切相关的是好奇心,这推动了每一位伟大的发明家和探险家。我们可以通过在不确定某些事情时自我训练提出问题来培养这种品质。有时,我们倾向于对不理解如何、为什么或假设了解的东西感到满意。提出这些问题并为我们的环境、经验或流程寻找答案,让我们识别可以做得更好的地方。如果你不明白某件事是如何运作的,那么它可能就不能正常工作,这是一个改进的机会! 培养持续的学习也很重要。过去学校和大学为我们一生的职业做好了准备的日子一去不复返了。今天保持领先意味着不断更新我们的技能和知识。幸运的是,大量免费和负担得起的在线课程的激增,以及雇主对于再培训员工的需求日益增长,意味着机会往往是可得到的。 其他因素包括愿意与人和机器协作的意愿、对生成式人工智能伦理影响的认识、批判性思维能力和解决问题的动力。 极客心态 最近,我有幸读到了麻省理工学院主要研究员兼数字经济倡议负责人安德鲁·麦卡菲的最新著作《极客之道》的预发行版本。 麦卡菲对极客的定义是一个“痴迷的反叛者”,他们执着并敢于非常规。他将他所说的“极客之道”定义为四个特征:速度、所有权、科学和开放。 采用这种心态使极客继承了地球。正如麦卡菲最近在与我交谈时所说,21世纪美国公司所有市值增长的三分之一都是由北加州的企业产生的 – 具体来说,他是指硅谷,极客的故乡。 速度体现在科技界取得成功的人能够快速迭代的能力上 – 启动最小可行产品,在必要时失败,并利用吸取的教训改进。 所有权是指确保每个人对自己的工作和达成自己目标负责。科学意味着根据数据行事 – 根据证据显示的最佳方向前进。开放是接受批评或新想法的能力。 所有这些品质与我所认为的生成式人工智能心态息息相关,而且同样是可以学习的特征。此外,它们与使我们成为成功人类的特征密切相关 – 学习、批判性思维和协作 – 而不是技术或机械能力。 正确的心态 从上面的例子可以看出,这些品质大多是我们所有人在日常生活中或不使用的品质,这取决于我们是什么样的人。 但至关重要的是,这些都是几乎任何人都可以在我们的日常环境和工作生活中培养和改进的品质。 适应能力、好奇心、开放性、协作意愿和解决问题的能力都是我们可以在自己和他人身上发现的人性品质。 它们大多是通过与其他人互动和接触培养的技能。反过来,我相信当它来定义我们与将改变每个行业的新一代机器和智能工具的关系时,它们会非常有益。 朋友们,新的技术革命已经来临,我们必须做好准备迎接它。调整心态非常重要,这样我们才能在这个变革中获得成功。让我们保持积极心态,培养适应能力和团队合作精神,抓住机遇创造更美好的未来!
Category: Uncategorized
开源AI模型新王登基
让开吧,Meta,开源界出现了新王者。Mistral 7B在2023年9月底发布,它不仅采用了Apache 2.0协议,还比Llama 2体积更小、性能更好,现在有传言a16z要以25亿美元估值投资它4亿美元。 当然,Mistral在发布文章中强调的97.5%的压缩率中,有75%来自Chinchilla论文,我们在播客中已经讨论过它了,现在大家也都知道了。但真正的重点是它改变了模型大小与性能之间的效率前沿: 根据Mistral的论文。注意图中的轴都没有从0开始,这夸大了差异,但这仍然是一个重大成就。 Mistral称其为“示范模型”,我们之前已经讨论过猜测,Mistral 7B可能是建立在高达8T标记的数据集上训练的800B检查点。而Llama 2只训练了2T标记。如果这种猜测是真的,再考虑到Together AI本月发布了一个新的30T标记数据集,那么“标记危机”似乎还不是问题(OpenAI和EleutherAI的领导者都认为存在这一问题)。 微调。在发布一个月后,Mistral彻底改变了开源模型的局面,最明显的是HuggingFace基于UltraChat数据集对Mistral的微调Zephyr 7B,它使用了一种名为DPO的PPO-RLHF的简单替代方案。这种微调令Mistral 7B的表现超过Llama 2 70B在MT Bench上的成绩,这对一个体积小10倍的模型来说是一个令人印象深刻的成就。Nous Research社区(在OpenAI开发者日有了高调亮相)也非常活跃,将Hermes基模型切换到了Mistral,击败了之前的Hermes 13B和70B模型。自然,自定义微调现在非常热门,Brev和WandB也在这个领域大显身手。 “开源”意味着什么? 尽管Mistral的权重确实是无BS的开源许可,但他们的数据集没有开源,虽然发表了论文,但只提供了关于滑动窗口注意力的红鲱鱼(误导信息)。我们并不真正知道它为什么表现那么好,而且研究社区似乎也没有从Mistral的发布中受益——那么,Mistral真的开源吗?还是说我们只满足于权重开源许可就算作“开源”? 6月份,OSS Capital试图定义一个开源权重基金会,但没有获得关注。实际上,公司没有任何动机公开自己的数据集,因为这只会引来诉讼和竞争。他们也没有多少动机公开模型架构和训练流程,只有在允许推理和微调时才会公开,就像Mistral和Meta做的那样。 来自“开源如何吞噬AI”的更新图表,我们难以相信这已经是一年前的事了。 斯坦福来了!来自Percy Liang的CRFM实验室的新的基础模型透明度指数(FMTI),是开源模型迈出的最重要的一步,因为它是由同行设置的开放标准: 它不是由开源倡议组织或其他监管基金会强加的二元开放/不开放模型,而是根据100个透明度点对模型和实验室进行评分,让他们可以选择透明度的程度,但使用他们比空谈开源抱怨者更在意的一件事:同行压力。 现在,开源模型运动可能有机会通过模型实验室的行动量化改进,而不是那些没有立场的人想要的开放程度,收敛到可集体接受的最大开放程度
AI读取脑部扫描图像,对于寻找阿尔茨海默病基因展现出潜力
机器学习方法检测阿尔茨海默症的准确率超过90%——这对临床医生和开发治疗方法的科学家来说是一个潜在的福音。 华盛顿特区 研究人员筛选了成千上万人的基因组,努力寻找与阿尔茨海默症相关的基因。但这些科学家面临一个严峻的障碍:很难确定这些人中谁确实患有阿尔茨海默症。这种疾病没有确凿的血液测试方法,而痴呆是阿尔茨海默症的一个关键症状,也由其他疾病引起。早期阿尔茨海默症可能不会引起任何症状。 现在,研究人员开发了基于人工智能的方法,这可能会有所帮助。一种算法可以有效地筛选大量的大脑图像,挑出那些包含阿尔茨海默症特征的图像。第二种机器学习方法识别大脑的重要结构特征——这最终可能帮助科学家在大脑扫描中发现阿尔茨海默症的新迹象。 目标是将人们的大脑图像用作阿尔茨海默症的“视觉”生物标志物。将该方法应用于也包含医疗信息和遗传数据的大型数据库(例如英国生物库)中,可能使科学家找出对该疾病起贡献作用的基因。反过来,这项工作可能有助于开发治疗方法和预测谁有患病风险的模型。 将基因组学、大脑成像和人工智能结合起来,使研究人员能够“找到与基因驱动因素紧密相关的大脑测量指标”,该研究的带头人,洛杉矶南加州大学的神经科学家保罗·汤普森说。 汤普森等人于11月4日在华盛顿特区召开的美国人类遗传学年会上描述了这些新型人工智能技术。 数据过载 过去20年来,成千上万的人既测序了基因组,又进行了大脑扫描,以构建巨大的研究数据库。但产生这股信息洪流的速度正超过研究人员分析和解释它的能力。 “与5-10年前相比,我们现在数据非常丰富,这就是人工智能(和机器学习)方法可以发挥作用的地方,”纽约市西奈山伊坎医学院遗传学家艾莉森·戈特说。 2020年,汤普森启动了AI4AD,这是一个跨美国的研究人员联盟,旨在开发人工智能工具来分析和整合与阿尔茨海默症有关的遗传、图像和认知数据。作为这个项目的一部分,研究人员创建了一个人工智能模型,该模型经过对数万张磁共振成像(MRI)大脑扫描进行训练。这些图像之前已由医生进行审查,医生挑出显示阿尔茨海默症证据的扫描。从这些图像中,人工智能工具学习了患病和未患病人员的大脑外观。 自学算法 在一项尚未经同行评议的预印本研究中报告,AI分类器检测阿尔茨海默症大脑扫描的准确率超过90%。该联盟还使用了类似的方法创建了一个分类器,可以准确地将扫描分类到与认知衰退和痴呆相关的大脑病理变化的独立类别中。 德桂治,得克萨斯大学休斯顿健康科学中心的数据科学家及其同事采取了不同的方法。汤普森和他的团队让人工智能模型关注已知与阿尔茨海默症相关的大脑区域,而德桂治希望工具自己学习有助于诊断该疾病的大脑结构特征。 研究人员的人工智能工具检查了成千上万的大脑扫描,选择了最可靠区分一个人大脑与其他人大脑的特征。德桂治说,这最大限度地减少了人为偏见对算法的影响。现在,德桂治的团队正在使用该算法来识别最能区分患病和未患病人员大脑扫描的特征。 汤普森和德桂治都承认,人工智能模型的质量与其训练数据的质量一样好。英国生物库等数据库中进行过大脑扫描和基因组测序的人员种族和地理分布不均,所以这种人工智能引导的研究结果可能不适用于所有人。此外,戈特说,证明人工智能模型的性能可以在其他数据库中复制,并显示出一致的结果,这将至关重要。 波士顿麻省总医院的神经遗传学家鲁道夫·坦西说,这些生物标志物有望成为疾病风险评分的一部分,还整合了血液生物标志物和遗传学。当所有这些数据点结合在一起时,风险评分可以变得“指数级更敏感”,这有望让人们在疾病进展之前寻求早期治疗,他补充说。 汤普森说,阿尔茨海默症只是开始。如果这种方法有效,也可以应用于在大脑成像上有体征的其他疾病,他说。
用客户端技术打造大型语言模型(LLM)驱动的网页应用
在当前的技术发展浪潮中,开源模型的飞速进步成为了一个让人振奋的亮点。以Llama 2和Mistral为代表的这些模型正在重新定义我们与技术的互动方式。在这个进步的背后,一个重要的推动力是消费硬件制造商不断在产品中集成GPU。这不仅仅是一个趋势,而是一个颠覆性的行业变革。 这种变革尤其在开源软件模型的发展上体现得淋漓尽致。如今,这些模型变得更加小巧、运行更快,这意味着使用像Ollama(Ollama on GitHub)这样的工具在本地硬件上运行模型不再是遥不可及的梦想,而是即将成为常态。 然而,尽管最近几个月针对浏览器的向量存储和嵌入技术等专用模型取得了巨大的进步,但大型语言模型(LLMs)仍然存在一个不小的挑战——它们的庞大体积使得直接将其打包进网页应用变得不现实。 这就引出了一个问题:如果我们想要在网页应用中利用本地的大型模型,该如何是好呢?幸运的是,有了像Ollama AI’s blog on building LLM-powered web apps这样的资源,我们可以探索将强大且预先安装的LLM模型与网页应用结合的新方法。 随着这些技术的不断发展和优化,未来在网页应用中融入本地运行的高级AI模型将成为一种越来越吸引人的探索方向。这不仅仅是技术的一次飞跃,更是开启普通用户接触和利用高级AI技术的大门,预示着一个更加智能、互动的数字世界的到来。
好莱坞演员牢牢守护AI使用的安全边界
根据工会达成的劳动协议,电影制片厂必须获得演员的许可,才能在由人工智能生成的作品中使用他们的形象,并且每当他们的数字替身出现在屏幕上时,都必须支付给演员报酬。 演员们作为周三晚些时候宣布的协议的一部分,确保了这些新的保障措施,根据演员工会SAG-AFTRA的首席谈判代表Duncan Crabtree-Ireland的说法。 在这份为期三年的合同下,演员们“拥有同意权和公平报酬权,无论何时他们的数字复制品或替代品被使用”,Crabtree-Ireland告诉路透社。Crabtree-Ireland说,拟议的协议为AI使用设定了最低报酬标准。演员们也可以自由谈判更高的报酬。 SAG-AFTRA的全国董事会将在周五对该提案进行投票后,将公布新合同的全部细节,工会表示。然后,该协议将提交给工会成员批准。电影和电视表演者将AI视为一种存在的威胁,担心他们会被自己肖像的数字版本或由AI创造的“元人类”所取代。 背景和配音演员特别担心他们会失去工作,被合成表演者所取代。Crabtree-Ireland说,拟议的合同还包括围绕使用生成性AI创造合成演员的安全保障。AI技术已经被用来消除年龄线条或替换对话片段,引发了人们的担忧,即工作室可能会让演员说出他们未经批准的话。 Crabtree-Ireland说,这个问题成为SAG-AFTRA工会的一个主要难题,该工会代表约16万名演员、特技表演者、配音艺术家和其他表演者,也是最后一个待解决的话题之一。“我们终于,在过去几天取得的改变中,达到了一个我们可以自信地说,我们的成员确实拥有了保护措施的地步,”Crabtree-Ireland说。 “这些保护措施是这样设立的,即使随着技术的发展,这些保护也会随之发展。”谈判代表华特迪士尼、华纳兄弟探索、奈飞和其他主要制片厂的电影和电视制片商联盟表示,合同提供了“在使用人工智能时广泛的同意和报酬保护”。在好莱坞经商的技术高管表示,制片厂一直在等待业界就AI使用建立基本规则,之后他们才会全面探索新的用途。 电影和电视编剧也在今年作家工会长达五个月的罢工后赢得了围绕AI使用的保护。 其中,制片厂必须向编剧披露是否有任何材料是由AI生成的……
生成型人工智能搜寻服务现在扩张得比热气球还快,新覆盖了超过120个国家和地区,准备在全球范围内“智造”风暴
各位网友,大新闻来了!今年,我们的搜索小组把玩具箱里的新宠——生成型人工智能(AI),搬到了搜索引擎上,让大家能以新颖又快捷的方式找到心中所求。有了搜索生成体验(SGE),只需动动手指,AI就能帮你汇总出最有帮助、最相关的信息摘要。 过去,搜索就像是在海里捞针,现在好了,生成型AI的加持下,我们不仅提供了更广范围的信息,还能从多角度满足你的好奇心。现在的SGE,就像是给搜索结果页开了个链接自助餐,品类丰富,让更多的内容有机会大展身手。 不仅如此,我们还将视野扩大到了美国以外,印度和日本的小伙伴们也开始享受这项服务。反馈呢?大多数像尝到了甜头一样,尤其是对那些曾经想都不敢想的复杂问题,AI就像个无所不知的小能手,给出了意想不到的答案。 现在,请允许我放大招——我们的生成型AI搜索将拓展到超过120个新国家和地区,同时还加入了四种新语言的支持哦。此外,在美国率先推出的一些升级功能,将让SGE的交互性更上一层楼——包括更简便的后续提问、AI助力的翻译帮手,以及像编程这样的主题更多的定义解释。 惊不惊喜,意不意外?从今天开始,包括墨西哥、巴西、韩国、印尼、尼日利亚、肯尼亚和南非在内的120多个新地区,都能用英语体验Search Labs和SGE啦! 而且,对于SGE的用户,我们还特别开通了西班牙语、葡萄牙语、韩语和印尼语的支持。比如说,如果你在美国用西班牙语溜达,现在可以用自己习惯的语言使用生成型AI搜索啦! Search Labs是我们提供的一种全新方式,让你在谷歌应用(Android和iOS)和Chrome桌面端上测试搜索的早期实验。一旦你加入了Search Labs,开启SGE实验就可以大显身手了。新加入的国家今天就可以通过Chrome桌面端访问,通过谷歌应用的访问权限将在接下来的一周内开放。 想要更自然地获得信息,或者更深入探讨一个话题?我们了解到,大家喜欢提问后续问题,所以我们正在试验直接在搜索结果页面提问后续问题的新方法。你可以轻松查看之前的问题和搜索结果,包括整个页面上的专属广告位中的搜索广告。 也许你最初搜索的是“如何和我的比格犬一起跑步”,现在想问“那远足呢?”只需点击输入你的问题,让好奇心引领你继续探索。这项更新将在未来几周首先在美国的英语搜索结果中推出,并且我们将继续对这一体验进行迭代。 在进行语言翻译时,有时候真的得靠猜——比如,很多语言中的一个词可能有多个含义,而标准的翻译工具可能不会检测到这一点。假设你想将“is there a tie?”从英语翻译成西班牙语。看似简单,但tie可能既指一种服饰,也可能指一场比赛的平局。 好消息是,生成型AI搜索可以帮你避免这种含糊其辞。不久的将来,如果你要求搜索翻译一个可能有多个意思的短语,你会看到这些词被下划线标出。点击任何一个这样的词,你就可以指出反映你想表达的特定含义。当你需要指定某个词的性别时,这个选项也可能出现。 很快,这项AI驱动的翻译能力将在美国推出,支持英语到西班牙语的翻译,并计划在不久的将来覆盖更多国家和语言。 在今年八月,我们增加了一种新的互动方式,可以在AI驱动的概述中看到教育主题的定义——比如科学、经济或历史。现在,我们将这个功能扩展到更多领域,包括编程和健康信息。在相关搜索中,你将看到某些词被突出显示,只需将鼠标悬停在它们上方,就可以预览它们的定义或查看相关图片。这项更新将在下个月推出,在美国的英文搜索中先行一步,预计很快就会有更多国家和语言跟进。
Universe 2023: Copilot将GitHub转变为AI驱动的开发者平台
在2023年的3月,一股激动人心的新风潮席卷了软件开发界——那就是Copilot X的概念首次展现在世人眼前,预示着AI将与开发者的生活息息相关,影响他们生命周期的每一个环节。自那以后,我们一直在忙碌中前进,致力于扩大和成熟这项基础技术——在此过程中,我们还孕育了更加宏大的梦想。那个梦想,现在已不仅仅是愿景,它已成为全球开发者的新现实。 就像GitHub初建立时基于Git一样,今天我们在Copilot的基础上重新定义了自己。开源和Git已经从根本上改变了我们构建软件的方式。现在,AI所带来的这场变革同样波澜壮阔,而且速度更是以指数级加速。在很短的时间内,GitHub Copilot已经扩展并演化成为世界领先的AI驱动开发平台。 我们确信,对GitHub平台的这次根本性转变,以及软件开发的全新方式,在一个依赖软件的世界里是必不可少的。全球的开发者每天都在努力平衡对现有遗留代码的现代化需求和构建我们数字未来的需求。我们的指导信念是,使开发者能够更容易地完成所有工作,从创意激发到提交代码、拉取请求、代码审查和部署——并且这一切都将与GitHub Copilot深度整合。 让我们一起跳入这个新的现实。 2023年12月,GitHub Copilot Chat将正式上线 编程是软件开发生命周期的核心。有了GitHub Copilot Chat,我们将使自然语言成为全球每一位开发者的新通用编程语言。无论是寻找错误、编写单元测试,还是帮助调试代码,Copilot Chat都将是你的AI伙伴,帮助你用任何你擅长的语言编写和理解代码。 Copilot Chat将在2023年12月作为现有GitHub Copilot订阅的一部分向组织和个人用户正式提供。这项服务对于经过验证的教师、学生和流行开源项目的维护者也是完全免费的。 Copilot Chat变得更加普遍,也更加强大: 由GPT-4驱动的Copilot Chat:我们升级了您的Copilot Chat体验,使用OpenAI的GPT-4模型带来了更精准的代码建议和解释。 基于代码的指导和代码生成:Copilot Chat以您的代码为上下文,能够解释复杂概念,根据您打开的文件和窗口建议代码,帮助检测安全漏洞,并协助在代码、终端和调试器中找到和修复错误。 与AI驱动的内联Copilot Chat迭代代码:通过新的内联Copilot Chat,开发者可以在代码和编辑器的流程中直接针对特定代码行进行讨论。 使用斜杠命令简化重大任务:我们正在引入斜杠命令和上下文变量到GitHub Copilot——这样修复或改进代码就像输入/fix一样简单,而生成测试现在可以以/tests开始。 一键应用AI的力量:智能动作为您的工作流提供了强大的快捷方式,无论是需要修复建议、拉取请求审查内容,还是通过生成响应式UI组件代码来搭建前端界面。 这就是我们共同迈入的全新时代,一个让软件开发变得更简单、更快、更有趣的时代。随着我们将GitHub Copilot的能力与你的智慧和创意结合,我们将共同构建更好的未来。欢迎加入这场变革之旅。 Nasdaq迎来了这场变革的历史时刻。今天,NASDAQ:GHUB的开盘价为$123.45,这充分体现了投资者对GitHub新时代的信心。
亚马逊正在开发代号为“奥林匹斯”的人工智能技术,以缩小与微软和OpenAI的差距。
亚马逊正在构建一个名为“奥林匹斯”的新AI模型,企图赶上OpenAI和谷歌这样的竞争对手。 根据《The Information》的一份报告,这家科技和商务巨头正在开发这一大型语言模型,并计划将其整合到其在线商店和Alexa智能扬声器中。 据报道,该模型可能最快将在12月公布。正值亚马逊准备进入AI军备竞赛之际,该公司宣布了对AI初创企业Anthropic 40亿美元的投资。 作为商业巨头,亚马逊已经把AI作为优先事项,其目标是构建能与ChatGPT和Bard等产品竞争的产品,CEO安迪·贾西直接监管着构建亚马逊最雄心勃勃模型的团队。 最新的这些模型可能是有史以来建立的最大的AI模型之一。路透社报道称,“奥林匹斯”具有两万亿参数,相比之下GPT-4则有一万亿参数——尽管专家警告说,模型参数越多并不必然意味着比参数更少的模型更有能力。 由于技术问题以及ChatGPT的推出,后者被高管认为远优于亚马逊的产品,亚马逊去年推迟了另一个AI模型泰坦的发布。 自那以后,亚马逊一直在迅速尝试缩小这一差距。公司正在开发一个名为“尼罗项目”的“对话式购物代理”用于其在线商店,并于9月宣布将生成式AI整合到其Alexa智能扬声器中。 新的AI功能,这些都是建立在定制的大型语言模型之上,承诺能使Alexa与用户进行对话、编写消息并回答更复杂的查询。 Alexa的AI工具仍在向选定用户预览中,亚马逊暗示将来可能会收取订阅费用以访问这些工具。
三星刚刚发布了它的新一代人工智能大模型,起名叫‘三星高斯’哦!
星期三,三星首次公开展示了自家的生成式人工智能模型,被命名为“三星高斯”。 这个韩国科技巨头的生成式AI模型是以著名数学家卡尔·弗里德里希·高斯命名的,他建立了被广泛认识为钟形曲线的正态分布理论。 另外,三星的创始故事几乎难以置信。 三星表示,这个名称“反映了三星对模型的终极愿景,那就是从世界上所有的现象和知识中汲取灵感,利用人工智能的力量来改善世界各地消费者的生活”,公司在首尔举办的年度AI论坛——三星AI论坛上这样说。自2017年以来,由三星研究院和三星先进技术研究所联合主办,面向专家和学者。 三星表示,该模型是由其研究部门三星研究院开发的,目前正在用于提高公司内部员工的生产力,但未来将扩展到产品应用中。 三星高斯由三星高斯语言、三星高斯代码和三星高斯图像组成。 根据这家科技巨头的说法,语言是一个生成式语言模型,旨在通过帮助撰写电子邮件、总结文件和翻译等任务来提高工作效率,并且,当应用于产品时,还可以通过提供更智能的设备控制来增强消费者体验。该模型本身由多种模型组成,使其既可以在云端也可以在设备上应用。 另外,三星最新的旋转式投影仪在这个假日季秘密地成为了你能买到的最佳游戏机。 代码和它所基于的名为code的编程助手是为企业内部软件开发制作的。它允许开发人员容易快速地编码,并通过交互式界面支持代码描述和测试案例生成等功能,三星说。 同时,图像可以轻松生成和编辑图像,允许应用风格变更、增加内容以及将低分辨率图像转换为高分辨率图像,科技巨头补充说。 这些模型可以应用在设备上,以保护消费者的私人信息,同时三星也在通过其自己的AI红队工作以确保安全地使用AI,该团队检查在数据收集、AI模型开发、服务部署以及通过生成的结果过程中可能出现的安全和隐私问题。
Myspace的创始人团队来啦,这回带来了一个新玩意儿——一款文转视频生成器!只需上传你的自拍,它就能给你定制个性化的视频内容,让你的自拍活起来!
哇塞,Myspace社交平台和游戏公司Jam City的两位创始人Chris DeWolfe和Aber Whitcomb,这对老将级科技企业家,一直以来就致力掌握最热门的科技趋势。今年早些时候,他们通过最新的创业项目Plai Labs把目标转向了web3和人工智能风潮,这是一家得到a16z投资的社交平台开发创业公司,目的是为消费者提供AI工具进行协作和联系。 Plai Labs今天宣布推出其免费文本转视频生成器PlaiDay,加入了众多生成式AI视频工具的队伍,包括谷歌的Imagen、Meta的制作视频、OpenAI的DALL-E 2和Stable Diffusion。但是一个显著的特点是,可以通过自拍照将你的样子添加到视频中,对视频进行个性化。 如果你一直想看到自己(换句话说,动画版的你)飞过大峡谷或者与星际敌人作战的视频,PlaiDay可以实现这种愿望。你只需上传一张自拍,输入几个词,它就会生成一个短视频,你可以和朋友分享。视频目前只有3秒长,但视频时长未来会延长。公司也在加入音频功能。 公司给我们演示的一个例子使用了这样的提示词:“英国巡警,1800年代伦敦街景,特写,逼真。” 虽然我们不会说这很“逼真”,但PlaiDay在表达逼真的面部表情方面做得不错。此外,背景中的行人也走得相对流畅。(当然,他们的走动不完全像真人,但不显得突兀。) 个性化视频有点问题。由于用户的自拍中没有胡子,视频里这个人的胡须似乎正在融入皮肤。 这个其他例子(由Discord用户@Marvel创建)就扭曲了10倍。老实说,简直恐怖。为了避免这种情况,公司建议输入“特写”或“某人的画像”,以生成细致的人脸。由于还处于早期阶段,PlaiDay目前更适合生成一个面孔,而不是大量人群。 提示词:时尚女孩在时尚美容大赛中走秀 我们离看到电影级的AI生成视频还有很长的路要走。但是,我们对PlaiDay取得的成就和潜力仍然印象深刻。 你可以在PlaiDay的Discord频道上试用这款个性化文本转视频生成器。它即将在PlaiDay应用上推出,这是当前处于alpha版本的免费应用。PlaiDay提供各种其他有趣的功能,比如将你自己插入TikTok视频,文本转图像工具,调整图像样式的能力,生成字幕的文本生成器等等。公司称在未来几周会公布更多关于该应用的详情。 联合创始人兼首席架构师Jim Benedetto在接受TechCrunch采访时表示:“这只是我们看到的未来叙事方式的开始。一旦你可以把自己放进这些AI视频中,你就真正开始讲述自己的故事。”Benedetto之前是Myspace的高级副总裁。他还共同创立了内容优化创业公司Gravity,后被AOL在2014年收购。 该文本转视频生成器建立在公司自己的AI平台(内部代码名Orchestra)之上,它结合了自主和开源模型。这是Plai实验室计划提供的众多产品中的第一款。 正如团队所解释的,Orchestra是一个“灵活的工具集,可以增强几乎任何业务。它利用一组可重用的代码块为基础,这将使技术和非技术人员都能够快速高效地创建和部署新的有趣的AI应用程序,而与行业无关。” Plai实验室希望其平台可以帮助设计师和产品经理在没有工程师帮助的情况下创建AI功能。 Benedetto补充说:“我们感到兴奋,因为它使拥有远见的产品经理能够创建通常需要5至10名博士才能完成的AI。” 提示词:巨大的火焰石头怪兽,两条长手臂,红色电光,站在岩石平台上,逼真图形,黑暗奇幻。 Whitcomb解释说,AI平台不仅仅用于生成生成式艺术。很快,该平台可以帮助营销活动、安全监控、分析等。 “例如,你可以用扩散过程生成一系列创意作品。然后你可以用神经网络分析每一个创意作品,并添加一些文本……你可以使用语音转文字使其可索引,并使用LLM模块以便能够使用多种语言或推荐其他文本,”Whitcomb说。 他声称这个平台“灵活到可以做任何AI相关的事”。 这个还未命名的AI平台将在未来几个月内面向公众。