一个全新的开源语言模型荣登全球最佳宝座,根据领先的自然语言处理(NLP)研究和应用平台Hugging Face的最新排名显示。 https://huggingface.co/abacusai/Smaug-72B-v0.1 这款名为“Smaug-72B”的模型,今天由帮助企业解决人工智能和机器学习领域难题的初创公司Abacus AI公开发布。技术上,Smaug-72B是“Qwen-72B”的优化版本,Qwen-72B是几个月前由阿里巴巴集团的研究团队Qwen发布的另一款强大的语言模型。 最值得注意的是,Smaug-72B在多个热门基准测试中超越了GPT-3.5和Mistral Medium,这两款是由OpenAI和Mistral分别开发的最先进的开源大型语言模型。Smaug-72B也在许多评估中大幅度超越了其衍生模型Qwen-72B。 根据Hugging Face开放语言模型(LLM)排行榜的数据,Smaug-72B现在是唯一一个在所有主要LLM评估中平均分超过80的开源模型。 Abacus AI的CEO Bindu Reddy在X.com上的一篇帖子中表示:“Abacus AI的Smaug-72B现已在Hugging Face上线,位于LLM排行榜之首,是第一个平均分达到80的模型!换句话说,它是世界上最优秀的开源基础模型。” Smaug-72B尤其擅长于推理和数学任务,这得益于Abacus AI在微调过程中应用的技术。这些技术将在即将发布的研究论文中详细介绍,它们针对大型语言模型的弱点并增强了它们的能力。 Smaug-72B并不是近期唯一引起关注的开源语言模型。Qwen团队背后的Qwen-72B也发布了Qwen 1.5,这是一套从0.5B到72B参数不等的小型但强大的语言模型。 Qwen 1.5超越了如Mistral-Medium和GPT-3.5等流行的开源模型,具有32k的上下文长度,并且能够快速且本地地与各种工具和平台配合使用。Qwen还开源了Qwen-VL-Max,一款新的大型视觉语言模型,与Google和OpenAI分别开发的最先进的专有视觉语言模型Gemini Ultra和GPT-4V相媲美。 Smaug-72B和Qwen 1.5的出现在AI社区及更广泛的领域引发了极大的兴趣和讨论。许多专家和影响者赞扬了Abacus AI和Qwen的成就,并对他们对开源AI的贡献表示钦佩。 Smaug-72B和Qwen 1.5目前可以在Hugging Face上下载、使用和修改。Abacus AI和Qwen还宣布他们计划将他们的模型提交给llmsys人类评估排行榜,这是一个新的基准,用于评估语言模型在人类任务和场景下的表现。Abacus AI和Qwen还暗示了他们未来的项目和目标,包括创建更多的开源模型并将其应用于各种领域和应用。 Smaug-72B和Qwen 1.5代表了今年开源AI快速而显著的进化的最新例证。它们代表了AI创新和民主化的新浪潮,挑战了大型科技公司的主导地位和垄断,为每个人打开了新的可能性和机会。虽然目前还无法预测Smaug-72B将在Hugging Face排行榜上保持顶尖地位多久,但可以肯定的是,开源AI正迎来了年初的大时刻。
OpenAI给DALL-E 3来了个新动作,加入了全新水印技术
OpenAI的DALL-E 3图像生成器要在图片元数据中加水印了,随着更多公司开始支持来自内容出处和真实性联盟(C2PA)的标准,这一动作显得尤为重要。 公司表示,C2PA的水印将出现在通过ChatGPT网站和DALL-E 3模型API生成的图片中。到2月12日,手机用户也将看到这些水印。水印包括不可见的元数据组件和可见的CR符号,后者将出现在每张图片的左上角。 人们可以通过像内容凭证验证这样的网站检查任何由OpenAI平台生成的图片的出处——即使用了哪个AI工具来制作内容。到目前为止,只有静态图片可以携带水印,视频或文本则不行。 截图显示了DALL-E 3元数据中的新水印。OpenAI表示,向图片中添加水印元数据对延迟的影响“微乎其微”,且不会影响图片生成的质量。这还会略微增加某些任务的图片大小。 C2PA是一个由Adobe、Microsoft等公司组成的团体,一直在推动使用内容凭证水印来识别内容的出处,并显示其是由人类还是AI制作。Adobe创造了一个内容凭证符号,OpenAI正在将其加入到DALL-E 3创作的图片中。Meta最近宣布,它将在其社交媒体平台上为AI生成的内容添加标签。 识别AI生成的内容是拜登政府关于AI的行政命令中的一项旗舰指令。但是,水印并不是阻止错误信息传播的万全之策。OpenAI指出,C2PA的元数据“很容易被意外或故意移除”,特别是因为大多数社交媒体平台通常会从上传的内容中删除元数据。截屏会遗漏元数据。 OpenAI在其网站上表示:“我们相信,采用这些方法来建立出处并鼓励用户识别这些信号,是提高数字信息可信度的关键。”
一款聊天机器人帮助更多人获得了心理健康服务
一项新研究发现,通过英格兰国家卫生服务体系(NHS)推荐的患者数量增加了,特别是在那些不太可能寻求帮助的边缘化群体中,一个人工智能聊天机器人在此过程中发挥了重要作用。 英格兰对心理健康服务的需求正在上升,尤其是自从新冠疫情以来。2022年,心理健康服务接收到了460万个患者转介——这是有记录以来的最高数字——并且接触这些服务的人数正在稳步增长。但是,根据英国医学协会的说法,资金和心理健康专业人员的数量都不足以满足这种上升的需求。Limbic公司的聊天机器人创造者们旨在调查人工智能是否能通过帮助患者更快、更高效地获得帮助,从而降低接受治疗的门槛。 今天发表在《自然医学》杂志上的一项新研究评估了这款名为Limbic Access的聊天机器人对NHS谈话疗法焦虑和抑郁项目转介的影响,这是一系列针对经历焦虑障碍、抑郁症或两者均有的成人的基于证据的心理疗法。研究检查了129,400名访问网站自我转介到英格兰28个不同NHS谈话疗法服务的人的数据,其中一半使用了他们网站上的聊天机器人,另一半使用了其他数据收集方法,如网络表单。在为期三个月的研究期间,使用Limbic聊天机器人的服务的转介数量增加了15%,而没有使用它的服务的转介数量增加了6%。 当聊天机器人可用时,包括种族和性少数群体在内的少数群体的转介显著增加——在认同为非二元性别的人中增加了179%,亚裔患者增加了39%,黑人患者增加了40%。关键的是,报告的作者表示,从这些服务中获得帮助的患者数量增加并没有增加等待时间或导致进行的临床评估数量减少。这是因为聊天机器人收集的详细信息减少了人类临床医生需要花费在评估患者上的时间,同时提高了评估的质量并释放了其他资源。值得注意的是,互动式聊天机器人和静态网络表单是收集信息的非常不同的方法,马萨诸塞州贝斯以色列女执事医疗中心数字精神病学部门的负责人约翰·托鲁斯(John Torous)指出,他没有参与这项研究。 “在某些方面,这向我们展示了这个领域可能的发展方向——无论使用什么技术,都会更容易接触人们进行筛查,”他说。“但这确实引发了一个问题:我们将向人们提供什么类型的服务,以及我们如何分配这些服务?”总的来说,使用聊天机器人并向Limbic提供正面反馈的患者提到了其使用的便利和方便。他们还说,转介让他们对康复感到更有希望,或者帮助他们知道自己并不孤单。非二元性别的受访者比认同为男性或女性的患者更频繁地提到聊天机器人的非人性质,这可能表明与机器人的互动有助于避免因与人交谈而触发的评判感、污名感或焦虑感。 “看到在性别、性取向和种族等少数群体中取得的比例更大的改进,这些通常是难以接触的个体,是一个非常令人兴奋的发现,”Limbic的创始人兼首席执行官罗斯·哈珀(Ross Harper)说,他是这项研究的共同作者。“这表明,在正确的手中,人工智能可以成为公平和包容的强大工具。”访问启用聊天机器人的网站的访客会遇到一个弹出窗口,解释说Limbic是一个旨在帮助他们获得心理支持的机器人助手。作为初始基于证据的筛选过程的一部分,聊天机器人会问一系列问题,包括患者是否有任何长期医疗条件或之前的心理健康专业人员诊断。它随后会提出多个问题,旨在测量常见心理健康问题和焦虑的症状,根据患者的问题调整其提问。 聊天机器人使用它收集的数据创建详细的转介,并将其与服务使用的电子记录系统共享。然后,人类护理专业人员可以访问该转介,并在几天内联系患者进行评估并开始治疗。Limbic的聊天机器人是不同类型的AI模型的结合。第一个使用自然语言处理分析患者的键入回应并提供适当的、富有同情心的答案。概率模型取患者输入的数据并使用它来根据患者最有可能的心理健康问题调整聊天机器人的回应。这些模型能够以93%的准确率分类八种常见的心理健康问题,报告的作者说。“由于心理健康专业人员不足,所以我们想使用AI来放大我们所拥有的,”哈珀补充说。“人类专家和AI专家之间的合作——这就是我们将真正解决心理健康供需不平衡的地方。”
Google MobileDiffusion: 设备上的快速文字到图片生成技术
在今天这个喜欢拍照比喜欢呼吸还勤快的时代,大家都想在手机上玩出点新花样。别急,有个新鲜玩意儿叫“MobileDiffusion”,可能会让你的朋友圈瞬间高大上起来。 首先,不得不说,那些能把文字变成图片的大脑洞模型,真是太神奇了。不过,它们像是那种需要喝特制能量饮料才能启动的怪兽电脑或者服务器才能跑起来。比如“稳定扩散”(Stable Diffusion)、DALL·E和Imagen这些大佬,它们的模型参数多到可以装满好几个图书馆,想要轻松运行?门都没有。 然而,随着科技的进步,Android的MediaPipe和iOS的Core ML这对好基友在过去一年里已经在手机上做了不少魔法。但想要实现那种秒生成图片的梦想?还差得远呢。 于是乎,有人站了出来,提出了一个让手机也能快速从文本生成图片的方案,名字叫做“MobileDiffusion”。这不是你平常用的那种APP,它是一个专为手机设计的轻量级扩散模型。用了一种叫DiffusionGAN的黑科技,在推理过程中实现一步采样,相当于给预训练的模型加了个GAN来模拟去噪步骤。测试结果如何?在iOS和Android的高端设备上跑起来,半秒钟就能生成一个512×512的高质量图片,而且模型只有520M参数,小巧得很。 好,接下来让我们深入一点。原来那些文字到图片的模型之所以慢,主要是因为两个原因:一是它们需要多次迭代去噪来生成图片,二是复杂的网络架构让模型参数爆炸。尽管在手机上部署这种模型能极大提升用户体验,解决隐私问题,但现实是残酷的,这方面的研究还很少。 为了解决这个问题,人们研究如何优化模型的推理效率,尤其是减少函数评估次数(NFE)。通过使用先进的数值求解器或蒸馏技术,已经能把采样步骤大大减少,甚至减到只需要一步。 但在手机上,由于模型架构的复杂性,即使评估步骤减少了,运行速度仍然很慢。目前,针对文字到图片扩散模型的架构效率的研究还不够。只有少数研究涉及到这个问题,比如移除神经网络中冗余的模块,但这些努力还不足以提供一个全面的设计高效架构的指南。 “MobileDiffusion”的设计基于潜在扩散模型,包括文本编码器、扩散UNet和图像解码器三个部分。其中文本编码器使用了体积小巧的CLIP-ViT/L14模型,适合手机使用。而在扩散UNet和图像解码器方面也做了优化。 总之,“MobileDiffusion”通过精简模型结构和采用DiffusionGAN一步采样技术,实现了在手机上快速从文本生成图片的目标,开启了一扇新的大门,让手机用户也能享受到即时生成高质量图片的乐趣。而且,这技术还是遵循谷歌的负责任AI实践的,所以用起来也挺放心。 具体请去看 https://blog.research.google/2024/01/mobilediffusion-rapid-text-to-image.html
从这9家AI精英公司招人,别只盯着常春藤学校
近年来,人工智能行业的招聘标准发生了显著变化,哈佛大学的文凭、博士学位乃至在谷歌的工作经验已不再是衡量人工智能领域顶尖人才的唯一标准。现在,雇主们更倾向于寻找拥有实践人工智能应用经验的工程师和研究员。据SignalFire的Beacon AI数据平台显示,有九家初创公司被认为是拥有最高AI人才浓度的集群,这些公司被称为AI常春藤联盟,包括OpenAI、Anthropic、MosaicML(已并入DataBricks)、Cohere、AI21 Labs、Hugging Face、Stability AI、Midjourney以及Inflection。 过去七年里,随着对AI领域工程人才的需求激增,从顶尖学校或拥有博士学位的AI人才比例有了显著下降。越来越多的顶尖AI公司开始重视实际AI应用经验,而不仅仅是学术界的理论经验。这意味着雇主们需要将招聘目光从哈佛、普林斯顿、耶鲁等常春藤联盟学校,甚至包括斯坦福和加州理工这样的“西岸常春藤”学校转移开,寻找那些真正的AI应用能手。 SignalFire通过其Beacon AI平台的数据分析,发现这种转变不仅仅是一个趋势。该平台通过结合专有的人才排名系统和顶尖AI出版场合的研究发表记录,评估了超过8000万家公司和6亿个人的能力。结果显示,从AI常春藤联盟公司招聘人才已成为获取顶尖AI/ML人才的有效策略。 此外,从这些AI常春藤联盟公司而非传统精英大学招聘,有助于减少招聘过程中的历史偏见。过去,进入常春藤联盟学校的学生可能因为家庭背景和经济条件而获得优势,而现在,技术界对AI人才的渴求使得来自各种背景的人才都有机会脱颖而出。 SignalFire强调,AI的未来属于那些能够建立和贡献实际解决方案的人,而不仅仅是那些拥有名牌大学文凭的人。互联网教育资源的普及,包括常春藤联盟学校的在线课程,以及在GitHub和开源社区建立声誉的机会,为所有背景的工程师和研究员提供了在AI领域内脱颖而出的平台。
用生成式AI在地图上发现新去处的新招儿来啦!
终于挑到了大家都有空的那一天,问题来了:怎么满足这帮挑剔的朋友们?一个吃素的,一个不愿意去城北的,还有一个带着他们分不开的狗狗。面对这么多要求,找个合适的地方去简直是个大挑战。 今天,我们要介绍一种用生成式人工智能在地图上发现新去处的新方法,不管你的需求多特别、多小众还是多广泛,都能帮到你。只需告诉我们你想找什么,我们的大型语言模型(LLMs)就会分析地图上超过2.5亿个地点的详细信息和我们超过3亿社区贡献者的可信见解,迅速给出建议。 这个初期访问实验本周在美国启动,先向部分Local Guides开放,他们是地图社区中最活跃、最有热情的成员。他们的洞察和宝贵反馈将帮助我们塑造这一功能,以便我们逐渐向所有人推广。 比如,假设你要去旧金山,想要安排几个小时去淘一些独一无二的复古宝贝。只需问地图你在找什么,比如“旧金山有复古气息的地方”,我们的AI模型就会分析附近商家和地点的丰富信息以及地图社区的照片、评分和评论,给出可信的建议。 你会看到结果被有用地分类——像是服装店、黑胶店和跳蚤市场——还有照片轮播和评论摘要,突出为什么这个地方值得你去探访。 或许你还想找个地方吃饭,继续保持那种复古感。再问一个问题,比如“吃午餐怎么样?”地图会建议一些符合你复古气息需求的地方,比如附近的老派餐厅。从那里,你可以保存这些地方到列表里,以便整理、分享给朋友或将来再访问。 这些由AI驱动的结果在你需要灵活应对或突然改变计划时也很方便。比如,如果你在外面突然下雨,只需问地图“雨天活动”就能获得室内活动的建议。你会得到有用的建议,比如喜剧表演或电影院。如果你在找全家都能享受的选项,可以追问一个问题,比如“有适合孩子的选项吗?”你会看到根据你所在地点,如保龄球馆、儿童博物馆或室内游乐场等地方,以及基于去过那里的人的评论的亮点。 这种实验性功能为人们用地图更轻松地发现新地方、探索世界开辟了全新的方式。这只是我们用生成式AI增强地图功能的开始,我们很高兴能与我们热情的Local Guides社区一起,共同塑造地图的未来。
迈入三四十岁,对职业生涯感到忧虑的工程师们?
在当今这个技术日新月异的时代,那些已经迈入中年阶段的工程师们,可能会对自己的职业生涯感到一丝迷茫或者焦虑。毕竟,随着时间的推移,我们在组织中的角色、职位以及承担的职责都在发生变化,这些变化可能会让我们对当前的工作内容或者职业发展路径产生不满或者担忧。但别担心,这里有一些为30至40岁工程师量身定做的职业选择建议,无论你是想继续在工程领域深耕,还是寻找新的发展方向,总有一条适合你的道路。 首先,如果你希望继续身为一名工程师,你可以选择深化专业技能,成为某一专业技术领域的专家。这样的专家通常需要对特定的技术有深入的了解和丰富的实践经验。与此同时,你也可以考虑担任更为综合性的角色,比如技术与商业结合的岗位,这类岗位不仅要求你拥有扎实的技术能力,还需要你具备一定的商业视角,思考如何推进业务和组织管理。这些岗位的职称可能五花八门,如研发部门的高级工程师、技术总监(CTO)、产品经理(PdM)等,具体职称和要求会根据公司的规模和性质有所不同。 其次,加入初创公司是另一条可行的道路。近年来,许多来自知名公司的工程师选择加入新兴的初创公司,特别是那些处于起步阶段的公司。对于热爱创新、喜欢从零到一构建产品和组织的工程师而言,这无疑是一次难得的冒险和挑战。然而,需要注意的是,初创公司的不确定性较大,成功的概率和风险并存,因此这条路可能不适合追求稳定的工程师。 再者,创业是一条勇敢者的路。有些工程师可能会选择先做自由职业者,然后逐步发展自己的业务,最终实现创业梦想。创业可以让你完全按照自己的想法来构建服务或产品,但这条路充满了挑战,需要充分的市场调研、资金筹集以及对业务模式的深思熟虑。 除此之外,成为一名自由职业工程师也是一个不错的选择。随着远程工作的普及,越来越多的工程师选择自由职业者的生活方式,这种方式提供了更大的工作自由度和灵活性。但是,自由职业也意味着你需要自己管理工作流程、客户关系以及财务状况。 最后,如果你对人才招聘和组织发展感兴趣,那么转型成为负责工程师招聘的HR或者加入信息系统部门,负责内部系统和基础设施的建设和维护,也是非常有意义的职业转型方向。 总而言之,对于那些处于职业中后期的工程师来说,虽然面临着多种挑战和不确定性,但同时也拥有广阔的职业发展空间和机会。重要的是明确自己的兴趣、优势和职业目标,做出合适的选择,并勇敢地迈出那一步。在这个过程中,不断学习和适应变化,将是你通向成功的关键。
这个带着头戴相机的宝宝,竟然成了教AI如何学习语言的小小老师
即使是目前最先进的大型语言模型,在学习能力上也远远比不上人类婴儿。为了能够输出勉强过得去的英语,ChatGPT必须接受包含数百万甚至数万亿单词的大型数据集训练。相比之下,孩子们接触到的数据量只是其中的一小部分,但到了三岁时,他们已经能够以相当复杂的方式进行交流了。 纽约大学的一个研究小组好奇,AI是否能够像婴儿那样学习。如果给AI模型一个远小于常规数据集的数据集——即一个正在学说话的孩子所经历的视觉和声音体验——它能做些什么呢? 结果证明,AI模型做了很多。它成功地将单词与它们所代表的物体匹配了起来。“即使是在这孩子经验的一小部分数据中,也足以进行真正的词汇学习,”纽约大学的计算认知科学家Brenden Lake说,他是这项研究的作者之一。这项今天发表在《科学》杂志上的工作,不仅提供了婴儿学习的见解,还可能导致更好的AI模型。 在这个实验中,研究人员依赖于由一名住在澳大利亚阿德莱德附近的孩子所佩戴的头盔相机拍摄的61小时视频。这名孩子,Sam,从六个月大开始,断断续续地佩戴这个相机一年半的时间,直到他两岁多一点。相机捕捉到了Sam所关注的事物,这些记录大约占他清醒时间的1%。它记录了Sam的两只猫、他的父母、他的婴儿床和玩具、他的房子、他的餐点等等。“这个数据集是独一无二的,”Lake说,“这是我们有史以来对单个孩子可接触到的最好的窗口。” 为了训练模型,Lake和他的同事们使用了60万个视频帧,与Sam的父母或房间里其他人在图像捕捉时所说的短语配对——总共有37,500个“话语”。有时候,单词和物体是匹配的。有时候,则不是。例如,在一幅静止画面中,Sam看着一个形状分类器,而一位父母说:“你喜欢那根绳子。”在另一个画面中,一个成人的手遮住了一些积木,而一位父母说:“你也想要那些积木。” 研究团队给模型提供了两个线索。当物体和单词一起出现时,这可能意味着它们之间可能有联系。但当一个物体和一个单词没有一起出现时,这意味着它们可能不匹配。“所以我们模型内部就有了这种拉近和推开的动作,”纽约大学的计算认知科学家Wai Keen Vong说,他也是这项研究的作者之一。“然后我们希望,在数据中有足够多的实例,当父母说‘球’这个词时,孩子正在看一个球,”他说。 将单词与它们所代表的物体匹配起来可能看起来是一项简单的任务,但实际上并非如此。为了让你感受到问题的范围,想象一下一个有小孩的家庭的客厅。它有所有正常的客厅家具,但也有孩子的杂物。地板上散落着玩具。咖啡桌上散落着蜡笔。窗台上有一个零食杯,椅子上有洗好的衣服。如果一个小孩听到“球”这个词,它可能指的是一个球。但它也可能指的是任何其他的玩具,或者沙发,或者一条裤子,或者一个物体的形状,或者它的颜色,或者一天中的某个时间。“对于任何一个词,都有无限可能的含义,”Lake说。 这个问题是如此难以解决,以至于一些发展心理学家认为,儿童必须天生就具有对语言工作方式的理解,才能如此迅速地学会它。但这项研究表明,即使没有那种天生的能力,语言的某些部分也是可以从一组非常小的经验中学到的,斯基德莫尔大学的发展心理学家Jess Sullivan说,她是收集Sam头盔相机数据的团队的一部分,但没有参与这项新研究。“这确实改变了我的世界观。” 但Sullivan指出,能够将单词与它们所代表的物体匹配,虽然是一个困难的学习问题,但这只是构成语言的一部分。还有一些规则决定了单词如何组合在一起。你的狗可能知道“球”或“散步”的单词,但这并不意味着它能理解英语。而且,婴儿可能拥有的对语言的任何天生能力可能超出了词汇。它可能影响他们如何在世界上移动,或者他们关注什么,或者他们如何对语言做出反应。“我不认为如果婴儿没有创建出神经网络正在学习的数据集,这项研究就会成功,”她说。 Lake和他的同事们的下一步是试图弄清楚他们需要什么,才能使模型的学习更接近儿童早期的语言学习。“还有更多的工作要做,以尝试获得一个具有完全两岁孩子般能力的模型,”他说。这可能意味着提供更多的数据。Lake的孩子,现在18个月大,是下一批提供数据的孩子之一。她每周佩戴头盔相机几个小时。或许模型需要关注父母的目光,或者需要对物体的坚固性有所感知——这是孩子们直觉上就能把握的东西。创建能够更像儿童那样学习的模型将帮助研究人员更好地理解人类的学习和发展。 能够捕捉到人类学习语言方式的AI模型可能会在学习上更加高效;它们可能更像人类,而不是像语言学家诺姆·乔姆斯基及其同事们曾经描述的大型语言模型那样,“一个笨重的统计模式匹配引擎”。“AI系统仍然脆弱,缺乏常识,”负责管理资助Lake团队的美国政府国防高级研究计划局项目的Howard Shrobe说。但能够像孩子那样学习的AI可能能够理解含义,对新情况做出反应,并从新的经验中学习。目标是使AI更接近于人类智能。
苹果公司宣布,为Apple Vision Pro打造了超过600款新应用
2月2日对于Apple Vision Pro来说是个重要的日子。这款备受期待的虚拟现实和增强现实头戴设备不仅将在周五正式发货给消费者,苹果还将发布超过600款专为Vision Pro设计或修改的应用程序。虽然与已兼容Vision Pro的百万级App Store选项相比,这些新应用可能看起来只是沧海一粟,但它们承诺将带来一系列“突破性”的空间体验。 多款新应用旨在提供更加沉浸式的远程体育观赛体验。其中一个应用是PGA TOUR Vision,它将利用实时击球跟踪、真实高尔夫球场的3D模型和统计面板,增强观看巡回赛的体验。Vision Pro上的NBA应用将一次显示多达五个篮球比赛流,而MLB应用则将用户的视角放在本垒板上,同时提供每一投球的统计数据。 虽然Max(前身为HBO Max)将提供一些电影和系列剧的4K和Dolby Atmos空间音频版本,但它正准备为《权力的游戏》粉丝提供一种特别独特的体验。Vision Pro应用将包括一个可选的“铁王座室环境”,据HBO和Max内容主席Casey Bloys介绍,这一选项将“将观众带入标志性的红堡”,在内容观看者选择观看的前景播放的同时,背景中设置静态的“坦格利安时代装饰”。 苹果还利用周四的公告机会,强调Vision Pro在生产力方面的能力。增强现实相比传统屏幕有一个优势:它可以在环境中的任何地方弹出一个窗口,允许用户将自己包围在应用程序、浏览器窗口和其他程序中。Vision Pro版本的MindNode应用将用于头脑风暴和项目组织的思维气泡填充用户的环境。Navi将实时翻译现实生活中的对话。像Zoom和Microsoft Teams这样的虚拟会议,也可以在用户的增强现实空间中排序,创造出会议室般的效果。 Apple Arcade游戏、健康程序、购物界面和探索工具也将增强(无意中的双关语)Vision Pro看似丰富的应用程序列表。Vision Pro发货后,开发者创造全新体验只是时间问题。在Vision Pro正式发布前,苹果据报道已通过预售售出180,000台。
AI新宠Arc浏览器真可以取代Chrome吗?
仅仅几天前,推出了一款名为Arc Search的AI驱动移动应用后,The Browser Company现在也正在对其桌面浏览器进行一些重大的(当然也是AI驱动的)更新。 (Arc from The Browser Company) 不过,与Arc Search不同的是,Arc Search彻底重新思考了你在手机上使用网络的方式,而Arc在Mac和Windows上的新功能则更直接、更实用。它们能够将搜索查询转换为书签,而无需通过Google页面,并且能够让你在不需要另一个应用的情况下,及时了解你关心的内容。在Arc的世界里,一切都关于网络浏览器。 例如,新的“即时链接”功能就是一种使用AI跳过搜索引擎的方式:如果你正在寻找特定的内容,比如Taylor Swift在1989世界巡回演唱会悉尼站的那场震撼的“Blank Space”表演,你只需向Arc的AI机器人询问,它就会直接将那个链接作为一个开放的标签页放入你的侧边栏。The Browser Company还建议抓取一系列产品评论以供比较,或是一些听起来不错的食谱——任何你可能会去Google并点击前八个链接的时刻,Arc都可以直接将这些链接倾倒到你的标签栏中。 另一个名为“实时文件夹”的功能也将在几周后以beta版形式来到Arc。实时文件夹基本上是一个实时更新的数据流,来自于你想要的任何地方——一个RSS订阅源可以在每次更新时将新文章放入你的阅读列表,每当你最喜欢的创作者发布新视频时,你都可以得到一个新标签页,等等。 Josh Miller,The Browser Company的CEO表示,这个想法是要简化使用互联网的多步骤过程。“如果你设置了Google Alert,”他说,“你会收到一封电子邮件,你点击一个链接,切换应用…只是为了在浏览器中打开一个链接。我们为什么不直接在浏览器中为你打开链接呢?”就像公司几个月前推出的实验性Arc Max功能一样,他说目标就是让互联网感觉更快、更直观、比只是一个带有一堆标签的应用更有用。 Arc Explore,它是Arc Search“为我浏览”功能的桌面版本,创建一个关于你搜索的任何主题的定制网页,这个网页包含AI生成的信息,这无疑是The Browser Company正在进行的最雄心勃勃的项目。其他功能都很实用、直接,你可以选择使用它们或忽略它们。但Explore的影响远远超出了你的浏览器。 “我们正在与一项技术作斗争,也正在与软件和计算机工作方式的革命作斗争,这将会搅乱一些东西。” The Browser Company称Arc Explore为“从头到尾自动化浏览旅程的工具”,承诺你可以询问任何主题或问题上的信息,Arc将遍寻互联网并使用AI生成包含链接和信息的摘要。这对Arc来说是好事,也许对用户来说也是,但这对整个互联网意味着什么呢?Miller同意这是一个重大转变,但似乎并不担心它可能意味着什么。“我们正在与一项技术作斗争,也正在与软件和计算机工作方式的革命作斗争,这将会搅乱一些东西,”他说。“但我认为这将带来更多的正面影响。” 所有这些变化都是The Browser Company所称的Arc的“第二幕”的一部分,随着它开始更多地关注AI。坦白说,每个浏览器都在转向更多地关注AI:Edge全面投入到Copilot中,Chrome正在获取一些类似Arc即将推出的标签管理功能,Opera和其他公司都认为AI是网络的未来,浏览器是AI的未来。AI浏览器战争已经到来,它们发展迅速,谁也无法预测它们将如何改变互联网的运作方式。