关键要点:
Llama模型至今下载量接近3.5亿次(相比去年同期增长超过10倍),仅上个月就有超过2000万次下载,使Llama成为领先的开源模型系列。
从2024年5月到7月Llama 3.1发布期间,Llama的代币使用量在我们主要的云服务提供商伙伴中增长了两倍以上。
2024年1月至7月间,Llama的月度使用量(以代币量计算)在一些最大的云服务提供商中增长了10倍。
距离我们发布Llama 3.1仅一个多月的时间,这个版本扩展了上下文长度至128K,增加了对八种语言的支持,并推出了首个前沿级开源AI模型Llama 3.1 405B。正如我们在Llama 3和Llama 2发布时所做的那样,今天我们分享一下Llama模型在各领域的采用和发展趋势。
Llama的成功归功于开源的力量。通过开放Llama模型的使用,我们见证了一个充满活力和多样性的AI生态系统的诞生,开发者们比以往拥有更多选择和能力。创新已广泛而迅速地展开,从初创公司打破边界,到各类企业使用Llama构建本地或通过云服务提供商部署的AI应用。行业正在利用Llama进行构建和创新,我们对未来充满期待。
随着Llama 3.1的发布,Mark Zuckerberg也分享了一封关于开源AI益处的公开信,进一步巩固了我们的愿景和对开源方法的承诺。开源是我们公司的DNA,Llama既体现了我们的承诺,也强化了我们以负责任的方式分享工作的决心。开源促进了更具竞争力的生态系统,这不仅对消费者有利,对公司(包括Meta)有利,也最终对世界有利。
自18个月前我们首次发布以来,Llama已经从一个单一的最先进基础模型演变为开发者的强大系统。通过Llama 3.1,我们现在为开发者提供了一个完整的参考系统,使他们更容易创建自己的定制代理,并引入了一套新的安全工具,以帮助负责任地构建AI应用。
领先的开源模型
Llama生态系统正在快速增长。截至目前,Llama模型在Hugging Face上的下载量已接近3.5亿次,相比去年同期增长了超过10倍。仅上个月,Llama模型在Hugging Face上的下载量就超过了2000万次。而这只是Llama成功故事的一部分,这些模型也在我们行业伙伴的服务中被下载使用。
除了Amazon Web Services(AWS)和微软Azure,我们还与Databricks、戴尔、Google Cloud、Groq、NVIDIA、IBM watsonx、Scale AI、Snowflake等公司合作,以帮助开发者充分利用我们的模型。从2024年5月到7月Llama 3.1发布期间,主要云服务提供商的代币使用量增长了两倍以上。
Llama的月度使用量在2024年1月至7月间,在一些最大的云服务提供商中增长了10倍。在8月份,Llama 3.1在其中一家主要云服务提供商上的最大用户数来自405B变体,这表明我们最大的基础模型正在获得越来越多的应用。
通过Llama 3.1,我们将Llama早期访问计划中的合作伙伴数量增加了5倍,并将继续满足来自合作伙伴的激增需求。我们听到了一些公司希望成为未来LEAP和Llama集成伙伴,包括Wipro、Cerebras和Lambda。
AWS的AI和数据副总裁Swami Sivasubramanian表示:“客户希望能够在云端访问最新的最先进模型,这就是为什么我们是第一个提供Llama 2作为托管API的公司,并继续与Meta密切合作,发布新模型。我们很高兴看到Llama 3.1在Amazon SageMaker和Amazon Bedrock上的客户反响,期待看到客户如何利用这个模型来解决他们最复杂的用例。”
Databricks的CEO兼联合创始人Ali Ghodsi表示:“自发布以来,已有数千名Databricks客户采用了Llama 3.1,使其成为我们采用速度最快、销量最好的开源模型。这一代的Llama模型最终在质量上弥合了开源软件与商业模型之间的差距。Llama 3.1是客户希望构建高质量AI应用的突破,同时保持对其基础LLM的完全控制、可定制性和可移植性。”
Groq的创始人兼CEO Jonathan Ross表示:“开源胜利了。Meta正在构建一个开放生态系统的基础,足以与顶级封闭模型竞争,而我们在Groq则直接将这些模型交到开发者手中——这是Groq自成立以来的核心价值观。迄今为止,Groq已为超过40万名开发者提供了每日50亿个免费的代币,使用的是Llama模型套件和我们的LPU推理。这是一个非常令人兴奋的时刻,我们很自豪能够成为这一势头的一部分。我们无法为Llama快速增加容量。如果我们将部署容量扩大10倍,36小时内就会被消耗一空。”
NVIDIA的创始人兼CEO Jensen Huang表示:“Llama对推动最先进AI的发展产生了深远的影响。大门已经向所有企业和行业敞开,允许他们使用NVIDIA AI Foundry构建和部署定制的Llama超模,这是支持Llama 3.1模型在训练、优化和推理方面最广泛的工具。令人难以置信的是,过去一个月的采用速度如此之快。”
比起有多少人使用Llama,更令人鼓舞的是谁在使用Llama以及他们如何使用Llama。
我们在开发者社区中看到Llama的偏好正在增加,并且有强烈迹象表明这种增长将持续。据独立AI基准测试网站Artificial Analysis的调查显示,Llama是第二大最受关注的模型,也是开源领域的行业领导者。
在Hugging Face上有超过60,000个派生模型,说明开发者们正积极地为自己的用例微调Llama。AT&T、DoorDash、高盛、Niantic、野村证券、Shopify、Spotify和Zoom等大企业只是其中的一部分成功案例,而Infosys和毕马威也正在内部使用Llama。
Llama案例研究概览
埃森哲(Accenture)使用Llama 3.1构建了一个用于ESG报告的定制LLM,预计与公司现有的年度ESG报告生成方式相比,生产力提高70%,质量提高20-30%。借助其在多语言功能方面的创新,埃森哲能够将AI模型扩展到不同地区,例如帮助全球组织创建更加文化意识和相关性的聊天机器人。埃森哲认为,公司将需要利用来自不同提供商的多种AI模型。像Llama 3.1这样的开源模型扩展了选择范围,加速了创新,并将在商业和社会中产生积极的连锁反应。
在AT&T,客户关怀是AI驱动创新的一个重点领域。通过对Llama模型的微调,他们能够以更低的成本有效地改进客户关怀,更好地理解关键趋势、需求和未来增强体验的机会。总体而言,Llama和生成式AI使AT&T客户关怀互动中的搜索相关响应改进了近33%,同时降低了成本并加快了响应速度。
DoorDash使用Llama简化并加速了其软件工程师的日常任务,例如利用其内部知识库为团队解答复杂问题,并提供可行的拉取请求审查,以改进其代码库。
高盛的AI平台——GS AI平台,允许高盛工程师安全、负责任地使用Llama模型处理各种用例,包括从文档中提取信息。
为了推动其首创的AR游戏《Peridot》的虚拟世界,Niantic集成了Llama,使其可爱的生物“Dots”成为响应性AR宠物,现在这些宠物表现出类似真实动物的智能行为。Llama实时生成每个Dot的反应,使每次互动都充满动感和独特性。
日本领先的金融机构野村证券在AWS上使用Llama,获得了关键优势,包括更快的创新、透明度、偏见防护以及在文本总结、代码生成、日志分析和文档处理方面的强大性能。
Shopify正在继续试验最先进的开源模型,包括基于Llama构建的LLaVA。他们使用微调的LLaVA来完成多项专门任务,目前每天进行4,000万到6,000万次LLaVA推理,支持公司的产品元数据和丰富性工作。
Zoom使用其自己的模型以及封闭和开源的LLM——包括Llama——来为其AI伴侣提供支持,这是一种生成式AI助手,可以帮助员工避免重复性、单调的任务。AI伴侣为Zoom用户提供会议摘要、智能录音和下一步建议,使他们有更多时间进行协作、建立联系并完成工作。
#
一个繁荣的开放系统
Llama在开放性、可修改性和成本效率方面引领潮流。我们致力于在开放中构建,确保AI的益处能够惠及每个人。越来越多的学者和企业家也同意,开源AI是未来的发展方向。
LLM可以帮助我们回答棘手的问题,提高生产力,并激发我们的创造力。随着Llama生态系统的扩展,Meta AI的能力和可及性也在不断增加。我们的智能助手现已在Instagram、WhatsApp、Messenger和Facebook上提供,还可以通过网络访问。我们还将其引入了Meta Quest和Ray-Ban Meta系列——让我们更接近于我们所设想的未来,即在方便的可穿戴形式下,一个始终可用的上下文AI助手将主动帮助你度过一天中的各种时刻。
我们对Llama社区的增长感到兴奋,并且很高兴知道我们正在构建当今世界上最先进的大型语言模型,并以开源的方式分享给世界。请继续关注我们的博客,在接下来的几周和几个月里,我们将继续展示开发者和公司如何通过Llama找到价值的精彩故事。
感谢所有正在使用Llama进行开发的开发者们。我们一如既往地倾听你的反馈,很快会有更多更新与大家分享。