Meta AI 最近推出了一款全新的机器学习框架——ParetoQ,专门用于大型语言模型的4-bit 以下量化。随着深度学习模型的不断膨胀,模型压缩技术的重要性日益凸显,而低比特量化成为一种既能缩小模型体积,又能保持准确度的关键方法。然而,围绕量化比特数的争论一直没有定论,一些研究认为4-bit 量化是最优解,而另一些研究则认为1.58-bit 模型同样能取得类似表现。由于缺乏统一的评估框架,不同研究得出的结论往往矛盾,导致低比特精度量化的规模化规律难以建立。 量化的难点在于如何在计算效率与模型准确度之间找到最佳平衡。不同方法各有优缺点,例如后训练量化(PTQ)虽然可以直接在训练好的模型上进行量化,部署方便,但低比特时准确率损失较大;量化感知训练(QAT)则是在训练过程中就引入量化,使模型能够更好地适应低比特表示。此外,还有可学习量化和混合精度策略等方法尝试进一步优化模型压缩效果。但由于评估标准不统一,很难直观比较不同量化方法的优劣。 为了解决这一问题,Meta AI 研究团队推出了ParetoQ,它作为一个标准化框架,支持1-bit、1.58-bit、2-bit、3-bit 和 4-bit 量化的系统性评估。相比以往各自为政的量化研究,ParetoQ 通过优化训练方案和比特特定量化函数,提供了一种更具一致性的比较方式。 ParetoQ 如何优化低比特量化? 该框架采用优化版 QAT 训练策略,在保证模型压缩效果的同时,将准确率损失降到最低。研究发现,当模型精度降至2-bit 以下时,会发生显著的表征偏移,而3-bit 及以上的模型则仍然保持与原始预训练分布的相似性。为此,ParetoQ 针对不同比特宽度优化量化网格、调整训练方式,并提供比特特定的学习策略。 实验结果显示,ParetoQ 在性能上远超现有的量化方法。例如,研究团队基于 ParetoQ 训练的600M 参数三进制(ternary)模型,准确率超越了之前最强的 3B 参数三进制模型,但参数量仅为其五分之一。此外,2-bit 量化模型在相同体积下的准确率相比 4-bit 模型提升1.8 个百分点,证明了2-bit 量化是 4-bit 量化的有效替代方案。 不仅如此,ParetoQ 还带来了更高效的硬件适配性。优化后的2-bit CPU 内核在计算速度和内存效率上都比 4-bit 量化更优,使低比特量化在实际部署中更加可行。实验也表明,相比 1-bit 和 4-bit 量化,2-bit、3-bit 及 ternary 量化模型在准确率和模型大小之间达到了更优平衡,进一步强化了4-bit 以下量化策略的价值。 未来展望 这项研究奠定了大型语言模型低比特量化的坚实基础。通过引入结构化框架,ParetoQ 有效解决了准确率权衡与比特宽度优化问题。研究结果表明,虽然极端低比特量化(如 1-bit)可行,但目前来看,2-bit 和…
Author: aitrendtrackers@rengongzhineng.io
Mistral AI推出Small 3:开源对标GPT-4o mini,本地运行无压力!
法国人工智能实验室Mistral AI近日发布了Small 3,一款24B参数的大型语言模型(LLM),号称是**“同类中最优”的高效模型,并且优化了延迟表现。Mistral AI表示,该模型可以与Llama 3.3 70B、Qwen 32B等大模型竞争,甚至可以作为GPT-4o mini的开源替代方案**。 小巧但强大,Small 3为何值得关注? 1. 开源+本地运行,MacBook也能带得动 Small 3完全开源,采用Apache 2.0许可证发布,任何个人或企业都可以使用和修改。更值得一提的是,它可以在拥有32GB RAM的MacBook上本地运行,意味着开发者和企业无需昂贵的云计算资源,也能高效利用AI能力。 2. 高效低延迟,适合关键任务 Mistral AI表示,Small 3专门优化了延迟表现,尤其适用于需要快速、精准响应的场景。其架构采用较少的层数,提升了处理速度,同时仍保持卓越的推理能力。在MMLU基准测试中,Small 3的准确率超过81%,展现了强大的通用知识理解能力。 3. 训练方式不同,更具灵活性 有别于其他大模型,Small 3未经过强化学习(RL)或合成数据训练,Mistral AI认为,这让Small 3在模型生产过程中处于较早阶段,比DeepSeek R1等模型更具可塑性。此外,该模型指令微调版本的表现甚至可媲美参数量大三倍的开放权重模型,并且在代码、数学、通识知识和指令跟随能力上,与GPT-4o mini不相上下。 用户评价如何? Mistral AI通过第三方供应商进行了一项人类评估测试,使用超过1000个编码和通识问题对Small 3进行考验。测试结果显示,大多数评审者更喜欢Small 3,相较于Gemma-2 27B和Qwen-2.5 32B表现更优,但在对比Llama-3.3 70B和GPT-4o mini时,评价则相对平均。这表明Small 3在不同应用场景下可能具有不同的优势。 适用场景:从虚拟助理到金融风控 Mistral AI推荐使用Small 3来构建客户服务型虚拟助手,尤其适用于金融欺诈检测、法律咨询、医疗健康等高精度需求场景。该模型还能用于机器人、制造业等领域,甚至非常适合爱好者和企业在本地环境中处理敏感或专有信息。 此外,Mistral AI暗示,未来几周内将推出更多不同规模、推理能力更强的模型,敬请期待!目前,Small 3已可在HuggingFace上获取。https://huggingface.co/mistralai/Mistral-Small-24B-Instruct-2501
亚马逊即将推出全新AI版Alexa,订阅费或达10美元!
亚马逊终于要带来万众期待的Alexa升级版了!据知情人士透露,这次的改版引入了生成式人工智能(AI),堪称自Alexa诞生以来最重大的升级。为了预热这场科技革新,亚马逊已经向媒体发出了邀请函,定于2月26日在纽约举办发布会,由设备与服务部门负责人Panos Panay亲自主持。虽然官方还未透露具体细节,但可以确定的是,这场活动的核心就是Alexa的新生。 这一AI升级版Alexa不仅是亚马逊的一次大胆创新,同时也面临着巨大的商业风险。全球超过5亿台Alexa设备的用户,能否从免费用户转变为付费订阅者,将直接影响亚马逊的商业回报。新Alexa计划具备更强的对话能力,能够连续处理多个指令,甚至能自主完成任务,而不像当前版本那样只能应对单个指令。据悉,亚马逊高层将在2月14日召开“Go/No-go”会议,最终决定新版Alexa是否能按计划上线。 Alexa将走向付费模式? 新一代Alexa预计将在初期限量推出,并暂不收取费用。但亚马逊已经在考虑未来的订阅模式,费用可能在每月5到10美元之间。同时,目前的“经典版Alexa”仍将继续免费提供,但据消息人士透露,亚马逊已经停止为经典版添加新功能,未来可能会逐步引导用户向付费版转移。 AI升级,能否摆脱“计时器”形象? 尽管Siri早在2011年便已问世,但2014年发布的Alexa才真正引爆了智能语音助手市场。然而,近年来Alexa的使用场景逐渐被限定在设置计时器、播报天气等简单功能上,原因在于其核心功能多年未有重大升级。而这一次,亚马逊希望通过AI版Alexa彻底改变用户体验,让它成为一个能自主执行任务的智能“代理”,比如在用户下单前修改订单,或者根据个人偏好推荐音乐和餐厅。 不过,新的Alexa也面临着类似OpenAI、谷歌等AI聊天机器人常见的问题,比如AI“幻觉”(错误信息)。考虑到Alexa已经广泛应用于汽车、电视、智能家居等设备,亚马逊必须确保其准确性和安全性,以免造成不必要的困扰。 贝佐斯的星际梦,Alexa能否实现? Alexa的诞生可以追溯到亚马逊创始人杰夫·贝佐斯的愿景——他希望打造出一个类似《星际迷航》中全能电脑的语音助手。亚马逊曾设想,未来Alexa将能完成各种任务,比如控制智能家居、播放音乐、发送邮件、甚至叫车。2014年,时任设备主管的戴夫·林普曾表示:“也许未来的某一天,Alexa能够回答用户提出的所有问题。”然而,理想很丰满,现实却因技术瓶颈而屡屡受阻。为了完善新版Alexa,亚马逊甚至为该项目取了代号“Banyan”(印度榕树)和“Remarkable Alexa”,不过最终是否会以这些名字推出尚未可知。 能否实现商业突破? 亚马逊目前已经向AI初创公司Anthropic投资80亿美元,以强化Alexa的人工智能能力。有分析认为,如果10%的Alexa活跃用户愿意为新版Alexa支付每月5美元的订阅费,亚马逊每年可从中获利6亿美元。这意味着,新版Alexa不仅要展现出足够的智能,还需要让用户愿意为它买单,否则这场升级将难以带来真正的商业价值。 去年9月,亚马逊曾展示过Alexa AI版本的早期演示,但因质量问题而被无限期推迟。这次能否顺利发布,Alexa能否真正实现智能化蜕变,2月14日的最终决策和2月26日的发布会,将成为关键节点。
Gemini 2.0 全面开放,AI 进入新纪元!
谷歌今天正式宣布,最新 AI 模型 Gemini 2.0 现已面向所有用户开放!这标志着 AI 领域迎来新的发展阶段,尤其是在推理能力、编程表现以及高效处理复杂任务方面,Gemini 2.0 带来了革命性的提升。 Gemini 2.0 Flash:高效推理全面普及去年 12 月,谷歌发布了 Gemini 2.0 Flash 的实验版,为开发者提供了一款低延迟、高性能的 AI 模型。今年初,2.0 Flash Thinking Experimental 在 Google AI Studio 迎来升级,结合了 Flash 的速度与更强的推理能力,能够解决更复杂的问题。 上周,新版 2.0 Flash 已经向所有 Gemini 应用用户开放,无论是桌面端还是移动端,用户都可以体验 AI 在创作、互动和协作方面的全新可能性。今天,谷歌更进一步,宣布 2.0 Flash 通过 Gemini API 在 Google AI Studio 和 Vertex AI 上线,开发者现在可以用它来构建生产级应用。 Gemini 2.0 Pro:最强编程与推理…
谷歌的最新 AI 模型发布,Gemini 迎来“思考”能力!
全球科技巨头谷歌周三正式推出备受期待的旗舰 AI 模型——Gemini 2.0 Pro Experimental,同时还带来了一系列新 AI 模型的发布。更值得关注的是,该公司正式将其“推理”模型——Gemini 2.0 Flash Thinking,带入了 Gemini 应用。 此举恰逢科技圈对 AI 低成本推理模型的关注达到新高度,而中国 AI 初创公司 DeepSeek 更是成为市场焦点。DeepSeek 的 AI 模型不仅在性能上与美国科技巨头们的产品比肩,甚至在某些方面还更胜一筹。更重要的是,DeepSeek 还通过 API 以超高性价比向企业开放其 AI 模型。 事实上,早在去年 12 月,谷歌和 DeepSeek 就先后推出了 AI 推理模型,但 DeepSeek 的 R1 迅速抢占了风头。如今,谷歌似乎希望借助其流量巨大的 Gemini 应用,让 Gemini 2.0 Flash Thinking 获得更多关注度。 至于 Gemini 2.0 Pro,它是去年 2 月发布的 Gemini 1.5 Pro…
Hugging Face 的研究人员正致力于打造 OpenAI 深度研究工具的“开源版
Hugging Face 的一群开发者,又双叒出手了!这次,他们宣布打造了一个“开源版”的 OpenAI 深度研究工具,而且领头的正是公司联合创始人兼首席科学家 Thomas Wolf。 先来说说 OpenAI 的深度研究工具。这款 AI 利器在周日的一场发布会上惊艳亮相,能够爬取整个网络,为任何主题生成研究报告。不过,这项黑科技目前仅限于 OpenAI 订阅 $200/月 ChatGPT Pro 计划的用户,普通人只能望而兴叹。 而 Hugging Face 团队的“Open Deep Research” 项目,试图打破这一壁垒。他们的方案由两个部分组成:一是 OpenAI 的 o1 模型,二是一个开源的“智能代理框架”,可以帮助模型规划分析,并引导其使用搜索引擎等工具。虽然 o1 不是完全开源的(它还是需要 API 访问权限),但团队表示,它的表现比一些开源模型(比如 DeepSeek 的 R1)更胜一筹。 更令人震惊的是,研究团队在不到 24 小时内,就让 o1 学会了使用简单的文本浏览器,并能借助“文本检查”工具读取网页文件。Open Deep Research 甚至能自主浏览网页、翻阅文档、操控文件,甚至进行数据计算,真正实现了 AI 自己上网查资料! 在 GAIA 基准测试(衡量 AI 助手能力的一个标准)上,Open Deep Research 的得分达到了 54%,虽然比不上…
Meta财报解读:营收超预期,用户增长放缓,AI与元宇宙仍是烧钱重点
Meta最新的财报数据来了!在刚刚公布的2024年第三季度财报中,这家科技巨头的营收高达405.9亿美元,超出了市场预期的402.5亿美元,EPS(每股收益)也以6.06美元远超分析师预测的5.25美元。然而,用户增长未能达到预期,全球日活跃用户(DAU)增长5%至32.9亿,略低于预期的33.1亿。财报发布后,Meta股价在盘后交易中下跌超过3%。 AI加码,烧钱不减 Meta CEO马克·扎克伯格在财报电话会议上表示,公司业绩表现良好,AI正在推动旗下各类应用和业务增长。他特别提到,Meta在人工智能基础设施上的投资不会放缓,甚至预计2025年成本还会大幅增长。“我们在Meta AI、Llama大模型的采用,以及AI智能眼镜等领域都取得了强劲的进展。”扎克伯格说道。 公司表示,2025年基础设施支出将迎来“显著增长”,包括更高的折旧成本和运营支出,以支持更大规模的计算基础设施。虽然这一策略可能让投资者感到担忧,但扎克伯格强调,这是为了未来的持续增长做好准备,“即使这不是投资者最想听到的消息。” 此外,Meta广告业务继续回暖,其每条广告的平均价格同比增长11%,为公司贡献了稳定的收入来源。 元宇宙:史诗级创新还是烧钱大冒险? Meta的元宇宙业务——Reality Labs部门继续成为财务黑洞。公司预计2024年的相关亏损将“大幅增长”,过去几年,该部门已累计亏损近600亿美元。Meta CFO Susan Li在电话会议上回避了“是否已经达到亏损峰值”的问题,仅表示元宇宙“仍然是我们的长期战略重点之一。” 然而,Meta的CTO安德鲁·博斯沃思(Andrew Bosworth)在一份内部备忘录中明确表示,2025年将是决定元宇宙成败的关键一年。他在题为**《2025:伟大之年》**的帖子中强调,Reality Labs计划推出至少六款AI驱动的可穿戴设备,并推动混合现实(MR)产品的销量、用户留存和参与度。他直言:“如果你还没感受到历史的压力,那你根本没有在关注现实。” 他还强调,Meta必须确保旗下虚拟世界Horizon Worlds在移动端获得突破,否则整个元宇宙计划的前景将岌岌可危。“2025年将决定我们的努力是被视为远见卓识,还是一场史诗级的失败。” Meta的豪赌能否兑现? 尽管Meta在AI和元宇宙方面持续投入,但现实情况却不容乐观。在AI领域,Meta的Llama大模型仍面临OpenAI、谷歌和微软的激烈竞争,而在智能硬件市场,Meta的AI智能眼镜虽已售出100万副,但扎克伯格也承认这“只是一个不错的开始”,远未达到真正撼动市场的水平。 与此同时,Meta虽然在2024年增加了9%的员工总数,但自2022年底以来,公司已裁员超过2万人,仍在不断寻找优化运营的方式,以平衡投资与支出。 Meta如今站在一个十字路口——AI和元宇宙是它的未来愿景,但目前这条道路仍充满不确定性。2025年,Meta究竟能否兑现其“伟大之年”的承诺,还是会沦为一场“传奇级的错误”?这将是全球投资者和科技行业都在密切关注的问题。
AI取代人类?
一般来说,大型企业谈及人工智能时,总是强调它如何让员工的工作更加有趣,或者如何创造新的就业机会来弥补被淘汰的岗位。然而,瑞典金融科技公司Klarna的CEO Sebastian Siemiatkowski却完全不按常理出牌。他不仅公开表示AI可以胜任人类的所有工作,还豪言壮语地宣称,Klarna已经通过AI节省了数千万美元,甚至连自己的工作都可能被AI取代。 过去一年里,Klarna不断宣传其在AI自动化上的突破,特别是在营销、法律合同处理、媒体分析和客服等领域。据称,该公司的AI聊天机器人已经取代了700名客服人员,并能在不到两分钟的时间里解决客户问题,比人类客服快了九分钟。Siemiatkowski甚至特意打造了一个AI版的自己,在去年三季度财报发布时“亲自”出镜,向投资者展示AI如何渗透到高层管理中。 然而,这位CEO并不认为AI只是帮助员工减少琐碎工作,让他们从事更有价值的任务。相反,他在采访中直言,AI的发展意味着很多人将直接失业,而不是轻松转行。他举例说,AI已经让成千上万的专业翻译员失业,嘲讽式地质疑:“难道要告诉一个55岁的翻译员,‘别担心,你可以去当YouTube网红’?” Klarna的自动化浪潮不仅影响了普通员工,甚至直接导致公司裁员。自2023年9月起,该公司基本停止招聘,员工总数从约5000人缩减至4000人,并计划最终减少至2000人。虽然外界曾质疑其“停止招聘”的真实性,但无论如何,Klarna的AI转型正在深刻改变其用工结构。 相比起其他科技公司对AI的谨慎态度,Siemiatkowski的激进立场显得尤为突出。IBM CEO Arvind Krishna曾表示,AI会“减少重复性任务,让员工专注于更高价值的工作”,但Klarna的做法显然更加直接:能自动化的,就不再需要人类参与。 AI:革命还是炒作? 尽管Siemiatkowski大力宣传AI,但外界对Klarna的自动化策略仍存疑。例如,科技媒体TechCrunch调查发现,在Klarna宣称“停止招聘”一年后,公司仍然在招聘工程师等关键岗位。甚至有报道称,Klarna的客服自动化程度并不比行业内其他公司更高,只是之前依赖人工客服过多,因此裁员规模更大。 此外,经济学家Erik Brynjolfsson的研究表明,AI在客服等领域的确能提高员工效率,但短期内完全取代人类并不现实。当前AI的强项更多体现在优化流程,而非完全独立执行复杂任务。然而,Siemiatkowski的表述往往更具戏剧性,甚至可能夸大了AI带来的直接影响。 从“支付独角兽”到“AI试验田” Klarna创立于2005年,最初专注于“先买后付”业务,帮助消费者分期支付购物款项。公司凭借这一模式迅速崛起,并获得了硅谷风投的青睐。2021年,Klarna估值一度飙升至456亿美元,成为欧洲最具价值的金融科技公司之一。然而,疫情后市场环境急剧变化,投资者态度趋于保守,Klarna的估值在2022年暴跌至67亿美元,并在同年裁员10%。 在此背景下,Siemiatkowski开始大力推进AI转型,并将Klarna包装成AI时代的先锋。他不仅与OpenAI CEO Sam Altman建立了联系,还主动表示Klarna愿意成为OpenAI的“AI小白鼠”。在一次播客采访中,他回忆起最初体验ChatGPT的场景:“2022年11月,我在Twitter上看到有人说‘快来试试这个’,然后我就打开ChatGPT,心想,‘天啊,我真的在跟一个电脑对话’。”随后,他迅速推动公司内部试用AI,并频繁对外宣传Klarna的AI进展。 然而,Klarna的AI战略是否真正具备革命性,还是更像一场精心策划的公关秀?随着更多企业加速AI转型,Siemiatkowski的激进言论或许只是资本市场上的一种“自我营销”,而AI究竟能在多大程度上取代人类工作,仍然是一个未解之谜。
OpenAI新商标申请曝光:AI硬件、机器人、量子计算全线布局?
上周五,AI初创公司OpenAI向美国专利商标局(USPTO)提交了一项新的商标申请,涵盖与其品牌“OpenAI”相关的产品。正常情况下,这种操作并不值得大书特书,毕竟企业申请商标是家常便饭。但这次的申请却暗示了OpenAI正在布局一系列新产品,包括短期内可能推出的,以及更具未来感的技术概念。 申请文件中提到的硬件设备五花八门,从耳机、护目镜、眼镜、遥控器,到笔记本电脑和手机壳,甚至还包括智能手表、智能珠宝以及虚拟现实(VR)和增强现实(AR)头显,全部被归类为“用于AI辅助互动、模拟和训练”的设备。 其实,去年OpenAI就已经确认正在与前苹果设计师Jony Ive合作开发一款硬件产品,而就在本周日,该公司CEO Sam Altman在接受韩国媒体《The Elec》采访时也透露,OpenAI希望通过与多家企业合作,研发AI驱动的消费级硬件。不过,Altman也强调,哪怕是一个AI设备的原型机,至少还需要“数年”时间才能完成。 更加吸引眼球的是,OpenAI的商标申请中还提到了机器人,尤其是“可由用户编程的人形机器人”,以及具备沟通和学习功能、能够提供辅助和娱乐服务的智能机器人。 这与OpenAI近期的招聘信息不谋而合。去年11月,该公司从Meta的AR眼镜部门挖来了Caitlin Kalinowski,任命其为硬件团队负责人,而最近,OpenAI也开始组建新的机器人团队。据《The Information》报道,该团队可能会研发类人机器人,搭载定制传感器和AI系统,目标是让它们具备类人智能,在现实世界中独立运行。 此外,OpenAI的商标申请还提到了定制AI芯片以及利用量子计算资源优化AI模型性能的服务。 事实上,关于OpenAI自研AI芯片的传闻早已流传甚广。据悉,该公司内部已经有专门的芯片设计团队,而多方消息显示,OpenAI计划最早在2026年与半导体制造商Broadcom和台积电(TSMC)合作推出自研芯片。 至于量子计算,OpenAI的具体计划仍然是个谜。不过,该公司去年招募了一名前PsiQuantum的量子系统架构师加入技术团队,这一举动引发了外界猜测。正如《The Register》在3月份的报道中所提到的,量子计算凭借同时执行海量计算的能力,有望极大提升AI模型训练的效率。而考虑到AI的计算成本居高不下,OpenAI或许正试图探索完全不同于现有计算架构的解决方案。 不过,商标申请通常都是宽泛定义的,未必真正代表公司未来的产品规划。OpenAI的申请文件或许揭示了该公司正在探索的领域,甚至可能只是一个想法的备选清单。至于这些技术究竟何时,甚至是否能变成现实,仍然充满未知。
OpenAI 正式推出Deep Research。
OpenAI 正式推出一款全新的 AI “智能研究助手”,专为需要深入研究和复杂信息分析的用户打造,而它的名字也十分直白——Deep Research。 根据 OpenAI 在周日发布的博文,这项新功能主要面向金融、科学、政策、工程等领域的专业人士,以及需要精准、可靠信息支持的研究型用户。当然,官方还补充道,Deep Research 也适用于日常生活中那些需要认真比对的消费决策,比如购车、家电选购或家具挑选。 换句话说,Deep Research 适用于那些不满足于简单答案或摘要,而是需要从多个来源深度挖掘信息的场景。 Deep Research 限量开放,未来扩展至更多用户 目前,Deep Research 已向 ChatGPT Pro 用户开放,每月限 100 次查询。接下来,OpenAI 计划在未来一个月内向 Plus 和 Team 级用户开放,最终覆盖 Enterprise 订阅。而对于英国、瑞士及欧洲经济区的用户,OpenAI 目前还没有明确的发布时间表。 使用 Deep Research 也很简单——用户只需在 ChatGPT 的“撰写器”(composer)中选择“Deep Research”模式,然后输入查询内容,甚至可以附上文件或电子表格进行分析。目前,这项功能仅支持网页端,但 OpenAI 计划在本月晚些时候推出移动端和桌面应用集成。 不过,Deep Research 需要一定时间来处理查询,可能需要 5 到 30 分钟。完成后,用户将收到通知。 目前仅支持文本输出,未来将增加图像和数据可视化 当前 Deep Research 的答案是纯文本形式,但 OpenAI 透露,他们计划很快加入嵌入式图像、数据可视化等功能。此外,未来…