aitrendtrackers@rengongzhineng.io, Author at AI TrendTrackers

初创公司首次退出的经验教训

Posted on November 15, 2024November 15, 2024 by aitrendtrackers@rengongzhineng.io

初创公司首次退出的经验教训作者：SkyBridge创始人发布时间：2024年11月13日在2024年四月，SkyBridge的创始人完成了对这家硬件公司的出售。这是一家他创立并经营了四年的公司。这次出售的经历让他学到了很多宝贵的经验，包括在过程中哪些做法是成功的，哪些地方在未来可以改进，以及一些让人意想不到的发现。在这篇文章中，他分享了此次出售经历的细节，希望为其他创业者提供启发和借鉴。交易详情哪些做法被证明是成功的 1. 大量投资于业务文档化在创始人开始他的第一次创业之前，他阅读了约翰·沃里洛的《Built to Sell》一书。这本书鼓励创业者建立无需创始人日常管理也能高效运行的公司。一个高效的公司需要拥有一套清晰定义的流程，以及能够执行这些流程的团队。创始人一直喜欢复用型流程，因此在组建SkyBridge团队时，他在业务文档化方面投入了大量时间和精力。他没有依赖面对面的培训或视频通话，而是通过在团队的Notion工作区编写操作手册来完成培训。当操作手册中出现问题时，团队会进行修订以减少未来的错误。当新成员加入团队时，他们通过同样的操作手册完成入职流程，而团队则不断完善这些手册。在出售SkyBridge后，合同要求创始人在过渡期提供最多30天、总计80小时的咨询支持。但实际上，买家只需要创始人提供大约25小时的支持。这是因为SkyBridge团队已经能够独立运行公司的日常工作，并且买家也能够通过完善的文档获取所需信息。创始人在过渡期的主要工作仅仅是将新所有者介绍给团队成员和关键供应商。 2. 制定了清晰的过渡清单在准备出售公司时，创始人创建了一份清单，列出了所有需要在出售前完成的任务，比如删除过时的操作手册，以及确保所有账户凭据都存储在公司的Bitwarden账户中。在尽职调查阶段，他将这份清单扩展到包括过渡期间需要完成的事项，并将清单分为四个类别：这份清单在交割期间显得尤为重要。当时许多账户需要转移给新所有者，并且许多流程也需要根据新所有者的需求进行调整。这份在冷静时期制定的清单，为高强度的交割阶段提供了清晰的方向。 3. 选择了值得信赖的并购中介创始人在最初对并购中介存在一定的偏见，他以为中介只关注尽快完成交易，而不关心创始人的其他利益。然而，在2023年的Microconf大会上，他结识了Quiet Light Brokerage的顾问Chris Guthrie。Chris给人的印象是非常低调、没有任何压迫感，并且特别关注创始人的利益。他本人也是一位前创始人，因此特别强调找到最合适的交易，而不是追求最快的付款方式。通过与Quiet Light的合作，创始人发现双方的利益始终保持一致。Quiet Light帮助他找到了一个他自己无法找到的买家，并且在整个过程中推动交易顺利进行。尽管Quiet Light的佣金为交易金额的15%（即8.89万美元），但创始人认为这是值得的，因为中介提供的专业服务帮助他避免了许多潜在的麻烦。 4. 避免了卖方融资由于创始人当时并不急需现金，因此最初他对买家分期付款的方案持开放态度。然而，在与其他创业者交流后，他了解到卖方融资可能存在重大风险。一位经验丰富的创业者这样告诉他： “如果你自己为交易融资，那么你实际上是给买家打工。” 这位创业者解释道，如果交易涉及融资，卖方只有在企业盈利的情况下才能获得付款，而新买家对此心知肚明。他们可能会将管理责任推给卖方，因为他们知道如果公司失败，卖方也无法收回贷款。此外，作为一个小型贷款人，卖方很难在买家违约时有效追讨欠款。如果买家决定不支付款项，即使买家有能力支付，卖方也很难通过法律手段追回资金。 5. 假设交割后不再获得任何收益创始人了解到，很多创业者对交割后应收到的款项感到失望。部分原因是买家没有履行合同，还有一些情况是买家通过“创造性记账”避免支付基于绩效的奖金。因此，他选择设计一个交易结构，即使交割后无法获得额外款项，他仍然感到满意。任何交割后的款项都被视为额外的奖励，而不是交易的主要部分。 6. 认识到交割后对公司的影响力是有限的创始人希望找到一个愿意继续投资产品、团队和客户的新买家。在与其他创始人讨论如何避免找到只想短期获利的买家时，他们建议他不要试图控制交割后的局面，而是专注于筛选合适的买家。他通过筛选选择了那些愿景与他一致的买家，但同时也认识到，交易完成后，公司将完全由新买家掌控。他的经验表明，这种筛选可以一定程度上增加交易后结果符合预期的可能性。 7. 修改中介协议以确保佣金支付与实际收款挂钩创始人注意到，中介协议的初稿中规定，中介的佣金是购买价格的一部分，并且必须在交割时支付。但如果交易协议涉及分期付款，卖方可能需要提前支付基于全款的佣金，而实际可能需要数年才能收到全部款项。因此，他请求中介修改协议，确保佣金支付与实际收到的款项挂钩。中介同意了这一修改，确保了卖方和中介之间的利益一致性。总结 SkyBridge创始人通过这次出售积累了丰富的经验。他认识到，在出售过程中，细致的准备、清晰的沟通以及对潜在风险的准确评估都至关重要。虽然这一过程充满挑战，但最终结果让他感到满意。他希望通过分享这些经验，为其他创业者提供有价值的借鉴，帮助他们在类似的交易中取得成功。

OpenAI、谷歌与Anthropic：AI发展遇阻，前进之路不再平坦

Posted on November 15, 2024November 15, 2024 by aitrendtrackers@rengongzhineng.io

近年来，OpenAI、谷歌和Anthropic等人工智能领域的领军企业凭借一系列强大的AI产品在行业内掀起了一波浪潮。然而，最新报告显示，这些公司在开发更先进模型方面正面临逐渐递减的回报，其投入的巨额成本与结果之间的差距引发了广泛关注。 OpenAI的Orion模型：未能达到预期 OpenAI在9月完成了代号为“Orion”的新模型的初步训练，原本希望它能显著超越当前技术。然而，据知情人士透露，该模型在许多方面的表现未能达到目标，特别是在未经过训练的编码问题上表现不佳。与GPT-4相较，Orion的进步远未达到GPT-4相对于GPT-3.5的飞跃程度。目前，OpenAI正通过包括人类反馈在内的后续训练试图提升Orion的表现，但模型尚未达到可以公开发布的水平。这使得Orion的发布时间推迟至明年年初。谷歌的Gemini与Anthropic的Claude Opus：也未能幸免谷歌的Gemini系列一直被寄予厚望。然而，根据内部消息，其即将推出的新版本未能满足预期表现，令人失望。同样，Anthropic的Claude 3.5 Opus模型也面临开发难题。尽管其性能较早期版本有所提升，但改进幅度与投入成本并不成正比。Anthropic的发布计划因此一再推迟，其首席执行官达里奥·阿莫迪（Dario Amodei）在最近的播客中坦言，可能会在未来几年内因数据不足或其他障碍而“脱轨”。挑战：数据、成本与技术瓶颈这些困境反映了当前AI发展中的三大核心挑战：从规模扩展到新用途：AI的下一步方向面对当前困境，这些科技公司正在调整方向，重点转向模型的实际应用场景，而非一味追求更大的模型规模：这些调整显示，企业已意识到单纯依赖规模化的发展路径不再可靠。正如Amodei所说：“‘规模定律’并非宇宙法则，而是一种经验规律，未来是否能继续适用仍存疑。” 行业反思：AGI目标是否过于遥远？人工通用智能（AGI）的概念曾被视为人工智能的终极目标，但近年来实现这一愿景的可行性受到质疑。Margaret Mitchell，AI初创公司Hugging Face的首席伦理科学家指出：“AGI的泡沫正在破裂。”她认为，未来AI模型需要探索不同的训练方法，而非仅仅依赖扩大数据和计算能力。尽管如此，行业领袖依然对AI的潜力保持乐观态度。他们希望通过改善数据质量、提升模型应用性能，逐步克服当前的技术与成本障碍。结语：AI的未来依然可期，但步伐需更务实 OpenAI、谷歌和Anthropic正在经历AI发展中的“高原期”。这并不意味着AI的前景暗淡，而是标志着该领域需要从盲目追求规模扩展转向更务实的创新路径。随着新应用场景的探索和技术手段的改进，AI或许仍能实现更大的突破，但这需要时间、耐心与更具创造力的策略。

马斯克升级对OpenAI的诉讼：添加反垄断指控与新被告

Posted on November 15, 2024November 15, 2024 by aitrendtrackers@rengongzhineng.io

埃隆·马斯克（Elon Musk）针对OpenAI的法律战进一步升级。他最初于今年2月对OpenAI提起诉讼，指控其背离了最初的非营利使命。虽然案件在7月曾一度结案，但一个月后马斯克决定重新开案，而现在，这场法律战正变得更具火药味。新的指控与被告马斯克的律师团队对原有的107页诉状进行了强化，新增了多项指控及当事人： “xAI因无法以接近OpenAI所获得的优惠条件从微软获取计算资源而受到伤害。” 诉状指控Templeton曾是OpenAI董事会的非投票观察员，她涉嫌在微软和OpenAI之间达成协议并交换敏感信息，违反了反垄断规定。此外，霍夫曼则被控滥用其作为OpenAI和微软董事会成员的身份，获得不当的企业交易信息。反垄断指控的核心内容马斯克指控微软与OpenAI之间存在“事实上的合并”，这种合作关系削弱了市场竞争。具体指控包括： “允许Templeton和Hoffman在OpenAI董事会的任职，完全违背了反垄断法规设立的初衷。” 新原告：支持马斯克的盟友诉状中新增了几位原告，其中包括马斯克的AI初创公司xAI，以及Shivon Zilis——她是马斯克子女的母亲之一、前特斯拉项目总监及现任Neuralink高管。Zilis曾在OpenAI董事会任职四年，据称与马斯克一样对OpenAI与微软的合作表达过担忧，但她的意见未获重视。马斯克的论点：OpenAI的变质马斯克在诉状中直指OpenAI已经从一个独立的非营利组织，逐渐沦为微软的“全资营利子公司”。他批评OpenAI“安全与透明”的创始使命被抛弃，取而代之的是追逐商业利益的行为，并认为这完全背离了创始时的初衷。 “再巧妙的措辞和再复杂的交易手法也掩盖不了事实：OpenAI正在成为微软的工具。” 案件影响马斯克对OpenAI的诉讼不仅可能对双方未来的合作与竞争关系产生深远影响，也进一步揭示了科技巨头在AI领域的商业运作模式。案件的发展可能对AI行业的透明性、合作规范以及反垄断规则的执行带来广泛影响。

预测AI如何提升销售绩效管理：五大方式

Posted on November 15, 2024November 15, 2024 by aitrendtrackers@rengongzhineng.io

预测AI如何提升销售绩效管理：五大方式 AI与精准数据结合，可以显著改善账户评分、配额优化等销售决策。以下将介绍如何将其融入销售策略。背景：用AI驱动销售绩效管理（SPM）现代企业在寻求增长时，往往忽略了一个关键因素——预测AI在销售绩效管理中的潜力。特别是对于销售队伍规模较大的企业，预测AI已经成为优化销售流程、提升收入的重要工具。以假想医疗设备公司NovaMed为例：2022年，该公司因销售区域划分混乱、配额分配失衡等问题，销售额连续三年下滑，目标完成率仅为80%。通过引入AI驱动的SPM，NovaMed在两年内扭转了局面，实现了市场领先的表现。这充分展示了预测AI在SPM中的变革力量。 AI驱动的SPM：五大推动力 1. 提高预测准确性预测AI分析历史数据与市场趋势，为销售决策提供精确预测。例如，NovaMed利用AI预测客户需求，优化库存与销售策略，提前应对市场变化。这种基于数据的预测方法使企业告别凭直觉规划的被动模式。 2. 客户账户评分通过分析客户行为与潜在价值，AI帮助销售团队聚焦高回报的客户账户，提高转化率。例如，NovaMed此前试图“捕捉每一笔生意”，浪费了大量资源。预测AI将精力集中在最有可能成交的客户上，显著提升了销售效率与利润率。 3. 区域与配额优化 AI洞察复杂的销售区域与配额数据，帮助企业实现优化配置： 4. 销售容量规划预测AI协助企业根据市场需求分配销售力量。例如，AI根据销售周期复杂性与市场特点，为NovaMed调整销售团队规模，实现资源的最佳匹配。 5. 促进跨职能协作 AI还可实时整合SPM相关功能，打破部门壁垒，改善决策流程。通过数据共享与联合目标设定，NovaMed将营销、销售与客户成功团队连接为一体，从而提升整个收入体系的效率。实现AI驱动SPM的五大优先事项转型的关键：以AI为助力而非替代 NovaMed的成功在于其清晰的愿景与战略执行。他们专注于培训销售团队，让AI成为支持销售领导的工具，而不是威胁。同时，通过明确的资源投入与持续改进，企业克服了技术和组织挑战，最终实现了收入增长的目标。总结：SPM进入AI驱动时代整合预测AI已成为推动销售绩效的必要策略。那些愿意抓住这一机会的企业，将有能力在复杂市场中取得竞争优势。对于前瞻性公司而言，AI不仅重新定义了SPM，也为其在市场变化中带来了灵活性与洞察力。

在Mac M4电脑上本地运行强大的开源AI模型成为可能，得益于Exo Labs的努力

Posted on November 15, 2024November 15, 2024 by aitrendtrackers@rengongzhineng.io

苹果公司长期以来将其生成式AI努力集中于移动端，但最近发布的M4芯片为AI技术的发展开辟了新的可能性。无论是最新的Mac Mini还是MacBook Pro，这些搭载M4芯片的设备现在可以运行业界最强大的开源大型语言模型（LLM），如Meta的Llama-3.1 405B、Nvidia的Nemotron 70B以及阿里巴巴的Qwen 2.5 Coder-32B。 Exo Labs的突破性进展总部位于迪拜的Exo Labs由Alex Cheema创立，致力于通过开源分布式计算技术“让AI更民主化”。Cheema最近在社交平台X上分享了他的成果：通过连接4台Mac Mini M4和1台MacBook Pro M4 Max，他成功运行了Qwen 2.5 Coder-32B模型，而这套设备的总成本约为5000美元，仅为一台Nvidia H100 GPU价格的六分之一。 Cheema认为，这种本地运行AI模型的方式不仅更具成本效益，还能显著提升隐私和安全性。“通过本地设备运行AI，可以完全控制数据和任务流程，避免云端泄露的风险，”他在接受采访时表示。 M4芯片的性能优势苹果M4芯片凭借其超强的单线程性能和低功耗设计，成为AI任务处理的理想选择。Cheema的团队通过M4芯片组成功实现：即便是更早的Mac硬件也表现不俗。例如，使用两台MacBook Pro M3运行Llama 3.1-405B，达到了5 tokens/秒的速度。这些结果表明，本地化的AI训练和推理工作流不再依赖昂贵的云基础设施。对于预算敏感型企业和高度监管行业，Exo Labs的解决方案提供了一种经济高效且安全的选择。分布式计算背后的理念 Cheema的创业灵感源于个人经历。他发现，传统的单设备AI任务运行效率低下。为了加速他的机器学习研究，他尝试连接朋友的旧设备并开发了分布式系统来分配任务。然而，这一过程面临的带宽问题让他意识到需要更高效的分布式计算工具。最终，Cheema和联合创始人Mohamed “Mo” Baioumy开发了名为Exo的软件工具，并于2024年7月以开源形式发布在GitHub上，受GNU通用公共许可证保护，允许商业用途。自发布以来，Exo在GitHub上的受欢迎程度不断上升，并获得了私人投资者的资金支持。推动本地AI技术的未来为帮助更多用户探索分布式AI计算的潜力，Exo Labs计划于下周推出一个免费基准测试网站，提供硬件配置的性能比较，帮助用户根据需求选择合适的解决方案。 Cheema强调，这些基准测试基于真实使用情况，而非理论估算，能够为AI开发者提供更清晰的指导。他总结道：“我们的目标是通过展示可复制的测试设置，鼓励更多创新，让每个人都能更轻松地进入AI领域。” 无论是个人开发者还是企业，Exo Labs的技术都为那些希望在本地运行LLM的用户提供了一条高效、安全且经济的路径。

Stripe为LLM智能代理工作流添加支付功能

Posted on November 15, 2024November 15, 2024 by aitrendtrackers@rengongzhineng.io

大语言模型（LLMs）可以被用来创建各种自动化功能，通常被称为“AI代理”。这些代理能够将提示转化为一系列程序化操作，与其他系统交互。什么是代理式工作流？ “代理式工作流”是一种结合了大语言模型和函数调用的自动化流程。以“订机票”为例，用户可能会输入：“帮我订一张4月24日从纽约到旧金山的机票，预算500美元以下。”为了实现这个目标，代理需要：通过像Vercel的AI SDK、LangChain和CrewAI这样的框架，这些任务可以被分解并分配给专门的代理处理。此外，框架还能为代理配备“工具”，例如在线搜索功能或购买操作的代码片段，使得这些工具能够被调用以执行特定任务。如何集成支付功能？借助Stripe的代理工具包，你可以将其API直接嵌入代理框架中。Stripe工具包支持多个流行的框架，并可以与任何支持函数调用的LLM提供商兼容，比如Vercel的AI SDK或LangChain。使用示例假设需要构建一个“商务助手”代理来管理用户的账单。通过Stripe工具包，可以快速实现：类似地，还可以将Stripe与Slack结合，打造复杂的多步自动化：嵌入金融服务代理式工作流不仅限于虚拟任务。例如，可以利用Stripe的虚拟卡生成功能来处理商务消费：这种方式结合了LLM的智能决策能力和API的可控性，让自动化更加可靠。用计量式计费追踪使用情况代理工作流会消耗资源（如代币或时间），因此可以通过使用量计费为客户收费。Stripe工具包内置了中间件，可轻松追踪代币使用情况，并将其作为计费事件发送给客户： Stripe还提供快速入门指南，帮助开发者快速上手基于使用量的计费代理。测试与可靠性由于代理行为具有一定的随机性，建议开发者先在测试模式中运行，并使用受限API密钥限制代理的功能范围。例如，仅为库存管理代理启用产品和价格相关的功能：通过减少功能范围，不仅降低了选择错误工具的风险，还避免任务中途因工具失败而中断。总结 Stripe代理工具包让支付功能的集成变得前所未有的简单。无论是常见的支付任务自动化，还是基于使用量的计费模式，这一工具都能帮助开发者快速实现创新功能。想了解更多？访问官方文档获取详细信息！

Anthropic公司CEO达里奥·阿莫代伊（Dario Amodei）深入探讨了通用人工智能（AGI）、AI安全性、机制可解释性以及AI如何更好地与人类共存等多个重要主题

Posted on November 14, 2024November 14, 2024 by aitrendtrackers@rengongzhineng.io

在Lex Fridman的播客第452集里，Anthropic公司CEO达里奥·阿莫代伊（Dario Amodei）深入探讨了通用人工智能（AGI）、AI安全性、机制可解释性以及AI如何更好地与人类共存等多个重要主题。阿莫代伊的独特视角不仅来自他在OpenAI时期积累的丰富经验，也源自他在创立Anthropic后对AI伦理和技术安全性的深入思考。在AI技术飞速发展的背景下，阿莫代伊的观点为AI的未来提供了一种谨慎而现实的视角，反映了他对负责任创新的承诺。 1. Claude模型的开发与安全性优先的理念阿莫代伊介绍了Anthropic的旗舰AI模型——Claude，并强调了其开发理念是以“安全性优先”为核心。AI模型的潜力是巨大的，但这也意味着其带来的风险同样不容忽视。阿莫代伊解释说，Claude不仅是一个强大的语言模型，更是一个被特别设计用以应对风险的AI系统。Anthropic在设计Claude时特别注重模型在生成内容时的安全性，通过一系列技术手段来确保模型的输出符合人类的道德和伦理标准。 AI系统的不可预测性一向被认为是潜在风险之一，尤其是当它们在高风险领域应用时（例如医疗和法律）。阿莫代伊指出，Anthropic在Claude的开发过程中采用了“机制可解释性”技术，这一方法不仅有助于理解模型内部的运作，还能有效降低风险。例如，Claude在训练时会接受一系列道德和伦理约束，以确保其在生成内容时不会产生有害的结果。通过这种方式，Anthropic试图为AI模型构建“安全防护”，确保Claude可以成为一个安全的辅助工具，而不是一种可能带来意外后果的“黑箱”。 2. 扩展法则与AGI的发展潜力阿莫代伊在谈及AGI（通用人工智能）时强调了“扩展法则”（Scaling Laws）的重要性。他指出，通过增加模型的参数和数据量，AI系统的能力可以显著提升，从而实现更高级的推理和自适应能力。但他也提到，这种“简单粗暴”的扩展带来了许多潜在的风险，尤其是在系统规模增大后，AI的行为可能会变得更加难以预测。阿莫代伊解释道，扩展法则帮助研究人员理解如何有效增加模型的容量以提升性能，但这一方法的局限性也很明显。随着模型的复杂度增加，其内部决策过程会变得极为复杂且难以解读，可能会出现一些不可预见的“奇异行为”。这种不透明性让人担心AGI一旦应用于人类生活的各个方面，若其行为不受控制，可能会引发难以弥补的后果。因此，阿莫代伊呼吁在推进AGI技术的过程中，业界需要对模型的规模和复杂性保持谨慎，同时开发更多安全机制，以确保这些系统在更高智能化的同时，依旧在安全可控的范围内。 3. AI伦理与社会责任：确保AI的道德边界阿莫代伊的谈话中多次提及AI系统的伦理问题和社会责任。他认为，确保AI行为的道德边界和符合伦理标准，是技术发展中不可忽视的一个重要方面。Anthropic在AI开发中的一大核心理念便是，AI的开发不仅需要关注性能和效率，更要确保其行为符合人类的道德准则。尤其是当前许多AI模型被广泛应用于内容生成、决策支持等领域，如果缺乏明确的伦理准则，AI可能会作出不符合社会价值的决策。他进一步指出，为了确保AI模型在生成内容时保持“伦理性”，Anthropic在Claude的训练过程中融入了一系列社会伦理和道德标准的内容。这些训练旨在引导Claude模型在面对不同场景时，能够识别出伦理边界，从而做出符合道德的决策。阿莫代伊认为，AI系统的社会责任在于维护人类的价值观念，只有确保AI在伦理和道德层面上的“正确性”，用户对其信任度才会提升。此外，他还强调了开发者在AI伦理方面的职责，指出AI系统的道德边界不仅体现在编程规则中，还体现在模型训练过程中的“行为塑造”。通过对模型行为的精细调控，开发者可以确保AI模型在处理复杂的社会伦理问题时，能够做出符合人类社会价值观的选择。阿莫代伊认为，如果AI不能赢得公众的信任，那么即使技术再先进，其实际应用前景也会大打折扣。 4. 机制可解释性：破解AI的“黑箱” 机制可解释性（Mechanistic Interpretability）是阿莫代伊在本次采访中反复强调的一个技术主题。他解释道，机制可解释性是一个新兴的研究领域，旨在深入理解神经网络模型的内部运作，帮助研究人员更好地解读AI如何处理信息。通过这种技术，AI模型的“黑箱”特性得以逐步减少，研究人员可以在模型生成输出时，对其内部决策机制进行追踪和解释。阿莫代伊指出，Anthropic团队开发了一种名为“Gemma Scope”的工具，以帮助分析Claude等AI模型的内部机制。这种工具可以像“放大镜”一样，让研究人员更清晰地观察模型在不同层级上如何做出决策，从而帮助AI开发者更好地控制模型的输出。阿莫代伊提到，通过机制可解释性，研究人员可以在模型生成过程中追踪其逻辑路径，从而预测可能的误判，并在模型处理复杂任务时提供更为可靠的判断。他还补充说，机制可解释性技术的应用并非仅限于理解模型决策过程，它还帮助开发者发现模型中的潜在问题。例如，通过追踪模型在生成特定内容时的决策路径，开发者可以更有效地预测模型在不同情境下的表现，进而设计出更为安全、可靠的AI系统。 5. AI的未来与人类的和谐共存阿莫代伊在展望AI的未来时表示，AI有着深远的潜力，不仅仅在技术层面上，而且在与人类社会的融合与共存方面。阿莫代伊指出，随着AI技术的成熟和广泛应用，AI将有能力进入包括生物学、医学、化学等领域，为这些行业带来新的突破。例如，Anthropic在医疗领域开发的图像分类工具，就曾帮助许多用户获得及时的健康建议，有人反馈这些工具甚至在关键时刻挽救了他们的生命。这类工具展示了AI技术在关键领域的巨大价值，说明AI不仅仅是一个技术工具，更可能成为人类生活的“伙伴”。阿莫代伊还提到，AI与人类的未来关系应建立在“互利互补”的基础上。Anthropic在开发AI时，始终将人类福祉放在首位。通过将AI设计为“助手”而非“替代者”，阿莫代伊希望AI能够在未来的社会中协助人类完成一些高风险或重复性的任务，而非取代人类的角色。这样一来，AI既可以实现技术创新，又不会对社会结构和人类生活方式带来冲击。他认为，AI技术在未来将更广泛地融入各个行业，但在AI成为人类不可或缺的伙伴之前，AI技术的开发仍需秉持“负责任的创新”原则，确保技术对社会的积极影响。他提到，通过负责任的AI开发和严格的伦理审查，AI技术可以为人类带来更加美好的未来，而不是一种不可控的技术威胁。总结在整个对话中，阿莫代伊以务实和谨慎的态度提出了关于AI发展的多层次观点。他的核心观点是，AI的发展潜力无限，但技术必须要在安全、伦理和可控性等方面达成平衡。他指出，尽管技术进步可能带来AGI的出现，但不负责任的开发可能会导致严重的负面影响。因此，Anthropic的研发策略始终围绕确保AI系统符合人类价值观展开，通过机制可解释性和伦理控制等技术手段，为AI与人类社会的未来共存铺平道路。阿莫代伊的观点不仅为AI技术的未来发展指明了方向，也为科技行业提供了关于如何将技术创新与社会责任相结合的深刻启示。

谷歌DeepMind推出了一种新的方式来“窥探”AI的“内心”

Posted on November 14, 2024November 14, 2024 by aitrendtrackers@rengongzhineng.io

谷歌DeepMind推出了一种新的方式来“窥探”AI的“内心”，并利用自动编码器揭示AI的黑箱运作。这种方法可能帮助研究人员更好地理解和控制AI的决策机制，为未来更可靠的AI系统铺路。 DeepMind的团队在研究被称为“机制可解释性”的领域，即试图理解神经网络如何实际运作。今年7月，他们发布了名为“Gemma Scope”的工具，让研究人员可以更清楚地观察AI在生成输出时内部发生了什么。团队负责人Neel Nanda指出，机制可解释性是一种新兴研究领域，目标是解构神经网络内部算法的运作方式。例如，AI在接收到“写一首诗”的指令后会输出韵律十足的句子，但具体执行的算法却不明朗，研究人员希望通过这种方式追踪其过程。在分析AI模型Gemma时，DeepMind使用了一种“稀疏自动编码器”的工具。这种编码器可放大模型的每一层，帮助研究人员更直观地观察AI如何在不同数据层级上分类特征。例如，如果向Gemma提问“吉娃娃”，它就会激活“狗”这一特征，显示模型关于狗的知识。稀疏自动编码器的特点是仅使用部分神经元进行激活，形成更高效的表现形式，但同时控制信息的粒度，以便研究人员不至于被过度复杂的信息淹没。 DeepMind此举的目的是将Gemma和自动编码器的研究开源，鼓励更多研究人员使用和探索，从而进一步推动AI模型内部逻辑的理解。据悉，Neuronpedia，一个机制可解释性平台，也与DeepMind合作开发了Gemma Scope的演示版。用户可以在演示中输入不同指令并观察模型的响应，比如如果对“狗”特征进行极度放大，模型会在回答美国总统相关问题时莫名加入“狗”的内容，甚至可能回应出“狗叫声”。稀疏自动编码器的有趣之处在于它们是无监督的，可以自主发现特征。例如，Neuronpedia的科学负责人Joseph Bloom提到，在自动编码中，“尴尬（cringe）”特征会在涉及负面评论时激活，这也说明模型能够自主找到与人类情感和判断相关的特征。此外，Neuronpedia还允许用户检索特定概念，标注激活的具体词汇，以了解模型是如何分解和理解人类概念的。这种研究还揭示了AI为何会产生错误。举个例子，研究人员发现，AI模型将“9.11”视作比“9.8”更大，因为模型将这些数字误认为日期。这种错误往往是AI受限于特定的训练数据，经过调整后问题便可纠正。机制可解释性还有许多潜在应用，例如在模型中去除敏感内容。当前LLM模型通常会内置系统级提示，以阻止用户获取不良信息，但通过机制可解释性，模型开发者有望找到并永久关闭这些节点，使AI彻底忘掉特定内容。尽管机制可解释性前景广阔，但目前的技术难以完全控制AI的行为。Neuronpedia的创始人Johnny Lin表示，在模型参数的调整上，技术仍然存在不足。比如，如果通过减少暴力特征来控制模型，有可能会削弱AI在其他领域的知识。总而言之，如果能够进一步深入AI的“心智”，机制可解释性研究将有可能成为实现AI对齐（确保AI行为符合预期）的有效途径。

OpenAI “Operator”的AI代理将首先以“研究预览”形式通过其开发者API推出

Posted on November 14, 2024November 14, 2024 by aitrendtrackers@rengongzhineng.io

继宣布其下一款重要模型Orion不会在今年发布后，内幕消息透露，OpenAI最早可能在明年1月推出一款可以自主控制电脑、完成任务的AI代理。 🔑 关键点：据内部人士透露，OpenAI已向员工透露，代号为“Operator”的AI代理将首先以“研究预览”形式通过其开发者API推出，供开发者反馈测试，随后再向公众发布。 OpenAI的CEO Sam Altman也证实，他认为“下一次重大突破将来自智能代理”，而首席产品官Kevin Weil表示，“2025年将是智能代理系统走向主流的一年。” 与此同时，Anthropic刚刚推出了名为“Computer Use”的自主AI代理，谷歌也宣布计划在12月推出其“上网助手”AI代理Jarvis，可以与用户共同浏览网页。 🤔 为什么值得关注：正如上周提到的，由于缺乏未开发的真实世界数据，AI改进速度正在放缓，迫使像OpenAI这样的科技公司寻找新的方法来训练和扩展新模型。单纯的小幅改进已经无法支撑高昂的成本，而价格的提升对于开发和维护这些昂贵的AI模型至关重要。AI代理的引入被寄予厚望，业界希望这一技术能像ChatGPT一样带来创新飞跃，从而让高额的开发成本物有所值。

Ilya Sutskever AI行业将进入一个新的“探索时代”

Posted on November 13, 2024November 13, 2024 by aitrendtrackers@rengongzhineng.io

OpenAI联合创始人伊利亚·苏茨凯弗（Ilya Sutskever）近日预言，随着大语言模型（LLM）的扩展遇到瓶颈，AI行业将进入一个新的“探索时代”。曾坚定支持“越大越好”理念的苏茨凯弗，如今表示，AI的核心不再是简单地扩大模型规模，而是要“扩大正确的部分”。有消息人士透露，包括OpenAI、Google、Anthropic在内的主要AI实验室均面临类似的困难：大型LLM的训练成本高达数千万美元，系统结构极其复杂，有时甚至需要数月时间才能验证模型是否符合预期。近期的信息显示，OpenAI的新模型Orion、Google的Gemini 2.0以及Anthropic的Opus 3.5均遭遇了技术障碍。苏茨凯弗直言：“2010年代是AI扩展的时代，现在则回归到探索和发现的阶段，大家都在寻找下一个突破。” 为应对当前的技术瓶颈，AI公司纷纷转向“推理计算”（test-time compute），让模型在执行任务时投入更多计算资源。与传统的快速给出答案不同，推理计算方法让AI在给出最终答案前，生成多个备选方案并逐一评估，以此获得更优解。这一新方法有望降低成本，并在保持高效的同时提升模型解决复杂问题的能力。这一变化或将打破Nvidia在AI硬件领域的垄断地位。过去，Nvidia的显卡在训练大型语言模型中占据主导地位，但推理计算的兴起为其他芯片制造商带来了新机遇，例如Groq等公司正专注于开发针对推理计算优化的芯片。随着AI实验室逐渐尝试新策略，AI行业正在从单纯扩展模型规模转向更具智能化的计算方法。这一转变不仅有望提高模型性能，还可能从根本上重塑人机交互的方式，引领AI进入新的发展阶段。

Subscribe 订阅