加州州长加文·纽瑟姆否决了一项具有里程碑意义的人工智能(AI)安全法案,该法案遭到了多家大型科技公司的强烈反对。 这项提案本来将成为美国首批针对AI的监管法案之一。 纽瑟姆表示,该法案可能会阻碍创新,并导致AI开发者离开加州。 提出该法案的参议员斯科特·维纳认为,否决这一法案等于允许公司继续在没有任何政府监管的情况下开发“极具威力的技术”。 该法案原本要求最先进的AI模型必须进行安全测试,并且强制开发者确保其技术包含所谓的“自毁开关”,以便在AI系统成为威胁时,组织可以隔离并关闭它。 此外,法案还要求对“前沿模型”,即最强大的AI系统的开发进行官方监管。 纽瑟姆在声明中表示,法案“并未考虑AI系统是否部署在高风险环境中,涉及关键决策或敏感数据的使用”。他补充道,法案将严苛标准适用于大型系统的任何基本功能,而不论其实际用途。 与此同时,纽瑟姆宣布了保护公众免受AI风险的计划,并邀请顶尖专家帮助开发该技术的安全保障措施。 过去几周,纽瑟姆还签署了17项法案,其中包括打击虚假信息和所谓“深度伪造”的法律。这些伪造内容包括通过生成式AI创建的图像、视频或音频。 加州是全球许多最大的AI公司总部所在地,包括ChatGPT的开发公司OpenAI。 由于加州是全球最大科技公司的集聚地,任何监管该领域的法案都会对行业在全国乃至全球范围内产生重大影响。 维纳参议员表示,否决这一法案意味着AI公司仍然“没有来自美国政策制定者的任何约束,尤其是在国会继续陷入无法有效监管科技行业的僵局时”。 国会试图对AI实施安全保障的努力也已停滞不前。 包括OpenAI、谷歌和Meta在内的多家科技巨头对该法案表示反对,警告称该法案将阻碍这一关键技术的发展。 Counterpoint Research的高级分析师魏孙(Wei Sun)表示:“作为一种通用技术,AI仍处于早期阶段,因此像提案那样限制技术本身为时过早。”她补充说,更有利的方法是监管可能在未来造成危害的特定应用场景。
在2024年夏季的Y Combinator展示日第二天活动中,共有9家脱颖而出的初创企业
硅谷知名加速器Y Combinator在本周四举行了2024年夏季创业展示日的第二天活动,和第一天一样,AI依然是众多初创企业的核心焦点。 不过,现场也有几家展现了有趣技术的初创公司,比如抗干扰的无人机、货运拼车服务和天气预测模型。 以下是其中几家亮眼的公司: Entangl Exa Laboratories Kopra Bio LedgerUp OrgOrg Oway Silurian Theseus XTraffic
Allen Institute for Artificial Intelligence (Ai2) 发布开源多模态语言模型 Molmo
Ai2,一家非营利性研究机构,发布了一系列名为 Molmo 的开源多模态语言模型,据称其性能与来自 OpenAI、Google 和 Anthropic 的顶级专有模型相当。https://molmo.allenai.org/ 该组织声称,其最大的 Molmo 模型,具有 720 亿个参数,在测试中胜过了 OpenAI 的 GPT-4o(估计具有超过 1 万亿个参数),这些测试衡量了理解图像、图表和文档等方面的能力。 与此同时,Ai2 表示,一个较小的 Molmo 模型,具有 70 亿个参数,在性能上接近 OpenAI 的最先进模型,它将这一成就归功于更高效的数据收集和训练方法。 Ai2 的首席执行官 Ali Farhadi 表示,Molmo 表明开源 AI 开发现在与封闭、专有模型不相上下。开源模型具有显著优势,因为它们的开放性意味着其他人可以在它们的基础上构建应用程序。Molmo 演示可在[链接]上找到,开发者可以在 Hugging Face 网站上对其进行试验。(最强大的 Molmo 模型的某些元素仍然受到保护。) 其他大型多模态语言模型是在包含数十亿个从互联网上收集的图像和文本样本的庞大数据集上训练的,它们可以包含数万亿个参数。这个过程给训练数据带来了大量噪声,以及随之而来的幻觉,Ai2 的高级研究总监 Ani Kembhavi 说。相比之下,Ai2 的 Molmo 模型是在一个明显更小且经过精心挑选的数据集上训练的,该数据集仅包含 60 万张图像,并且它们具有 10 亿到 720 亿个参数。Kembhavi 说,专注于高质量数据而不是不加选择地抓取数据,导致在更少的资源下实现了良好的性能。 研究人员长期以来对什么是开源…
诚实的人力资源招聘人员告诉你,为什么大多数求职者无法获得工作机会
作为一位曾经为各种科技初创企业招募了数百名来自各行各业人才的人,原以为招聘“明星员工”的过程已相对掌握。然而,近年来,招聘流程发生了巨大的变化。如今,不仅对优秀人才来说,找工作变得更加艰难,现有的招聘系统似乎也在有意无意地阻碍着找到最适合职位的人选。 招聘行业的现状在过去二十年里,与招聘人员的合作经验中,存在各种类型的招聘者:有些毫无用处,有些极其优秀,甚至有少数成了朋友。在撰写一篇关于虚假工作信息泛滥的专栏时,和一位长期合作的资深招聘朋友——姑且称她为“罗莎”——进行了一场长时间的深入讨论,试图寻求一些招聘行业的“秘诀”。 出人意料的是,罗莎并没有什么所谓的“秘诀”,她给出的更多是“严厉的爱”。通过这次交流,她总结出大多数求职者无法找到理想工作的几个关键原因,这些理由并非陈词滥调,而是相当发人深省的事实。以下几点可能会让求职者感到刺痛,但它们揭示了求职过程中最常见的误区。 1. 简历质量堪忧令人惊讶的是,许多非常有才华的人往往将他们的才华隐藏在结构化、正式、甚至晦涩难懂的文字堆中。罗莎提到:“我在看简历时最先寻找的是空白空间。如果你做过一些重要的事情,应该能够用简短的几句话就能突出这些成就。” 相反,那些依靠外界环境顺风顺水度过职业生涯的人,他们的简历往往会成为冗长的、充满流行词汇的、过度设计的“词语沙拉”。简历应简明扼要,突出求职者的核心优势和匹配度,而不是用大量没有实际意义的词汇充斥。 根据罗莎的经验,简历作为个人传记的时代已经结束。现代简历的目标是将候选人的定性和定量方面与具体职位进行匹配。如果求职者最近没有做过重要的事情,也无需夸大简历的内容。简历的长度不应成为衡量成就的标准,重要的是简洁明了地展示求职者的经验,突出与应聘职位的相关性。 2. 缺乏工作之外的表现求职者的竞争优势不仅在于工作中的表现,还在于他们在工作之外的主动学习和展示。在与罗莎的对话中,她强调了这样一点:“你知道你的优势是什么吗?是你展示你在工作之外的持续思考和深度参与。”这不仅仅是列出一系列的兴趣爱好或课程,而是要展示出真正的行动,表明求职者对所在行业的热情与动力。 例如,对于一位软件开发人员来说,简历上简单罗列编程技能或所修课程远远不够。求职者需要展示自己在工作之外也在不断钻研软件开发,这可以通过参与开源项目、撰写技术博客、或者在行业论坛上的活跃贡献来体现。 罗莎对此直言不讳:“我真的不在乎你是否跑过马拉松,或者你是不是一个好父亲。这些只是些不错的聊天话题,但它们几乎不可能成为你获得面试机会的决定性因素。”换句话说,求职不是大学申请,重点应放在工作相关的技能和经验上,而非个人生活。 3. 缺乏准备很多求职者并没有意识到,准备工作不仅仅是在面试当天开始,而是在提交申请时就已经开始了。随着求职过程的数字化,许多求职者采取“广撒网”的策略,投递大量简历,寄希望于其中之一能成功。这种方法不仅效率低下,还浪费了大量时间和精力。 真正的招聘人员不想进行数量游戏。他们希望看到的是求职者对所申请的公司、职位、行业以及公司文化的深入了解。罗莎指出,求职者往往花费过多时间思考自己的优势,却很少考虑公司真正需要什么。因此,求职者的简历不仅需要清晰明了,还要根据具体职位进行量身定制,体现与公司需求的契合点。 找到与职位匹配的关键点,并在简历、求职信甚至面试中加以展示,可以帮助求职者在众多竞争者中脱颖而出。 4. 回答问题缺乏针对性罗莎还谈到了求职者在面试中的表现。她指出,很多求职者在回答面试问题时,给出的答案往往空洞无物,缺乏实质性内容。她认为,面试不仅是展示求职者的专业能力,更是展现其真实性和信心的机会。虚假的回答不仅无法打动面试官,反而可能适得其反,让人觉得求职者缺乏诚意。 罗莎强调,面试中应展示出对自身价值的自信,并通过具体的事例和成就来证明这一点。那些过于模糊或敷衍的回答,不仅无法展现求职者的真正实力,反而会让面试官怀疑其能力。 5. 求职依然是双向选择尽管招聘流程因数字化转型而变得更加复杂和充满挑战,但诚实和努力依然是通向成功的唯一途径。尽管数字化和自动化招聘工具让求职变得越来越像一场无奈的博弈,但找到最适合的候选人与最适合的职位的本质依然没有改变。 追逐梦想的道路与梦想本身并没有太大区别——做你热爱的事情,并因此获得报酬与认可。尽管这一目标看似越来越难以实现,但通过诚实地面对自己的优势与不足,付出努力并不断尝试,依然能够获得理想的职位。 总结而言,成功的求职不仅仅在于拥有丰富的工作经验,还在于简历的简洁明了、对公司需求的深入了解、以及在面试中展现真实的自己。真正优秀的候选人不仅是在工作中展现出色的表现,还在工作之外积极提升自我。只有做到这些,才能在竞争激烈的职场中脱颖而出。
FLUX.1 AI图像生成行业的新挑战者
近年来,AI图像生成行业发展迅猛。 当OpenAI(就是开发ChatGPT的公司)在2021年推出DALL-E图像生成模型时,引起了极大关注,因为将文本转为图像在当时还没有听说过。然而,随着OpenAI不断推出更新的模型,全球逐渐意识到,这项技术将对多个行业产生颠覆性影响。 亿美元级的AI图像生成市场 根据研究数据,2023年全球AI图像生成市场收入达到了3.496亿美元,预计到2030年将飙升至10.81亿美元。 很多公司已经开始使用这些图像生成器,尤其在广告创作上,这大大节省了成本。你可能已经看过可口可乐的热门广告,或者注意到那些利用AI技术进行品牌代言的虚拟网红。应用场景多到数不清。 甚至电商巨头亚马逊也已经在广告中使用AI生成的逼真模型了。 例如,亚马逊印度的应用程序中,广告使用的就是AI生成的图片。亚马逊印度已经开始用AI图像进行广告展示。 在这个前景广阔的AI图像生成市场上,活跃着很多公司,例如Midjourney、Adobe、OpenAI、Stability AI、Google、微软、Leonardo AI、Runway AI等,名单还远不止于此。 截至2024年7月,市场领先的AI生成模型包括Midjourney V6.1、OpenAI的DALL-E 3以及Stability AI的Stable Diffusion(开源)。但2024年8月1日,一家名为Black Forest Labs的初创公司发布了FLUX.1,令行业内的一些专家感到震惊,也让许多顶尖的AI图像生成公司感到压力。 新晋强者——FLUX.1 https://flux-ai.io/ FLUX.1系列模型定义了一个新的标准,提供了更高的细节表现、对文本提示的更好遵从、多样化风格以及更复杂的场景构建。 FLUX.1的背后团队正是最初开发Stable Diffusion技术以及潜在扩散算法的原班人马。这家公司位于德国,已经筹集到了3100万美元的种子资金。 FLUX.1包含三种模型: FLUX.1 Pro 这是旗舰模型,以其卓越的文本提示响应能力、视觉质量、图像精细度以及输出多样性而著称。该模型主要通过API提供,适合商业应用,非常适合专业需求。 FLUX.1 Dev 这是FLUX.1 Pro的精简版,专为非商业用途设计。它保留了与FLUX.1 Pro类似的质量和提示响应能力,同时比同类标准模型更高效。该模型是开源的,用户可以自由使用它进行个人和研究目的,而不受商业限制。 FLUX.1 Schnell 这是FLUX系列中速度最快的模型,专为本地开发和个人使用优化。它在Apache 2.0许可下开放,适合想要快速原型设计或个人项目的用户,优先考虑速度和效率。 如何访问FLUX.1模型 最简单的方式是通过Hugging Face平台访问,该平台是一个专注于自然语言处理(NLP)和机器学习的AI社区。用户可以在Hugging Face上找到FLUX.1 Dev和FLUX.1 Schnell的空间,并根据需要输入提示生成图像。 不过,Hugging Face的使用频率有限制,这意味着在高峰期可能需要较长的等待时间。为了解决这个问题,Black Forest Labs还与多个合作伙伴(如fal.ai、replicate和Freepik等)合作,用户可以选择免费的或付费的计划。 在Freepik平台,FLUX.1的各个模型被称为不同的模式:FLUX.1 Schnell为Flux Fast模式,FLUX.1 Dev为Flux模式,FLUX.1 Pro则是Flux Realism模式。 FLUX.1生成的图片展示 FLUX.1生成的图像可以说是令人惊叹,它们的质量已经让很多用户大为赞叹。这种开源工具的一个重要优势是,用户可以根据需要自定义并添加新功能。 以下是几个例子,展示了FLUX.1模型生成的高质量图像:…
OpenAI计划取消其非营利组织对公司的控制权,并首次为首席执行官萨姆·阿尔特曼分配股权
据知情人士透露,ChatGPT的开发者OpenAI正计划重组其核心业务,转型为一个营利性的公益公司,不再由其非营利董事会控制。这一举措旨在使公司更具吸引力,吸引更多投资者。据路透社报道,OpenAI的非营利组织将继续存在,并持有新营利公司的一小部分股权。此外,新的治理结构可能会影响公司如何应对AI风险。 消息还指出,OpenAI的首席执行官萨姆·阿尔特曼将首次获得该营利性公司的股份,而重组后的公司估值可能高达1500亿美元,并且有意取消投资者收益上限。由于这些信息涉及私密内容,消息来源选择匿名。 OpenAI的一位发言人表示,公司仍专注于开发对所有人有益的人工智能,并正与董事会合作,确保实现这一目标。非营利组织仍然是公司使命的核心,并将继续存在。该公司拟议的结构调整方案,背后涉及重大治理变革。目前,律师和股东仍在协商具体方案,重组完成的时间尚不确定。 此外,OpenAI近期还经历了一系列高层变动。公司长期首席技术官米拉·穆拉蒂在周三突然宣布离职,OpenAI的总裁格雷格·布洛克曼也处于休假状态。 OpenAI成立于2015年,最初是一个非营利性AI研究组织,2019年增加了一个营利性的子公司OpenAI LP,以获得微软等公司的资金支持。自2022年推出生成式AI应用ChatGPT以来,OpenAI迅速走红,吸引了超过2亿每周活跃用户,全球掀起了AI投资热潮。OpenAI的估值也从2021年的140亿美元飙升至当前讨论中的1500亿美元,吸引了Thrive Capital和苹果等投资者的关注。 OpenAI的独特结构使其非营利组织控制营利性子公司,旨在确保其使命——创造安全且广泛有益的AGI(通用人工智能)。然而,去年11月,一场引发广泛关注的董事会危机中,非营利董事会曾一度解雇阿尔特曼,随后在员工和投资者的强烈支持下,他在五天后被复职。如今,OpenAI的董事会已被更多科技高管刷新,由前Salesforce联合CEO布雷特·泰勒担任主席。 非营利控制权的移除将让OpenAI更像一个典型的初创公司,这一变化受到投资者的普遍欢迎,但也引发了AI安全社区的担忧。今年早些时候,OpenAI解散了专门研究AI长期风险的”超对齐”团队,令外界质疑其是否仍具备足够的治理机制来实现对AGI的责任承担。 目前还不清楚阿尔特曼将获得多少股权。尽管阿尔特曼此前已通过其他初创投资成为亿万富翁,但他曾公开表示,自己之所以不持有公司股权,是因为董事会需要没有公司利益相关的成员。他也曾表示,自己已经不缺钱,做这一切是出于对工作的热爱。 新的公司架构将类似于OpenAI的主要竞争对手Anthropic和埃隆·马斯克的xAI,这两家公司也都注册为公益公司,既追求利润,又强调社会责任和可持续发展。
Meta发布了新版本的开源AI模型Llama 3.2
Meta在2024年Connect大会上发布了新版本的开源AI模型Llama 3.2,这些小型和中型模型能够在边缘设备和移动设备上运行工作负载。Llama 3.2支持多语言文本生成和视觉应用,如图像识别。这是Meta首次推出的开源多模态模型,能够实现需要视觉理解的多种应用。 相比7月发布的Llama 3.1(拥有4050亿参数,是史上最大开源AI模型),Llama 3.2的模型尺寸更小,参数范围从1亿到90亿,适合那些计算资源有限的研究人员。小型模型(1B和3B)专注于文本输入,可以在Qualcomm和MediaTek的硬件上运行,并且经过优化能在Arm架构处理器上本地运行。这种本地处理不仅速度快,而且更安全,因为数据无需上传至云端。 中型模型(11B和90B)则支持多模态输入,能够处理文本和图像,例如用来理解图表和财务报表中的销售数据。 在性能上,Llama 3.2表现优于OpenAI和Anthropic的领先模型。3B版本在任务跟随和内容总结上超越了谷歌Gemma 2 2.6B和微软Phi 3.5-mini,而90B版本在多个基准测试中击败了Claude 3-Haiku和GPT-4o-mini。 为确保安全,Meta在Llama 3.2中引入了新“守护”功能(Llama Guard),增加了图像理解的防护措施,并为小型模型优化了Llama Guard,使其更小巧但仍具备基本功能。 Llama 3.2模型现已在llama.com和Hugging Face上开放下载,用户也可通过谷歌云、AWS、Nvidia、微软Azure等云合作伙伴访问这些模型。Together AI还提供了免费访问Llama 3.2视觉模型(11B)的机会,加速开源AI的应用。 https://huggingface.co/meta-llama
Meta宣布为Ray-Ban Meta智能眼镜增加全新AI功能
Meta宣布为Ray-Ban Meta智能眼镜增加全新AI功能,让用户体验更加智能和便捷。现在,眼镜不仅可以记住你停车的位置,还可以实时翻译语言、识别周围的事物,并提供更多实用的功能。通过与Spotify、Amazon Music以及新加入的Audible和iHeart的合作,用户可以轻松通过语音命令播放音乐或有声读物,让娱乐体验更加丰富。 AI功能的提升使用户无需重复唤醒“Hey Meta”就能连续提问。同时,Meta AI现在支持语音录制和发送WhatsApp或Messenger消息,解放双手,方便随时随地与他人沟通。此外,用户可以请求AI提供实时视频帮助,比如在探索新城市时,AI可提供景点解说或推荐路线,甚至在超市购物时,帮助用户做出食材搭配的决策。 未来,眼镜还将具备实时翻译功能,用户与讲西班牙语、法语或意大利语的人交流时,眼镜会自动将对话内容翻译成英文并通过开放式耳机播放。这项功能不仅方便旅行,还能拉近人与人之间的距离。 在合作方面,Meta与Be My Eyes应用合作,为视障者提供帮助。通过眼镜的视频通话功能,志愿者可以看到用户的视角,协助他们完成日常任务,比如调整温控器或整理邮件。 最后,Meta推出限量版透明镜框和新型变色镜片,进一步展现创新科技与设计美学的结合。这些升级让Ray-Ban Meta眼镜变得更智能、更有趣,同时也更具时尚感。
Meta发布了全新Meta Quest 3S头显
在Connect大会上,Meta发布了全新Meta Quest 3S头显,这款设备与Meta Quest 3具备相同的混合现实功能和强劲性能,但价格更亲民,仅售299.99美元。Quest 3S是为那些初次接触混合现实或希望从Quest或Quest 2升级的用户量身打造的最佳选择。 与Meta Quest 3一样,Quest 3S支持全彩透视功能,用户可以在虚拟与现实世界之间自由切换。这款设备不仅能让用户在大屏幕上观看电影、进行健身训练、享受多任务处理功能,还能畅玩各种游戏,性价比极高。Meta Quest 3S的推出标志着Meta Quest 3系列的进一步扩展。 在2024年,Meta对Quest生态系统进行了多项改进,包括重新构建了Meta Horizon OS,增强了空间音效,提升了透视功能的对比度和色彩表现。此外,Quest 3S还具备旅行模式,甚至可以在旅途中使用。未来Meta还计划支持更多场景,如火车旅行模式、躺下使用头显、升级Meta AI以及唤醒功能“Hey Meta”。 Quest 3S支持数千款应用程序和游戏,未来还将推出如《蝙蝠侠:阿卡姆之影》等Quest 3和3S独占游戏。Meta也宣布将512GB版本的Meta Quest 3价格从649.99美元降至499.99美元,四倍的存储空间、4K+无限显示和超广视角,使其仍然是技术发烧友和游戏玩家的首选。 总的来说,Meta Quest 3S让混合现实体验更加普及,进一步推动了这项技术的未来发展。
OpenAI首席技术官Mira Murati宣布她将离开公司
OpenAI首席技术官Mira Murati在周三于X平台发文宣布她将离开公司。她表示,在OpenAI度过了六年多的时光后,决定离开,开启自己的探索旅程。Murati在帖子中说道:“经过深思熟虑,我做出了离开OpenAI的艰难决定。尽管没有理想的时机告别一个珍惜的地方,但此刻感觉恰到好处……与OpenAI团队共事的六年半是一段非凡的经历。” 针对这一消息,OpenAI的发言人拒绝进一步评论,只是将TechCrunch引向Murati的推文。CEO Sam Altman随后也在X上回应了Murati的帖子,表达了对她的感谢。他表示:“目前我们还会稍后公布更多的过渡计划,但此刻,我只想表达我的感谢。对她帮助我们取得的成就,我心怀感激,尤其是在艰难时刻她给予的支持和关爱。” Murati的决定正值OpenAI年度开发者大会DevDay即将举行前一周。去年年底,OpenAI前董事会突然解雇了Altman,Murati曾一度被任命为临时CEO。报道称,Murati与前首席科学家Ilya Sutskever一起向董事会表达了对Altman行为的担忧,导致了这一变动。 目前,Altman正在逐步加强对OpenAI的控制以及其形象的塑造。本周一,Altman撰文称OpenAI可能在未来几年内实现“超级智能”,并有望首次获得公司股权,OpenAI也正在从非营利性结构过渡。 Murati于2018年加入OpenAI,最初担任应用AI和合作伙伴关系副总裁,2022年晋升为首席技术官。在此期间,她领导了ChatGPT、DALL-E、Codex等项目的发展,这些AI技术广泛应用于GitHub的Copilot产品。 在加入OpenAI之前,Murati拥有达特茅斯学院的机械工程学位,并曾在高盛和法国航空航天集团Zodiac Aerospace实习,随后在特斯拉担任Model X项目的高级产品经理,期间推出了早期版本的Autopilot。她还曾在Leap Motion公司担任产品和工程副总裁,致力于开发手指追踪技术。 作为OpenAI的CTO,Murati也因发表颇具争议的言论而闻名。她曾在采访中模糊表示OpenAI的AI会达到“博士水平的智能”,并在今年六月声称一些创意工作可能会被取代,而且这些工作“不应该存在”,因为它们的内容质量并不高。 Murati是近期离开OpenAI的多位高层主管之一。前首席科学家Ilya Sutskever和安全负责人Jan Leike在五月离职,联合创始人John Schulman也在上个月宣布加入竞争对手Anthropic。与此同时,OpenAI的总裁Greg Brockman则将休假至年底。 Murati的离职恰逢OpenAI正寻求一轮融资,估值预计超过1500亿美元。据报道,微软、Nvidia、苹果和Thrive Capital正在与其洽谈,融资金额可能高达65亿美元。 OpenAI目前急需资金。据消息称,公司已经在模型训练上花费了约70亿美元,员工成本达到15亿美元。仅ChatGPT的运营费用每天就高达70万美元,而训练GPT-4模型的成本超过1亿美元。