Google 这波操作太炸了!Gemini 现在不仅能“听”“说”“读”“写”,还正式解锁“看”的能力!全新上线的实时视觉功能,允许它通过手机屏幕或摄像头画面,直接进行 AI 级别的“眼观六路、智能解读”。
目前这一功能已开始向部分 Google One AI 高级订阅用户陆续开放,尤其在一些小米手机上已经有用户晒出实测视频了。Gemini 现在可以实时“看”你的手机画面,比如你打开一个网页、一个 App,它就能理解屏幕内容,并对用户的问题作出回应。
更炸的是,“看镜头”功能也上线了。用户对着手机摄像头展示物体,Gemini 就能像个聪明的朋友一样给出建议。比如,有人拿着刚上釉的陶器问它该刷哪种颜色,Gemini 就现场当起了“色彩搭配师”。
这一切背后的技术其实早在去年 Google 的 Project Astra 项目里亮过相,现在终于落地到了 Gemini Live 中。而它的上线时间,也刚好压过了亚马逊 Alexa Plus 的预热期,还把还在“跳票”的 Apple Siri 升级远远甩在后面。
值得注意的是,虽然三星还保留了自家的 Bixby,但在 Galaxy 系列手机上,Gemini 已成为默认 AI 助理。这下来看,Google 在 AI 助手这条赛道上的领先优势,似乎越来越稳了。
一句话总结:现在的 Gemini,已经不只是“智慧大脑”,而是“有眼有脑”的超级 AI 助理。未来的手机使用体验,真的可能会被它彻底改写。