打脸苹果和!刚刚发布的,让手机的体验抢先一步

当人们还在排队灰测GPT-4o的语音模式,当苹果的AppleIntelligence只能在Beta版体验部分挤牙膏的功能时,今天Google彻底掀桌了,将这些之前只在发布会惊艳的功能,直接塞进了刚刚发布的Pixel9系列里了。

过去Pixel一般在10月发布,这次提前亮相,让Android抢先iOS成为首个拥有大型设备内多模态AI模型的移动操作系统——GeminiNano。

不是期货,马上能用。矛头直指苹果和OpenAI的Google没少在发布会上调侃那些「即将推出」的AI功能。

虽然Google今年在AI产品发布上屡次翻车,但这次将Gemini模型和一系列AI功能整合到手机里,让我们看到Android这个全球最多人用户的操作系统,该怎么用AI重塑,给智能手机带来真正来自由里到外的更新。

让我们先看看这次发布会主要的更新:

GooglePixel系列迎来了四款AI手机:Pixel9、Pixel9Pro、Pixel9ProXL以及Pixel9ProFold

对标GPT-4o高级语音功能的GeminiLive落地手机,未来几周内向iOS设备开放

Gemini支持实现多个应用跨界调用的无缝体验,承诺用户个人数据不会被发送给第三方AI提供商

AI图像功能迎来迭代进化,推出Addme与MagicEditor新功能

买GoogleAI送手机

Google紧握的救命稻草便是当下最为风头正劲的词汇——人工智能(AI)。

当AI落地端侧成为众所瞩目的命题作文时,如何把Gemini更好地塞进手机等端侧设备里,成了本场发布会的最大悬念,好在Google也没有让我们的期待落空。

在本场发布会上,Google推出了重磅的GeminiLive功能。简单来说,你可以将之理解为你的聊天搭子。

类似于GPT-4o的高级语音模式,GeminiLive能够让你与Gemini进行自由流畅的交流,并且提供了包括名为Ursa和Dipper在内的10种新的语音选项。

感受一下Gemini多变的声线在对话过程中,你甚至随时可以打断Gemini的回应,深入探讨某个话题,或是暂停对话,稍后再继续。

此外,GeminiLive现在也支持免提功能,用户即使在手机后台或者锁屏的状态下也能与Gemini进行对话,这样无论是在走路还是忙于其他事务时,都能像普通电话一样随时进行交流。

即日起,GeminiLive将在Android手机上向Gemini高级订阅用户推出英文版本,未来几周内还将支持iOS设备,并增加更多语言选项。

GeminiLive不仅仅只是Gemini嵌入Google端侧设备的一个缩影,也昭示着Google对于整合Gemini至其应用生态不再是模糊的概念,而是日渐成型的蓝图。

另一个典型的案例就是,上机的Gemini省却了在不同的应用程序和服务之间来回切换的繁琐,真正意义上实现多个应用跨界调用的无缝体验。

比如你要举办晚宴,那么你可以使用Gemini来搜索Gmail中的千层面食谱,并要求Gemini将食谱中的食材添加到Keep应用的购物清单中。

又或者,在未来你可以随手拍摄一张音乐会传单的照片,询问Gemini在那一天是否有空闲时间,Gemini将能够访问你的日历信息给出回复,如果你恰好有空,它还可以帮你设置一个提醒,以购买音乐会的门票。

在发布会现场,Google高管DaveCitron也演示了这项功能。

声称所有演示都是现场直播的Citron通过拍摄SabrinaCarpenter音乐会海报的照片,然后让Gemini检查他的日历,看看他是否在这位艺术家今年来到旧金山时有空。

结果Gemini在最初的两次尝试中都没有响应,直到Citron换了手机后,Gemini才最终给出了回应。

通过长按电源按钮或是轻声呼唤「HeyGoogle」,你还可以随时在Pixel上激活调用Gemini。

无论是在YouTube上观看旅行视频时查看信息,还是需要将Gemini生成的图像拖放到Gmail或GoogleMessages中,Gemini都能迅速响应你的需求。

为了提高响应速度和质量,Google也引入了Gemini1.5Flash这样的新模型。并且,Google还计划与其他服务进行更深层次的集成,包括但不限于GoogleHome、Phone和Messages。

至于用户最为关心的隐私安全问题,Google也承诺Gemini将在Google的安全云内部处理复杂的个人数据,以确保用户的个人数据不会被发送给任何第三方AI提供商。

Pixel9,全系登场

在这场提前了两个月的年度盛典上,Pixel9系列登场。

今年,GooglePixel系列迎来了四位成员,分别是Pixel9、Pixel9Pro、回归的Pixel9ProXL以及Pixel9ProFold,这四台手机均搭载了Google自研的TensorG4处理器。

TensorG4处理器使用1 3 4的内核配置,由一颗Cortex-X4、三颗Cortex-A720与四颗Cortex-A520组成,与Pixel8上的TensorG3处理器相比(或更以前的芯片),TensorG4中新的Cortex-X4提升了约11%的单核性能,但由于缺少一个内核(Cortex-A720),所以与TensorG3相比,多核结果预计只会上升约3%。

GooglePixel9ProXL与上一代Pixel8Pro跑分对比

不过,芯片的短暂停滞并没有影响Google使用AI的决心:这是第一台搭载了GeminiNanoMultimodality多模态模型的手机,Google宣称这个模型比去年推出的模型要强大3倍,复杂程度也提高3倍。

除了新芯片,Google为影像也做足了准备。

虽然Pixel9标准版与上代Pixel8标准版的变化不大,只是将超广角摄像头从IMX386提升到IMX858,但在Pixel9Pro与ProXL上,Google选择「一致强大」的方案:除了主摄使用三星GNK五千万像素传感器外,其他所有摄像头都使用索尼IMX858传感器。

IMX858是目前影像旗舰中最常见的传感器,1/2.51英寸足以在适当的影像模组大小中担任超广角镜头与长焦镜头的成像任务——这与小米14Ultra的相应焦段配置相同。

Pixel从单摄「硬刚」双摄的时代一路走来,终于在今天赶上了影像旗舰手机应有的硬件配置。

AI影像,由「实」入「虚」

在AI浪潮袭来的时候,Google企图踏浪而行——去年的MadebyGoogle与今年GoogleI/O2024大会上,Google公布了大量AI技术,从生成式模型到自然语言处理、从独立app到系统集成,这是一种行为上的「AllinAI」。

乔布斯最认可的计算机科学家艾伦·凯(AlanKay)有句名言:

真正认真对待软件的人,就应该自己做硬件。

Google推出的AI新功能的第一位接棒者,自然是「亲儿子」Pixel,而影像,便是手机AI的大展拳脚之处。

Google将Pixel9系列的相机称呼为「世界上第一款AI相机」,足以见证除了旗舰级别的摄影模组外,Google对全新AI的加持抱有同样的信心。

在Pixel8中,有一个专为合照准备的功能:BestTake

在拍照时,有时难免会拍下不符合当时情景的表情和姿态,BestTake会拍摄多张照片,通过AI选择出这些照片中每个人最好的一部分自动合成,如果你对AI选择的不满意,也可以手动进行选择,最后合成在一张照片中。

而在Pixel9中,为了帮助你更好地合照,Google又搞了新花样:Addme。

这个新功能企图解决你在没有外人的帮助下进行「非自拍合影」的困难——你只需要将Pixel9举起来拍摄朋友,再让朋友在同样位置将Pixel9对准你,Addme会自动帮你们合成在一张照片中。

这有些像摄影中常用的手法——堆栈:将相机稳定后,拍摄同一场景下不同位置的人物,再将这些拍摄的照片放入Photoshop或其他后期软件中进行对齐,最后合成在一起,将不同的人物呈现在同一张照片上。

使用相机进行堆栈拍摄的照片

现在,在AI的加持下,Pixel9在抬手之间就能完成这个复杂流程。

如果说Addme只是「堆栈」技术的自动化,那么「MagicEditor」的新功能,则是将手机影像真正带到了「真实」与「虚假」的交汇点。

升级后的「MagicEditor」成为了真正的「魔术编辑器」:除了前代的改变画面曝光、去除背景与移动画面元素外,只需要输入相应的文字,就能创造出根据用户脑海中的画面。

简而言之,这就是我们常说的文生图模型。

文生图,已经不算是AI技术中的「新鲜」家伙了,例如OpenAI开发的DALL-E与开源的StableDiffusion等模型都早已是我们熟悉的作图帮手,经过多次迭代,各类创作可以说是信手拈来。

使用Midjourney生成的图片

不过,传统的模型都需要我们使用网页或是Discord等渠道才能访问,更有甚者需要自己配置本地的操作界面,才能顺利使用,而Pixel9系列则简单多了——你只需要解锁手机后输入文字,MagicEditor就可以帮你完成这一切。

这离不开Google对于生成式AI的技术储备——Google旗下的Imagen从2022年5月开始,就为使用者提供AI图像生成服务,例如我们最讨厌的人机验证程序。

作为Android阵营的嫡长子,Pixel一直以来都比较低调,但谁也不能忽视它的存在——Google有任何新技术,总是第一时间交给它,久而久之,Pixel变成了一种指路标:Addme与MagicEditor两个新功能,也许会是未来一段时间内Android对于AI摄影技术运用的方向。

AI手机,可能为时尚早

今年以来,我们已经看过不少打着AI手机噱头的发布会,GooglePixel9系列交出的这份答卷虽有不少惊喜,但总体上也没有脱离以往的框架,AI要成为影响消费者购买的主要因素还为时尚早。

与苹果WWDC大会上精心策划的演示相比,以往饱受PPT画饼诟病的Google明显多了几分松弛感,至少敢在发布会现场向世人掏出实打实的真家伙。

这种从容自信也融入到今天发布的产品上。Google在系统级AI集成方面的成熟度,使其在图像处理、语音助手和智能搜索等领域的表现尤为出色。

就拿苹果和Google在AI功能上的效果来说,苹果有升级版Siri,Google有更自然对话的GeminiLive,苹果ImagePlayground允许用户在信息等应用中创作图像,生成素描、插图和动画等样式的图像,而GooglePixelStudio也允许用户创作个性化的贴纸……

甚至Google的AddMe功能通过AI集成不同照片中的人,确保每个人都能出现在合影中,也都是相当实用的功能。

基于这些先发底气,这或许也是Google在发布会上明里暗里频繁cue苹果的重要原因。

不过,即便去年Google先苹果一步推出了搭载不少AI功能的Pixel8系列,但市场反应并非总是与技术进步成正比。

一份来自国际数据公司IDC的报告显示,打脸苹果和!刚刚发布的,让手机的体验抢先一步2023年Pixel手机在美国市场的份额仅为4.6%。这也反映了当下AI手机的痛点:AI功能固然重要,但尚未成为绝大多数消费者决策的核心因素。

而在端侧模型的能力还没突破到一个理想的水平之前,所有硬件厂商都要面临的问题是,长久以来依赖云端模型实现的AI功能,比起端侧模型整合在系统层面上的体验还要逊上一筹。

Google的翻身仗或许还要再晚上一阵,但凭借软硬件的技术闭环,谁也指不准GooglePixel会不会很快就攻守易形态也,而这同样也是其他全力押注AI手机厂商的最大野心。

文|周奕旨莫崇宇

版权声明

本文仅代表作者观点,不代表百度立场。
本文系作者授权百度百家发表,未经许可,不得转载。

分享:

扫一扫在手机阅读、分享本文

允霆科技

允霆科技网是一家以科技创新为核心,为客户提供各类科技新闻、科技资讯、科技产品评测、科技解决方案等科技行业服务的高科技企业。

最近发表