“开云体育入口”AI交互设计怎么做?谷歌详解自家AI相机设计思路
根据:前几天谷歌在主页上发表博文,详细说明了AI照相机谷歌Clips的设计构想。以下是编译器。像过去多次发生的移动革命和再次发生的网络革命一样,机械学习反省、重建、新的检查我们生活中已经享受的一切。在谷歌用户体验(UX)社区,我们开始了以人为中心的机器学习(HCML)这个工作项目,指导和协助重建世界。
站在这样的视角下,我们在思考机械学习(ML)如何在解决问题的人类市场需求时充分发挥自己的独特性。我们的团队聚集了Google整个公司的各种人才,为UX用户提供机器学习的核心概念,让用户理解如何将机器学习和人工智能最大限度地融入交互设计。
谷歌AI摄像头Google,Clipscamera狩猎的父母、孩子和宠物的现实时刻GoogleClips是谷歌的一种AI射击摄像头,专门用于狩猎周围人的精彩时刻。设备附带的人工智能通过机器学习,可以知道谁是你最亲近的周围人,告诉我如何拍电影,拍出可爱难忘的照片。今天,以这个ai相机为例,详细说明了这三年中如何构筑产品模型、开展工业设计和用户界面。通过这篇文章,我们希望每个人都能理解如何以人为本设计自己的产品。
AI摄像头可以放在同一个框架上,保持惯性。在上图中,我把相机夹在篮子上,抓住了儿子打篮子的精彩时刻。只是将更多的UX用户分配到机器学习的项目中是远远不够的。
更重要的是,让更多的人理解机器学习的核心概念,分解AI阅读能力,围绕最佳实践产品构建信赖。只是,从确认产品建设中哪个模型简单,到数据的收集和评论,以及精致的原型机的建设和测试,机械学习生命周期的各个阶段都是创造性的时机。首先,第一个问题是,为什么用以人为中心的方法构筑机械学习产品和系统是最重要的呢?我们指出了机器学习本身必须在现实中解决问题的理由。
如果在设计中不考虑人的市场需求,只是建立非常强大的系统来解决问题,或者明显不存在的问题。如果AI系统的目标不具体,用户不知道自己在调整系统中的作用,用户就不会根据自己对AI的解读和想象来影响自己的自信。
为了迅速发展,机器学习必须适应环境多学科的任务,即使不需要多学科,如何适应环境人类社会系统也是必须面对的技术问题。机器学习是基于在数据中自动找到的模式和关系进行预测的技术。
一个ML模型的工作就是要弄清楚这些自动找到的模型有多大可能出现错误,这样才能尽可能的保证一般的预测尽可能的准确。但是,这是不够的。从最初创建模型的构想到自由选择训练用的数据来源到样本数据本身、描述和标记数据的方法,模型关系是非的识别标准,机械学习系统的各个方面都依赖于人的识别来调整和修正。总之,那句UX的公理总有一天比用户理解他自己好,在这里发生异常是最重要的。
以人为本提高AI设计的三种方法解决问题的人的确市场需求今年,人们不会用来制约我们的照相机1兆张照片。面对对如此可观的数字图片库时,我们中的许多人实质上会仔细检查网页。初学者的父母特别是这样,感觉婴儿的第一次是他们的日常生活。在珍贵而有一段时间的时候,人们已经习惯用于手机照相机,期待着将来的狩猎和回忆。
但最后的结果是,人们用小屏幕代替所有的感觉,与世界的对话反而更低。作为初学者的父母,你的照片库可能看起来像我上面的手机照片——倒数拍摄,猎取孩子最甜蜜的表情。
因此,我们希望能否创造产品,帮助更关注我们关心的人?不是总是躲在相机后面,而是经常出现在照片里吗?我们能不能立即拍照,不停下来,拿起电话,关上照相机,在镜头中焦虑,维持现实?我们能让摄影师在我们周围随时猎取更现实的生活时刻吗?例如,孩子们的确笑容呢?在现实瞬间过去的时候,我们总有一天背着照相机也不能全部捕猎。这是我们这台AI照相机想满足的人类市场需求。在设计机械智能产品之初,最迫切的问题是,如果人们拍了很多照片,但是想整理的话,怎么显示数据呢这是基本的以人为中心的机械学习项目登场的起点:理论上讲述人类专家继续执行任务的方法。
这个理论有两个含义。第一,如果连人类都不能完成这项任务,AIto也不能完成。第二,通过了解研究专家完成任务的方法,可以找到数据收集、标记、部件模型的结构。当时我们能想的最相似的专家是婚礼摄影师,所以我开始采访了。
我们通过代理开展录用,用于非常模糊的录用信息秘密项目摄影!的双曲馀弦值。’的双曲馀弦值。经过多次检查和运气,我们最后找到了宝库纪录片制作人、摄影记者和美术摄影师的专业素材。
我们一起开始搜集团队成员的镜头材料,试图问难忘的时刻是什么?评价我们的照片和录像质量时,我们必须意识到很多微小的地方,人们的审美本能和个人的生活历史,以前被我们忽视了。例如,每次看到儿子在寻找倾斜的瓶口(左),或者去偷亲戚(中间),我的心情就不会波澜起伏。看到长子在公园骑自行车的时候(右),我很自豪。因为忘了那天他第一次一个人骑自行车。
创建信赖这个项目的最初假设是,我们可以向机械学习模型展示美丽有趣的东西,然后不会自学寻找更多的东西。我们在图片景深、线条原则、光线高低、视频剪辑、情节设计等方面的处理变得更加随意,但令人失望的是,有一天我们找到了,不能高估人类的运用常识和本能能力。这些早期的实验暴露了一些重要的技术差距,协助新的评价产品的假设,确实理解了这项工作的本质。我们改变了工作方式,机器学习并不像我们指出的那样神圣,只有在非常修改的框架下才能有效地自学。
例如,当时的我们不是Go、dog、go,而是使用莎士比亚请告诉我两岁的孩子英语。对我来说,这是AI这个巨大的东西回顾神坛的时刻——AI不意味着解读一切,自己推进教授的科学知识的单一智能。不,那个很远。
回归基础的一致性是教授什么时候的秘诀。例如,当我们教孩子英语时,为了准确发音,我们不会重复同一类词汇(例如,tough,through,through,through中的O-U-G-H,或者,tbat,tat,tat中的a-T),通过一致性,我们可以预测更多同类词汇发音和拼法。自信之后来自一致性。
例如,当一位老师获得两个可能不完全一致的例子时,大多数学生会立即认为他们没有谈判。但是,算法将获得这样的系统。在算法方面,除非有其他命令,算法获得的所有内容对算法都有完全相同的价值。
对于Clips、Camera来说,这意味着我们不仅需要示例之间的一致性,还需要每个示例的一致性。AI必须明确预测各自的框架。
同时,我们还必须教会它可以忽略的内容。捕捉图像,必须训练模型自学的不好的图像。
例如,手在镜头前,慢慢摇晃,镜头模糊。我们用以上例子训练机械学习模型,识别照相机在口袋和钱包中(左图)或照相机被手指遮挡时(右图)。训练模式忽视某些东西的好处不能立即反映,但随着时间的推移,它不会成为我们设计的重要战略部分。
这种训练需要增加摄像机违宪摄影的摄影浪费,捕捉图像的整体质量不会明显下降。线条问题必须训练模型,以保持图像的稳定性和清晰度,并准确取景。如果不注意一点,面部观测模型就不会同等对待框架中心和边缘检测到的面部。
为了培训模式保持对某一对象的连续性,我们必须特别强调一些类似的例子。例如,上图中,左边是我的小儿子在焦点范围内,右图中我的长子只有5%左右的时间在焦点中。确认人物知道你是为你拍的前提。
把照相机对准某人时,他们用笑容和姿势表达同意,可以按下焦点。另外,摄影师是要求照片和线条的人。因此,对于自动照相机来说,我们必须根据社交线索确认你想和谁一起拍照。
我们可以根据你和别人在一起的时间来确认是否拍摄他的照片。编辑的多样性和检查问题在我们的照片上不是大问题。因为我们脑子里总是有一个小声音说:我们还没见过这个。我必须拍照或者你已经拍了太多孩子的照片,可以停下来。
但是,我们的AI模型在这方面需要很多协助。我们从三个方面处理多样性:时间:时间是最简单的图像狩猎信号。摄像头不能复工太久。
视觉:颜色复杂或戏剧性变化可以说明环境和活动的变化。你可以在这里捕捉独特的美好时刻。
人物:你是在很多人中还是一个人中?让相机解读你和多少不同的熟悉面孔是你人生的根本时刻的关键。我把AI摄像头放在书架的边缘,镜头朝下,这个角度正好可以看到我的孩子们积木的场面。
同时,这意味着我在很宽的时间里,向照相机展示了很多相似的内容。为了防止不必要的考验,不能错过很多精彩的时刻,这是一个非常复杂的UX挑战。
用户的信赖和自我效能我们投资AI照相机的原因之一是,设备所具有的用户个人机械学习系统是多么重要,当然还有其他非常强大的功能特征(例如,只需要少量的电力,设备就会变热,设备处理器不需要网络连接摄像头是一个非常私人的物品,我们仍然希望确保这一特点——摄像头的硬件内容和机器智能只属于你。一切都有一天保存在你的照相机里。除非你自己公开。
概念设计侧重于用户的信赖和自我性能,在用户界面设计中也特别强调。这意味着当项目开始时,我们大大假设AI产品应该如何不存在。
当我们开始考虑与未来相关的技术时,很多设计师一下子冲刺了少数派报告和刀锋战士等电影的沉浸体验。但是,请想象一下少数派报告书中的UI有多可怕。打开胳膊,等两秒后抓住空气,坂一挥反方向一起旋转就完成了,多么简单啊完全科幻电影的用户界面有类似的东西,产品的交互模式似乎需要反映科幻系统的变化复杂性。我们早期的设计多次有这样的时间,最后尽量避免这样的幻想,其原因是我们在显着的模拟环境中向人们展示了欺诈内容,人们没有与图像确实交流。
请注意,这个问题不是AI独特的可用性实验室经常发生。我们每天和同行们在一起,对AI未来的想法完全一致。
我们的错误是,记住普罗大众是我们产品设计的参考点。我们总是指出我们的新设计很酷,所以即使产品不能早点构筑,也可以说过去。
大部分产品都有一些学习曲线,但随着AI的热情,必须重点考虑用户的理解费用。对用户来说,产品内容精致时(图a)的可靠性是最重要的。UI界面非常精致,用户必须自学时(图b),必须特别考虑初级用户的体验。
产品功能特别新颖时(图c),您的用户界面必须接近人们熟悉的模式。随着时间的推移,我们退出了那些不简单的幻想。我们开始大幅度减少用户界面的复杂性,获得用户的体验框架,减少用户的熟悉感。
我们在摄像头上减少了软件摄像头和硬件狩猎按钮。从摄像头中的最佳采景框到理想的续航时间,我们都保证用户有最后的决定权。
同时,让摄像头拍摄更多的照片。实质上,让用户看更多的照片,自己删除不太好的照片,更好地解读摄像头能拍摄的画面,提高对摄像头的信赖。经过这个过程,我们发现了另一个关于测试的AI产品的最重要原则。
用于用户的现实内容,创建用户体验模单。后者需要很长时间来构建和部署(与传统软件开发相比,ML。模型的灵活性和适应性也相当差,所以错误的成本也很高),前者可以得到确实的人类视角,人们可以确实从你的产品中获得价值。
用户通过摄像机的流动传输预览他们的照片。在左图中,用户可以自由选择想要收集的照片。在中间图中,用户可以转换为建议的视图。
在右图中,用户可以正确定位想留下的静态图像。在主观和个性化的背景下,终极是不可能的,我们不应该以此为目标。
与传统的软件开发不同,机械学习系统有一天没有被击败。因为预测本身就是模糊的科学。
但是,这种模糊的特性使机器学习非常简单!这是帮助我们生产更强大、更动态的IF语言的真正意义,我们可以用它来设计看起来像XX,就继续执行Y。我们不仅要背离笨拙的逻辑规则,还要舍弃传统的用户参与方式。谷歌AI相机的顺利性在于保存、删除、页面和编辑(这些都是最重要的),但更重要的是用户的作者身份、机械和用户的联合自学和大幅度改良。
我们希望通过这个产品,让用户忘记照片,享受乐趣。以目的设计传统AI范例的新定位,寻找使机器更加智能的方法,寻找提高人类能力的方法,可以释放机器学习的更好潜力。它不会成为前所未有的创造性探索工具。
帮助我们找到自己和周围世界内在模式的工具。在以人为本的机器学习项目中,我们有无数机会用AI创造更人性化、更多文化的世界。
这都要从我们的本源到达:寻找和解决问题市场需求,确保人类的价值。我们为了强化人类的能力而设计,不是为了机器的自动化而忘记的。人工智能的发展不是老板,而是在杂草中失的针,而是帮助清扫杂草,自己寻找那个针。
viadesign.google(公共编号:)编译器的原文章允许禁止发布。下一篇文章发表了注意事项。
本文关键词:开云体育入口
本文来源:开云体育入口-www.hslsls.com