人工智能,这个曾经经常出现在科幻作品里的词汇,如今已经成为我们日常生活的一部分,相信大家从我们最近的文章中也能看出来端倪。但随着人工智能领域的演进,一些之前还潜伏着的挑战也慢慢浮出水面——那就是如何处理好人工智能与人的关系,如何理解该领域存在的偏见 (当然也包括技术层面上的人为偏见造成的样例训练偏见) 造成的影响力,以及如何在新的技术时代遵循以人为本的设计方针,是至关重要的。
正如我们在Google Design 2018 总结中提到的,People + AI Research (PAIR) 团队正是为应对这个挑战而生,这个 Google 团队专注于提供深度文章、资源以及框架,从而确保我们在打造人工智能产品时始终不会偏离 "人" 这个核心。本文算是 PAIR 专栏文章的热身。
作为 UX 团队的一部分,设计师有责任了解我们的应用和网站的内部运作方式。然而,在我们以人工智能为重点开始构建产品和服务时,这项工作就可能会更具挑战性了——虽然在计算机科学领域里,人工智能并不是什么新课题 (人工智能滥觞于上世纪 50 年代*),但对于我们这些从事消费产品用户体验设计和内容策略的人来说,"人工智能" 依然是一个全新的设计原点,包括其运行逻辑和美学。
* 包括大家经常提到的 "图灵测试" 也出自该时期。
在 Google,我们致力于向用户以及更广义上的公众提供一个简洁的解释: AI 系统是如何运作的——这个领域越是透明,人们对其了解越是透彻,其接受度和发展助力也会越大。我们面对的对象有很多种: 新手、专家、研究人员、开发者、设计师、内容策略制定者或政策倡导者——这些人对如何使用或应用同一个 AI 术语,以及对这个术语的期望也许会非常不同。
如果这些人的认知都可以同步的话,我们就可以对 ML 和 AI 从业者使用的某些关键术语形成一个共同的、特定的理解*,从而帮助 UX 团队更好地沟通,不仅限于探讨如何满足用户需求,还可以通过简单清晰地解释这些系统的工作方式,来更进一步建立用户对 AI 系统的信任。
* 在任何行业,统一的术语都是高效且准确进行沟通的重要基础。
为了确定 UX 设计师们会接触到的基础术语,我们回顾了 People + AI Research 专栏中的首批文章,看看哪些 AI 术语的出现次数最多。我们还询问了 Google 的数十位设计师: ML 对他们意味着什么,他们如何用自己的语言定义 ML。
之后,我们编写了一个基本的 AI 词汇表,我们从中找出了 UX 设计师、研究人员和内容策略师常用的 (并经常被误解的) 六个术语。在这里,我们用简单清晰的方式来阐述它们,做为之后文章的 "术语基础"。
使机器智能化的科学,使它们能够识别不同的模式,并提高机器帮助人们解决特定问题或完成多种挑战的能力。
当计算机程序根据预测的内容作出应对的决策时,我们就说它具有人工智能——这个过程可能是通过简单的基于规则的或启发式的逻辑方法来实现的,例如 "如果下雨,那么就带上雨伞"。但是在机器学习 (见下文) 中,这个决策不是通过固定的逻辑,而是是通过学习来作出的。
人工智能的一个子领域,其中包括开发人工智能的技术和方法。旨在让计算机程序能完成特定的任务,但人们无需逐步编写完成该任务的具体逻辑。
有很多方法可以让计算机程序学习东西。PAIR 专栏中经常提到的是监督式机器学习 (supervised learning) ,程序会学习如何通过成千上万的例子进行预测,比如预测您的通勤时间。其他流行的方法还包括非监督、半监督和强化学习 (unsupervised, semi-supervised, reinforcement learning),这些内容我们之后有机会再为大家详述。
* 如果您已经迫不及待想要了解更多机器学习术语,请访问: https://developers.google.cn/machine-learning/glossary/
一组专门的、互相关联的数学函数。它们共同组成了智能机器为达成决策所需采取的步骤。
假定您遵循相同的行进路线,通过识别交通状况、模式以及加上对特定路况的理解,ML 模型就能够估测您到达目的地的时间。有时 ML 模型这个术语会和算法或神经网络混淆。算法这个说法更广义一些*,可以理解为像是食谱那样的逐步执行逻辑;而神经网络只是 ML 模型的一种。
另外补充一个小知识,"神经网络" 这个称谓的来由,是因为它模仿的是人类大脑中的神经元。大量的神经元交织在一起传递神经脉冲,从而让人类拥有了学习能力、创造能力和高超的抽象能力。
* 从定义上讲,算法意味着 "用有限的步骤,将输入计算为输出" 。机器学习研究和设计的正是一些特定的算法,这些算法可以让计算机 "学习" 到如何根据输入计算出结果。
模型预测新的输入属于哪个或哪些特定的已知组的过程。
举个具体的例子: 为了帮助保持 Gmail 收件箱的清洁和数据安全,ML 模型在后台运行,不断将每封电子邮件分类为垃圾邮件或非垃圾邮件 (在这个过程中如果出现了任何疑问,Gmail 会要求您验证未知发件人的电子邮件地址)。
在这个例子里,"垃圾邮件" 是一个组,"非垃圾邮件" 是另一个组,这样的分类被称为 "二元分类 (binary classification)"。二元预测非常适合解决 "是或否" 问题,但分类模型可以做的比这还要多得多。这些模型可以预测给定输入的多个类别。这样的模型不仅可以将电子邮件分类为 "非垃圾邮件" 或 "垃圾邮件",还可以把它分类为 "重要",并加上 "财务" 和 "后续" 等标签。
如果您想要了解分类的运作原理以及有关其多样性的信息,请试试我们的 What-If 工具。What-If 是一个交互式数据的可视化工具,可以帮助团队理解 ML 模型的结果,而无需编写任何代码。
What-If 工具:https://pair-code.github.io/what-if-tool/uci.html
模型根据输入预测对应的输出数值的过程。
举个具体的例子: 当您想查看两周后的机票价格范围时,模型就需要执行 "回归" 任务。和分类不同,ML 模型这时不是给出离散的预测结果 (比如 "是和否" 或者 "高和低" ),而是需要给出一个具体的数字价格。所以模型会基于历史机票数据,给出一个数学上连续的 "价格曲线"。
再打个比方。比如您的任务是在商店中设计一个冬季配饰展览活动。分类任务就简单粗暴一些,例如将帽子分为一类,将围巾分为另一类。想完成任务,您需要搜集各个配饰的形状、结构等数据,从而判断它是 "帽子" 还是 "围巾" 即可。
而回归任务就更 "精细" 一些。比如根据每一个橱窗所在的位置、温度等在里面展示出更混合精准的 "配装" ——比如配装里可以有围巾和帽子,但也可以根据一些细节环境的不同加上耳罩、袜子,羊毛衬垫和外套等,具体的调整依据包括当前的天气,你过去对客户在这个季节的愿望和需求的了解,以及今年的时尚潮流等等。
回归预测的使用方法充满了多样性和创造性,它可以创造出极其复杂的用户体验,足以预测币值变化,为歌曲排名并创建个性化播放列表,甚至可以判断一个图像的质量。在确定回归模型是否适合您的用户时,不妨先了解一下最终产品或服务中所需的细微差别和复杂程度,再决定是否真的需要打造回归模型。
用于展示确定性的百分比数字。
当人类试图猜测某人的年龄时,会说 "我想这个人可能已经 35 岁了。" 我们知道这只是一个猜测,因为像 "我想" 和 "可能" 这样的短语表示猜测者缺乏信心或确定性。同样,我们也可以将模型所做的预测视为有根据的猜想,其中包含有一定的不确定性。
模型的确定性水平以百分比形式表示,如 "我有 73.3% 的把握断定这个人今年 35 岁。" 产品团队可以使用置信度来决定何种回应是可以接受的——如果一个模型有 70% 的把握说今天会下雨,那么我们就有必要建议用户出门时准备好雨伞。
希望本次的文章能帮助您了解一些人工智能领域的基础概念,以及一些我们日常使用到的技术产品 (如 Gmail ) 功能背后的技术术语。更重要的是,我们希望本文能启发您去更多地了解人工智能这个领域,从而让设计师与开发者们能更好地沟通,从而打造出以人为本的好产品。