走向以证据为导向 | Itamar Gilad (Gmail, YouTube, Microsoft)

Itamar Gilad 2023-09-21

走向以证据为导向 | Itamar Gilad (Gmail, YouTube, Microsoft)

绿野仙踪测试:Gmail 标签收件箱的早期验证

Itamar Gilad: 你可以做假门测试(fake door test),做冒烟测试(smoke test),做绿野仙踪测试(Wizard of Oz test)。顺便说一下,我们在分标签收件箱(tabbed inbox)项目中大量使用了这些方法。最早期的版本之一,实际上是向用户展示了标签收件箱的效果,但那并不是真正的 Gmail,只是一个 HTML 的外壳。在幕后,根据用户授予我们的权限,我们几个人手动把邮件的主题和发件人挪到正确的位置。一开始,采访者先转移用户的注意力,然后展示他们的收件箱——如果我们操作正确的话,顶部大约50封邮件或多或少都被归到了正确的位置。用户的反应是:“哇,这真的很酷。“这给了我们一些证据,让我们可以说:“嘿,我们应该试着把这个东西做出来。”

Lenny: 欢迎收听 Lenny’s Podcast,在这里我采访世界级的产品领导和增长专家,从他们来之不易的经验中学习如何打造和增长当今最成功的产品。今天的嘉宾是 Itamar Gilad。Itamar 是一位产品教练、作者、演讲者,也是 Google 的长期产品经理,曾负责 Gmail、身份系统和 YouTube 的工作。他还刚刚出版了一本很棒的新书,叫《Evidence-Guided: Creating High-Impact Products in the Face of Uncertainty》。Itamar 对为什么以及如何推动你的团队和组织从基于观点的决策过程转向以证据为导向的方法,有着重要的见解。在我们的对话中,Itamar 分享了若干非常实用和便捷的框架来实现这一目标,包括置信度仪表(confidence meter)、指标树(metrics trees)、GIST 和 GIST 看板,以及他对人们在用 ICE 进行想法优先级排序时常犯错误的看法,还有如何让你的 OKRs 更有效等等。尽情收听这期与 Itamar Gilad 的节目。

Itamar Gilad,非常感谢你的到来,欢迎来到播客。

Itamar Gilad: 很高兴来到这里,谢谢你的邀请。

Lenny: 这是我的荣幸。我想我们可以从你在 Google+ 和 Gmail 上的工作经历开始,以及这些经历如何塑造了你对如何打造成功产品的看法。你能分享一下这个故事吗?

Google+ 的教训:基于观点的开发

Itamar Gilad: Google+ 是我在 Gmail 的第一次经历。我于2011年8月加入 Gmail,他们交给我的第一件事就是:“让我们把 Gmail 和 Google+ 连接起来。“如果你对这段故事有些模糊,当时 Facebook 非常庞大——现在仍然很大——但那时它像蘑菇一样疯长,人们花好几个小时在上面。这让 Google 非常紧张,显而易见的解决方案就是推出 Google 自己的社交网络 Google+。我们都相信这个东西,它最初确实很受欢迎,我们都在使用,我们都对它充满信心。所以我们的使命就是把它做出来,而 Google 不惜代价,在公司内部创建了一个全新的部门,围绕 Google+ 制定了完整的战略,我们必须把 Gmail、YouTube 和搜索都连接到 Google+ 上,让它们变得更加个性化、更加社交化。这就是当时的想法。于是我们开始行动,在接下来的几年里在 Gmail 中发布了一系列功能。而 Google+ 本身变成了一个庞大的项目,功能非常丰富,经历了大量的重新设计和迭代——但这一切都没有奏效。

事实证明人们其实并不需要另一个社交网络,人们不喜欢它,也不使用它。最终在 Gmail 中,我们几年后回滚了所有 Google+ 的集成,而 Google+ 本身在2019年被关闭。暂且不谈投入其中的巨大浪费——数百万的人时和人周。事后看来,Google 不仅押错了方向,还错过了更容易把握的机会。就在离 Google 总部不远的地方,有 WhatsApp——在美国不太出名,但它实际上创造了巨大的影响力,数亿人在使用他们的产品,他们对 Facebook 构成的威胁远比 Google 大。所以 Google 错过了像 WhatsApp、Snapchat 等社交移动应用的机会。对我来说,这个故事几乎就是我今天所说的基于观点的开发(opinion-based development)的缩影——我们想出一个主意,我们相信它,所有迹象都显示它很好,也许早期测试也显示它很好,然后我们就全力投入去实现它。作为产品经理,我自己犯过很多次这个错误,我就是那个推动这些想法的人。所以对我而言,这是一个转折点,我感到我们需要采用一种不同的体系。

Lenny: 在你讲下一个故事之前,团队有多大?大概在这个方向上花了多少年?只是让大家感受一下你说的那种浪费的规模。

Itamar Gilad: Google 内部发生了一场巨大的震荡来组建 Google+ 团队,各个团队甚至整个部门被打散重组,我想在巅峰时期大约有1000人——

Lenny: 哇,难以置信。

Itamar Gilad: 这是一个与 Android 和 Docs 规模相当的部门,体量相当大,有自己专属的大楼。这套做法取自 Steve Jobs 的剧本——在公司内部创建一个完全保密的项目,然后拼命地干。

Lenny: 对。不过我记得 Facebook 当时真的很害怕,我记得他们停掉了所有东西,简直就是 DEFCON 一级戒备状态,确实也把 Facebook 吓得不轻。

Itamar Gilad: 是的,确实如此。但最终结果是,Google 的广告收入没有受到影响,Facebook 也没有受到影响。所以事实证明这个想法毕竟并没有那么必要。

Lenny: 好。所以这是一个失败的例子,因为它是基于观点的软件,我记得你用了这个说法。然后 Gmail 的标签页则是完全不同的经历。

Google 的基因:从证据驱动到计划执行

Itamar Gilad: 没错。Google 是一家非常成功的公司,轮不到我来批评它,也不是事后诸葛亮地说”你们应该做得更好”。而且 Google+ 背后的一些人是最聪明的领导者,尽管有这个故事,我至今仍然这样认为。如果你回顾 Google 的历史,看头十年左右的发展轨迹——Google 是一家我所说的证据引导型公司。它高度重视关注客户,提出大量想法,观察数据,看这些想法实际表现如何。他们不怯于发布测试版和非常粗糙、不完整的产品,从中学习,然后他们期望人们根据结果采取行动。所以”快速失败”(fail fast)是一个非常著名的范式,如果你的项目不行,就必须砍掉或大幅转型。我认为如果我们当时保持快速失败的心态,对 Google+ 会大有帮助。

但出于某种原因,Google+ 这个项目把这套打法搁置了,转而采用了一套我称之为”计划与执行”(plan and execute)的做法。不过我认为 Google 内部的 DNA 仍然存在。所以在 Gmail 内部,Google+ 之后的下一个项目就是标签页收件箱。它恰好是 Google+ 的反面——它始于一个非常小的、没人看好的想法,然后我们开始追问:背后的本质是什么?目标是什么?我们到底要解决什么问题?结果发现很多人都在接收社交通知和促销信息等等,其中大多数人非常被动。他们不清理收件箱,就这样生活在一堆杂乱之中。我提出了一个解决方案,我当时觉得棒极了,想直接推行,走计划与执行的路子。但我的同事说:“等等,我们其实试过了。我们有一堆帮用户整理收件箱的想法,他们根本不用。你的想法凭什么行?“

Gmail 标签页的诞生

这促使我和我的团队开始研究这些用户,建立一个更加以用户为中心的目标,然后思考其他方案。接着我们开始更严格地测试——基本上先在自己的收件箱上测试,然后招募其他内部测试者,也就是其他 Googler 来测试同样的收件箱,再开放给外部测试者。我们做了可用性研究,收集数据,组建了一整个数据挖掘团队和一整个机器学习团队来构建正确的分类方案。最终我们得到的解决方案对这些被动用户来说非常成功。这对很多人来说是个意外,因为我大多数同事、大多数与我交流的人其实都知道如何管理自己的收件箱。所以对他们来说那个方案完全说不通——把促销和社交邮件分开听起来是最愚蠢的主意。但大约 85% 到 88% 的用户绝对喜欢它。如今 Gmail 拥有大约 18 亿活跃用户,其中大多数人都在使用这个功能,所以它也是一个影响力相当大的功能。

Lenny: 具体的功能,以防有人不太清楚——就是促销邮件文件夹、社交邮件文件夹,还有常规收件箱。

Itamar Gilad: 对,如果你愿意的话,在设置里还可以启用更多分类。

Lenny: 我就在用,我很喜欢。只不过它把我的 Newsletter 放到了用户的促销文件夹里,这事该找谁说理?

Itamar Gilad: 嗯,Newsletter 对分类引擎来说是一个非常复杂的场景。

Lenny: 对,只需要给我的 Newsletter 加个例外就好了,其他都好说。好吧,继续。

证据引导型公司

Itamar Gilad: 事后回顾,我问自己:“为什么这个项目如此不同?“我认为原因在于我们对自己的观点没有那么强的信心。我们有观点、有想法,但我们没有直接全力押上、直接开干。我们实际采用的是一套证据引导的体系,我认为这不仅限于 Google。我认为每一家成功的产品公司——Amazon、Airbnb,你去考察任何一家,至少在它们最好的时期,都找到了一种平衡人类判断与证据的方式。它们并没有试图消灭人类判断和观点,而是用证据来强化它们。它们发展出了非常不同的模式。Apple 是另一个例子,但这个原则在所有这些公司中都成立。

Lenny: 太棒了。所以你把这些经历,加上你指导产品负责人、与企业合作的所有经验,写成了这本书,叫 Evidence-Guided,看 YouTube 的人可以看到它就在你身后。我想聊聊其中的一些故事,以及从中涌现出的其他经验和框架。不过作为开始,这本书的电梯演讲(elevator pitch)是什么?

Itamar Gilad: 这本书是写给我们这样的人的——产品人,想把证据引导思维或者说现代产品管理带入自己组织的人。这中间有很多挑战,并不简单。我们都读过那些书,都知道理论,都知道体系的一部分。这本书试图给你一套系统性的方法来做到这件事,它是一个元框架,帮助你将组织朝着证据引导的方向提升——如果这是你想要的话。

自上而下的产品决策是否有时合理?

Lenny: 让我们稍微回到前面那个故事,在进入书中的框架和经验之前。第一个 Google+ 的例子,基本上是自上而下的——“我们需要建一个社交网络,去建吧。“显然这在很多公司都会发生,我不知道是否有一个简单的答案。但是否存在一些情况下,这种方式是合理的?显然 Apple 是一个经典例子,Steve Jobs 说我们需要做 iPhone。我不知道具体是不是那样发生的。但是否存在一些情况,基于创始人的经验、创造力和洞察力来推进新产品想法是值得的?还是说你认为应该始终采用这种基于证据的方法?

Itamar Gilad: 我认为创始人非常重要,尤其是在初创和扩张阶段。很多最重要的想法都是他们提出的,给他们空间去表达、推动组织关注这些想法,至关重要。但关键不是要压制他们,而是要用审视的眼光来看待这些想法。你需要创造一种组织环境——当领导者走过来说:“你知道吗?我跟三个客户聊了,我想明白了,接下来五年我们该这么做”——你可以问:“你的证据在哪里?“顺便说一句,你举的那个例子很经典。Steve Jobs,据说他在厨房里头脑风暴出了 iPhone,然后让团队去造——这是 Steve Jobs 自己讲的故事,但完全不是真实的情况。现在我们知道实际发生了什么:iPhone 的诞生其实是一个不断探索、不断试错的过程,涉及多个项目——多点触控、手机结合——大部分都失败了。

Steve Jobs 是那个架构师。他成功地把各种线索串联起来,最终打造出了那款完美的设备。但这并不是他的独创,不是他一个人的灵感产物。他最初其实反对做手机,但随着他看到越来越多的证据,看到这个东西能做到什么,看到那些演示,他逐步拼凑出了一件非常有价值的产品。

Lenny: 这个洞察非常重要。听到这里的人可能会想——我很喜欢这个推动反方意见、鼓励创始人走向证据引导的想法。但拿 Google+ 来说,在当时的情况下,这真的可能吗?你能去找 Larry 和 Sergey,说”我收集了所有这些数据,告诉我们这行不通”吗?你有没有什么建议,关于如何提出反对意见,让创始人和高管真正认真对待反面观点,或者说真正去审视他们的想法?

Itamar Gilad: Google 有一个很好的特点,就是文化非常开放。人们并不怯于告诉 Sergey 和 Larry 他们是错的,而且大家一直这么做。当然要通过合适的渠道。关于 Google+ 确实有过很大的讨论——到底要不要做一个 Facebook 的克隆品——有过非常公开的内部讨论。我认为需要改变的是:不要让这些讨论基于观点。因为当讨论基于观点时,每个人都会带着自己的观点来,而通常最资深的人的观点会胜出,就是这样。如果我们当时带着硬数据来说:“听着,实际情况并没有按照你们预期的那样发展。我们该怎么办?继续还是转型?“我认为讨论的效果会好得多。当然,我这么说有点以偏概全,我并没有参与所有讨论。我知道在 Google+ 项目中,类似这样的严肃讨论肯定也在发生。

但总体趋势上,我发现证据确实能赋予我们很大的力量——让我们这些组织中职位较低的人、中层管理者,有能力去挑战那些观点。

如何在不太开放的领导面前用数据说话

Lenny: 在战术层面,你有没有发现什么方法特别有效?比如说,有些人并不在 Google 工作,他们所在的公司创始人、老板和高管没有那么乐于接受挑战。关于如何提出一个反向方案,或者”嘿,我有这份数据,我们真的应该重视它”——你有什么战术上的建议吗?

Itamar Gilad: 我认为如果你带着数据去,如果你偷偷跑了一个实验,然后拿着结果去给他们看,通常会得到两种反应。一种是他们极其愤怒,让你回去干活、照吩咐做事——如果是这种情况,你可能需要开始打磨简历,在组织内部或外部找下一个去处了,因为那个人说实话已经不讲道理了。但更常见的情况是他们会感到惊喜。Steve Jobs 的情况也是如此——他反对做手机,但后来有人向他展示了各种证据,证明 Apple 能做手机。他最初也反对多点触控,但后来改变了想法,中间经过了大量反复讨论。所以即使是 Steve Jobs,面对证据也愿意翻转立场。我在很多组织中都看到过这种情况。证据的力量就是这么大,这也是我把整本书建立在这个原则之上的原因。

你真的做到证据引导了吗?

Lenny: 你提出了一个”证据引导”(evidence guided)的概念。听众可能会觉得:“嘿,我们是证据引导的,我们做实验,我们用数据做决策。“但很多时候他们其实并没有做到。那么,有哪些迹象说明你可能并没有你想象的那样做到证据引导?

Itamar Gilad: 我认为有几个典型的信号。首先,目标非常不清晰——要么目标太多,要么非常模糊、晦涩,要么只关注产出(output),缺乏对齐。目标这块出了问题,通常和指标密切相关——指标缺失,或者只使用收入和商业指标,而没有面向用户的指标。这是另一个典型信号。然后你会看到大量时间和精力花在规划上,尤其是路线图(roadmap)规划上。打造一份完美的路线图,确实会消耗高管和产品经理等人大量的时间。再往下看,你会发现实验很少,即使有实验,也没有从中产生太多学习。最后一个典型信号是团队缺乏参与感——工程师们接收到的信号就是”你需要做的就是交付”,他们专注于产出,这也是他们被考核的标准。所以他们实际上脱离了用户、脱离了业务,并不那么在意。

这些问题通常可以通过采用更证据引导的体系来解决。

GIST 模型概览

Lenny: 好,那我们来深入谈谈你关于走向证据引导的方法。在书中,你分享了一个叫做 GIST 模型的框架,它是一种几乎能迫使你变得更加证据引导的、构建产品的整体方法。我们先从最简单的角度来理解——这个 GIST 模型到底是什么?

Itamar Gilad: 如果你允许的话,我可以展示几张幻灯片。

Lenny: 好啊,来吧。

Itamar Gilad: 也许这样会有帮助。

Lenny: 开始了,这也算是去 YouTube 上看视频版的一个好理由。

Itamar Gilad: 好,你看到了吗?这就是 GIST 模型——目标(Goals)、想法(Ideas)、步骤(Step-steps)和任务(Tasks)。本质上,它试图把对很多公司来说非常巨大的变革,拆解成四个稍微更容易管理的部分。每一部分仍然不小,但你可以逐一应对。这就是我把它们分开的原因。目标(Goals)定义我们要达成什么;想法(Ideas)是达成目标的假设性方案;步骤(Steps)是实施方案并同时验证它的方式——本质上就是”构建-测量-学习”循环(build-measure-learn loops);任务(Tasks)是我们在看板(Kanban)、Jira 等工具中管理的那些东西,也就是开发团队通常非常关注的事项。听到这里,你会发现很多东西听起来很熟悉,因为 GIST 并不是一个全新的发明。它是一个元框架(meta framework),整合了大量已有的方法论。它基于精益创业(lean startup)、设计思维(design thinking)、产品发现(product discovery)、增长(growth)等——所有这些都在这里面。它只是试图把它们统一到一个框架或模型中。

Lenny: 那么理解这个模型用途最简单的方式是什么?它是你思考路线图的方式吗?是你的规划方式吗?从根本上说,它想告诉人们在构建产品的方式上要做出哪些不同的改变?

GIST 的四个层面

Itamar Gilad: 我会说这是四个你需要审视的领域,在每个领域中都要问自己:我们做的是对的事情吗?在每个层面上,你可能需要改变,甚至彻底转型。当我逐一解释每个部分时,我基本上会给出三样东西。在书中每一章,我都试图涵盖三个方面:背后的原则、落实这些原则的框架或模型,以及流程。说实话,流程是最脆弱的部分,也是你最需要根据自己公司的情况去调整和适配的部分。因为没有两家公司是完全一样的。写书的时候,不给任何流程是很诱人的做法,但流程恰恰是人们最想要的部分。所以书中也包含了流程,但要意识到你必须对其进行调整。

战略与愿景的位置

Lenny: 太好了。好,我们会逐一讨论这四个层面。在此之前,愿景和战略放在哪里?它们归入这四个层面中的某一个吗?你怎么看待战略和愿景?

Itamar Gilad: 这个问题很好。战略有一个整体的上下文,它是在 GIST 之外的。GIST 并不试图解决战略问题,它假设战略已经到位了。还有另一个巨大的板块是研究(research)。GIST 不涉及研究,它更多是关于发现和交付的。但战略极其重要,你也可以用我们将要讨论的一些工具来制定你的战略。在很多公司里,战略不过是一份加强版的路线图,本质上还是”计划-执行”模式,只是规模更大。回想一下 Google+,其实它本身就是一个战略选择。书中有一个章节专门讨论战略,我解释了同样的证据引导方法如何被公司用来制定战略。

GIST 在回应什么问题

Lenny: 好,也许最后一个背景问题。人们看到这个模型可能会想:挺酷的,我有目标、有想法、有步骤、有任务,我已经在做这些了。那这个模型是对什么的反思和回应?人们看到它的时候,可能错过了什么?他们会意识到”哦,原来这是我们没在做的,这是最重要的,是我们应该改变的”。我们后面也会详细展开每一部分。

Itamar Gilad: 我觉得逐一讨论每一层会更有帮助。

Lenny: 好,开始吧。

Itamar Gilad: 我们可以逐层讨论实际在发生什么。当人们说”我有目标”的时候,通常他们把目标这一层当成了一个规划会议。他们讨论的是:我们要在什么时候之前构建什么,需要什么资源。但这其实根本不是目标,这是规划工作。

目标与价值交换循环

Lenny: 好,让我们来聊聊目标,我知道这部分也和 OKR 有关,我很期待听到你对 OKR 的看法。

Itamar Gilad: 哦,那是另一个完整的话题了。你之前请过 Christina,她是真正的专家,我不确定自己还能补充什么。但确实,OKR 也是其中的一部分。我们先从目标说起。目标应该是什么样的?目标应该描绘出终态,定义我们想要到达哪里。如果你不知道自己想去哪里,证据是无法引导你的。在很多公司里,你看到的是顶层有关于收入、市场份额之类的目标,然后每个部门各自有一堆竖井式的目标——工程有工程的目标,设计有设计的目标,营销有营销的目标等等。这实际上把人们推向了不同的方向,很难做出决策。我认为在证据引导的公司中——你在几家公司工作过,可能也见过这种现象——他们会使用模型来构建覆盖整个组织的统一目标。我在关于目标的章节中展示的一个模型叫做”价值交换循环”(value exchange loop)。

它的基本思路是,组织试图向市场交付尽可能多的价值,并尽可能多地从市场中获取价值回来。通过在两者之间建立反馈循环,你实际上能够实现非常快速的增长。我认为你应该同时度量这两者,为每一方设定一个指标。我们通常用来度量交付价值的指标叫做北极星指标(North Star metric)。我知道你写过一篇非常好的文章来介绍它。

Lenny: 谢谢。

Itamar Gilad: 你在那篇文章里列出了几十家领先公司,以及它们各自的北极星指标是什么,非常有趣。不过我认为他们告诉你的其实是”我们度量哪些最重要的指标?我们排名第一的指标是什么?“但这并不完全是我所说的北极星指标。北极星指标度量的是我们为市场创造了多少价值。以 WhatsApp 为例,WhatsApp 很长一段时间度量的是发送消息数,因为每一条发送的消息都是一小份增量价值——对发送者、接收者来说都是如此;它是免费的、支持富媒体,可以从世界任何地方发送。相比短信,这是巨大的价值提升。如果第一年我们发送了十亿条消息,第二年二十亿条,那我们可能就把创造的价值翻了一倍。再看 Airbnb,我认为你们的一个关键指标,或者说真正的北极星指标,是预订夜晚数。我不确定你在的时候是不是还是这样?

Lenny: 是的,没错。

Itamar Gilad: 还有很多类似的例子。比如 Amplitude,他们度量的是活跃学习用户(active learning users),或者叫周活跃学习用户——这些用户在工具中发现了一条非常重要的洞察,以至于至少分享给了另外两个用户,并且这些用户也消费了这条洞察。所以,指向这个指标并说”这是最重要的指标,再加上我们要获取的价值指标——收入、市场份额等等”,是一件非常有力的事情。一旦你有了这两个指标,就可以进一步将它们拆解成我所说的指标树(metrics trees)。北极星指标有一棵指标树,顶层 KPI 也有一个指标树——也就是你在这里左侧蓝色部分看到的顶层业务指标,两者通常会有重叠。你可能会在中间发现一些超级重要的指标,因为推动它们实际上能带动其他一切。

Lenny: 你能再解释一下你所说的顶层 KPI 和北极星指标之间的区别吗?

Itamar Gilad: 北极星指标度量的是我们为用户创造了多少价值,也就是他们获得的核心价值。在这个例子中,这是一个生产力套件,所以指标可能是每月创建的文档数。因为我们认为每创建一份文档——也许是很小的文档,我不知道——加上现在 AI 很流行——都是一小份增量价值,这就是我们要增长的数字。顶层 KPI 则是我们期望获得的回报,应该是收入或利润。

Lenny: 我明白了,这就是价值交换。一个是用户得到了什么,一个是你从用户那里获得了什么。

Itamar Gilad: 没错。

指标树

Lenny: 也就是业务如何受益。太好了。我认为指标树是一个非常重要的概念。很多人觉得自己脑子里已经有类似的东西了——“好,这是我们的北极星指标,这些是我们能拉动的影响它的杠杆”。但我认为像你这样把它真正画出来,一层一层深入到影响这个指标的所有不同变量,这种映射方式不仅在思考影响力、目标等方面有用,还能帮助你估算你打算进行的实验的潜在影响。比如,如果你要在这棵树的底层对激活率(activation rate)做工作,假设你提升了 10%,它对全局指标的影响有多大?可能是一个非常小的数值。

Itamar Gilad: 这是一个非常重要的点,我们稍后会谈及影响评估,指标树对此很有帮助。它也有助于对齐,因为整个组织都在努力推动这两个指标,它们本质上就是我们使命的两面。我们有一个使命,那是公司的最高目标,而这两个就是最顶层的两个关键成果,可以说是最重要的东西。所以当你去找另一个团队合作时说:“嘿,你们要不要来一起做我的项目?“他们可能会说:“根据你的这个模型,这个想法确实有可能推动北极星指标。“这就帮助你们对齐了。我见过这样的案例——B 团队放下自己的想法,转而投身 A 团队的想法,正是因为这个模型。它还创造了一个机会,可以把一些子指标交给各个团队长期负责,从而在树中建立起一种主人翁意识和使命感。

Lenny: 它还能帮你判断应该设立哪些团队,哪些团队对指标有最大的潜在影响力。

Itamar Gilad: 在很多组织中还有另一种常见现象——团队拓扑反映的是软件结构,或者是某种层级模型,我们希望以特定方式来组织团队架构。但如果你从指标树出发,就可以尝试围绕目标来安排团队拓扑。有时候你需要重新调整,这并不是持续不断的重组,但时不时你会意识到目标已经变了,需要重新组织,而指标树可以帮助可视化这个过程。

Lenny: 我觉得对于正在听这段内容、思考这个问题的人来说,最简单的理解方式就是——本质上存在一个数学公式,等于你的北极星指标,或者你的收入,或者你试图实现的任何目标。如果你对这个数学公式没有一个尽可能清晰的认识,你应该先把这个搞清楚。因为它会深刻影响你如何思考资源投向哪里、应该有哪些团队、哪里多投资源、哪里少投资源。

Itamar Gilad: 没错。

(广告部分已跳过)

Lenny: 好的,那指标树之后,接下来是什么?

想法层与 ICE 评估

Itamar Gilad: 好。接下来我们需要进入想法层。想法层的作用是帮我们从可能遇到的众多想法中进行筛选。这些想法可能来自——正如你所说——创始人、管理者、利益相关者,来自团队本身,来自用户研究,来自竞争对手。我们被想法淹没,而在组织内部通常发生的是某种观点之争,有时候甚至是政治博弈,或者是最高薪人士的意见。你之前在节目里请过 Ronny Kohavi,他发明了这个说法。而很少发生的是理性、逻辑性地做出”这些是最好的想法”这样的决策——因为说实话,这真的非常难预测。用户需求、市场变化、技术、产品、我们自己的组织,处处充满了不确定性。几乎不可能断言某个想法一定会是最好的。但我们确实会这样说,因为认知偏差让我们相信某个想法远胜于其他一切,绝对是正确的选择。

为了避免这种情况,我们需要以一种更加客观、一致且透明的方式来评估想法。在书中我建议使用 ICE——影响(impact)、信心(confidence)和简易度(ease)。我想我接下来会有一页幻灯片讲这个。ICE 本质上就是为每个想法赋予三个值。影响试图评估这个想法对目标的影响程度——这就是为什么拥有非常清晰且数量不多的目标如此重要。我们是在用北极星指标、顶层业务 KPI,还是团队的局部指标来衡量想法?不管是什么,我们先把它明确下来,然后以此为标准来评估想法。简易度基本上是投入的反面——做这件事有多容易或多困难。但这二者都是粗略估计,都是我们需要去估算的东西。我认为,仅仅通过把问题拆分成这两个维度来讨论,我们通常就能获得比”我的想法比你的好”稍微好一点的讨论质量。

然后还有第三个要素——信心,它试图评估的是:我们对自己的前两个粗略估计——影响和简易度——到底有多确定,或者说应该有多确定。

Lenny: 你用了”简易度”(ease)这个词,很有意思,因为通常人们用的是”投入”(effort)。你把它变成了一个正向的表述,这是你有意为之的调整吗?

Itamar Gilad: 我用的是 Sean Ellis 的定义。ICE 是 Sean 发明的。你认识 Sean 吗?我不确定你有没有请过他?他是——

Lenny: 我还没请过他。

Itamar Gilad: 对。给不认识他的人介绍一下,Sean 非常了不起。他可以说是增长运动的开创者之一,他创造了”增长黑客”(growth hacking)这个词,并且推广了产品市场契合(product market fit)的概念。

Lenny: 对。

Itamar Gilad: 他发明了 ICE,还创造了很多我们在产品领域使用却不自知的东西。

Lenny: 哇,我不知道 ICE 也是他发明的。好的,很酷。所以 ICE 的原始版本用的就是”简易度”而不是”投入”。

Itamar Gilad: 没错,是的。

Lenny: 有意思。

Itamar Gilad: 很多观众可能在想,R 在哪里?因为还有另一个变体叫 RICE,多了一个 R(reach,覆盖面)。我更倾向于 ICE,因为出于各种原因我更愿意把覆盖面折叠到 I 里面去,但两者都是有效的,在某种意义上也是等价的。

Lenny: 我和你立场一致,我的想法完全一样。我觉得人们把这件事过度复杂化了,试图引入各种数学公式来估算影响。我觉得这些只是简单的启发式方法,用来把最好的想法浮上来。它不需要是对影响、信心等东西的完美估算,所以越简单越好。而且最终它总是落到一个电子表格上。人们总想用各种工具来估算这些东西,但其实就是一个电子表格,Google Sheets,就很好了。

Itamar Gilad: 所以,你正好引到了我的下一个要点。当你去估算影响的时候,你会发现这是最难的部分。有时候它就是直觉和猜测,有时候基于一些电子表格或分析,以及你做的粗略估算——我觉得这是合理的。有时候这些方法确实能揭示你没想到的东西,而最理想的情况是,它基于测试——你实际做了测试,访谈了 12 位客户,给他们看了这个东西,结果其中只有一个真正喜欢。你通常应该据此降低你的影响估算,或者你做其他类型的测试。我们稍后会聊到测试。问题在于,人们往往就凭直觉行事,然后给自己一个很高的信心。他们说影响是 8 分,而且我很确定,所以信心也给 8 分——我觉得这有点令人不安,因为它实际上颠覆了整个系统。

所以我希望能帮助人们认识到,什么时候他们的猜测有强有力的证据支撑,什么时候只是薄弱的证据——从某种意义上说,就是如何计算信心。为此我创建了一个叫信心仪表盘(confidence meter)的工具,就是你能看到的这个彩色的东西——我要不要详细解释一下?

Lenny: 好,来吧。同样提醒一下,如果你只是在听音频,可以去 YouTube 上看,能看到实际的幻灯片。

Itamar Gilad: 好的。基本上我把它设计得有点像温度计。从低信心(蓝色区域,右上角)一直到高信心(红色区域),数字从 0 到 10。0 是非常低的信心——基本上我们什么都不知道,只是在黑暗中猜测;10 是完全的信心——你确定这个东西会成功,毫无疑问。我在圆盘上标出了你可能遇到的各种证据类型。比如,从右上角开始,所有这些蓝色区域都是关于意见的。可以是你自己对想法的自信、你的自我信念——你觉得这是个好主意。但你猜怎么着?每一个糟糕透顶的想法背后,都有人觉得它棒极了——这只能给你 10 分中的 0.01 分。也许你做了一个精美的演示文稿,或者一份六页文档,详细解释为什么这是个好主意。做起来稍微难一点,但信心仍然非常低。也许你把它和某个主题联系起来了——比如区块链……

嗯抱歉,区块链已经不时髦了。现在什么最火?

Lenny: AI。

Itamar Gilad: 没错,AI。这和 AI 有关,所以它就是个好主意?绝对不是。或者和公司战略挂钩,那是另一种主题支撑。就在我们说话的此刻,成千上万个糟糕的主意正在基于这些主题被执行。按照这个工具,所有这些加在一起最多也只能给你 10 分中的 0.1 分。接下来我们进入稍微严格一些的测试。一是和同事、经理、利益相关者一起评审这个想法。他们也不知道答案,他们没有水晶球,他们通常也不是用户,无法预测。但他们可以用稍微客观一点的方式来评估,也许能发现你想法中的缺陷。另一方面,群体也有偏见——政治、从众心理。所以群体有时反而会做出比个人更糟的决策,有这方面的研究支持这一点。接下来是估算和计划。你可能做一些粗略计算,或者你的同事去尝试更好地评估简易度。这会给你稍微多一点信心,但此时我们仍然停留在猜测的层面。接下来是数据——数据可以是轶事性的。你在数据中找到零星的几个数据点,或者和几位客户聊了聊,或者某个竞争对手有同样的想法。在我接触的很多公司里,如果领先的竞争对手有这个功能,我们就认为验证完成了——上线吧,这就是个好主意,我们得做。说实话这从来都不管用,你不应该假设你的竞争对手比你更知道自己在做什么。数据也可以是我所说的市场数据——来自调查,来自对你大量数据的分析,通过深入的竞争分析获得——还有其他方法可以创建更大的数据集,把你的想法与之对照。最后,要获得中等和高等信心,你真正需要的是把你的想法构建出来并测试它——这就是红色区域所在。所以有各种形式的测试,如果时间允许我们会谈到,它们能给你不同程度的信心。

Lenny: 太棒了,这个可视化非常酷。我们会在节目备注中链接这张图片,方便大家查看。我觉得这个工具的厉害之处在于,你完全可以在团队里把它当作一个小工具来用——就是问:我们在光谱上的哪个位置?我们认为这个的影响非常高,但我们的信心可能还停留在蓝色区域——那我们就确保认识到这一点。它用非常清晰的语言帮助人们理解。如果我们有这个工具,大家会更有信心得多。

Itamar Gilad: 所以你还可以根据你获得的信心水平来决定对这个想法的投入程度。本质上,早期你只想做成本低的事情来获取更多信心,然后再加大投入。如果是一个非常低成本的想法,你可以直接跳到高信心的测试——你可以做 AB 实验、早期采用者计划,什么都行,然后上线。有些想法不需要测试,有时候专家意见就足够了。如果你只是在改设置的顺序,没人会注意到,也没人会受影响——风险很低,你可以不测试直接上线。所以诀窍的一部分也在于知道什么时候该停下来,而不是在不必要的时候一路强行推到底。

Lenny: 这是一个非常重要的观点。另一个重要的观点是,产品经理工作的很大一部分就是说”不”,阻止愚蠢的事情发生——这是一个非常好的工具来帮你做到这一点。就是说,好吧,你有这个想法,我们现实一点——我们对此有多大信心?好的,这要花我们三个月来做这件事。也许我们应该考虑别的,也许我们应该在真正投入之前先把信心等级提上去。

Itamar Gilad: 是的。这是我经常听到的真实使用场景,有些人用这个来做一个……客观而温和地说”不”的方式。或者说我们会考虑,但看看我们的其他想法,它们的影响和信心是怎么排的。

Lenny: 经典的产品经理招数——“这个想法很好,但看看这个更好的想法怎么样?” 回到我们开头聊过的一点——假设你有一个非常聪明且经验丰富的创始人,甚至是在初创公司里,你其实没有时间为想法构建大量证据。对于花多少时间来建立信心 versus 就觉得他们的想法确实很好、直接看看效果——你有没有不同的看法?

交付速度与发现速度的权衡

Itamar Gilad: 所以交付速度和发现速度之间始终存在一种权衡,这实际上引出了下一个层面——我们如何将二者结合起来?因为人们倾向于认为这是一非此即彼的选择。要么我们非常快速地构建,要么我们在学习、但构建得非常慢。但我认为我们用错了衡量标准。衡量标准不是你能多快把代码推上线——当存在大量不确定性的时候,而且我们所有人都面临不确定性,初创公司尤其如此——关键不在于把代码推上线,而在于把正确的代码推上线。关键在于创造你所需要的成果、所需要的影响,所以衡量标准是通往成果的时间。而我认为证据引导方法的影响要大得多,速度要快得多,资源效率也高得多,远超基于意见的方法。因为基于意见的方法往往会浪费你更多的资源,构建错误的东西,或者学得太晚。而证据引导帮助你更早地学习。

另外,认为”如果你在学习就不能构建”是一个谬误。优秀的团队知道如何同时做到这两点,而这正是步骤层旨在教你、帮助你做到的事情。

不同阶段公司的应用方式

Lenny: 太好了。那么也许来闭合这个话题——假设听众中有人在更大的公司工作,比如 Netflix,对比处于 A 轮、B 轮的初创公司。你会建议他们以不同的方式来应用这些方法吗?对于不同阶段的公司,有没有什么指导性的建议?

Itamar Gilad: 当然。我认为我们讨论过的北极星指标这个概念,创造的价值与捕获的价值之间的区分,对每家公司都非常重要。构建完整的指标树,在早期阶段可能有些过度;做沉重的加权 OKR 也可能有些过度。早期阶段的公司甚至不知道自己如何创造价值,所以他们需要迭代,他们的目标真正是找到产品市场契合。在此之后,你需要开始构建你的商业模式。这就是你的目标,你朝着这个方向迭代,你需要为此设定指标。然后当你进入规模化阶段,你需要尝试建立秩序,因为当你扩大规模时……所有这些在书里都有涉及,有一个专门的章节专门讨论这些问题。当你扩大规模时,你会有很多人、很多钱,所有事情同时在发生。所以在那里你需要一种非常系统化的方式来评估想法。顺便说一下,像 Netflix 这样的公司,我不知道他们是否需要这个具体方法。他们非常——

Lenny: 对,也许那个例子不太好。他们可能已经做得很好了。

最受益的两类公司

Itamar Gilad: 顺便说一下,我发现有两类公司特别受益于这个方法。一类是那些正在逐步进入现代产品开发的公司。他们有产品团队,有产品经理,有 OKR,开始做敏捷开发,开始做实验,但他们在将这一切整合在一起方面遇到了困难。每个 CPO 都在构建自己的小框架。另一类是那些曾经是证据引导但后来倒退了的公司,这种情况发生的频率太高了。管理层变动,文化变动,然后突然之间他们需要重新发现、重新点燃那种曾经失去的精神,就像 Google+ 那样。所以一些对这个方法反应最强烈的人,出人意料地正是在这些公司里。

Lenny: 我很喜欢你的框架以及我们讨论的所有这些东西——你几乎可以把它们看作一整套工具箱,帮助你的公司变得更加证据引导。你可以从信心仪表盘开始,可以开始更多地使用 ICE,可以开始使用指标树——所有这些东西都在一步步推动你更加证据引导,你不必一次性全部采用。

Itamar Gilad: 完全同意。我建议你不要试图一次性全部采用,因为如果变革规模太大,你会感到疲惫,你只是给很多人带来了很多流程,却看不到结果,一个季度之后就会放弃。所以你刚才建议的正是正确的方法。

从哪里开始

Lenny: 如果人们想从更多以意见为导向转向更多以证据为导向,你会建议首先做什么?这些框架或模型中你会优先推荐哪个?

Itamar Gilad: 我建议他们先在内部讨论,目前面临的最大问题在哪里。如果目标不清晰,存在不一致,我们一直在追错的东西——从目标层开始。尝试确立你的北极星指标、你的顶层业务指标、你的指标树,开始为各团队分配各自的责任领域。如果你花大量时间在争论上,不断争执、反复改变主意——从想法层开始,建立影响-信心评分或任何你喜欢的优先级模型,但要把证据纳入其中。我认为信心仪表盘是一个不论在什么情况下都值得使用的好工具。如果你构建得太多、学习得太少——开始采用我们还没看到的步骤层。如果你的团队参与度很低——你有一种团队,开发人员非常投入于敏捷、非常注重质量、非常注重发布——从任务层开始着手。

Lenny: 太好了。好,我们继续。

步骤层:在学习的同时构建

Itamar Gilad: 好,那么步骤。步骤就是帮助我们同时学习和构建,正如我们所说的。我看到的一个模式是,组织不知道他们其实可以以低得多的成本来学习。他们相信需要构建一个精心设计的 MVP——而这个 MVP 实际上一点也不”最小化”——然后发布它,然后他们才会发现结果,本质上这就是我们 20 年前所谓的 beta 版,只是换了个名字。我在步骤层试图做的,就是帮助公司意识到,验证你的想法——或者更具体地说,验证你想法中的假设——有一个完整的范围。我为此创建了一个小模型,叫做评估、事实调查、测试、实验和发布结果。但同样,这只是把更聪明的人发明的东西组合在一起。在评估阶段,你有非常简单的事情,不需要大量工作。你检查它是否与目标一致——你手头的这个想法。

你可能做一些商业建模,做 ICE 分析,做 Assumption Mapping——这是 David J. Blend 的一个很好的工具——或者你与利益相关者一对一交谈,看看是否存在风险等等。这些通常花费不大,但能让你对想法的影响和简易度了解很多。下一步是挖掘数据,这通常与评估同步进行。你可以通过数据分析、问卷调查、竞品分析、用户访谈和实地研究——观察你的用户——来获取数据。显然最后两种方式花费较高,所以最好不要等到有了想法才开始做研究。最好是持续不断地做研究,这样你就有一些数据可以依赖,可以将你的想法与之对比。但到目前为止我们还没有构建任何东西,现在你准备开始测试了——构建产品的版本,放到用户面前,衡量结果。但最初你不需要构建任何东西,你只需要模拟它。

低成本验证方法

Itamar Gilad: 你可以做假门测试(fake door test)、冒烟测试(smoke test)、Wizard of Oz 测试、礼宾测试(concierge test)、可用性测试。顺便说一下,我们在标签式收件箱项目中大量使用了这些方法,最早的一个版本实际上是我们向人们展示标签式收件箱的工作效果。但这并不是真正的 Gmail,只是一个 HTML 的外壳——在幕后,根据用户授予我们的权限,我们的一些人手动把邮件的主题和发件人移到了正确的位置。所以一开始访谈者先转移他们的注意力,然后向他们展示收件箱,其中前 50 封邮件被分到了正确的位置——如果我们没搞错的话——人们的反应是,“哇,这真的很酷。“这给了我们很多证据。

Lenny: 这个故事太棒了。所以那是在用户研究阶段,并没有真正向用户发布?是手动逐个操作的?

Itamar Gilad: 没写一行代码,都是研究人员和设计师拼凑出来的。但它给了我们一些证据,让我们有理由说,我们应该尝试构建这个东西。

Lenny: 太喜欢这个故事了。

Itamar Gilad: 所以最初你先伪造它。中级测试则是构建一个粗糙版本,不完整,不精致,不可扩展,但足以让用户开始使用。这些就是早期采用者计划、alpha 版、纵向用户研究和 fish food。Fish food 是在你自己的团队上测试。

Lenny: Fish food?我没听过这个词。所以就是 dog fooding,但仅限于你自己的团队?

Itamar Gilad: 我觉得这是 Google 的说法,不过有人告诉我他们公司也用 fish food 这个名字。所以我就用了,不知道有没有更好的叫法。

Lenny: 我想知道为什么叫 fish food,因为是小小的?像是轻轻的小口咬?

Itamar Gilad: 可能是吧。嗯,我不知道。

Lenny: 哇,好的,太酷了。我学到了很多东西。

从测试到实验再到发布

Itamar Gilad: 下一个阶段是构建一个更完整的版本,然后你可以 dog food 它,把它交给内部用户使用。多年前我刚加入微软时,第一件注意到的事就是 Outlook 漏洞百出。我问大家怎么回事?他们告诉我,我们都在 dog food 尚未发布的下一个版本的 Outlook,这在硅谷是非常普遍的做法。你可以做预览版、beta 版、labs 实验,这些也都是测试。现在,有一类特殊的测试是实验(experiment),因为它们包含对照组。所以 AB 测试、多变量测试,这些都是实验。我使用的”实验”一词是数据科学家的用法,虽然人们倾向于把这里看到的一切都叫实验。最后,即使是发布,你也可以做分阶段发布、百分比上线、回退保留。所有这些方法都能帮助你进一步验证假设。有时你需要回滚并修改,但这又是一个学习的机会。

关键点是,你不必从右侧——也就是高成本的那端——开始。你可以从早期阶段开始,这样可以快速试探很多想法。你发现它们并不像你想的那么好,然后你可以把更多精力投入到好的想法上。如果它们产生了正面证据,你可以一步步深入,直到你觉得自己准备好交付为止。

Lenny: 好的。我们已经谈了目标,谈了想法,现在在谈步骤。关于步骤还有什么要补充的吗?然后我知道接下来是任务。

Itamar Gilad: 没有了,步骤就到这里。这中间还有很多内容,我们不会全部展开。

Lenny: 好的。我们来谈谈任务,你指什么。

两个世界的鸿沟

Itamar Gilad: 在很多组织里,存在着两个世界。一个是规划世界,基本上是管理者、利益相关者、一些 PM 坐在一起思考我们需要发布什么,在这里我们制定策略、路线图和项目。但猜猜谁没被邀请参加这个派对?那些真正干活的人。他们生活在敏捷世界里,非常专注于把工单移到完成状态,完成燃烧的故事点,把东西推上线。这两个世界之间存在巨大的鸿沟。他们互不理解,意见不一,有时会积累很多不信任——对计划的不信任,或者管理者觉得团队就是效率不高。这些我们都见过,而解决方案——那个权宜之计——就是把一个 PM 放在中间。PM 本应让这一切运转起来,像项目经理一样按路线图交付,用完美排序的产品待办列表和用户故事喂养敏捷机器——说实话,这根本行不通。

GIST 看板:连接规划与执行

我遇到的 PM 都非常疲惫,他们不得不花大量时间在计划会议和路线图讨论上,忙得没有时间做研究或测试想法。所以我建议改变这种状况,让开发者稍微走出他们的敏捷牢笼——如果你愿意这么叫的话。没有不尊重敏捷的意思,它是好东西,但让我们让他们做的不仅仅是开发,也让他们参与发现。我建议的工具之一——同样这也是一个流程——就是我所说的 GIST 看板。它基本上就是 GIST 的上面三层。目标在右侧,通常就是每个团队的关键结果,我建议不超过四个。所以每个团队创建一个 GIST 看板,然后是我们正在推进的想法——有时带有 ICE 评分——然后是我们可能要推进的接下来几个步骤,以验证这些想法。这是一个非常动态的东西。

它一直在变,团队负责人需要更新它,团队需要至少每两周围绕它开一次会,讨论当前的情况。我们还在跟进正确的想法吗?目标完成得怎么样?下一步是什么?什么阻碍了我们完成最重要的步骤?而这是如今不存在的一种讨论,因为大多数讨论发生在路线图层面,然后又有很多讨论发生在任务层面。但这个中间层——我们到底在试图达成什么、做得怎么样——是不存在的。如果你确实有了这个,你就在团队脑海中建立了更多的上下文,然后他们需要问你的问题就更少了,你需要告诉他们做什么也更少了。他们知道什么是成功,能够真正更多地自主行动。

Lenny: 理解 GIST 看板的方式,是把它看作你做路线图的方法,还是更像一个战略框架,帮助你思考为什么要进行广泛的优先级排序?

Itamar Gilad: 我通常是这样说的:在季度初,团队定义自己的目标。团队负责人定义目标,但他们会和团队一起审核,和管理层一起审核,当然也和利益相关者一起审核。大家达成一致:这些是你们最多四个关键结果和一两个需要推进的目标,团队不可能交付比这更多的东西。你把这些关键结果复制到 GIST 看板上,然后开始查看你的想法库,或者开始生成想法,说:我们怎样才能达成这些关键结果?

Lenny: 确认一下,你复制的是关键结果,把它作为目标?

Itamar Gilad: 是的,没错。你也可以把目标写在旁边,提醒大家我们在追求什么,但关键结果才是我们在这里展示的核心。然后你挑选一些想法,那些看起来最有前景的。听起来可能不太直觉,甚至有点反直觉,但我建议让团队来挑选这些想法。管理者或利益相关者可以提出想法,每个人都可以提出,但团队应该用 ICE 流程来——尤其是产品经理在这里非常关键——决定先测试哪些想法。然后团队一起需要确定我们应该执行哪些步骤,怎么验证?有些步骤由产品经理完成,有些由数据分析师完成,有些由用户研究员完成。但有些需要团队一起参与,会涉及一些编码、一些实验运行等,所以步骤层面也有一定的归属感。一个子团队负责每个步骤,我们会非常频繁地更新看板。

所以如果一个想法被证明不好,我们会把它从看板上拿掉,换成另一个想法;或者也许我们已经达成了目标,不需要再在这上面花时间了,可以专注于其他事情。所以从某种意义上说,它也是一个项目管理工具。

GIST 看板的核心:学习里程碑而非工程里程碑

Lenny: 很好。我看着这个看板,觉得也许最重要的部分是——步骤不仅仅是像”启动一个更好的引导流程”或”在引导中加一个步骤”这样的项目。你想强调的是,你要采取的步骤本质上是为了获得越来越多的信心,越来越多的证据引导思考,而不是仅仅说”好吧,我们来想办法把这个功能点子上线。”

Itamar Gilad: 完全正确。它不是工程里程碑,也不是设计里程碑,而是学习里程碑。所以我们构建一些东西,在此过程中实际上也在扩大构建的范围。我们在过程中构建产品,同时也在学习,这两者必须齐头并进。

Lenny: 对于那些没有在 YouTube 上看视频的人,我们快速走一个例子。你这里的一个目标是平均引导时间,你希望平均引导时间少于两天,目前是五天半。那里的一个想法是引导向导,然后步骤是用模型做可用性测试,接着用原型做可用性测试,然后做 A/B 测试?

Itamar Gilad: 对,基本上是这样,而且你可以边走边调整。有时候你可以并行运行多个步骤,不一定是串行的。但基本上就是这个过程。

Lenny: 很好。所以再次强调,你作为团队要在这里突出的是——我们不会直接上线这个引导向导,然后再慢慢摸索。而是我们要提前规划好将要采取的步骤,一步步建立越来越多的信心。这是我们应该持续投入越来越多的东西,这真的很有意思。

Itamar Gilad: 是的,还有一件有趣的事——每次你运行一个步骤,如果成功了,你就有了证据,可以拿回去给管理者看,跟他们分享,说:“这个想法我们本来觉得很好,但得到了这样的结果。你们觉得这意味着什么?“有时候提出这个想法的管理者会说:“我觉得测试失败了,我们重新跑一次。“有时候他们会说:“也许它没有我想的那么强。“讨论由此变得更加细致、更加客观。

GIST 看板与路线图的关系

Lenny: 也许作为这个框架的收尾。这和人们可能在电子表格或 Jira 或 Asana 里维护的路线图是什么关系?它是叠在那上面的?还是替代其他地方的路线图?

Itamar Gilad: 我觉得发布路线图——就是你写”Q3 之前我们要上线这个”或者”十月之前我们必须上线那个”——那种路线图和这个是冲突的。如果你那样做,人们知道目标是十月上线那个东西,那就别谈学习、别谈证据引导了。我建议使用成果路线图(outcome roadmap),说”到十月我们想达成这个成果”。到 Q4 我们想在另外三个国家上线,或者我们想在那之前把印度的使用量增长多少,到这个时候我们需要解决流失问题,至于怎么达成——有时候我们确实有一个具体想法,是高信心、已经测试过的,那就切换到交付模式,可以把它放上路线图,说”对,我们会构建这个东西,目标是十月”。但其他时候你想保持开放,而路线图如果你在低信心的时候就提前决定某个特定想法必须在某个时间上线,它反而会扼杀这个过程。

Lenny: 好的。所以你在提议人们把路线图的实践切换到这种方式,这非常大胆。我很喜欢。

Itamar Gilad: 嗯,这不是路线图。这只是团队用来管理项目的工具,但我在书里确实有一个成果路线图的方案。

如何开始实践

Lenny: 好,很好。我本来想问,如果人们想尝试这种方法,书是充分理解这个框架及其实施方式最好的途径吗?

Itamar Gilad: 那是一种方式。我有文章,网站上也有资源,但我尽量把我们刚才讨论的很多内容以更细致的方式浓缩在书里。所以如果你对此感兴趣,不妨读一读。

Lenny: 好。也许快速谈谈 OKR 的话题。OKR 怎么和这一切联系起来?听起来大致上你假设人们会继续按”这是我们的指标或关键结果或目标”的方式工作,然后那套东西接入 GIST 框架。

Itamar Gilad: 指标树,加上你的使命,加上各个团队的单独使命,基本就能提供你填写 OKR 所需的大部分内容。当然还有一个对齐的过程——自上而下、自下而上、横向之间——我在书里也谈了一些。OKR 是一个非常丰富的话题,但那些东西通常是核心。通常还有一些关于公司健康度、产品健康度等的 OKR,叫做补充 OKR(supplementary OKR),我也讨论了这些。所以是的,我认为 OKR 如果你喜欢的话是一个有用的工具。

Lenny: 再拉远一点看。基本上你不需要把所有这些想法一口气全盘接受,改变整个业务的工作方式。你可以从挑选其中一些想法开始,逐步变得越来越证据引导。听起来这个 GIST 看板可能不是你起步的地方,也许是在你积累了越来越多使用这些工具的经验之后才用的——或者你来告诉我。你有时候会直接从这种路线图和规划的思考方式开始吗?

Itamar Gilad: 所以可能不是完整的看板,因为你缺少一些组成部分,也许你的目标还不够好,或者想法优先级做得还不够好。但如果你的团队非常、非常以交付为中心——有时候情况恰恰相反,管理者在告诉他们怎么构建——你想打破这种动态,你想创建一个步骤 backlog。所以不是产品 backlog,而是创建一个步骤的 backlog,就是验证步骤、beta 版、预览版等等,这会相当强烈地改变动态。

推荐资源与闪电问答环节

Lenny: 那么到这期播客上线的时候,书应该已经出了。找这本书最好的地方是哪里?

Itamar Gilad: 希望在亚马逊上能搜到。你可以去我的网站 itamargilad.com,那里会很醒目地展示,还有一个专门的书籍落地页,你能在 evidenceguided.com 上找到关于这本书你需要了解的一切。

Lenny: 好,那我们进入非常令人期待的闪电问答环节。准备好了吗?

Itamar Gilad: 准备好了,来吧。

闪电问答环节(续)

Lenny: 有哪两三本书是你最常推荐给别人的?

Itamar Gilad: 我要耍点小聪明,我要推荐的是系列书,所以是两个系列。一个是——

Lenny: 允许耍小聪明。

Itamar Gilad: 好,太好了。第一个,这些都是比较显而易见的。一个是 SVPG,也就是 Silicon Valley Product Group 出版的系列。《INSPIRED》《EMPOWERED》,现在好像《TRANSFORMED》也出了,我还没读,但我肯定它很棒。这是 Marty Cagan 和他的同事们写的,都是非常好的书,每个产品经理都应该读。另一个系列稍微老一些,是精益系列,《精益创业》《Lean Enterprise》《Lean Analytics》,这些书里都有真金白银,《Lean UX》也是,非常重要非常好的书,我觉得它们没有得到应有的重视。《Running Lean》也是一个例子。

影视与学习

Lenny: 最近最喜欢的电影或电视剧是什么?

Itamar Gilad: 我其实不算什么影视迷,随便放什么就看什么。我发现 YouTube 实际上正在成为我获取信息和娱乐的来源之一。我最近在学西班牙语,所以发现了一个叫 Dreaming Spanish 的频道,如果你在学西班牙语的话,这个频道太棒了。这就是我的推荐。

Lenny: 这个选择很独特,我很喜欢。你最喜欢问候选人的面试问题是什么?

Itamar Gilad: 我喜欢让他们为一个小众受众群体设计一个东西。比如为老年人设计一个导航系统,或者为视力障碍人群设计某种笔记本电脑等等。这类问题能很好地观察他们的用户同理心、创造力、评估多个想法的能力,以及发现自身想法缺陷的能力。所以有很大的空间可以深入挖掘,观察这个人作为产品人的思维方式。

AI 与产品发现

Lenny: 最近发现并喜欢的某个产品是什么?

Itamar Gilad: 说起来有点老套,但就是 AI。有一家叫 ElevenLabs 的公司,做语音的,你听到过的最好的合成语音就是他们做的,而且他们还能复制你自己的声音,你可以创建一个声音签名。如果你是美国人,可以用他们的免费默认版本或者便宜的版本复制自己的声音,如果你需要为有声书配音或者做在线课程,这个就非常有用。所以我觉得这个服务非常有趣。

Lenny: 这都是我宏大退休计划的一部分,把所有这些组件拼到一起,最终能替代我。有 AI 生成内容,还有这个语音的东西。我太喜欢了,一切都在发生。

Itamar Gilad: 已经有一个 AI 版本的你了对吧?我可以向它提问——

Lenny: 哦,有一个 lennybot.com。

Itamar Gilad: 对。

Lenny: 都是这个计划的一部分。好了。你最喜欢、最常对自己重复并分享给他人的人生格言是什么?

人生格言

Itamar Gilad: 这个问题很大。爱因斯坦说过:“不要努力成为一个成功者,而要努力成为一个有价值的人。“我觉得这对个人和公司来说都是一条极好的格言。它指引着我,而整个价值交换等概念也与之有一定关联。

Lenny: 我太喜欢这句话了,对于在网上输出内容的人来说,这一点非常重要。很多人就是想,我想成功,想涨粉,于是发各种推文、晒各种东西,但真正有效的是交付价值,创造出人们真正需要和想要的有价值的东西。我觉得一个判断信号是:你自己是否觉得它有趣、有价值?如果你自己觉得”哇,这真的很有意思”,通常其他人也会觉得有意思。所以我非常喜欢这句话,很好的选择,我要去查一下原文。还有两个问题。你从你妈妈或爸爸那里学到的最有价值的道理是什么?

Itamar Gilad: 他们两位各有各的方式,他们做的工作都比较朴素,教书或者做其他事情,但他们总是努力做到最好,尽可能交付最大的价值。所以这某种程度上是相通的,也许我是透过这个滤镜看世界的。但他们教会了我努力在自己的领域做到最好。

家乡味道

Lenny: 最后一个问题,你是以色列人,可能有些人听不出来。你最喜欢的以色列美食是什么?大家一定要去尝尝或者有机会就要吃的?

Itamar Gilad: 我到以色列通常直奔沙瓦尔玛(shawarma),类似于土耳其烤肉(döner kebab),如果你知道的话,就是比它更好吃。所以如果你在以色列,如果你去海法(Haifa)——就是我长大的城市——一定要尝尝那里的沙瓦尔玛。

Lenny: 太棒了。Itamar,希望大家从我们的对话中了解了你这本书的要义。找到这本书最好的方式是什么?了解你、联系你最好的方式是什么?另外,听众怎样能帮到你?

Itamar Gilad: 要找这本书,可以去 itamargilad.com 或者 evidenceguided.com,你能找到这本书,也能找到我。对我来说最大的价值是,去试试看,把这些想法中的一些带回去,带到你的办公室,和同事聊聊,说说你觉得我们应该怎么做?动手试一试,然后回来找我,我在我的网站上很容易找到。告诉我发生了什么,我真的很有兴趣了解。

Lenny: 太好了。Itamar,再次非常感谢你的到来。

Itamar Gilad: 谢谢你。

Lenny: 大家再见。非常感谢大家的收听。如果你觉得这期节目有价值,可以在 Apple Podcasts、Spotify 或你喜欢的播客应用上订阅本节目。另外,也请考虑给我们评分或留下评价,这真的能帮助其他听众找到这个播客。你可以在 lennyspodcast.com 找到所有往期节目或了解更多关于本节目的信息。下期再见。


术语表

原文中文
activation rate激活率
Assumption MappingAssumption Mapping(David J. Blend 创建的工具,保留原文)
build-measure-learn loops构建-测量-学习循环
concierge test礼宾测试
confidence信心
CPOCPO(Chief Product Officer 的缩写,保留原文)
David J. BlendDavid J. Blend(人名保留原文)
design thinking设计思维
dog foodingdog fooding(团队内部使用自己开发的产品)
Dreaming SpanishDreaming Spanish(频道名保留原文)
döner kebab土耳其烤肉
ease简易度
ElevenLabsElevenLabs(公司名保留原文)
evidence guided证据引导
fake door test假门测试
fish foodfish food(在自有团队内部进行的产品测试,源自 Google 的说法)
GISTGIST(Goals, Ideas, Step-steps, Tasks 的首字母缩写,不译)
GIST boardGIST 看板
growth hacking增长黑客
Haifa海法(以色列城市)
ICEICE(Impact, Confidence, Ease 的首字母缩写,不译)
impact影响
lean startup精益创业
Marty CaganMarty Cagan(人名保留原文)
meta framework元框架
metrics trees指标树
MVPMVP(Minimum Viable Product 的缩写,保留原文)
North Star metric北极星指标
OKROKR(Objectives and Key Results 的缩写,保留原文)
output产出
product discovery产品发现
product market fit产品市场契合
reach覆盖面
RICERICE(Reach, Impact, Confidence, Ease 的首字母缩写,不译)
roadmap路线图
Ronny KohaviRonny Kohavi(人名保留原文)
Sean EllisSean Ellis(人名保留原文)
shawarma沙瓦尔玛(中东烤肉卷)
siloed goals竖井式目标
smoke test冒烟测试
story points故事点
SVPG (Silicon Valley Product Group)SVPG(硅谷产品集团,保留原文缩写)
top KPI顶层 KPI
value exchange loop价值交换循环
Wizard of Oz testWizard of Oz 测试

此文档由 AI 分片翻译(translate_long_document)