当前位置: 首页 > news >正文

谷歌数据分析-II-笔记-全-

谷歌数据分析 II 笔记(全)

001:谷歌数据分析师课程第二课《以数据驱动的决策提出问题》🎯

概述

在本节课中,我们将学习如何通过有效提问来驱动数据分析,从而解决实际的商业问题。课程将涵盖问题解决的基础、有效与无效提问的区别、数据类型、结构化思维以及有效沟通的策略。


欢迎与课程介绍

欢迎来到谷歌数据分析师认证的第二门课程。

如果你完成了第一门课程,我们已经在开始时简短地见过面。但对于刚刚加入的学员,我叫Humana,是谷歌的一名财务数据分析师。

很高兴能和大家一起学习数据分析这个迷人的领域。学习和教育对我而言一直非常重要。我年轻时,母亲常说:“我无法留给你遗产,但我可以给你一份能打开大门的教育。”这句话一直激励我持续学习,而这份教育也给了我申请谷歌工作的信心。

现在,我每天都能从事非常有意义的工作。最近,我在一个名为Verily生命科学的团队担任分析师。我们的工作是帮助将救生医疗物资送达最需要的人手中。为此,我们预测了医疗专业人员需要储备的物资,并将信息分享给相关网络。我们团队提供的信息帮助做出了以数据驱动的决策,这些决策实际上拯救了生命。

我很荣幸能担任本课程的讲师。我们将探讨有效提问与无效提问的区别,并学习如何提出能带来深刻见解、帮助解决商业问题的好问题。

你会发现,有效提问能帮助你在数据分析的各个阶段充分利用数据。你可能还记得,这些阶段包括:提问、准备、处理、分析、分享和行动。


问题解决与有效提问入门

在“提问”阶段,我们定义要解决的问题,并确保完全理解利益相关者的期望。这有助于你将注意力集中在实际问题本身,从而带来更成功的成果。

因此,本课程将从讨论问题解决以及数据分析师帮助解决的常见商业问题类型开始。

由于本课程侧重于“提问”阶段,你将学习如何构建有效的问题,以帮助你收集正确的数据来解决这些问题。


数据类型及其应用

接下来,我们将讨论许多不同的数据类型。

你将学习每种类型在何时以及如何最为有用。你还有机会进一步探索电子表格,并发现它们如何帮助你更有效地进行数据分析。


结构化思维简介

然后,我们将开始学习结构化思维。

结构化思维是一个过程,包括:识别当前问题或情况、组织可用信息、揭示差距和机会、以及确定可选方案。

在这个过程中,你将一个非常复杂的问题分解成更小的步骤来处理。这些步骤将引导你找到一个合乎逻辑的解决方案。

我们将共同努力,确保你完全理解如何在数据分析中运用结构化思维。


有效沟通策略

最后,我们将学习一些经过验证的有效与他人沟通的策略。

我迫不及待地想与大家分享更多我对数据分析的热情。让我们开始吧!


总结

本节课中,我们一起学习了数据分析中“提问”阶段的核心价值。我们探讨了如何通过定义问题和理解期望来聚焦于实际挑战,介绍了有效提问的技巧以收集关键数据,概述了不同数据类型的用途,引入了将复杂问题分解的结构化思维方法,并简要提及了有效沟通的重要性。这些基础将帮助你开启以数据驱动决策的旅程。

002:谷歌数据分析师第二课《以数据驱动的决策提出问题》📊

课程概述

在本节课中,我们将通过一个真实的数据分析案例,学习如何运用数据分析流程的六个阶段来解决实际问题。我们将看到,从明确问题到采取行动,数据如何引导一家小型企业做出有效的商业决策。


案例背景:Anywhere Gaming Repair 🎮

本案例的主角是一家名为“Anywhere Gaming Repair”的小型企业。这家公司提供上门维修视频游戏主机及配件的服务。其所有者希望拓展业务,他知道广告是获取更多客户的有效途径,但面对众多广告策略(如印刷品、广告牌、电视广告、公共交通广告、播客和广播广告),他不知从何入手。

选择广告方法时,需要考虑两个关键因素:目标受众预算

  • 目标受众:指你希望触达的特定人群。例如,医疗设备制造商若想接触医生,在健康杂志上刊登广告是明智之选。
  • 预算:不同广告方式的成本差异巨大。例如,电视广告通常比广播广告昂贵,大型广告牌的成本也高于公交车背面的小海报。

企业主聘请了数据分析师玛丽亚来提供建议。


数据分析流程的应用

上一节我们介绍了案例的背景和核心挑战。本节中,我们来看看数据分析师玛丽亚是如何运用数据分析的六个阶段来解决问题的。

第一阶段:提问 (Ask) ❓

玛丽亚从数据分析流程的第一步——“提问”开始。她首先需要定义待解决的问题。为此,她必须跳出细节,审视整体背景,以确保关注的是根本问题,而非表面现象。

这引出了问题解决过程的另一个重要部分:与利益相关者协作并理解他们的需求。对于Anywhere Gaming Repair而言,利益相关者包括企业主、传播副总裁以及市场与财务总监。

通过协作,玛丽亚与利益相关者共同明确了问题所在:不了解目标受众偏好的广告类型

第二阶段:准备 (Prepare) 📁

明确了问题后,玛丽亚进入了“准备”阶段,为即将开始的分析收集数据。

首先,她需要更好地理解公司的目标受众:拥有视频游戏系统的人群。之后,玛丽亚收集了关于不同广告方式的数据,以便确定哪种方式在目标受众中最受欢迎。

第三阶段:处理 (Process) 🧹

接着是“处理”阶段。在此阶段,玛丽亚清洗数据,以消除任何可能影响结果的错误或不准确之处。

正如我们所知,清洗数据意味着将其转换为更有用的格式、创建更完整的信息以及移除异常值

第四阶段:分析 (Analyze) 🔍

处理完数据后,便进入了“分析”阶段。玛丽亚希望弄清两件事:

  1. 谁最可能拥有视频游戏系统?
  2. 这些人最可能在何处看到广告?

通过分析,玛丽亚首先发现18至34岁的人群最有可能进行与视频游戏相关的消费。因此,她确认Anywhere Gaming Repair的目标受众应为18至34岁的人群,公司应努力触达这部分人。

考虑到这一点,玛丽亚进一步了解到,电视广告和播客在目标受众中都非常受欢迎。但由于玛丽亚知道Anywhere Gaming Repair的预算有限,并且了解电视广告的高昂成本,她的建议是:在播客上投放广告,因为这种方式更具成本效益。

第五阶段:分享 (Share) 📊

分析完成后,玛丽亚需要分享她的建议,以便公司能做出数据驱动的决策。她使用清晰且具有说服力的分析可视化图表来总结结果,这有助于利益相关者理解针对原始问题的解决方案。

第六阶段:行动 (Act) 🚀

最后,Anywhere Gaming Repair采取了行动。他们与一家本地播客制作机构合作,制作了一条关于其服务的32秒广告。该广告在播客上投放了一个月,并且效果显著:仅第一周后,客户数量就有所增长;到第4周末,他们获得了85位新客户


课程总结 🎯

本节课中,我们一起学习了数据分析六阶段(提问、准备、处理、分析、分享、行动)在解决实际问题中的应用。通过Anywhere Gaming Repair的案例,我们看到了如何从定义商业问题开始,通过数据收集、清洗、分析,最终形成可执行的建议并取得实际成果。这就是有效的问题解决,也是数据分析流程在现实世界中的生动体现

003:数据处理流程如何运作 🛠️

在本节课中,我们将跟随谷歌教育评估与研究团队负责人Nikki,学习一个完整的数据处理流程是如何运作的。我们将通过一个具体的案例——谷歌新员工入职培训项目的评估,来了解从提出问题到最终行动的六个关键步骤。


概述:从问题到行动的数据之旅

Nikki介绍了她最喜爱的数据分析环节:发现最棘手的问题,并提出大量问题以探寻解答的可能性。本节将以谷歌新员工入职培训项目为例,详细拆解整个数据处理流程。

第一步:提出问题 ❓

我们首先需要明确分析的核心问题。在谷歌的案例中,团队提出的问题是:我们如何知道新员工通过新的项目制入职培训项目,比旧的讲座式培训项目入职得更快?

提出问题是数据分析的起点,它决定了后续所有工作的方向。

第二步:准备数据 📊

上一节我们明确了分析目标,本节中我们来看看如何为分析准备数据。

一旦问题确定,下一步就是准备数据。这需要与内容提供方紧密合作,以准确定义“更快入职”的具体含义。数据准备包括:

  • 确定分析对象:理解我们所考察的新员工总体是谁。
  • 划分样本集:明确我们的样本集、控制组和实验组分别是谁。
  • 定位数据源:找到数据来源。
  • 确保数据格式:确保数据格式干净、规整,便于我们编写正确的分析脚本。

第三步:处理数据 ⚙️

数据准备就绪后,我们需要对其进行处理,使其进入可分析状态。

我们的下一步是处理数据,确保其格式适用于SQL等工具进行分析。这包括:

  • 格式化数据:确保数据处于正确的格式、正确的列和正确的表中。
  • 编写分析脚本:我们使用 SQLR 编写脚本来关联控制组或实验组的数据。
  • 解读数据:解释数据,以理解我们观察到的行为指标是否有任何变化。

第四步:分享结果 📈

分析完所有数据后,我们需要以利益相关者能够理解的方式报告结果。

根据利益相关者的不同,我们准备了多种形式的报告:

  • 书面报告
  • 数据仪表盘
  • 演示文稿

并将这些信息分享出去。

第五步:根据结果行动 🚀

报告完成后,我们看到了非常积极的结果,并决定采取行动。

我们决定继续推行基于项目学习的入职培训计划。知道我们有数据支持这一决策,并且该计划确实行之有效,这令人非常满意。

总结与收获 🎯

本节课中,我们一起学习了数据处理的全流程。通过谷歌的实例,我们看到了一个数据分析项目如何从提出一个关键问题(“新培训是否更快?”)开始,经历准备数据处理分析分享见解,最终推动实际行动(继续推行新项目)。整个过程不仅依赖于数据的存在,更让我们确信我们的学员真正学到了东西,并且能更快地在工作中提高效率。

004:谷歌数据分析师第二课《以数据驱动的决策提出问题》- 04_01_01_常见问题类型 📊

在本节课中,我们将要学习数据分析师在日常工作中遇到的六种常见问题类型。理解这些类型是解决问题的第一步,它能帮助你更有效地运用数据技能,找到富有创意和洞察力的解决方案。

上一节我们介绍了数据分析如何帮助公司决策,本节中我们来看看数据分析师具体会处理哪些类型的问题。

概述:六种常见问题类型

数据分析师处理的问题多种多样,但可以归纳为几种常见类型。以下是数据分析师在工作中最常遇到的六种问题类型:

  1. 做出预测:利用数据对未来情况做出有根据的决策。
  2. 分类事物:根据共同特征将信息分配到不同的组或集群中。
  3. 发现异常:识别与常态不同的数据。
  4. 识别主题:将信息归类到更广泛的概念中。
  5. 发现关联:找到不同实体面临的相似挑战,并整合数据与见解来解决它们。
  6. 寻找模式:利用历史数据理解过去发生的情况,从而预测未来可能发生的情况。

接下来,我们将逐一详细探讨这些类型。

1. 做出预测 🧮

这种问题类型涉及使用数据对未来事物的发展做出明智的决策。

例如,一个医院系统可能使用远程患者监测数据来预测慢性病患者的健康事件。患者每天在家测量生命体征,这些信息结合他们的年龄、风险因素和其他重要细节,可以使医院的算法预测未来的健康问题,甚至减少未来的住院次数。

核心概念:预测模型通常基于历史数据,其基本思想可以表示为:未来结果 = f(历史数据, 相关变量)

2. 分类事物 🗂️

这种类型意味着根据共同特征将信息分配到不同的组或集群中。

以下是这种问题类型的一个例子:一家制造商审查车间员工绩效数据。分析师可能会为工程效率最高和最低的员工创建一个组,为维修和维护效率最高和最低的员工创建一个组,为装配效率最高和低的员工创建一个组,以及许多其他组或集群。

核心概念:分类算法(如K-means聚类)的目标是将数据点分组,使得组内相似性高,组间相似性低。

3. 发现异常 ⚠️

在这种问题类型中,数据分析师识别与常态不同的数据。

现实世界中发现异常的一个实例是:一个学校系统的注册学生人数突然增加,可能增幅高达30%。数据分析师可能会调查这一激增现象,并发现当年早些时候在该学区建造了几座新的公寓楼。他们可以利用这一分析来确保学校有足够的资源来应对额外的学生。

核心概念:异常检测旨在识别不符合预期模式的数据点,通常使用统计方法(如计算Z-score:Z = (X - μ) / σ)或机器学习模型。

4. 识别主题 🎯

识别主题通过将信息分组到更广泛的概念中,将分类推进了一步。

回到那家刚刚审查了车间员工数据的制造商。首先,这些人按任务类型被分组。但现在,数据分析师可以拿这些类别,并将它们归入“低生产率”和“高生产率”这个更广泛的概念中。这将使企业能够看到谁的生产率最高和最低,从而奖励表现最佳者,并为那些需要更多培训的工人提供额外支持。

核心概念:主题识别常通过文本分析技术(如主题建模)实现,从大量文本中提取出抽象的主题。

5. 发现关联 🔗

发现关联这种问题类型使数据分析师能够找到不同实体面临的相似挑战,然后结合数据和见解来解决它们。

具体来说:假设一家滑板车公司遇到了其车轮供应商提供的车轮问题。公司将不得不停止生产,直到能重新获得质量合格的车轮库存。但与此同时,车轮公司也遇到了制造车轮所用橡胶的问题。结果发现,其橡胶供应商也找不到合适的材料。如果所有这些实体都能公开讨论他们面临的问题并分享数据,他们会发现很多相似的挑战,并且更能够协作找到解决方案。

核心概念:关联分析可以揭示变量之间的关系,例如使用相关性公式:r = Σ[(Xi - X̄)(Yi - Ȳ)] / √[Σ(Xi - X̄)² Σ(Yi - Ȳ)²]

6. 寻找模式 📈

数据分析师通过使用历史数据来理解过去发生的事情,从而寻找可能再次发生的模式。

电子商务公司经常使用数据来寻找模式。数据分析师查看交易数据,以了解客户在一年中某些时间点的购买习惯。他们可能会发现,客户在飓风来临前会购买更多罐头食品,或者在较温暖的月份购买较少的帽子、手套等冷天配件。电子商务公司可以利用这些洞察,确保在这些关键时期储备合适数量的产品。

核心概念:模式识别依赖于时间序列分析或序列模式挖掘,以发现数据中的重复规律或趋势。

总结

本节课中我们一起学习了数据分析师面临的六种基本问题类型:做出预测分类事物发现异常识别主题发现关联寻找模式。理解这些类型是有效解决问题的基石,它将帮助你在未来的数据分析师生涯中,更系统、更高效地应对各种挑战。在接下来的课程中,我们将进一步探讨这些类型,并通过更多实际案例加深理解。

005:六类常见商业问题应用详解 🎯

在本节课中,我们将继续探索数据分析师在商业环境中常遇到的六类问题,并通过具体实例理解它们如何被应用于解决实际挑战。我们将逐一回顾预测、分类、发现异常、识别主题、发现关联和寻找模式这六类问题,并学习如何将它们转化为数据驱动的解决方案。


预测问题:预见未来结果

上一节我们介绍了六类常见问题,本节中我们来看看第一类:预测。预测问题旨在利用现有数据推断未来可能发生的情况。

以下是预测问题的一个应用实例:

  • 背景:Anywhere Gaming Repair公司希望吸引新客户。
  • 问题:如何确定针对目标受众的最佳广告投放方式?
  • 解决方案:公司分析在不同平台投放广告的历史数据,预测各种方案可能带来的效果,从而做出更明智的决策。

虽然无人能预知未来,但数据可以帮助我们评估不同决策可能产生的结果。

分类问题:将事物系统化分组

接下来,我们探讨第二类问题:分类。分类问题涉及根据特定标准将数据点分配到不同的组别中。

以下是分类问题的一个应用实例:

  • 背景:某公司希望提升客户满意度。
  • 问题:如何评估并提升客服质量?
  • 解决方案:数据分析师可以分析客服通话录音,识别通话中的关键词或短语,并将它们分类,例如:
    • 礼貌程度
    • 满意度
    • 不满意度
    • 同理心表达

通过分类,公司可以识别出表现优异的客服代表以及需要额外培训的员工,从而提升整体客户满意度和服务评分。

发现异常问题:识别意外情况

现在,让我们讨论第三类问题:发现异常。这类问题专注于识别数据中与常规模式显著不同的点或事件。

以下是发现异常问题的一个应用实例:

  • 背景:智能健康设备持续收集用户生理数据。
  • 问题:如何及时发现潜在的健康风险?
  • 解决方案:设备(如同数据分析师)持续监测心率等数据。例如,一位用户的静息心率通常为70次/分钟,但某晚设备监测到心率突然飙升至120次/分钟,这触发了异常警报。用户据此就医,及时发现了可能危及生命的健康问题。

识别主题问题:提炼核心观点

紧接着,我们来看第四类问题:识别主题。这类问题常用于用户体验等领域,旨在从大量定性数据中归纳出核心观点或模式。

以下是识别主题问题的一个应用实例:

  • 背景:用户体验设计师希望了解用户对其公司生产的咖啡机的看法。
  • 问题:如何从海量用户反馈中提取有效改进信息?
  • 解决方案:设计师分析匿名调查数据,将零散的见解归纳为更广泛的主题。例如,他发现一个常见主题是“用户难以判断咖啡机是否已启动”。基于此,他优化了开关按钮的位置和指示灯设计,从而提升了产品体验。

发现关联问题:揭示事物间的联系

然后,我们进入第五类问题:发现关联。这类问题旨在找出不同数据集或变量之间的相互关系。

以下是发现关联问题的一个应用实例:

  • 背景:第三方物流公司面临卡车等待时间过长的问题。
  • 问题:如何减少因发货方未准备好货物导致的卡车等待时间?
  • 解决方案:通过共享数据,合作双方可以查看彼此的时间线,发现关联。例如,他们可能发现延误是因为一方仅在周一、三、五发货,而另一方仅在周二、四收货。通过调整日程至同一天,即可有效减少等待时间。

寻找模式问题:洞察重复规律

最后,我们探讨第六类问题:寻找模式。这类问题通过分析历史数据,发现重复发生的规律或趋势。

以下是寻找模式问题的一个应用实例:

  • 背景:石油天然气公司需要确保设备持续正常运行。
  • 问题:如何预防机器故障?
  • 解决方案:数据分析师研究历史数据,寻找模式。他们可能发现,当设备维护周期超过15天时,故障率会显著上升。基于这一模式,公司可以实施更严格的定期维护计划,并在类似问题再次出现迹象时及时干预。

本节课中,我们一起学习了数据分析六类常见问题在真实商业场景中的应用。从预测未来趋势到分类归纳,从发现异常警报到识别核心主题,再到发现事物关联并寻找潜在模式,数据为各行各业提供了强大的决策支持。理解这些问题的类型及其应用场景,是成为合格数据分析师的关键一步。

006:从假设到结果 🧪

在本节课中,我们将跟随谷歌营销团队高级营销分析负责人 Anmol 的讲解,学习如何将一个初步的假设,通过数据分析与测试,最终转化为可执行的商业策略和推荐。这个过程是数据驱动决策的核心。


我的核心工作是在正确的时间,将正确的信息传递给正确的用户。

第一步:识别广泛模式

第一步是广泛地识别正在发生的某种模式。

例如,我们发现某个特定的用户群体对某类内容的反应更积极。

第二步:通过数据验证假设

一旦我们能够通过数据观察到这个假设,我们会进行测试以确保假设是正确的。

以下是测试流程:

  1. 设计测试:我们会测试向这个用户群体发送这类内容。
  2. 控制环境:在一个受控的环境中实际验证。
  3. 验证指标:确认该类内容对该群体的响应率是否确实更高。

验证过程可以用一个简单的逻辑表示:
if (测试组响应率 > 对照组响应率) { 假设成立 } else { 假设不成立 }

第三步:向利益相关者汇报结果

一旦我们能够验证这个假设,我们会回到利益相关者(这里指我们的营销人员)那里进行汇报。

我们会说:“我们已经在相当高的确定度下证明,这个特定群体对这类内容反应更积极。因此,我们建议你们生产更多这类内容。”

第四步:共同见证从假设到策略的演变

我们的利益相关者得以亲眼看到从假设到已验证概念的整个演变过程。

他们能够与我们一同经历我们如何验证这些假设,并最终将其转化为商业策略和建议的旅程。


成果与影响

这个过程的成果是,我们得以真正改变整个营销团队的工作方式。

我们使其变得更加以用户为中心。

从我们的视角来看,这意味着一个根本性的转变:

  • 旧方式:我们先构思我们认为用户需要的内容。
  • 新方式:我们先弄清楚用户需要什么,证明他们需要或不需要某些东西,然后利用这些信息反馈给营销人员,再创作出满足他们需求的内容。

这彻底改变了我们生产内容的方向。


总结

本节课中,我们一起学习了数据驱动决策中“从假设到结果”的完整闭环。这个过程始于对业务模式的观察和假设形成,关键在于通过严谨的测试在数据中验证假设,最终将验证后的结论转化为具体的、以用户为中心的商业行动建议。掌握这一流程,是成为高效数据分析师的重要一步。

007:智能提问 📝

在本节课中,我们将学习如何提出有效的问题,以获取关键洞察并解决各类问题。作为数据分析师,提问是工作中至关重要的一部分。通过提出正确的问题,我们可以更好地理解数据,从而得出有力的结论。


有效提问的重要性

上一节我们介绍了六种基本问题类型,本节中我们来看看如何通过提问来解决这些问题。数据分析师通过提问来确保项目计划与目标一致,并在获得结果时进行质疑,以发现数据背后的深层含义。

提问越多,对数据的理解就越深入,最终得出的洞察也越有力。然而,并非所有问题都同样有效。以下是几种无效提问的例子:

  • 引导性问题:例如,“这些三明治是最好吃的,对吧?”这种问题会引导对方给出特定答案,限制了真实意见的表达。
  • 封闭式问题:例如,“你在马来西亚长大开心吗?”这类问题通常只能用“是”或“否”回答,难以获得有价值的细节信息。
  • 模糊性问题:例如,“你喜欢巧克力味还是香草味?”问题缺乏具体语境(指冰淇淋、布丁还是咖啡?),可能导致误解。

了解有效与无效问题的区别,对数据分析师的职业生涯至关重要,因为数据分析流程始于“提问”阶段。


SMART提问法

有效的问题通常遵循 SMART 原则,即具体可衡量可行动相关有时限。让我们逐一拆解:

  • 具体:问题应简单、有意义,并聚焦于单一或少数紧密相关的主题。这有助于收集与调查内容直接相关的信息。

    • 公式:将宽泛问题转化为具体问题。
    • 示例:将“现在的孩子体育活动足够吗?”转化为“有多少比例的孩子能达到每周至少5天、每天60分钟的推荐运动量?”
  • 可衡量:问题应能被量化和评估。

    • 示例:将“我们的视频为什么火了?”转化为“视频发布第一周在社交媒体上被分享了多少次?”
  • 可行动:问题应能鼓励并导向改变,帮助我们从现状转向理想状态。

    • 示例:将“如何让客户回收产品包装?”转化为“哪些设计特性能让我们的包装更容易被回收?”
  • 相关:问题必须与待解决的问题密切相关,且具有重要意义。

    • 示例:在研究一种濒危青蛙时,与其问“松巴蟾蜍消失有什么关系?”,不如问“1983年至2004年间,北卡罗来纳州达勒姆有哪些环境因素发生变化,可能导致松巴蟾蜍从沙丘地区消失?”
  • 有时限:问题需明确所研究的时间范围,这有助于聚焦分析。

    • 示例:上述关于青蛙的问题将时间限定在 1983年至2004年

确保问题的公平性

在构思问题时,除了SMART原则,公平性也至关重要。公平意味着确保你的问题不会制造或强化偏见。

以下是需要注意的几点:

  • 避免引导性假设:例如,在博物馆满意度调查中问“您最喜欢我们展品的哪一点?”,这就假设了参观者一定喜欢展品。
  • 确保清晰易懂:问题的措辞应清晰、直接,让所有人都能轻易理解。
  • 不公平问题的后果:不公平的问题会导致反馈不可靠,并可能错失获取宝贵洞察的机会。

总结与展望

本节课中,我们一起学习了如何构建有效的问题,包括运用SMART框架,以及确保问题的公平与客观。

接下来,你将探索不同类型的数据,了解每种数据如何指导商业决策。你还将深入学习数据可视化,以及指标或度量如何帮助定义和衡量成功。接下来的内容非常精彩,敬请期待。

008:谷歌数据分析师课程第二课《以数据驱动的决策提出问题》 🎯

概述

在本节课中,我们将跟随谷歌的学习产品组合经理 Evan,了解数据分析领域的职业全景。我们将探讨数据分析师、数据工程师和数据科学家这三个核心角色的职责与关系,并理解掌握数据分析技能如何为你开启多元的职业机遇之门。


我是 Evan,目前在谷歌担任学习产品组合经理。我的工作非常酷,需要研究影响大数据领域的各种技术,并将它们整合到像本课程这样的培训项目中,供学生们学习。在我刚大学毕业或高中毕业时,真希望当时能有这样一门课程。

坦白说,这门数据分析师课程的设计方式非常实用。如果你已经观看了一些视频,它真的能为你胜任任何想做的事情做好准备。它将为你打开数据课程体系内所有你向往的职位大门。

那么,具体有哪些职位呢?对于对数据感兴趣的人来说,职业路径非常多元。

通常,如果你像我一样,你会以数据分析师的身份入门,与电子表格打交道。你可能会处理小型、中型和大型的数据库。

但你需要记住的核心是三个不同的主要角色。当然,每个职业方向内部还有许多专业细分领域。

以下是这三个核心角色:

  • 数据分析师:通常指使用 SQL、电子表格和数据库工作的人,可能会在商业智能团队中创建数据仪表板。
  • 数据工程师:数据分析师通常与数据工程师合作,将原始数据转化为可操作的流水线。
  • 数据科学家:数据工程师构建了这些出色的数据流水线(有时分析师也做这部分工作),分析师提供了干净、可操作的数据,然后数据科学家的工作就是将这些数据转化为非常酷的机器学习模型或统计推断,其成果远超你的想象。

我们会分享很多资源和链接,帮助你了解如何进入这些不同的角色并为之兴奋。

最棒的部分是,如果你像我一样——我上学时并不知道自己想做什么——你并不需要一开始就确定自己想走哪条路。

你可以都尝试一下。看看自己真正、真正喜欢什么。这是非常个人化的选择。

成为一名数据分析师非常令人兴奋。为什么?因为这不仅仅是一个达到目的的手段。踏上这条职业道路,意味着跟随许多杰出前辈的脚步,他们创造的工具和技术让我们今天的工作变得容易得多。

例如,当我开始学习 SQL(结构化查询语言,你将在本课程中学到它)时,我是在自己的本地笔记本电脑上操作的,每条查询可能需要 20 到 30 分钟才能运行完毕。而且,我很难跟踪自己编写的不同 SQL 语句,或者与他人分享。那大约是 10 到 15 年前的事了。

如今,得益于众多公司和工具都在让数据分析的技术和工具变得更易用,你将能轻松愉快地创造数据洞见,而无需承受我起步时的那些负担。

所以,我真的很期待听到你的想法,以及你将会拥有怎样的体验。😊


总结

本节课中,我们一起学习了数据分析领域的三大核心职业角色:数据分析师数据工程师数据科学家,并了解了它们之间的协作关系。我们认识到,掌握数据分析技能能开启广泛的职业机会,并且无需在起步时就确定最终方向,可以多方尝试找到自己的热情所在。同时,我们也看到,如今的学习和工作工具已比过去更加高效和友好。

009:谷歌数据分析师第二课《以数据驱动的决策提出问题》📊

概述

在本节课中,我们将深入探讨数据分析中的问题解决与有效提问。我们将学习数据如何赋能决策、定量与定性分析的区别与应用、不同数据可视化工具的优缺点、指标的定义与分析师的用法,以及如何运用数学思维连接信息点。


数据赋能决策

上一节我们介绍了问题解决与提问的基础,本节中我们来看看数据如何在实际决策中发挥作用。数据能够为各种规模的决策提供支持,无论是日常运营还是战略规划。

定量分析与定性分析

以下是定量分析与定性分析的核心区别及其适用场景:

  • 定量分析:处理可量化的数字数据,例如销售额、用户数量或点击率。其核心是公式代码,例如计算平均值:平均值 = 总和 / 数量
  • 定性分析:处理描述性的、非数字的数据,例如用户访谈记录、观察笔记或情感反馈。

这两种分析方式并非互斥。在实际工作中,定量数据与定性数据可以协同工作,提供更全面的洞察。例如,在金融领域的工作大多基于定量分析,但近期一个关注同理心与信任的项目引入了大量定性分析。将定性因素纳入考量与分析,能帮助我们理解定量与定性数据如何结合,从而做出更有力的决策。


数据可视化工具

了解数据后,我们需要有效地展示它。不同的数据可视化工具各有其优缺点。

以下是常见可视化工具的简要对比:

  • 图表(如折线图、柱状图):擅长展示趋势和比较。
  • 仪表盘:集成多个视图,提供实时概览。
  • 热力图:用于显示密度或关注度分布。

选择工具时,需考虑数据特性和沟通目标。


指标与数学思维

分析师通过指标来衡量和评估情况。指标是量化的测量标准,例如“用户增长率”或“客户满意度得分”。

运用数学思维意味着能够识别数据中的模式、关系和逻辑联系,从而“连接信息点”。这包括理解比例、趋势和相关性,而不仅仅是计算数字。


构建你的分析工具箱

现在,你已经开始构建自己的数据分析工具箱。很快,你将能够独立分析各种数据,并在过程中持续学习。但首先,让我们从观察的力量开始,迈出第一步。


总结

本节课我们一起学习了数据如何驱动决策、定量与定性分析的结合、数据可视化工具的选择、指标的应用以及数学思维在连接信息点中的重要性。这些是构建数据分析能力的基础组件。

010:数据如何赋能决策

在本节课中,我们将探讨数据如何在决策过程中发挥作用,并初步了解数据驱动决策与数据启发决策的区别。我们将通过实际例子,理解数据如何从原始事实转化为有价值的知识,并最终赋能决策。


我们已经讨论过数据的定义及其在决策中的作用。目前我们了解到:数据是事实的集合数据分析能揭示数据中的重要模式和洞见数据分析能帮助我们做出更明智的决策

本节中,我们将具体观察数据如何融入决策流程,并快速区分数据驱动决策与数据启发决策。


🔍 数据在现实决策中的应用

回想一下你最近一次使用“附近餐厅”搜索,并按评分排序来帮助决定去哪家就餐的经历。这就是一个利用数据做出决策的实例。

企业和组织同样时刻利用数据来优化决策。它们主要通过两种方式实现:数据驱动决策数据启发决策。我们稍后会详细讨论数据启发决策,这里先给出一个简要定义:

数据启发决策通过探索不同数据源,找出它们之间的共同点。

以谷歌为例,我们每天以各种令人惊喜的方式运用数据。例如,通过分析人工智能收集的多年数据,我们做出了帮助将数据中心冷却能耗降低超过40% 的决策。

谷歌的人力运营团队也利用数据来改进招聘流程与新员工入职体验。我们希望确保不错过任何有才华的申请人,并让新员工顺利适应角色。在分析了申请、面试和新员工培训流程的数据后,我们开始采用一种算法

算法是为完成特定任务而遵循的一系列过程或规则集。

借助该算法,我们重新审核了未通过初筛的申请人,以发现优秀候选人。数据还帮助我们确定了能带来最佳招聘决策的理想面试次数。此外,我们制定了新的入职计划,以帮助新员工更好地开启工作。


🌐 数据的潜力与转化

数据无处不在。科学家估计,全球90%的数据是在过去短短几年内产生的。这蕴含着巨大潜力:我们拥有的数据越多,能解决的问题就越大,解决方案也越有力。

然而,负责任地收集数据只是过程的一部分。我们还需将数据转化为能帮助我们制定更好解决方案的知识。正如谷歌同事所说:

仅仅拥有海量数据是不够的,我们必须用它来做有意义的事。数据本身提供的价值很小。

引用推特和Square创始人杰克·多西的话:

“我们在世界上所做的每一个行动都会触发一定量的数据。在有人对其加以解读或赋予叙事之前,这些数据大多毫无意义。”

数据是直白的:数据 = 收集在一起的事实,描述某物的数值

单个数据点在收集和结构化后会变得更有用,但其本身仍缺乏意义。我们需要解读数据以将其转化为信息

以迈克尔·菲尔普斯在200米个人混合泳比赛中的成绩为例,“1分54秒”这个数据本身信息有限。

但当我们将其与比赛中其他选手的时间进行比较时,就能看出迈克尔获得了第一名,赢得了金牌。

我们的分析获取了数据(即迈克尔一系列比赛的成绩列表),并通过与其他数据对比,将其转化为了信息。上下文至关重要:我们需要知道这是一场奥运会决赛,而非普通比赛,才能确定这是金牌成绩。

但这仍未成为知识。当我们消化信息、理解并应用它时,数据才发挥最大效用。换句话说,我们由此得知:迈克尔·菲尔普斯是一位速度极快的游泳运动员


⚠️ 数据分析的局限性

但请记住,数据分析存在局限性。有时我们无法获取所需的全部数据,或者不同项目对数据的衡量方式不同,这可能导致难以找到确凿的例证。我们将在后续课程中更详细地探讨这些,但现在开始思考它们非常重要。


🎯 总结与展望

现在你已了解数据如何驱动决策,也明白了数据分析师角色对企业的重要性。数据是决策的强大工具,而你可以帮助企业获得解决问题和做出新决策所需的信息。

但在那之前,你需要进一步了解将要处理的数据类型以及如何处理它们。我们将在接下来的课程中展开学习。


本节课中,我们一起学习了:

  1. 数据在现实生活和企业决策中的具体应用实例。
  2. 数据驱动决策与数据启发决策的初步概念。
  3. 数据如何从原始事实,经过解读和对比转化为信息,并最终通过应用成为知识。
  4. 认识到数据分析存在获取和衡量标准等方面的局限性。
  5. 明确了数据分析师在将数据转化为决策知识过程中的关键作用。

011:定性数据与定量数据 📊

在本节课中,我们将要学习数据分析中两种核心的数据类型:定量数据定性数据。理解它们的区别以及如何运用它们来回答不同的问题,是成为一名优秀数据分析师的关键。


概述:数据是决策的关键 🔑

在决策过程中,数据至关重要。然而,不同类型的问题需要不同类型的数据来解答。本视频将重点讨论两种主要的数据类型:定量数据定性数据


什么是定量数据? 🔢

定量数据是关于数值事实的具体、客观的度量。它通常用于回答“是什么”、“有多少”以及“频率如何”这类问题。换句话说,定量数据衡量的是可以计数或测量的东西。

核心概念:定量数据 = 可测量的数值事实。

例如,每周有多少通勤者乘坐火车上班就是一个典型的定量问题。作为一名金融分析师,我经常处理定量数据,我欣赏数字带来的确定性和准确性。


什么是定性数据? 🎨

与定量数据相对,定性数据描述的是主观的或解释性的特征与品质,这些无法用数值数据来衡量。

核心概念:定性数据 = 描述性、主观的特征(如发色、观点、感受)。

定性数据非常适合帮助我们回答“为什么”的问题。例如,为什么人们更喜欢某位明星或某种零食


两种数据的协同作用 🤝

上一节我们介绍了两种数据的定义,本节中我们来看看它们如何协同工作。

通过定量数据,我们可以看到以图表形式可视化的数字。而定性数据则能让我们从更高层面理解这些数字为何如此。这一点非常重要,因为它帮助我们为问题添加上下文。

作为一名数据分析师,你将根据具体的业务任务,同时使用定量分析和定性分析。


实例解析:在线评论 📝

评论是结合两种数据的绝佳例子。回想一下你曾借助评论来决定是否购买某物或前往某地的经历。这些评论可能告诉你有多少人喜欢或不喜欢那样东西,以及原因。

企业也会阅读这些评论,但他们以不同的方式使用数据。让我们看一个企业利用客户评论数据的例子,来观察定性和定量数据是如何发挥作用的。

假设一家本地冰淇淋店开始利用其在线评论与客户互动并建立品牌。这些评论让冰淇淋店得以洞察客户的体验,从而为决策提供信息。

店主注意到店铺评分一直在下降。他发现最近店铺收到了更多负面评价。他想知道原因,于是开始提出问题。


提出定量问题

以下是可量化的问题示例:

  • 有多少条负面评论?
  • 平均评分是多少?
  • 有多少条评论使用了相同的关键词?

这些问题会产生定量数据,即帮助确认客户不满意的数值结果。


转向定性问题

定量数据可能引导他们提出不同的问题。以下是引导出定性数据的问题:

  • 客户为什么不满意?
  • 我们如何改善他们的体验?

在查阅评论后,冰淇淋店老板发现了一个规律:17条负面评论都使用了“沮丧”这个词——这是定量数据。

现在,我们可以通过询问“为什么这个词被重复使用”来开始收集定性数据。他发现,客户感到沮丧是因为店铺在每天关门前就售罄了热门口味。


总结与行动 🚀

本节课中我们一起学习了定量数据与定性数据的核心区别与应用。

凭借定量和定性数据,冰淇淋店老板能够确定客户不满意,并理解其原因。拥有这两种类型的数据使他能够做出正确的改变并改善业务。

现在你知道了定量数据和定性数据之间的区别,也就知道了如何通过提出不同的问题来获取不同类型的数据。作为数据侦探,你的职责就是知道该问哪些问题来找到正确的解决方案。

之后,你就可以开始思考一些酷炫且有创意的方法,来帮助利益相关者更好地理解数据,例如我们即将学习的交互式仪表板

012:成果展示 - 分享你的发现 📊

在本节课中,我们将学习如何有效地组织和展示数据分析成果。数据本身很有价值,但若无法清晰传达数据背后的故事,它对任何人都没有用处。因此,我们需要掌握将数据转化为信息的方法。本节将重点介绍两种数据展示工具:报告和仪表盘。


报告与仪表盘:两种可视化工具

上一节我们介绍了数据的重要性,本节中我们来看看如何展示数据。报告和仪表盘都是有用的数据可视化工具,但各有优缺点。

报告是定期提供给利益相关者的静态数据集合。仪表盘则用于监控实时传入的数据。


深入了解报告 📄

报告非常适合展示组织的高层次历史数据快照。例如,一家金融公司的月度销售额。

以下是报告的主要优点:

  • 报告可以定期设计和发送,通常按周或按月进行,是组织有序且易于参考的信息。
  • 只要持续维护,报告设计快捷且易于使用。
  • 报告使用静态数据(即记录后不再更改的数据),因此反映的是已经过清理和排序的数据。

当然,报告也有一些缺点需要注意:

  • 报告需要定期维护,并且视觉吸引力通常不强。
  • 由于报告不是自动或动态的,因此无法显示实时演变的数据。

探索仪表盘 🖥️

若需要实时反映传入的数据,您需要设计一个仪表盘。

仪表盘之所以出色,原因有很多:

  • 仪表盘让您的团队能更多地访问正在记录的信息。
  • 您可以通过使用筛选器与数据进行交互。
  • 由于是动态的,仪表盘具有长期价值。如果利益相关者需要持续访问信息,使用仪表盘比反复提取报告更高效,这为您节省了大量时间。
  • 最后同样重要的是,仪表盘看起来更美观。

但仪表盘也有一些缺点:

  • 仪表盘设计需要大量时间,如果使用频率不高,其效率可能反而不如报告。
  • 如果底层数据表在任何时候出现问题,仪表盘需要大量维护才能恢复运行。
  • 仪表盘有时会因信息过多而让人不知所措。如果不习惯查看仪表盘上的数据,可能会在其中迷失方向。

选择正确的沟通方式

作为数据分析师,您需要决定向利益相关者传达信息的最佳方式。

例如,如果您的利益相关者对公司社交媒体参与度感兴趣,那么一份告知其页面新增关注者数量的月度报告是否有用?还是一个能监控多个平台实时社交媒体参与度的仪表盘更有用?

在后续课程中,您将创建自己的报告和仪表盘来练习使用这些工具。但现在,我想向您展示报告和仪表盘可能是什么样子。


使用电子表格创建报告示例

我们将从一个熟悉的工具——电子表格开始。让我们看看电子表格数据在报告中可视化的一种方式。

这个电子表格包含一家公司的订单详情数据集。信息量很大。从标题行可以看出,这里记录了不同的内容,例如订单日期、销售人员、单价和每笔记录交易的收入。

这些都是有用的信息,但有点难以理解。我们需要一份更易读的报告。

假设您的利益相关者希望快速查看按销售人员划分的收入情况。利用这些数据,您可以为他们制作一个数据透视表,并附上显示该信息的图表。

数据透视表是一种用于数据处理的数据汇总工具。它用于汇总、排序、重组、分组、计数数据,或计算数据库中存储数据的平均值。它允许用户将列转换为行,将行转换为列。我们稍后会深入学习数据透视表,但我先快速演示一下。

我们将选择“数据”菜单,点击“数据透视表”按钮。它可以从这个表格中提取数据,所以我们只需点击“创建”,它就会在这里调出一个新的工作表。它为我们提供了可供选择的数据透视表字段。

我选择“销售人员”和“收入”。就这样,它为我们制作了一个图表。此时,您可以调整图表的外观,但所有信息都已呈现。


仪表盘示例

如果您需要一种更动态的方式与利益相关者共享信息,仪表盘是您的得力助手。

您可能会创建类似这样的 Tableau 仪表盘,其中包含交互式图表,展示数据的多个视图。用户可以通过点击仪表盘上的不同元素,来更改位置、日期范围或他们正在查看数据的任何其他方面。很酷,对吧?

在本课程的后续部分,我们将探讨如何制作自己的数据可视化。在达到那个水平之前,我们还有很多东西要学,但我希望这是对不同可视化工具的一次激动人心的初探,这些工具将是您作为数据分析师要使用的。


总结

本节课中我们一起学习了如何通过报告和仪表盘来分享数据分析发现。报告适合提供定期的、静态的历史数据快照,而仪表盘则擅长展示动态的、实时的数据交互视图。作为分析师,根据利益相关者的具体需求选择合适的工具至关重要。我们通过电子表格初步了解了报告的制作,并预览了交互式仪表盘的功能,为后续深入学习数据可视化奠定了基础。

013:数据与指标对比

在本节课中,我们将要学习数据与指标之间的区别,以及如何利用指标将原始数据转化为有用的信息。我们将探讨指标的定义、如何选择正确的指标,以及不同行业如何运用指标来达成业务目标。


在上一节视频中,我们学习了如何通过报告和仪表板可视化数据,以有趣的方式展示发现。在其中一个例子中,公司希望查看每位销售人员的销售额,这一具体的数据测量正是通过指标完成的。

本节中,我们将进一步探讨数据与指标的区别,以及指标如何将数据转化为有用信息。

什么是指标? 📈

指标是一种可量化的单一数据类型,可用于测量。

可以这样理解:数据最初是一堆原始事实的集合,直到我们将它们组织成代表单一数据类型的个体指标。

指标还可以组合成公式,你可以将数值数据代入这些公式进行计算。

在我们之前的销售额例子中,除非使用特定的指标来组织数据,否则所有数据意义不大。

以每位销售人员的收入作为我们的指标,现在我们就能看出哪位销售人员带来了最高的收入。

指标通常涉及简单数学运算 ➕

例如,收入的计算公式是:收入 = 销售数量 × 销售单价

选择正确的指标是关键。数据包含大量关于我们所探索问题的原始细节,但我们需要正确的指标来获得我们寻找的答案。

不同行业的指标应用 🏢

不同行业会使用各种指标来测量数据集中的事物。

以下是不同行业企业使用指标的一些方式,以便你了解如何将指标应用于你收集的数据。

投资回报率

你听说过ROI吗?公司经常使用这个指标。ROI,即投资回报率,本质上是一个使用指标设计的公式,它让企业了解一项投资的表现如何。

ROI由两个指标组成:一段时间内的净利润投资成本。通过比较这两个指标——利润和投资成本,公司可以分析他们拥有的数据,以评估其投资表现。这进而可以帮助他们决定未来如何投资以及优先考虑哪些投资。

客户保留率

我们在市场营销中也看到指标的应用。例如,指标可用于帮助计算客户保留率,即公司长期留住客户的能力。

客户保留率可以帮助公司比较一个时期开始和结束时的客户数量,以查看其保留率。这样,公司就能知道他们的营销策略有多成功,以及是否需要研究新方法来吸引更多回头客。

指标目标 🎯

不同行业使用各种不同的指标,但它们都有一个共同点:都试图通过测量数据来实现特定目标。

指标目标是公司设定的、可使用指标进行评估的可衡量目标。就像有许多可能的指标一样,也有许多可能的目标。

也许一个组织希望达到一定的月销售额,或者达到一定比例的回头客。

通过使用指标来关注数据的各个具体方面,你可以开始理解数据所讲述的故事。

总结 📝

本节课中,我们一起学习了数据与指标的核心区别。指标是将原始数据转化为可测量、可分析信息的关键工具。我们了解了指标的定义、基本运算方式,并通过投资回报率和客户保留率等例子,看到了指标在不同行业的具体应用。最后,我们认识到设定明确的指标目标对于利用数据驱动决策至关重要。指标和公式是衡量和理解数据的有效方法,但并非唯一途径,我们将在课程后续继续探讨如何解读和理解数据。

014:数学思维

在本节课中,我们将学习如何运用数学思维来解决问题。数学思维是一种强大的技能,它能帮助你分析问题并发现新的解决方案。我们将探讨数学思维的含义,以及如何开始运用它。


什么是数学思维?🧠

上一节我们介绍了数据可视化和指标,本节中我们来看看数学思维。运用数学方法并不意味着你必须突然成为数学专家。它意味着观察问题,并逻辑地将其分解为逐步的步骤,以便你能看到数据中的关系与模式,并利用这些来分析问题。

这种思维方式还能帮助你确定最适合的分析工具,因为它让你看到问题的不同方面,并选择最合理的分析方法。


选择分析工具时的考量因素🔧

选择最有用的分析工具时,需要考虑许多因素。

以下是决定使用哪种工具的一种方式:

  • 数据规模:处理数据时,你会发现数据有大小之分。
    • 小数据:这类数据可能非常小,通常由在短而明确的时间段内与特定指标相关的数据组成,例如你一天喝了多少水。小数据可用于日常决策,比如决定多喝水,但它对业务运营等更大的框架影响不大。刚开始时,你可能会使用电子表格来组织和分析较小的数据集。
    • 大数据:另一方面,大数据具有更大、更不具体的数据集,覆盖更长的时间段。它们通常需要被分解才能进行分析。大数据有助于审视大规模的问题,并帮助公司做出重大决策。处理这种规模的数据时,你可能会转向使用 SQL。

数学思维应用实例🏥

让我们看一个例子,看看在医院工作的数据分析师如何运用数学思维和正确的工具来解决问题。

医院可能发现存在床位使用过度或不足的问题。基于此,医院可以将床位优化设为目标。他们希望确保需要床位的患者有床位可用,但又不浪费医院在维护空床位上的空间或金钱等资源。

运用数学思维,你可以将这个问题分解为逐步的过程,以帮助你在数据中发现模式。

这个场景中有很多变量,但为了简化,我们先关注几个关键变量。

以下是与此问题相关、可能显示数据模式的指标:

  • 一段时间内开放的床位数量
  • 一段时间内使用的床位数量

实际上,这已经有一个公式,称为床位占用率。它的计算使用给定时间段内的总住院天数总可用床位数

公式:床位占用率 = (总住院天数 / 总可用床位数) × 100%

我们现在要做的是,提取关键变量,并观察它们之间的关系如何向我们展示可以帮助医院做出决策的模式。

为此,我们必须选择适合此任务的工具。

医院在很长一段时间内会产生大量的患者数据。因此,从逻辑上讲,一个能够处理大数据集的工具是必需的。SQL 是一个很好的选择。

在这种情况下,你发现医院总是有未使用的床位。了解到这一点,他们可以选择减少一些床位,从而节省空间和资金,这些资源可以用于购买和储存防护设备。

通过逻辑地考虑这个问题的所有独立部分,数学思维帮助我们看到了新的视角,从而找到了解决方案。


课程总结✨

本节课中我们一起学习了如何运用数学思维进行问题解决。我们了解到,数学思维是一种逻辑分解问题、发现数据模式的方法,它不要求你是数学专家,但能帮助你选择正确的分析工具(如针对小数据的电子表格或针对大数据的SQL)。通过一个医院床位优化的实例,我们看到了如何将实际问题转化为可分析的指标和公式,并最终得出有效的解决方案。


接下来,我们将开始学习电子表格基础知识。这将帮助你将所学知识付诸实践,并掌握一个在数据分析过程中有用的新工具。

我们下次见。

015:谷歌数据分析师课程第二课《以数据驱动的决策提出问题》 📊

第15讲:强大的电子表格 💪

在本节课中,我们将重新审视电子表格这一工具。电子表格功能强大且用途广泛,是数据分析师几乎所有工作的核心组成部分。当你尝试回答数据驱动的问题时,电子表格很可能是你首先使用的工具。

因此,在你明确了需要用数据做什么之后,你将借助电子表格来构建证据,进而将其可视化并用于支持你的发现。电子表格通常是数据世界中默默无闻的英雄,它们并不总能得到应有的赞赏。但作为一名数据侦探,你绝对会希望将它们纳入你的证据收集工具箱。

我知道电子表格不止一次帮我解决了大问题。我曾将采购订单数据添加到表格中,在一个工作表里设置好公式,然后让相同的公式在其他工作表中为我完成工作。这为我节省了时间,让我可以在白天处理其他事务。我无法想象不使用电子表格会怎样。

数学是每位数据分析师工作的核心部分,但并非每位分析师都喜欢它。幸运的是,电子表格可以让计算变得更有趣,我的意思是更简单。让我们看看它是如何做到的。

上一节我们介绍了电子表格的重要性,本节中我们来看看它如何进行计算。

电子表格可以自动执行基本和复杂的计算。这不仅有助于你更高效地工作,还能让你看到结果并理解其由来。以下是你执行计算时会用到的一些函数。

  • SUM: 对一系列单元格中的数值求和。
  • AVERAGE: 计算一系列单元格中数值的平均值。
  • COUNT: 计算包含数字的单元格数量。
  • MAX: 找出一系列单元格中的最大值。
  • MIN: 找出一系列单元格中的最小值。

许多函数也可以作为数学公式的一部分使用。

函数和公式还有其他用途,我们也将探讨这些。我们将通过使用来自数据库的真实数据进行练习,将学习更进一步。这是你重组电子表格、进行实际数据分析并享受数据乐趣的机会。

本节课中我们一起学习了电子表格在数据分析中的核心作用,特别是其强大的自动计算功能。通过掌握基本函数,你可以更高效地处理数据,为后续的可视化和决策支持打下坚实基础。

016:16_03_02_开始使用电子表格

概述

在本节课中,我们将学习数据分析师如何使用电子表格来组织和计算数据。电子表格是数据分析师日常工作中不可或缺的工具之一,它能帮助分析师高效地处理各种任务。

电子表格在数据分析中的角色

数据分析师花费大量时间组织数据和执行计算。幸运的是,有多种工具可以帮助他们完成这些工作,其中就包括电子表格。本节视频将介绍数据分析师使用电子表格协助完成日常职责的一些方式。稍后你将有机会亲自尝试其中一些功能,但现在,我们先快速了解数据分析师如何利用电子表格开展工作。

核心任务概述

具体工作内容会根据你需要完成的任务而变化,但以下是几项主要任务的概述。

假设你在一家建筑公司工作,公司需要你运用电子表格技能来分析一些关于支出的数据。因此,你需要访问相关数据并将其添加到电子表格中。我们现在不会涵盖这个项目的所有细节,但随着课程的深入,你将有机会近距离了解许多电子表格功能。

数据导入后的处理步骤

现在数据已经在你的电子表格中了,接下来该做什么?同样,这因工作而异,但你可以从根据被分配的任务来组织数据开始。

以下是可能涉及的几个步骤:

  • 使用数据透视表组织数据:例如,你可以将数据放入数据透视表中。我们在本课程之前提到过数据透视表,后续会更详细地介绍。现在,你可以将它们视为组织良好且非常有用的表格。
  • 在数据透视表中筛选数据:对数据进行排序和筛选是大多数工作的常见部分。这让你可以只关注分析所需的数据。在我们的例子中,也许你只需要某个时间段(如过去三个月)的支出数据。
  • 执行计算以深入了解数据:筛选数据后,你可以执行一些计算来了解更多信息。例如,你可能需要找出哪些建筑项目最终花费了最多的资金。

公式与函数的作用

这时,公式函数就非常实用了。我们稍后会详细讨论它们,但公式和函数非常适合进行快速计算,尤其是在你“掰手指脚趾都数不过来”的时候。

总结

本节课中,我们一起了解了数据分析师在日常工作中如何使用电子表格来完成各种任务,包括组织数据和进行计算。很快,你将有机会在自己的电子表格中进行实际操作。

017:基础电子表格操作

在本节课中,我们将学习如何利用电子表格进行基础数据整理与操作。电子表格不仅是组织数据的强大工具,还能帮助我们高效执行计算任务。接下来,我们将通过实际步骤,演示数据分析师常用的电子表格基础功能。


🚀 开始创建电子表格

上一节我们介绍了电子表格在数据整理中的重要性,本节中我们来看看如何从零开始创建一个电子表格。

作为数据分析师,您可能不会总是从空白表格开始工作,但掌握创建方法仍然很有必要。

以下是创建新电子表格的步骤:

  1. 打开 Excel、Google Sheets 或其他您使用的电子表格软件。
  2. 选择新建一个空白文件。

打开新表格后,第一件事是为其命名。一个专业建议是:标题应简短、清晰,并能准确说明表格中的数据内容。这能极大方便后续的文件查找。

为电脑创建一个专门存放电子表格及相关文件的文件夹,也能帮助您更轻松地管理文件。对于本例,我们的文件已保存在云端硬盘中。我们打开“文件”菜单,点击“移动”,然后创建一个名为“人口数据”的新文件夹,并将电子表格移动至此。

这样,我们的表格就有了专属位置。当您需要查找此文件时,这将为您节省大量不必要的点击和时间。


📥 获取与导入数据

数据分析师获取数据的途径多种多样,具体取决于工作需求。您可能会使用开源数据、被分配数据,或被要求自行寻找数据。在本课程后续部分,您将体验到所有这些方式。

网络上有许多向公众开放的开源数据源。例如,我们将使用来自世界银行(Worldbank.org)的数据,这些数据已经以电子表格形式提供。该数据显示了2010年至2019年拉丁美洲和加勒比地区国家的人口数据。

让我们打开这个电子表格。


🧹 整理数据以备分析

现在,是时候为数据分析做准备了。我们将从选择整个工作表开始。

为了让数据更清晰地显示,我们可以通过拖动某一列的边界来加宽所有列。之后,再根据需要调整个别列宽。当然,加宽列还有其他方法,但目前这种方法就足够了。

电子表格的第一行用于存放数据属性或变量,其本质是为每列的数据类型添加标签。为了让属性行与其他行区分开来,我们可以选中它并填充颜色,同时将标签加粗。

如果需要在两个现有属性之间添加新的数据属性,我们随时可以插入新列。只需点击任意列中的一个单元格,然后使用“插入”菜单添加新列即可。新列将出现在您最初点击的列旁边,操作非常简单。

删除列同样简单:右键单击要删除列中的任意单元格,选择删除选项即可。

请注意:我们演示的步骤可能因您使用的电子表格程序而异,但大体上应该相似。

让我们再为数据表添加一项内容:边框。边框可以帮助您更清晰地查看每个数据单元格。要添加边框,首先点击表格左上角的“全选”按钮(这个按钮很实用,因为当您需要对工作表中所有单元格进行更改时,都可以点击它),然后点击菜单中的边框按钮,选择您想要的边框类型。

为了保持表格格式统一,我们选择为所有单元格添加边框。

就这样,我们的表格从原始状态变得精致起来。现在,我们的电子表格不仅填满了数据,而且看起来也更加美观。在开始分析前使用这些整理工具,能帮助您在分析过程中更专注于数据本身。


📝 总结

本节课中,我们一起学习了电子表格用于整理数据的一些基本方法。您现在应该已经准备好开始亲自操作电子表格了。在后续课程中,您将了解更多关于电子表格的知识,包括一些常见错误及其解决方法。

018:谷歌数据分析师课程第二课《以数据驱动的决策提出问题》 📊

第18讲:成功公式

在本节课中,我们将学习如何在电子表格中进行计算。你将掌握使用公式进行求和、求平均值、寻找最大值和最小值等基本操作,并通过一个销售数据分析的实例来巩固所学知识。


公式基础

上一节我们介绍了如何整理数据,使其为分析做好准备。本节中,我们来看看如何利用公式进行计算。

公式是一组执行特定计算的指令。在数据分析中,公式能自动为你完成数学运算,其功能远不止于此,你将在后续的分析过程中学习其更多用途。

公式基于运算符构建。运算符是用于命名要执行的操作或计算类型的符号。例如,加号 + 就是一个常见的运算符。数据分析中使用的公式通常至少包含一个运算符。

数学表达式

数学表达式或方程可以有很多种形式,你可能已经对它们很熟悉了。

以下是表达式的例子:

  • 3 - 1
  • 15 + 8 / 2
  • 846 * 513

在数学课上,你很可能学过通过包含等号和结果来完成一个表达式。但在电子表格中创建公式时,情况略有不同:你用一个等号 = 来开始公式

例如,如果我们想进行减法运算,我们输入一个等号,然后输入表达式的其余部分,公式中不能有任何空格。

现在,让我们尝试一个更具挑战性的表达式。我们输入:
=317982 - 17795
然后按回车键进行计算。

在处理大数字或多步骤的表达式时,你很可能会以这种方式使用公式。

以下是完成公式所需的运算符:

  • 加号 + 用于加法。
  • 减号或连字符 - 用于减法。
  • 星号 * 用于乘法。
  • 正斜杠 / 用于除法。

除法和乘法的符号可能与你习惯的不同。这些是小变化,但很重要,需要记住。

单元格引用

如果你的电子表格中已有数据,你可以在公式中使用单元格引用,而不是直接输入数字。

单元格引用是工作表中可以在公式中使用的单个单元格或单元格区域。单元格引用包含数据所在列的字母和行的编号。

单元格区域是两个或更多单元格的集合。一个区域可以包括同一行或同一列的单元格,也可以包括不同列和行组合在一起的单元格。我们将在后续视频中展示一个例子。

实践:销售数据分析

现在,让我们将刚刚学到的知识应用到一些销售数据中。

假设我们想将这些数字相加,以找到第一行数据的总销售额。你可以点击单元格 F2。

从那里,我们以一个等号开始,并使用单元格引用来输入表达式中的值。我们从单元格 B2 开始,因为 A2 中的年份不是我们想加到总额中的值。

公式如下:
=B2 + C2 + D2 + E2
然后按回车键。就这样,你的总销售额就计算出来了。

但是,如果你发现数据中某个值是错误的怎么办?没问题。你可以更改公式中使用的任何单元格的值,总额将自动更新。

使用单元格引用的一个巨大好处是,当公式被复制到新单元格时,它们也会自动更新。这节省了大量时间。因此,无需为每一组新的单元格引用再次输入相同的公式,只需使用菜单或键盘快捷键(如 Ctrl + C)复制公式,然后使用 Ctrl + V 将其粘贴到你想应用的地方。公式会自动更新所有新的单元格和值。

计算平均值

现在,假设你还想计算平均销售额。你可以在另一个单元格中创建一个新公式。

要在公式中对值进行分组,请使用括号 ()。这能让你的电子表格知道哪些值要一起计算,以及要执行的操作顺序。

例如,要计算平均值:
=(B2 + C2 + D2 + E2) / 4
你正在将四个单元格中的值相加,然后使用斜杠 / 将总和除以四。和上一个公式一样,我们可以复制并粘贴这个公式。

计算百分比变化

如果你想计算六月和七月之间销售额的百分比变化,可以使用另一个公式。

公式如下:
=(C2 - B2) / B2
公式计算出值后,你可以使用百分比按钮将该值更改为百分比格式。当你将此公式应用到其他行时,公式和百分比格式都会自动更新。

处理错误

哦,这看起来不像正确答案。我们好像遇到了一个错误。别担心,错误可能发生在数据分析的任何阶段,包括使用电子表格时。公式必须是严密的,如果某个单元格引用有问题,它就无法工作。

那么我们的错误是什么?我们可以看到,单元格 D4 中的值缺失了。你可能需要花一些时间并查找资料来找到正确的值,但这是值得的,因为你希望你的分析尽可能准确。当你添加了正确的值后,公式会自动处理其余的计算。


总结

本节课中,我们一起学习了电子表格中公式的基础知识。我们介绍了运算符、数学表达式、单元格引用的概念,并通过销售数据实例实践了求和、求平均值以及计算百分比变化。我们还学习了如何复制公式以提高效率,以及如何处理公式中可能出现的错误。掌握这些技能将使你的分析更高效,工作更轻松。很快,你就可以在自己的电子表格中应用这些知识了。祝你使用愉快!

019:电子表格错误与修复

在本节课中,我们将学习如何识别和修复电子表格中常见的公式错误。掌握这些技巧对于数据分析师至关重要,因为错误排查是数据分析工作的重要组成部分。

🔍 常见错误类型与修复方法

上一节我们介绍了电子表格公式的基础知识,本节中我们来看看几种常见的错误类型及其解决方法。

1. #DIV/0! 错误

当公式试图用某个单元格的值除以0或空单元格时,就会出现#DIV/0!错误。

以下是一个示例:在电子表格中,C列的“完成百分比”是通过将“已完成任务”列的值除以“所需任务”列的值来计算的。C列已格式化为百分比。

#DIV/0! 错误出现在单元格C4,因为我们除以了0,即单元格A4中的值。

为避免此问题,我们可以让电子表格在A列包含0时自动输入“不适用”,从而避免错误。

为此,我们使用IFERROR函数。如果遇到因单元格包含0而导致的错误,将插入短语“不适用”。我们还可以将公式复制到C列的其余单元格,以检查其他包含零的单元格。

2. #ERROR! 错误

在Google Sheets中,#ERROR!告诉我们公式无法按输入的方式被解释。这也称为解析错误。

假设我们想统计B列和C列的总任务数,我们使用SUM函数。但公式=SUM(B2:B6 C2:C6)会导致#ERROR!。

仔细检查后,我们发现单元格范围B2:B6C2:C6之间缺少一个逗号。我们可以通过在单元格范围之间插入逗号来修复此问题,以指示每个数据项的结束。这称为分隔符。

现在,公式可以正确计算出总任务数为25。

3. #N/A 错误

N/A错误表示电子表格无法找到公式中的数据。通常,这意味着数据不存在。此错误最常在使用VLOOKUP等函数时发生,该函数在列中搜索特定值以返回相应的信息。

这里我们看到一个坚果及其价格的主列表。使用VLOOKUP,电子表格在列表中查找价格,然后使用指定的加价计算每家商店的价格。但我们在单元格B49和C49中遇到了#N/A错误。VLOOKUP公式是正确的。

那么问题出在哪里?如果我们仔细查看坚果的名称,“almond”在查找表中没有匹配项。查找表使用的是复数形式“almonds”。因此,我们将“almond”改为“almonds”,修复了这个拼写错误后,正确的价格就被填入了。

4. #NAME? 错误

有时,拼写错误会导致#NAME?错误。当公式的名称未被识别或理解时,就会发生#NAME?错误。

假设我们在净价电子表格中看到一个#NAME?错误。如果我们仔细观察,单元格B21中的VLOOKUP函数拼写错误,多了一个“O”。这导致商店的价格和加价计算都出现了#NAME?错误。

要修复此错误,我们可以删除VLOOKUP中多余的“O”。

5. #NUM! 错误

有时,错误是由不一致或错误的数据引起的。例如,#NUM!错误告诉我们无法按照数据指定的方式执行公式计算。数据对该计算没有意义。

假设我们正在处理一个大型建筑项目,并使用电子表格跟踪达到关键里程碑所需的月数。我们可以使用DATEDIF函数计算开始日期和结束日期之间的月数。

该函数要求开始日期位于第一个引用的单元格中,结束日期位于第二个引用的单元格中。在我们的例子中,分别是单元格B2和C2。“M”代表月份,因为我们希望电子表格计算开始日期和结束日期之间的月数。

但我们在单元格D6中得到了#NUM!错误。我们注意到结束日期在开始日期之前,因此DATEDIF函数无法计算两者之间的月数。很可能是开始日期和结束日期被意外互换了。

我们可以请求验证数据以确保正确。同时,让我们反转公式中单元格的顺序以暂时绕过错误。现在,结果是9个月。

6. #VALUE! 错误

如果客户的名字被意外插入到电子表格的开始日期中会怎样?我们得到了#VALUE!错误。#VALUE!错误可能表示公式或引用单元格存在问题。通常,问题并不立即明确,因此修复此错误可能需要更多努力。

在这种情况下,“John Wety”被输入为开始日期,使得DATEDIF函数在单元格D6中无法进行计算。因此,我们只需将文本“John Wety”替换为正确的开始日期“2016年9月1日”。

7. #REF! 错误

最后是#REF!错误,当公式中引用的单元格已被删除时,经常会出现此错误,从而使公式无法执行计算。

这是一个用于计算公司午餐可用座位数的电子表格。假设公司决定不开放二楼,因此我们删除了第4行。这导致在计算单元格B5中的总可用座位数时出现#REF!错误。

要修复此问题,我们可以将公式更改为添加单元格B2和B3中的值。此外,在这种情况下,我们可以通过使用SUM函数和单元格范围,而不是通过直接引用添加单元格值,来防止#REF!错误。

现在,如果我们删除第10行,SUM函数会计算总可用座位数。

📝 总结

本节课中我们一起学习了电子表格中七种常见的公式错误:#DIV/0!、#ERROR!、#N/A、#NAME?、#NUM!、#VALUE!和#REF!。我们了解了每种错误的含义、常见原因以及相应的修复方法。错误排查是数据分析的重要组成部分,因此能够找到解决方案是数据分析师的一项关键技能。当你再次看到这些错误时,你将知道它们的含义以及如何处理。

020:谷歌数据分析师第二课《以数据驱动的决策提出问题》- 函数入门 📊

在本节课中,我们将学习电子表格中函数的基本概念和应用。函数是预设的命令,能自动对数据执行特定计算或任务,是提升数据分析效率的强大工具。我们将通过实际销售数据的例子,演示几个常用函数的使用方法。


什么是函数? 🤔

上一节我们介绍了公式,本节中我们来看看函数。在电子表格的世界里,函数是一种预设命令,它能自动使用数据执行特定的过程或任务。你可以把函数看作是最有用的快捷方式。好消息是,很多电子表格函数的名称直接表明了它们的功能。

随着你不断使用电子表格,你会发现某些函数会经常使用,而另一些则很少或根本不用。


应用函数:计算总销售额 💰

现在,让我们看看如何将函数应用到上一视频的销售数据中。我们将从计算总销售额开始。

我们将使用 SUM 函数。操作步骤如下:

  1. 选择希望显示计算结果的单元格(例如 F2)。
  2. 输入等号 =
  3. 输入函数名 SUM
  4. 输入开括号 (
  5. 选择要相加的单元格范围(例如 B2:E2)。冒号 : 表示一个范围。
  6. 输入闭括号 ),然后按回车。

代码示例:

=SUM(B2:E2)

按回车后,总销售额就会显示出来。

与公式一样,函数也可以复制粘贴到同一列的其他单元格中。


使用填充柄快速复制 📋

除了复制粘贴,电子表格还有一个名为“填充柄”的工具。当你点击一个单元格时,其右下角会出现一个小方框,这就是填充柄。

以下是使用填充柄的方法:

  • 将光标悬停在填充柄上。
  • 按住并拖动到同一行或同一列的其他单元格。
  • 原单元格中的任何公式或函数都会自动添加到被填充的单元格中。
  • 填充柄会自动更新公式,使单元格引用与所填充单元格的行或列相匹配。

这意味着公式会基于每一行或每一列的独立数据进行计算。填充柄并非适用于所有情况,但它是一个非常实用的技巧。


计算平均值与百分比变化 📈

现在,让我们使用 AVERAGE 函数找出每个月的平均销售额。

不同的函数执行不同的计算,但它们的运作方式相同。请记住,并非你遇到的所有计算都有对应的函数来帮助你。

例如,要计算六月和七月之间的销售额百分比变化,你需要使用之前视频中学过的相同公式。


查找极值:最小与最大值 🔍

假设你需要找出数据集中的最低月销售额。有一个专门的函数,叫做 MIN 函数,代表最小值。

以下是它的工作原理。假设你需要找出整个数据集中的最低月销售额,你只需设置函数,然后在开括号后选择所有三行的数值。

代码示例:

=MIN(B2:E4)

这可能是你的利益相关者需要的重要信息,因此我们可以在数据集中为该数值所在的单元格添加颜色以突出显示。

操作步骤如下:

  1. 点击包含该值的单元格(例如 D2)。
  2. 点击“填充颜色”图标(看起来像一个油漆桶)。
  3. 选择一种颜色,例如黄色。

你可以遵循相同的步骤,使用 MAX 函数来查找最高销售额。


排查常见错误 ⚠️

看起来我们收到了一条错误信息。可能出了什么问题?啊,我们忘记在函数后加上开括号了。别担心,这很容易修复。

但这提醒我们,在使用函数和公式时要持续检查其格式。我们将在后面学习更多关于错误信息以及如何处理它们的知识。

现在,我们也将为包含最高销售额的单元格添加颜色。这只是突出显示关键数据的一种方式,你稍后会了解到其他一些方法。


总结 🎯

本节课中,我们一起学习了电子表格中函数的基础知识。你初步了解了如何在电子表格中添加和组织数据,也看到了公式和函数在应用于真实世界数据时的强大力量。

作为数据分析师,这只是你使用电子表格经验的开始。你很快会发现电子表格能提供的功能远不止这些。在此期间,你可以自由练习这些公式、函数和其他操作。尝试探索电子表格的所有功能会很有趣。

接下来,我们将从电子表格转向结构化思维。数据分析的拼图正在一块块拼合起来,激动人心的内容即将到来,请继续关注。

021:解决问题前先理解问题 🧩

在本节课中,我们将学习如何通过结构化思维来清晰定义问题。这是数据分析的第一步,也是确保后续所有工作方向正确的关键。


阿尔伯特·爱因斯坦曾说:“如果给我一小时来拯救地球,我会花59分钟定义问题,用1分钟解决它。” 这听起来或许有些极端,但它确实向我们展示了在尝试解决问题之前,清晰定义问题是多么重要。

很多时候,团队会直接跳入数据分析,几个月后才意识到他们要么在解决错误的问题,要么没有正确的数据。在本视频中,我们将学习如何建立一种结构化方法来定义问题领域。这一点至关重要,因为如果你从一开始就清晰地定义了问题,解决起来就会更容易,从而节省大量时间、金钱和资源。

在数据领域,我们称这第一步为“问题领域”,即分析中涵盖所有受问题影响或影响问题的活动的特定范围。


在开始任何其他工作之前,我们需要理解问题领域及其所有组成部分和相互关系,以便发现完整的情况。实际上,将其称为“第一块拼图”让我想到了拼图游戏。

假设你有一副拼图,让我们把这副拼图看作一个问题领域。你拥有全部500块拼图,但丢失了盒子,因此你不知道拼图最终会呈现什么图像。它会是一只动物、一处瀑布,还是一碗橙子?无论是什么,在没有参考图像的情况下试图将其拼凑起来都将非常困难。即使是银河系中最厉害的拼图高手,也需要新的方法和大量时间才能完成这副拼图。

数据分析师也面临着类似的挑战。你可能记得,在项目开始时,数据分析师并不总是能获得完整的图景。他们工作的一个重要部分是建立结构化方法并运用批判性思维来寻找最佳解决方案,而这始于理解问题领域。


这正是结构化思维发挥作用的地方。要作为一名数据分析师成功解决问题,你需要训练你的大脑进行结构化思考。这正是接下来你将学习的内容。


总结

本节课中,我们一起学习了定义问题领域的重要性。我们了解到,像爱因斯坦强调的那样,花时间清晰定义问题是高效解决问题的前提。通过将问题领域比作一副丢失了参考图的拼图,我们明白了在没有完整背景信息时进行分析的挑战。最后,我们认识到,结构化思维是数据分析师应对这些挑战、确保工作方向正确的核心能力。

022:谷歌数据分析师第二课《以数据驱动的决策提出问题》 📊

第二讲:工作范围与结构化思维

在本节课中,我们将要学习如何通过定义清晰的工作范围和运用结构化思维来高效地解决问题,从而节省时间、金钱和资源,并确保数据分析工作的顺利进行。


结构化思维的价值

上一节我们探讨了如何提出有效的问题。本节中我们来看看如何通过结构化思维来组织和执行分析工作。

结构化思维是一个过程,它包括:识别当前的问题或状况,组织现有信息,揭示信息缺口与机会,并识别各种选项。换句话说,这是一种让你做好充分准备的方式。它意味着你有一份清晰的待交付成果清单、主要任务和活动的时间表,以及检查点,以便团队了解你的工作进展。

结构化思维不仅能帮助节省时间和精力,也让数据分析师的工作变得更轻松,因为它能让我们更好地理解正在执行的工作。

在商业环境中,团队常常花费大量宝贵时间试图解决一个重要问题,最终却可能回到起点。这不仅导致初始问题未能解决,还浪费了数小时的时间。这种结果对你、你的团队乃至整个组织都会产生负面影响。

然而,这种情况通常是可以避免的。很多时候,问题源于对议题的理解不够充分。结构化思维将帮助你在宏观层面理解问题,从而识别出需要深入调查和理解的领域。

结构化思维的起点是问题域。一旦你明确了分析的具体领域,就可以在开始调查之前,设定基础,并列出所有需求和假设。有了坚实的基础,你就能准备好应对任何可能出现的障碍。

可能遇到的障碍

那么,会遇到什么样的障碍呢?假设你被要求根据给定的数据预测一栋公寓楼的未来价值。你手头有数百个变量,每一个对你的分析都至关重要。但如果有一个变量(例如“平方英尺”)被意外遗漏了,你就必须回头重做所有辛苦的工作。这是因为缺失变量可能导致不准确的结论。

运用工作范围避免错误

实践结构化思维、避免错误的另一种方法是使用工作范围。工作范围是一份关于你将在项目中执行工作的、经双方同意的纲要。对许多企业而言,它包括工作细节、时间表和客户可以期待的交付报告等内容。

作为一名数据分析师,你的工作范围会更偏技术性。它会包含我们刚才提到的基本项目,但你还会重点关注诸如数据准备、验证、定量与定性数据集分析、初步结果,甚至可能包括一些可视化图表,以便更清晰地传达观点。

工作范围实例解析

让我们通过一个简单的例子让工作范围变得生动起来。假设一对夫妇雇佣了一位婚礼策划师。我们将只关注其中一项任务:婚礼请柬。

以下是工作范围可能包含的内容:

以下是工作范围的核心组成部分:

  • 交付成果
  • 时间表
  • 里程碑
  • 报告

让我们详细拆解其中一个交付成果。婚礼策划师和这对夫妇需要决定请柬样式、制作宾客名单、收集地址、打印请柬、填写信封、贴邮票并寄出。

现在,让我们看看时间表。你会注意到其中的日期和里程碑,它们确保我们按计划推进。

最后,我们还有报告。报告会告知这对夫妇每个步骤何时完成,让他们安心。

工作范围可以是一个简单但强大的工具。凭借一份扎实的工作范围,你能够预先解决关于数据的任何困惑、矛盾或疑问,并确保这些潜在的障碍不会阻碍你的进程。这是一个简单的工作范围示例,稍后你将有机会练习构建自己的。


总结与下节预告

本节课中我们一起学习了结构化思维的重要性,以及如何通过定义清晰的工作范围来规划数据分析项目、避免返工和资源浪费。一份好的工作范围是项目成功的基石。

接下来,我们将从另一个角度审视潜在障碍,学习数据情境化避免偏见的重要性。期待与你分享更多精彩的见解。

023:保持客观性 📊

在本节课中,我们将探讨数据情境化的重要性以及如何识别数据偏见。我们将学习如何将数据置于正确的背景中,并保持分析的客观性,从而得出准确的结论。


上一节我们介绍了数据驱动决策的基本概念,本节中我们来看看如何确保数据的客观性和情境化。

数据并非孤立存在,它总是存在于特定的情境中。我们之前了解到,情境是某物存在或发生的条件。因此,某些行为在一种情境下可能是合适的,但在另一种情境下可能就不合适。

例如,在一种情境下大喊“让开”可能显得粗鲁,比如当你的朋友正站在电视机前时。但在另一种情境下,这完全是恰当的,比如当那位朋友即将被一个骑三轮车的孩子撞到时。你看出区别了吗?😊

在数据世界中,没有情境的数字意义不大。随着我们可获得的数据越来越多,我们可以以日益复杂的方式利用这些数据,并从中产生更强大的见解。

我们可以在许多不同层面使用数据。有时我们的数据是描述性的,回答诸如“上个月我们在差旅上花了多少钱?”这样的问题。当我们能够生成诊断性和预测性见解时,数据就变得更有价值,例如理解为什么上个月的差旅支出增加了。然而,当我们能够生成规范性见解时,数据最有价值,例如“我们如何利用数据来激励更高效的差旅?”

弄清楚数据的含义与收集数据同等重要。作为数据分析师,你工作的一个重要部分就是将数据置于情境中。在得出结论之前,保持客观并认识到论点的所有方面也取决于你。

关于情境的一个特点是它非常个人化。如果两个人整理相同的数据集并遵循相同的指示,他们最终可能会得到不同的结果。为什么?因为不存在一套通用的情境解释,每个人都以自己的方式来处理。即使数据收集过程是正确的,分析仍然可能被误解。

结论可能会受到你自身意识和潜意识偏见的影响,这些偏见基于文化、社会和市场规范。例如,如果你问一个波士顿居民哪支棒球队是最好的,他们很可能会说是波士顿红袜队。这引出了数据分析的一个主要局限性:如果分析不客观,结论就可能具有误导性。

要真正理解数据的含义,你必须思考谁、什么、哪里、何时、如何以及为什么。最好问自己一些问题,例如:

以下是关于数据来源和背景的关键问题:

  • 收集了数据?数据是关于什么的?
  • 数据在现实中代表什么?它与其他数据有何关联?
  • 何时收集的数据?鉴于当前情况,一段时间前收集的数据可能存在某些局限性。例如,如果我们收集了过去一个世纪的电话号码,在某个时间点移动电话被引入,导致需要额外的电话号码字段。
  • 你还应该思考数据是在哪里收集的?法律可能因城市、州和国家而异。以及数据是如何收集的?例如,调查可能不如面对面访谈有效。
  • 当然还有为什么。“为什么”可能与偏见有特别强烈的关系。因为有时数据是为了服务于某个议程而被收集,甚至是被编造出来的。

为了确保数据的公平性和准确性,你能做的最好的事情就是确保你从一个准确的人群代表开始,并以最合适、最客观的方式收集数据。这样,你就能获得可以传递给团队的事实。


本节课中我们一起学习了数据情境化的关键作用以及识别和避免偏见的重要性。我们了解到,没有背景的数据可能产生误导,而客观的分析对于得出可靠结论至关重要。通过思考“谁、什么、哪里、何时、如何、为什么”,我们可以更好地理解数据,确保分析的公平与准确。

接下来,我们将探讨如何让数据“活”起来。

024:与团队沟通

在本节课中,我们将学习数据分析师必备的非技术技能,特别是如何与团队成员及利益相关者进行有效沟通,以营造积极高效的工作环境。


上一节我们介绍了数据分析所需的技术技能,如电子表格和分析思维。本节中我们来看看同样重要的非技术技能。

你已经学习了电子表格、分析思维、指标和数学等知识。这些都是非常重要的技术技能,将在你的数据分析职业生涯中持续发挥作用。

同时,你还需要记住,存在一些非技术技能可用于创造积极且高效的工作环境。这些技能将帮助你思考与同事及利益相关者的互动方式。

我们已经知道,将团队成员和利益相关者的需求放在心上非常重要。接下来,我们将探讨其原因,并开始学习一些可以在日常工作中使用的沟通最佳实践。

请记住,沟通是关键。我们将首先学习关于有效沟通的一切,以及如何平衡团队成员和利益相关者的需求。请将这些技能视为新的工具,它们将帮助你与团队合作,找到最佳的解决方案。

好的,让我们进入下一个视频,开始学习。


本节课中我们一起学习了沟通在数据分析工作中的重要性,并引入了有效沟通与平衡各方需求的核心概念,为后续具体沟通技巧的学习奠定了基础。

025:平衡团队需求与期望 📊

在本节课中,我们将学习如何平衡团队中不同成员的需求与期望。作为数据分析师,理解并满足利益相关者的期望是项目成功的关键。我们将探讨利益相关者期望的重要性,并通过一个具体案例来展示如何在项目中协调各方需求。


什么是利益相关者? 👥

上一节我们介绍了数据驱动决策的基本概念,本节中我们来看看项目中的关键角色——利益相关者。

利益相关者是指那些在数据分析师所参与的项目中投入了时间、兴趣和资源的人。换句话说,他们在你所做的事情中持有“利益”。他们很可能需要你的工作成果来完成他们自己的任务。因此,确保你的工作符合他们的需求,并与团队中的所有利益相关者进行有效沟通,至关重要。

利益相关者通常会希望讨论以下内容:

  • 项目目标
  • 达成目标所需的资源
  • 你遇到的任何挑战或顾虑

这些对话有助于在你的工作中建立信任和信心。


项目中的多层次需求 🎯

以下是项目中不同层级的团队成员可能对你的需求:

想象你是一家公司人力资源部门的数据分析师。该公司员工流失率(即员工离职率)有所上升。人力资源部门希望了解原因,并请你帮助找出潜在的解决方案。

人力资源副总裁:关注识别离职员工的共同模式,并查看这些模式是否与员工生产力和参与度有关。作为数据分析师,你的工作是专注于人力资源部门的问题并帮助他们找到答案。但副总裁可能太忙,无法管理日常任务,或者可能不是你的直接联系人。

项目经理:你将更定期地向项目经理汇报。项目经理负责规划和执行项目,他们的部分工作是确保项目按计划进行并监督整个团队的进展。在大多数情况下,你需要定期向他们提供更新,告知他们你需要什么才能成功,并告诉他们你是否遇到任何问题。

其他团队成员:例如,人力资源管理员需要知道你使用的指标,以便他们设计有效收集员工数据的方法。你可能还会与其他负责数据不同方面的数据分析师合作。

了解项目中的利益相关者和其他团队成员非常重要,这样你才能有效地与他们沟通,并为他们提供在项目中推进各自角色所需的信息。


案例:协调需求与交付成果 🔄

回到我们的例子,通过分析公司数据,你发现员工在公司工作13个月后,参与度和绩效有所下降。这可能意味着员工开始感到缺乏动力或与工作脱节,然后在几个月后经常离职。

另一位专注于招聘数据的分析师也分享说,公司在18个月前大幅增加了招聘。你将此信息与所有团队成员和利益相关者沟通,他们就如何与副总裁分享此信息提供了反馈。

最终,你的副总裁决定实施一项深入的管理层检查,针对即将在公司工作满12个月的员工,以识别职业发展机会。这从第13个月开始降低了员工流失率。

这只是一个如何平衡团队需求和期望的例子。你会发现,在你作为数据分析师参与的几乎每个项目中,从人力资源副总裁到你的数据分析师同事,团队中的不同人员都需要你的专注和沟通,才能将项目推向成功。


总结与展望 🌟

本节课中我们一起学习了平衡团队需求与期望的重要性。专注于利益相关者的期望将帮助你理解项目目标,在团队中更有效地沟通,并在你的工作中建立信任。

接下来,我们将讨论如何确定你在团队中的定位,以及如何以专注和决心帮助推动项目前进。

026:聚焦关键事项 🎯

在本节课中,我们将学习如何在处理多个利益相关者和团队成员的需求时,保持对项目目标的专注。我们将探讨三个核心问题,帮助你在复杂项目中高效工作,避免分心。


上一节我们介绍了在团队中平衡各方需求的重要性。本节中,我们来看看如何在实际工作中保持对核心目标的专注。

当与许多需求不同、意见各异的同事合作时,保持专注可能具有挑战性。但在每个任务开始时,通过问自己几个简单的问题,你可以确保在平衡利益相关者需求的同时,始终聚焦于目标。

让我们回顾上一视频中的员工流失率案例。在那个案例中,我们需要与许多不同的团队成员和利益相关者打交道,例如经理、行政人员,甚至其他分析师。作为数据分析师,你会发现平衡每个人的需求有时会有些混乱。但你的部分工作就是透过纷扰,保持对目标的专注。

专注于重要事项而不分心至关重要。作为数据分析师,你可能同时参与多个项目,与许多人合作。但无论你正在处理哪个项目,关注以下三点将帮助你保持任务专注:

以下是三个帮助你保持专注的核心问题:

  1. 主要和次要利益相关者是谁?
  2. 谁在管理数据?
  3. 遇到困难时可以向谁求助?

让我们尝试将这些问题应用到我们的示例项目中。


第一个问题:识别利益相关者

这个项目的主要利益相关者可能是人力资源副总裁,他希望通过本项目的发现来制定新的公司政策决策。

你还需要向你的项目经理、团队成员或依赖你的工作来完成其任务的其他数据分析师汇报进展。这些是你的次要利益相关者。

在每个项目开始时,花时间识别你的利益相关者及其目标。然后,了解团队中还有哪些成员以及他们的角色是什么。


第二个问题:明确数据管理者

接下来,你需要询问谁在管理数据。例如,考虑与本项目中的其他分析师合作。你们都是数据分析师,但可能在项目中管理不同的数据。

在我们的例子中,有另一位数据分析师专注于管理公司的招聘数据。他关于18个月前搜索和招聘情况的见解,最终成为你分析的关键部分。如果你没有与此人沟通,你可能需要花费大量时间自行收集或分析招聘数据,甚至可能根本无法将其纳入你的分析。

相反,你能够与另一位数据分析师沟通你的目标,并利用现有的工作成果来丰富你的分析。

通过了解谁在管理数据,你可以更高效地利用时间。


第三个问题:确定求助渠道

接下来,你需要知道在需要帮助时可以去找谁。这是你在开始任何项目时都应该了解的事情。如果在完成任务的过程中遇到障碍,你需要知道谁能最好地帮你扫清这些障碍。

当你知道谁能提供帮助时,你将花更少的时间担心项目的其他方面,而将更多的时间专注于目标。

那么,如果在这个项目中遇到问题,你可以找谁呢?项目经理通过管理项目时间表、提供指导和资源以及建立高效的工作流程来支持你和你的工作。他们对项目有宏观的把握,因为他们知道你和其他团队成员在做什么。这使他们成为你遇到问题时的绝佳资源。

在员工流失率的例子中,你需要能够访问员工离职调查数据以纳入你的分析。如果你在获取该数据的访问权限时遇到困难,可以与你的项目经理沟通,让他帮你扫清障碍,以便你继续推进项目。


你的团队依赖你专注于自己的任务,以便作为一个团队共同找到解决方案。通过在开始新项目时问自己这些简单的问题,你将能够满足利益相关者的需求,对数据管理者有清晰的了解,并在需要时获得帮助,从而让你能够“紧盯目标”——即项目目标。


本节课中,我们一起学习了在团队协作中保持专注的三个关键问题:识别利益相关者、明确数据管理者以及确定求助渠道。通过应用这些方法,你可以更有效地管理复杂项目,确保工作始终围绕核心目标展开。

接下来,我们将探讨一些成为更有效沟通者的实用方法,以确保团队能够达成其目标。

027:清晰沟通是关键 🗣️

在本节课中,我们将学习与利益相关者和团队成员进行清晰沟通的重要性。我们将探讨如何通过思考受众来规划沟通,从而建立更好的工作关系,并确保项目顺利进行。


上一节我们讨论了理解利益相关者和团队的重要性。本节中,我们来看看如何通过清晰沟通来平衡各方需求,并保持对项目目标的明确关注。

建立良好工作关系的一个关键部分是与你共事的人进行有效沟通。如何做到这一点?两个词:清晰沟通

首先,思考一下你在日常生活中可能遇到的沟通挑战。例如,你是否曾讲一个非常有趣的笑话,却发现朋友已经知道笑点,或者他们根本不觉得好笑?这种情况经常发生,尤其是在你不了解听众的情况下。工作场所也可能出现类似问题。

有效沟通的一个秘诀是:在准备演示、发送电子邮件,甚至向同事讲那个有趣的笑话之前,先思考你的受众是谁。你需要考虑:

  • 他们已经知道什么。
  • 他们需要知道什么。
  • 你如何能有效地将这些信息传达给他们。

当你首先考虑受众时,他们会感受到你的用心,并感激你花时间考虑了他们的需求。


为了更具体地说明,让我们通过一个例子来应用这些原则。

假设你正在处理一个分析年度销售数据的大项目,并且发现所有在线销售数据都缺失了。这个问题可能影响整个团队,并显著延迟项目进度。

通过思考以下四个问题,你可以规划出与团队沟通此问题的最佳方式:

1. 你的受众是谁?
在这个案例中,你需要联系参与该项目的其他数据分析师、你的项目经理,以及最终的利益相关者——销售副总裁。

2. 他们已知什么?

  • 其他数据分析师知道你在使用哪些数据集的所有细节。
  • 项目经理知道你正在遵循的时间线。
  • 销售副总裁知道项目的高层目标。

3. 他们需要知道什么才能推进工作?

  • 其他数据分析师需要知道你迄今为止尝试过的细节以及你想到的任何潜在解决方案。
  • 项目经理需要知道可能受影响的团队以及这对项目的影响,特别是如果此问题改变了时间线。
  • 销售副总裁需要知道存在一个可能延迟或影响项目的潜在问题。

4. 如何有效地与他们沟通?
现在你已决定了谁需要知道什么,可以选择最佳沟通方式。与其发送一封冗长且令人担忧的电子邮件(可能导致大量来回沟通),你决定快速与项目经理和其他分析师安排一次会议。

在会议中,你告知团队在线销售数据缺失的情况,并提供更多背景信息。大家一起讨论这如何影响项目的其他部分。作为一个团队,你们制定一个计划,并在需要时更新时间线。

在这种情况下,销售副总裁无需被邀请参加会议,但如果时间线有变,他会感谢收到一封邮件更新(你的项目经理可能会亲自发送)。


当你进行周到沟通并首先考虑受众时,你将与团队成员和利益相关者建立更好的关系和信任。这很重要,因为这些关系是项目成功的关键,也是你个人成功的关键。

因此,当你准备发送电子邮件、组织会议或准备演示时,请思考:

  • 你的受众是谁?
  • 他们已经知道什么?
  • 他们需要知道什么?
  • 你如何能有效地将这些信息传达给他们?

本节课中,我们一起学习了清晰沟通的核心原则:以受众为中心。通过预先思考“谁需要知道什么以及如何告知”,你可以避免误解,建立信任,并更有效地推动项目前进。

下一节,我们将进一步探讨职场沟通,并学习一些确保信息清晰传达的实用技巧。

028:有效沟通技巧 📧

在本节课中,我们将学习如何在职场中进行有效沟通。无论你身处哪个团队或组织,良好的沟通技巧都是成功协作的关键。我们将探讨如何适应不同的沟通期望,并掌握一些通用的沟通策略。

适应团队沟通风格

当你开始一份新工作或新项目时,可能会发现自己与团队的沟通方式不太同步。这完全正常。只要你愿意边做边学,并在不确定时主动提问,很快就能适应。

例如,如果你的团队使用你不熟悉的缩写,不要害怕询问其含义。当我刚加入谷歌时,我不知道“LGTM”是什么意思,后来我了解到它代表“Looks Good To Me”。现在,当我需要快速给出反馈时,我经常使用它。这是我学到的众多缩写之一,我还会不断遇到新的缩写,而我从不害怕提问。

理解职场礼仪

每个工作环境都有其特定的礼仪。你的团队成员可能重视眼神交流和有力的握手,或者在与国际客户合作时,鞠躬可能更为礼貌。通过观察同事的沟通方式,你也能发现一些特定的礼仪规则。

掌握电子邮件沟通技巧

除了面对面交流,你还需要处理电子邮件沟通。每天有近3000亿封电子邮件被发送和接收,这个数字还在不断增长。幸运的是,你可以从这些数字沟通中学到有用的技巧。

以下是帮助你撰写专业电子邮件的一些建议。

良好的写作习惯

良好的写作习惯能让你的电子邮件显得专业且易于理解。电子邮件天生比短信更正式,但这并不意味着你需要写出一部伟大的小说。只需花时间写出拼写和标点正确的完整句子,就能清楚地表明你在写作时经过了深思熟虑。

电子邮件经常被转发给其他人阅读,因此要写得足够清晰,让任何人都能理解。我喜欢在发送重要邮件前大声朗读出来,这样我就能听出它们是否通顺,并发现任何拼写错误。

请记住,你邮件的语气会随着时间的推移而改变。如果你的团队氛围比较随意,那很好。一旦你更了解他们,你也可以开始变得更随意。但保持专业始终是一个好的起点。

一个很好的经验法则是:如果你写的内容被刊登在报纸头版,你会为此感到自豪吗?如果不会,那就修改到你满意为止。

保持简洁明了

你也不希望你的邮件太长。想想你的团队成员需要知道什么,然后直奔主题,而不是用大段文字让他们不知所措。

你需要确保你的邮件清晰简洁,这样它们才不会在众多信息中被淹没。

让我们快速看一下两封邮件,以便你理解我的意思。

以下是第一封邮件:

嘿,关于我们昨天讨论的那个项目,我想跟进一下。我一直在思考我们谈到的数据问题,我觉得可能有一些方法可以改进。另外,我注意到报告中有一个小错误,可能需要修正。还有,下周的会议时间确定了吗?我们需要提前准备材料。对了,你看到市场部发来的新需求了吗?我觉得那个也挺重要的。

这封邮件里“我们”这个词用得太多,以至于很难看出重要信息在哪里。而且第一段没有快速总结重要的要点。它也比较随意,问候语只是“嘿”,也没有结束语。另外,我已经发现了一些拼写错误。

现在,让我们看看第二封邮件:

主题:关于XX项目数据问题的跟进及下周会议安排

尊敬的[同事姓名],

希望您一切顺利。

此邮件旨在跟进我们昨日讨论的XX项目。主要事项如下:

  1. 数据问题:我已初步构思了三种改进方案,详见附件草案。
  2. 报告修正:发现第5页图表有一处数据标注错误,已在本邮件修正版本中高亮标出。
  3. 下周会议:暂定下周三下午2点,请确认您的时间是否方便。会议材料将在周一前准备好并分享。
  4. 市场部新需求:已查阅,其优先级评估已加入项目计划表。

请您在本周五下班前就上述事项,特别是会议时间给予反馈。

祝好,
[你的名字]

这封邮件看起来不那么令人不知所措,对吧?只用几句话告诉了我需要知道的内容。它组织清晰,并且有礼貌的问候和结束语。这是一个简短扼要、礼貌且书写良好的电子邮件的好例子,包含了我们到目前为止讨论的所有要点。

何时选择会议沟通

但是,如果你需要说的内容对于一封邮件来说太长了怎么办?那么,你可能需要安排一次会议来代替。

及时回复的重要性

及时回复同样重要。你不希望回复邮件的时间太长,以至于你的同事开始担心你是否安好。我总是尽量在24到48小时内回复邮件,即使只是告诉他们我将在何时给出他们正在寻找的确切答案。这样,我可以设定预期,让他们知道我正在处理。

反之亦然。如果你需要从某位团队成员那里得到关于某件具体事情的回复,请明确你需要什么以及何时需要,以便他们能够回复你。我甚至会在邮件主题行中包含日期,并在正文中加粗日期,使其非常清晰。

请记住,明确表达你的需求是成为一个良好沟通者的重要组成部分。

总结

本节课中,我们一起学习了提升职业沟通技能的一些有效方法,例如主动提问、培养良好的写作习惯以及一些电子邮件沟通的技巧。这些方法将帮助你在任何项目中与团队成员进行清晰有效的沟通。虽然可能需要一些时间,但只要你愿意学习,你就能找到适合你和你的团队的沟通风格,无论是在线下还是线上,你都能轻松适应未来工作中遇到的不同沟通期望。

029:谷歌数据分析师课程第二课《以数据驱动的决策提出问题》 🎯

第29讲:管理期望与设定实际项目目标 📊

在本节课中,我们将学习如何在数据分析项目中管理利益相关者的期望,并设定实际可行的项目目标。我们将探讨数据局限性对沟通的影响,以及如何通过清晰、客观的沟通确保项目顺利进行。


我们之前讨论过数据存在局限性。有时你无法获得所需数据,或者数据源不一致,又或者数据不干净。这些问题在分析数据时确实会造成困扰,同时也会影响你与利益相关者之间的沟通。

因此,平衡利益相关者的期望与项目的实际可行性至关重要。接下来,我们将学习设定现实目标的重要性,以及如何就项目可能遇到的问题与利益相关者进行最佳沟通。

请记住,许多决策都依赖于你的分析。你的团队可能在没有你的报告的情况下无法做出决定,或者你的初步数据工作将决定如何以及在何处收集额外数据。你可能还记得,我们讨论过一些需要让利益相关者参与进来的重要情况。

例如,告知你的项目经理你是否按计划进行,或者是否遇到了问题。

现在,让我们看一个现实生活中的例子,了解在需要与利益相关者沟通时的情况,以及遇到问题时应采取的措施。

假设你正在为一家保险公司做一个项目。该公司希望找出导致轻微汽车事故的常见原因,以便制作鼓励安全驾驶的教育材料。你和你的团队需要先回答几个问题:你的数据将包含哪些驾驶习惯?你将如何收集这些数据?在用于分析之前,收集和清理这些数据需要多长时间?

项目初期问题清单
以下是项目初期需要明确的核心问题:

  • 数据将包含哪些驾驶习惯?
  • 如何收集这些数据?
  • 收集和清理数据需要多长时间?

你应立即与利益相关者清晰沟通以回答这些问题,这样你和你的团队才能为项目设定一个合理且现实的时间表。你可能会很想告诉利益相关者你很快就能完成,但这并非长久之计。

设定现实的时间预期将对你大有裨益。利益相关者会知道何时能期待结果,而你也不会因为过度承诺而过度工作或错过截止日期。我发现尽早设定期望有助于我更高效地利用时间。

因此,在项目开始时,你需要发送一份包含项目不同阶段及其大致开始日期的高层时间表。在这个案例中,你和团队确定需要三周时间来完成分析并提供建议,并告知了利益相关者,以便他们做出相应计划。

现在,假设项目已进一步推进,但你遇到了一个问题。

也许司机们同意分享他们在车内的手机使用数据,但你发现有些数据源统计了GPS使用情况,有些则没有。这可能会增加你的数据处理和清理时间,并延迟一些项目里程碑。

你需要告知你的项目经理,并可能制定一个新的时间表提交给利益相关者。越早标记这些问题越好。这样,你的利益相关者就能尽快做出必要的调整。

或者,如果你的利益相关者希望将汽车型号或H作为可能的变量添加进来呢?你必须与他们沟通,说明这可能会如何改变你已建立的模型、是否能在截止日期前添加、以及他们需要了解的任何其他障碍,以便他们决定在项目当前阶段进行更改是否值得。

为了帮助他们,你可以准备一份报告,说明他们的请求如何改变项目时间表或修改模型。你还可以概述该变更的利弊。你希望帮助利益相关者实现他们的目标,但在项目的每个阶段设定现实的期望非常重要。

这需要一些平衡。你已经学习了如何平衡团队成员和利益相关者的需求。但你还需要平衡利益相关者的期望与项目资源和限制下的可行性。这就是为什么保持现实、客观并清晰沟通如此重要。这将帮助利益相关者理解时间表,并对你实现这些目标的能力充满信心。


总结

本节课中,我们一起学习了在数据分析项目中管理期望和设定实际目标的关键性。我们认识到数据局限性会影响沟通,因此必须从一开始就与利益相关者清晰沟通,设定现实的时间线和目标。通过及时沟通问题、准备变更影响报告并权衡利弊,我们可以帮助利益相关者做出明智决策,同时确保项目在可行的范围内稳步推进。记住,清晰、客观的沟通是项目成功的基石。

030:以数据驱动的决策提出问题 📊

第30讲:如何与利益相关者有效沟通 🤝

在本节课中,我们将学习数据分析师如何与利益相关者进行清晰、有效的沟通,包括如何管理期望、解释数据局限性,并通过实际案例展示沟通如何驱动决策。

我是Sarah,是谷歌的一名高级分析主管。作为一名数据分析师,你会遇到对项目所需时间毫无概念的各类利益相关者。项目初期,当我被要求进行某项分析或调研时,我总是尝试设定一些关于交付时间的预期。因为大多数利益相关者并不真正理解你如何处理数据、如何获取数据、如何清洗数据,以及如何构建数据背后的故事。

上一节我们讨论了设定预期的重要性,本节中我们来看看沟通的另一个核心方面。

另一件我想向大家阐明的事情是,你必须确保数据在讲述故事。有时人们认为数据可以解答一切问题,但我们必须承认,事实并非总是如此。

沟通数据局限性

以下是沟通数据局限性的关键步骤:

  1. 提出理论:基于数据观察,形成一个初步假设。
  2. 展示证据:明确指出哪些数据点支持你的理论。
  3. 承认不确定性:坦诚说明数据的局限性,以及哪些信息无法从现有数据中100%确认。

案例分析:优化福利申请流程

我最近与一个州政府合作,试图找出人们为何没有注册他们需要且应得的福利。

我们看到人们访问了网站,浏览了福利注册页面并查看资格要求。但出于某种原因,有东西阻止了他们最终完成注册。

于是,我使用Google Analytics深入分析,试图找出阻止人们注册所需福利的原因。

我进入Google Analytics,发现用户在“服务页面”和“失业救济页面”之间反复跳转。因此,我提出了一个理论:人们没有找到他们需要的信息,因此无法进行下一步来确认自己是否符合服务资格。

我意识到,要确切知道某人为何未采取行动就离开网站,唯一的方法是直接询问他们,即进行用户调研。Google Analytics并没有提供能100%证实或否定我理论的数据。

因此,在向利益相关者解释时,你需要这样说:“我有一个理论,数据正在暗示一个故事。但由于数据的局限性,我无法100%确定。”你必须直言不讳。

我的沟通方式是:我提出理论,认为人们没有找到采取行动所需的信息。然后,我展示支持该理论的证据点。

尽管我们无法100%确定我的理论正确,但我们有足够的信心采取行动。我们随后简化了信息查找流程。

之后我们回顾数据,发现所有指向该理论的关键指标都得到了改善。能够通过数据帮助一项你坚信的事业做得更好、惠及更多人,这种感觉总是非常棒。这让所有关于SQL等等的“极客”学习变得完全值得。

总结

本节课中,我们一起学习了与利益相关者沟通的两个关键点:主动管理项目时间预期,以及清晰沟通数据洞察和其局限性。通过实际案例,我们看到了如何提出数据驱动的理论、展示证据,并在不确定性中推动有效决策。记住,坦诚沟通数据的能与不能,是建立信任和实现数据价值的关键。

031:数据权衡 - 速度与准确性 ⚖️📊

在本节课中,我们将探讨数据分析中一个常见的核心矛盾:速度与准确性。我们将学习如何在快速响应与提供精确答案之间找到平衡,并通过重构问题、明确沟通来确保团队和利益相关者获得有价值的洞见。


我们生活在一个追求即时满足的世界。无论是次日达快递还是按需点播的电影,我们都希望立刻得到想要的东西。

但在数据领域,速度有时会成为准确性的敌人,尤其是在需要协作的情况下。我们将讨论如何平衡快速答案与正确答案,以及如何通过重构问题、清晰界定问题,来帮助团队成员和利益相关者理解他们可以期待何种答案。

作为数据分析师,我们需要了解事物背后的原因,例如销售额下滑、球员的击球率或降雨总量。这不仅关乎数字,也关乎背景信息。而深入探究这些原因需要时间。

因此,当利益相关者向你提出需求时,很多时候他们可能并不真正清楚自己需要什么,他们只是希望立刻得到答案。但有时压力会迫使我们妥协,即使是最有经验的数据分析师也可能为了节省时间而走捷径,提供有缺陷或未完成的数据。

当这种情况发生时,数据中蕴含的大量信息就会丢失。这就是为什么沟通是与团队协作时最有价值的工具之一。

重要的是从结构化思维精心规划的工作范围开始,这一点我们之前讨论过。如果你能清晰理解利益相关者的期望,就可以制定一个现实的工作范围。

工作范围应包含:

  • 达成一致的期望
  • 时间线
  • 里程碑
  • 报告形式

这样,你的团队就始终有一个指导行动的路线图。如果有人要求你处理范围之外的事情,你可以有信心地设定更现实的期望。归根结底,你的工作是平衡快速答案与正确答案,更不用说还要弄清楚对方真正想问的是什么。


现在来看一个例子。假设你的人力资源副总裁来到你的工位,要求查看有多少新员工完成了他们引入的培训课程。

她说:“人们根本不可能学完课程的每个部分,人力资源团队被各种问题淹没了,我们可能应该直接取消这个项目。”你会如何回应?

你可以登录系统,快速计算一些数字,然后交给你的上司。这几乎不花时间。但这个快速的答案可能不是最准确的。

因此,你可以选择另一种方式:重构她的问题,并清晰地阐述问题、挑战、潜在解决方案和时间框架

你可能会说:“我当然可以查看完成率。但我认为背后可能有更多原因。您能否给我两天时间运行一些报告,以便更深入地了解实际情况?”

有了更多时间,你就能获取背景信息。你和人力资源副总裁决定延长项目时间线,以便有时间收集新员工关于培训课程的匿名调查数据。

他们的回答提供了数据,帮助你精确找出完成率如此之低的原因。员工们反馈说,该课程令人困惑且内容过时。

因为你能花时间解决这个更大的问题,人力资源副总裁现在更清楚地了解了新员工为何没有完成课程,并可以就如何更新课程做出新的决策。现在,培训课程变得易于跟进,人力资源部门收到的问题也减少了。各方都从中受益。


重构对话有助于你发现真正的问题,从而带来更具洞察力和更准确的解决方案。但请记住,有时你需要成为坏消息的传达者,这没关系。沟通问题、潜在解决方案和不同的期望,可以帮助你在项目中取得进展,而不是陷入僵局。

在与团队和利益相关者沟通答案时,最快的答案和最准确的答案通常不是同一个答案。但通过确保你理解他们的需求并清晰地设定期望,你可以在速度与准确性之间取得平衡。只要确保清晰、坦诚,你就会取得成功。


本节课总结:我们一起学习了在数据分析中如何权衡速度与准确性。关键在于通过结构化沟通重构问题来理解真实需求,设定清晰的工作范围与期望,从而在提供及时响应的同时,确保分析结果的深度与准确性。记住,良好的沟通是平衡这对矛盾、实现数据驱动决策的核心。

032:思考你的流程与成果

在本节课中,我们将学习如何与团队分享数据分析结果,并探讨在分享过程中需要考虑的关键变量。通过一个清晰的流程,你可以确保团队能够基于数据做出最佳决策。


上一节我们讨论了分享数据时速度与准确性的平衡。本节中,我们来看看如何通过思考流程与成果,确保你的分析能够有效支持决策。

数据拥有改变世界的力量。思考以下案例:

  • 一家银行识别出15个推广产品的新机会,带来了1.2亿美元的收入。
  • 一家分销公司找到了更好的运输管理方式,降低了50万美元的成本。
  • 谷歌开发了一种新工具,能够识别附近淋巴结中的乳腺癌肿瘤。

这些都是了不起的成就。但你知道它们有什么共同点吗?它们都是数据分析的结果。作为一名数据分析师,你完全有能力改变世界,而这始于你如何与团队分享数据。

在本视频中,我们将梳理分享数据时应考虑的所有变量。当你成功地将数据交付给团队时,你可以确保他们能够做出最佳决策。

我们之前学到,与团队分享基于数据的信息时,速度有时会影响准确性。因此,你需要一个坚实的流程来权衡分析的结果和行动。

那么,从哪里开始呢?最好的解决方案往往始于提问。你可能还记得上一个视频的内容,利益相关者会有很多问题,但需要由你来弄清楚他们真正需要什么。所以,问问自己:

  • 你的分析是否回答了最初的问题?
  • 是否有你尚未考虑的其他角度?
  • 你的数据和分析能否回答可能被问到的任何问题?

最后一个问题引出了另一个需要思考的方面:分享结果时,你应该详细到什么程度?一个高层次的概览分析是否足够?

最重要的是,你的数据分析应该帮助你的团队做出更好、更明智的决策。

以下是另一个例子。想象一家园林绿化公司面临成本上升的问题,在投标过程中无法保持竞争力。你可以提出这样一个问题来解决这个问题:公司能否在不影响质量的前提下找到新的供应商?

如果你给他们一个高层次的分析,你可能只会包含客户数量和供应成本。这时,你的利益相关者可能会反对。她担心降低质量会限制公司保持竞争力和让客户满意的能力。她说的有道理。在这种情况下,你需要提供更详细的数据分析来改变她的想法。

这可能意味着探索客户对不同品牌的感受。你可能会了解到客户对特定的园林品牌没有偏好。因此,公司可以更换为更实惠的供应商,同时不影响质量。

如果你能自如地运用数据来回答所有这些问题和考量,那么你可能已经得出了一个坚实的结论,很好。

现在你理解了与团队分享数据时涉及的一些变量,如流程和成果,你就离确保团队拥有做出明智的、数据驱动的决策所需的全部信息更近了一步。


本节课总结

本节课我们一起学习了如何规划数据分享的流程与评估其成果。关键在于通过提问来明确分析目标,并根据决策需求决定分享的详细程度。一个考虑周全的分享过程,能够确保你的数据分析真正赋能团队,做出更优的决策。

033:会议最佳实践 📅

在本节课中,我们将学习如何高效组织和参与会议。会议是与团队成员及利益相关者沟通的核心环节。掌握会议的最佳实践,能帮助团队建立信任、协调目标,并更有效地解决问题。


会议的核心价值

上一节我们探讨了沟通的基础,本节中我们来看看会议的具体作用。会议不仅是项目进展的汇报平台,更是团队协作的基石。

无论是线上还是线下,会议都能:

  • 建立信任与团队精神:提供超越邮件往来的直接交流机会。
  • 提供宏观视角:了解合作者,能更好地认识自身工作在整体项目中的位置。
  • 协调团队目标:定期会议使目标对齐更容易,从而更顺利地实现目标。
  • 促进问题解决:当所有人信息同步时,团队能更好地互相协助,共克难题。

因此,无论是主持会议还是参与会议,遵循最佳实践都至关重要。


会议成功的关键行动 ✅

以下是确保会议成功的几个简单而有效的行动准则,适用于所有会议场景:

  • 充分准备
  • 准时出席
  • 保持专注并积极提问

让我们详细拆解如何实践前两项准则。

如何做到“充分准备”

“充分准备”包含多个方面:

  1. 携带所需物品:如果你习惯做笔记,请准备好笔记本、笔或工作设备。
  2. 提前阅读议程:会前阅读会议议程,并准备好汇报自己的工作进展。
  3. 主持者的额外准备:如果你是会议主持者,需准备好讲稿和演示材料,明确要讨论的内容,并准备好回答问题。

作为会议主持者,我还遵循以下原则:

  • 会议应有明确决策目标:每次会议都应聚焦于做出一个明确的决策。
  • 关键决策者必须出席:确保能做出该决策的关键人员在场。
  • 及时安排决策会议:如果需要通过会议来决策,应立即安排,不要等到下周的例会,以免延误进度。
  • 控制会议规模:尽可能将参会人数控制在10人以内。人数过多会阻碍协作性讨论。

如何做到“尊重他人时间”

尊重团队成员时间的最佳方式是守时。

  • 准时参会:作为参与者,务必准时。
  • 主持者提前准备:作为主持者,应提前到场并完成设置,以便在人员到齐后立即开始。
  • 线上会议同理:对于线上会议,确保技术设备提前调试好,并注意时间,避免意外错过会议。
  • 保持专注:在会议期间保持专注和投入,是尊重他人时间的另一重要体现。避免因分心而错过关键信息。

保持专注与积极沟通

“保持专注”也意味着在需要时积极提问。

  • 及时澄清:当你需要澄清某个观点,或认为项目计划可能存在问题时,应主动提问。
  • 会后跟进:如果会上没来得及提问,不要犹豫,在会后跟进小组,获取答案。

对于会议主持者,确保沟通顺畅尤为重要:

  • 提前发布议程:会前制定并发送议程,让团队成员能带着准备来,带着清晰的收获离开。
  • 鼓励全员参与:努力与所有参会者互动,以免错过任何团队成员的见解。
  • 开放提问渠道:明确告知大家,会后也欢迎提问。
  • 做好会议记录:即使是主持者,做笔记也是个好习惯。这有助于记住所有被提出的问题。会后,你可以根据信息需求范围,选择跟进个别成员回答问题,或向整个团队发送更新。

会议中应避免的行为 ❌

现在,让我们看看会议中应避免的事项。有些禁忌显而易见:

  • 避免准备不足、迟到或心不在焉地参加会议。
  • 避免垄断对话、打断他人或用漫无目的的讨论干扰大家。

请确保给予其他团队成员发言的机会,并在你开始讲话前,让他们完整表达自己的想法。

所有参会者都应有机会贡献意见。创造让大家发言的机会,提出问题,征询专家意见,征求他们的反馈。你不想错过他们宝贵的见解。

此外,尽量让所有人在不发言时将手机或电脑调至静音。


总结与展望

本节课中,我们一起学习了会议的最佳实践,例如充分准备、准时出席、保持专注、积极提问。我们还探讨了如何高效利用会议来做出明确决策、促进协作性讨论,以及如何在会后跟进以解决遗留问题。

同时,我们也明确了会议中应避免的行为:准备不足、迟到、分心、打断他人以及忽视他人的意见

牢记这些技巧,你将能顺利组织并参与富有成效、积极向上的团队会议。当然,团队中有时难免会出现冲突。我们很快将讨论如何解决冲突。


034:加入新团队

在本节课中,我们将学习数据分析师Ximena分享的关于如何在新团队中有效开展工作的经验。她将重点阐述清晰沟通和明确目标对于项目成功的重要性。


加入一个新团队在最初无疑是令人紧张的。尤其是在像谷歌这样规模庞大、人才济济的公司。但我非常依赖我的经理来理解我能为团队带来什么价值。这让我在会议中分享自己能力时感到更加从容。

我发现,我最成功的项目都始于对期望的清晰沟通。

上一节我们提到了清晰沟通的重要性,本节中我们来看看它对项目执行的具体影响。

如果我在接到项目任务离开会议时,能确切知道从哪里开始以及需要做什么,这就能让我更快、更高效地完成任务,并达成项目的真正目标。我甚至可能更进一步,因为我不必在“我需要做什么”这个问题上感到困惑而浪费时间。

沟通之所以如此重要,是因为它能让你最高效地抵达终点,同时也能让你表现出色。

在明确了沟通的价值后,我们来看看一个常见的误区以及如何克服它。

当我刚开始工作时,我接到了相当多的项目,并且非常兴奋,以至于一开始没有问太多问题就投入了工作。这成了一个障碍。因为虽然你可以在模糊性中成长,但关于项目目标的模糊性,在你真正试图达成目标时,可能是非常有害的。

我通过一个简单的方法克服了这个障碍:当有人请我做项目时,我会先退一步,仅仅去澄清那个目标是什么。一旦目标变得清晰明确,我就很乐意去探索如何达成目标的模糊过程。但目标本身必须是客观且清晰的。


我是Ximena,我是一名财务分析师。😊

本节课中我们一起学习了,在新环境中,通过与管理层沟通明确自身价值可以建立自信。同时,在接手项目时,确保对最终目标的理解绝对清晰是高效工作的基石。记住,先问清“做什么”(what),再探索“怎么做”(how)。

035:从冲突到协作 🤝

在本节课中,我们将探讨工作中冲突的产生原因以及如何通过有效的方法将冲突转化为协作机会,从而推动项目顺利进行。

概述

工作中出现冲突是正常现象。尽管之前学习的知识(例如管理期望和有效沟通)有助于避免冲突,但冲突有时仍会发生。本节将讨论冲突产生的原因以及解决冲突的最佳实践方法。

冲突产生的原因

冲突可能由多种原因引发。

以下是几种常见情况:

  • 利益相关者可能误解了项目的预期成果。
  • 你与团队成员的工作风格可能存在显著差异。
  • 重要截止日期临近时,人们的压力可能增大。

期望不匹配和沟通不畅是冲突最常见的原因。

例如,可能因未明确数据清洗的负责人而导致项目延误;或者,队友发送了一封包含你所有分析见解的邮件,却未提及这是你的工作。

以客观态度面对冲突

尽管人们容易将冲突个人化,但保持客观并专注于团队目标至关重要。

事实上,紧张时刻也可能是重新评估项目甚至改进工作的机会。当问题出现时,你可以通过几种方法将局面转向更具生产力和协作性的方向。

将问题重构为机会

将局面从“问题重重”转向“富有成效”的最佳方法之一是重构问题。

不要纠结于“哪里出了错”或“该责怪谁”,而是改变你提出的初始问题。尝试询问:“我如何能帮助你达成目标?

这为你和团队成员创造了共同寻找解决方案的机会,而不是因问题而感到沮丧。

沟通是解决冲突的关键

如果你发现自己身处冲突之中,请尝试沟通。

开启对话,或询问诸如“我是否还应考虑其他重要事项?”之类的问题。这能让你的团队成员或利益相关者有机会充分阐述他们的关切。

如果你发现自己情绪激动,请给自己一些时间冷静下来,以便能以更清晰的头脑进行对话。

例如,如果在紧张时刻需要写邮件,可以先将其保存为草稿,次日再重新审阅,确保自己保持冷静理智后再发送。

理解请求的背景

如果你不理解团队成员或利益相关者要求你做什么,请尝试理解他们请求的背景。

询问他们的最终目标是什么、他们试图用数据讲述什么故事,或者整体背景是什么。

总结与核心实践

通过将潜在的冲突时刻转化为协作和前进的机会,你可以化解紧张局势,让项目重回正轨。

因此,与其说“我不可能在这个时间框架内完成”,不如尝试重构表述:“我很乐意做这件事,但这需要[具体时间]。让我们退一步,以便我能更好地理解你希望用数据做什么,然后我们可以共同寻找最佳前进路径。


本节总结

在本节中,我们一起学习了工作中冲突的常见起因,并掌握了通过重构问题积极沟通理解背景将冲突转化为协作机会的关键方法。这些技巧有助于维护团队和谐,确保项目顺利推进。

正如本课程所强调的,沟通技巧与数据分析技术能力同等重要,是数据分析师专业工具包中的关键组成部分。通过不断实践,你的沟通与协作能力将日益精进。

036:谷歌数据分析师课程第二课《以数据驱动的决策提出问题》🎯

课程概述

在本节课中,我们将跟随谷歌首席数据分析师内森,了解他从美国海军陆战队到数据分析领域的职业转型故事。我们将学习他如何将军事训练中的核心技能成功应用于数据分析工作,并探索他为此转型所做的具体准备。


个人背景介绍

我是内森,目前在谷歌的信任与安全部门担任首席数据分析师。

我在大学期间加入了美国海军陆战队预备役。我加入的预备役单位是一个野战炮兵部队。

在经历了充满挑战的海军陆战队新兵训练营后,我进入了野战炮兵火力指挥控制学校。

对于可能不了解的听众,火力指挥控制被认为是野战炮兵的大脑。我们使用各种计算机进行炮兵计算。

但为了防止计算机出现故障,我们也接受了使用计算尺作为备用方案的操作训练。

一年后,我获得了被征召为卡车司机的机会,而不是继续我的野战炮兵本职工作。

我被部署到伊拉克,为一个步兵连队驾驶卡车。

从伊拉克回来后,我完成了学士学位,然后在德克萨斯州奥斯汀市担任应用工程师。

最终,我意识到需要转变职业方向,更多地专注于商业领域。

正是在深入学习商业知识的过程中,我真正爱上了数据分析。

实际上,从我对数据分析产生浓厚兴趣,到获得一份能全职从事并深入接触数据的职位,我花了几年的时间。


转型准备与实践

为了打好基础并获得相应资格,我做了一些准备工作。

以下是我为转型所做的关键努力:

  • 我参加了一个关于R语言的Coursera课程。
  • 我参与了一些数据科学黑客松。在这些活动中,你需要在某个大学度过整个周末。组织方通常在周五晚上发布数据集,到周日下午,你必须提出一些建议。这是两种非常好的方式,能让我真正做好准备、获得良好经验,并展现出对数据分析的强烈兴趣。

我的第一份全职数据分析工作是在一家大型银行。

我简直如鱼得水,终于可以真正地使用SQL进行实战。同时,我也大量使用了Tableau。

我有机会参加Tableau大会,那真的很酷。

后来,我很幸运地获得了进入谷歌的机会,担任我目前在信任与安全部门的职位。

这项工作最令人兴奋和满足的一点是,它与军队有相似之处,都有一个保护人民的总体使命。这让我感到超级兴奋。


军事技能在数据分析中的应用

在海军陆战队中培养的、至今我仍在使用的品质包括注重细节。

这在军队中至关重要,尤其是在野战炮兵领域。

其次是沟通的重要性。你掌握了自己的细节后,需要确保能非常清晰地将这些信息传达给与你共事的其他人。

第三点是协作。在军队中,团队合作成就梦想。你确实要依赖团队。这在我离开海军陆战队后的职业生涯和工作中也绝对是如此。


课程总结

本节课中,我们一起学习了内森从军人到数据分析师的不寻常职业路径。我们了解到,军事训练中培养的注重细节有效沟通团队协作能力,是数据分析工作中同样宝贵的技能。同时,通过系统学习(如Coursera课程)实践参与(如黑客松) 来主动构建知识体系与项目经验,是成功实现职业转型的关键步骤。他的故事表明,多元化的背景和软技能能够为数据分析职业带来独特的优势。

037:谷歌数据分析师课程第二课《以数据驱动的决策提出问题》课程总结 🎯

在本节课中,我们共同学习了数据分析流程的第一步——如何提出有效的问题,并利用数据驱动决策。现在,让我们对所学内容进行回顾与总结。


上一节我们探讨了与利益相关者和团队成员沟通的关键技巧。现在,我们来整体回顾本课程的核心内容。

在本课程中,我们探索了如何提出有效的问题,并学习了如何利用定量数据定性数据指标以及数学方法来建立联系。我们还涵盖了电子表格的基础知识。

以下是本课程涵盖的主要技能模块:

  • 有效提问:学习构建能够通过数据分析解答的清晰、可操作的问题。
  • 数据类型应用:理解并运用定量数据(如 销售额 = 15000)和定性数据来获取洞察。
  • 指标与计算:使用关键指标和基本数学运算(如 转化率 = (转化次数 / 总访问量) * 100%)量化问题。
  • 电子表格基础:掌握使用电子表格进行数据组织与初步计算的基本操作。
  • 结构化思维:将复杂问题分解为可管理的部分,并系统化地思考解决方案。
  • 协作沟通:培养与利益相关者及团队成员有效沟通、确认需求并呈现发现的技能。

掌握了这些基础知识后,是时候将所学应用到下一阶段了。在接下来的课程中,你将进入数据分析流程的下一步:数据准备

Hallally 将从这里开始带领你学习。你可能在第一门课程的开头见过她。她将指导你学习对工作至关重要的新工具和概念,例如:

  • 数据类型与数据结构
  • 数据的偏差、可信度与分析伦理
  • 数据库
  • 数据的组织与保护
  • 数据社区

感谢你坚持完成本课程的学习。当你准备好时,可以继续观看下一门课程的第一个视频。

祝你好运,你一定会做得很出色!


本节课总结:在本节课中,我们一起学习了数据分析的起点——如何提出正确的问题,并利用定量与定性数据、指标及基本工具来连接信息点,为基于证据的决策奠定基础。同时,我们也初步培养了结构化思维和关键沟通技能,为后续深入的数据处理与分析工作做好了准备。

http://www.jsqmd.com/news/538602/

相关文章:

  • Matplotlib绘图卡住?3种方法让plt.show()不再阻塞你的代码
  • Spring Boot项目里Redis连接总出问题?从配置到RedisTemplate序列化,一次讲清所有坑
  • League-Toolkit:本地化英雄联盟辅助工具的技术实践与应用指南
  • YOLOv8训练参数全解析:从epochs到optimizer的保姆级配置指南
  • 谷歌数据分析-IV-笔记-全-
  • 别再重装系统了!WSL2资源不足的5种解法(含PowerShell重置网络秘籍)
  • 5分钟快速掌握ImDisk:Windows虚拟磁盘工具完全指南
  • 杜克大学商业分析笔记-全-
  • 3分钟快速上手:DouYinBot抖音无水印视频下载终极指南 [特殊字符]
  • 剑桥信息论-模式识别与神经网络笔记-全-
  • 谷歌数据分析-VIII-笔记-全-
  • 告别Buildroot编译失败:手把手教你手动交叉编译e2fsprogs-1.47.0到ARM开发板
  • 谷歌数据分析-VII-笔记-全-
  • Qwen3-VL-4B Pro快速部署指南:开箱即用的视觉语言模型,一键开启图文对话
  • big but true
  • 新手别怕!用Vivado仿真Verilog的8个经典电路,从JK触发器到频率计保姆级复盘
  • 降维技术笔记-全-
  • 杜克大学数据科学笔记-全-
  • 5分钟精通英雄联盟智能助手League-Toolkit:从新手到高手的完整指南
  • 谷歌数据分析-VI-笔记-全-
  • 信而泰BigTao6000网络测试仪全解析:从基础配置到高级测试技巧
  • 机器视觉中的坐标系转换:从像素到世界的无缝衔接
  • 谷歌数据分析-V-笔记-全-
  • 杜克大学图像视频处理笔记-全-
  • 智能车竞赛必备:手把手教你搭建LCC无线充电系统(附实测数据)
  • 3个步骤,让OpenWRT路由器秒变智能应用中心:iStore完全指南
  • 终极Web安全实战指南:如何使用DVWA-Chinese提升你的网络安全技能 [特殊字符]
  • CVPR 2019明星数据集MVTec AD深度复盘:5年过去了,无监督异常检测走到了哪一步?
  • 多伦多大学降维与流形笔记-全-
  • NVIDIA Profile Inspector终极指南:如何解锁显卡隐藏性能参数