我是如何入门、成长并进阶为数据分析师的?
mhr18 2024-10-02 16:45 24 浏览 0 评论
前几天和一朋友A聊天,一个在我看来完全可以在大部分行业领域公司独当一面的数据分析师,目前仍谦虚的以“数据猿”自称。从事数据分析的他,半路出家,起初虽然懂一些数据库的知识,但仍然和很多人一样,艰难地上了路。于是我们就索性一起讨讨经,“一本正经”地聊起工作来,留下点感悟。
数据分析如何起步?
说入门很简单一定是骗你的,A说自己是从记数据开始的,记数据一方面是为了应付领导的提问,另一方面也是在培养数据的敏感度。确实,分析的源头一般是某些指标有了明显的变动,熟悉每天的交易数据或用户数据能让你一眼就看出问题在哪里,哪些数据有关联,然后再做分析。而我是从Excel做起的,大部分时间都是在取数,做“表哥”,还要抵挡来自业务的需求攻击。后来,他去做了数据挖掘,我从BI再从数据平台转做了技术。
万事开头难,但一旦数据分析有了动力,就要开始完善自己的知识体系,这也是真正入门的开端。那如何完善数据分析的知识体系?
1、基本的计算机知识和统计知识
数据库+SQL语言
一些常用的数据库如Oracle、SQL Sever、DB2、MySQL,这些数据库或者说日常接触的数据库都要有所了解,懂最常用的就好,最重要的还是要会写SQL。
数学/统计学知识
一些基本的数学统计方法如描述性统计、多元统计分析、回归分析等,重要性不言而喻。
数据挖掘知识:方差分析、回归分析、因子分析、聚类分析等等。这些东西作为入门多多少少都要会一些,虽然有可能不会全用到,但一旦用时方恨少。
数据分析可视工具
数据分析可视化工具很宽泛。首推Excel,中小公司很依赖,熟练使用数据透视表,这是必备技能。中大型公司都是用报表工具或者BI来做报表,但有了SQL+Excel的基础,这些工具上手都很快。
2、业务知识
数据分析师要与公司的各业务打交道,所以对于各部门的业务知识要有深入的了解。某业务领导需要知道某个指标,你需要知道这个指标由哪些数据构成?数据统计的口径是什么?数据怎么取出来?这个指标对于行业的意义是什么,处于什么范围分别对应什么样的情况,是好还是坏。然后慢慢摸索这个指标层面多维度的规律,如何设定最合理。
明确自己的位置,快速成长
附上网上的一张数据分析师能力体系图,用于参考。
数据分析是一向比较专业的工作,要时刻警惕自己能力是否有提升,目前是什么样的水平,习惯反思自己:
这里引用知乎上@任明远的回答
1、你了解你所整理的数据的来源吗?是自己公司的业务数据,还是与合作伙伴交换的数据?是自己公司相关部门采集的,还是从第三方获取的?获取过程中,具体的指标和逻辑是什么?
2、这些数据是真实的吗?采集和整理过程中会不会出现什么问题?技术上的逻辑和业务上的逻辑是不同的概念,有没有技术上没有瑕疵,但并不符合业务逻辑的数据流程?
3、到你手里的数据经过了什么处理?你又做了什么处理?为什么他们和你要做这些处理?
4、谁需要你的数据?你处理后的数据流向哪里?他们用数据做什么?这些数据最终又拿去做了什么?比如,为客户做了什么服务,公司发布了什么内容,或向管理层证明了什么KPI,或支持了哪个部门的评估?
5、你做整理的周期是什么?为什么是这样的周期?
6、公司有其他的部门在处理其他的数据吗?是什么样的数据?和你有什么关系?为什么这些数据要分开处理?
7、近一年,你自己的电脑上应该已经积累了不少数据,试试做个分析,从一段较长的时间来看,你负责的这一块数据发生了什么变化?为什么会有这个变化?和公司的产品、经营、业务有关,还是和行业有关?具体怎么有关?
如何进一步提升?
业务上
1.业务为核心,数据为王
了解整个产业链的结构
制定好业务的发展规划
了解衡量的核心指标
有了数据必须和业务结合才有效果
需要懂业务的整体概况,摸清楚所在产业链的整个结构,对行业的上游和下游的经营情况有大致的了解。然后根据业务当前的需要,指定发展计划,从而归类出需要整理的数据。最后一步详细的列出数据核心指标(KPI),并且对几个核心指标进行更细致的拆解,当然具体结合你的业务属性来处理,找出那些对指标影响幅度较大的影响因子。前期资料的收集以及业务现况的全面掌握非常关键。
2.思考指标现状,发现多维规律
熟悉产品框架,全面定义每个指标的运营现状对
比同行业指标,挖掘隐藏的提升空间
拆解关键指标,合理设置运营方法来观察效果
争对核心用户,单独进行产品用研与需求挖掘
业务的分析大多是定性的,需要培养一种客观的感觉意识。定性的分析则需要借助技术、工具、机器。而感觉的培养,由于每个人的思维、感知都不同,只能把控大体的方向,很多数据元素之间的关系还是需要通过数据可视化技术来实现。
3.规律验证,经验总结
发现了规律之后不能立刻上线,需要在测试机上对模型进行验证。
技能上
1.Excel是否精钻?
除了常用的Excel函数(sum、average、if、countifs、sumifs、offset、match、index等)之外,Excel图表(饼图、线图、柱形图、雷达图等)和简单分析技能也是经常用的,可以帮助你快速分析业务走势和异常情况;另外,Excel里面的函数结合透视表以及VBA功能是完善报表开发的利器,让你一键轻松搞定报表。
2.你需要更懂数据库
常用的数据库如MySQL,Sql Server、Oracle、DB2、MongoDB等;除去SQL语句的熟练使用,对于数据库的存储读取过程也要熟练掌握。在对于大数据量处理时,如何想办法加快程序的运行速度、减少网络流量、提高数据库的安全性是非常有必要的。
3.掌握数据整理、可视化和报表制作
数据整理,是将原始数据转换成方便实用的格式,Excel在协同工作上并不是一个好工具,报表FineReport比较推荐。项目部署的Tableau、FineBI、Qlikview一类BI工具,有没有好好培训学习,这些便捷的工具都能淡化数据分析时一些重复性操作,把精力更多留于分析。
相关推荐
- Springboot数据访问(整合动态数据源)
-
Springboot整合动态数据源dynamic-datasource-spring-boot-starter基本概念这个依赖是MyBatis-Plus团队开发的动态数据源组件,它是一个基于Spri...
- 《有手就会写sql》-第1章 数据库(sql实时更新同表里某个字段的数据)
-
为啥要用数据库存放数据的方式,有很多种,常用的比如:excel,数据库等。有了excel,为啥还要用数据库呢?原因有很多。其中之一:excel存储的数据有限的,最多能存个几千万条。但一个银行的交易数据...
- DBdoctor:一款企业级数据库性能诊断工具
-
DBdoctor是一个全面覆盖开发、测试、运维等各个环节SQL审核以及数据库性能诊断与优化的监控平台。针对数据库性能诊断门槛高、耗时长的问题,DBdoctor提供了快速易用的解决方案,深入到数...
- 面试必问:MySQL死锁 是什么,如何解决?(史上最全)
-
MySQL死锁接触少,但面试又经常被问到怎么办?最近有小伙伴在面试的时候,被问了MySQL死锁,如何解决?虽然也回答出来了,但是不够全面体系化,所以,小北给大家做一下系统化、体系化的梳理,帮助大家在面...
- JAVA入门教程-第1章 概述(java入门篇)
-
大道至简-JAVA入门教程在本教程中,你将学习Java语言的基础知识。Java基础内容涵盖:Java基础概念、Java词法结构、Java数组、Java流程控制、Java字符串、Java...
- 突发消息!微软停止俄罗斯业务(微软停止服务怎么办)
-
越来越多的IT公司加入封杀俄罗斯的阵营中。数字化转型网先后关注的有(点击下方蓝字可打开文章):SAP停止俄罗斯所有业务乌克兰呼吁SAP、Oracle封杀俄罗斯,Oracle已停止在俄所有业务埃森哲停止...
- 分布式数据库设计——存储引擎原理(全)
-
摘要数据库的一个首要目标是可靠并高效地管理数据,以供人们使用。进而不同的应用可以使用相同的数据库来共享它们的数据。数据库的出现使人们放弃了为每个独立的应用开发数据存储的想法,同时,随着数据库广泛的使用...
- Java运行环境配置(java运行环境配置成功截图)
-
若要在计算机上运行Java程序,需要配置Java运行环境(JRE)或Java开发工具包(JDK)。以下是在Windows操作系统上配置Java运行环境的步骤:下载Java安装程序:前往Oracle官方...
- 分布式任务调度Celery(分布式任务调度平台)
-
本文介绍了分布式任务调度系统Celery,包括安装,开发使用,并且配合supervisor,flower等工具进行系统化部署和使用。(一)安装和代码开发使用示例一,简介Celery是一个分布式任务调度...
- Android SDK 安装与配置(android sdk安装在哪里)
-
AndroidSDK安装与配置全流程指南一、前期准备与环境要求1.系统兼容性验证o操作系统:支持Windows10/11(64位)、macOS10.14+、Ubuntu16.04+等主流...
- 高性能Linux服务器构建实战:运维监控、性能调优与集群应用
-
百万级字迹详解实战案例,篇幅因素故只展现pdf目录,完整解析获取方式在篇尾了!目录读者对象Web应用篇(1至第3章)数据备份恢复篇(4至第6章)网络存储应用篇(7和第8章)运维监控与性能优化篇(9和第...
- Vmware虚拟机迁移数据库时踩过的坑
-
从Vmware迁移数据库虚拟机到其他平台,起来后认不到asm盘,不禁傻眼了。很多时候为了保证虚拟机系统的完整可启动,在做任何变更前,领导都会要求克隆一份镜像保存,或者直接在镜像上操作。这是传统的备份理...
- Java 中 java.util.Date 与 java.sql.Date 有什么区别?
-
Java里的java.util.Date和java.sql.Date绝对是那种看起来不起眼但能搞得你Debug到半夜的“坑王”。我们先从表面上看,java.sql.Date是继承自j...
- 主流数据库的不同点在哪?MySQL和SQL Server的区别介绍
-
在本教程中,树懒君介绍了两种最普遍应用的RDBMS—MySQL和MicrosoftSQLServer。通过介绍MySQL和SQLServer的几个关键区别,希望大家能在这两者之间做出最适合自己的...
- Java安全-Java Vuls(Fastjson、Weblogic漏洞复现)
-
复现几个Java的漏洞,文章会分多篇这是第一篇,文章会分组件和中间件两个角度进行漏洞复现复现使用环境VulhubVulFocus组件Fastjson1.2.24反序列化RCEFastJson...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- oracle位图索引 (74)
- oracle批量插入数据 (65)
- oracle事务隔离级别 (59)
- oracle 空为0 (51)
- oracle主从同步 (56)
- oracle 乐观锁 (51)
- redis 命令 (78)
- php redis (88)
- redis 存储 (66)
- redis 锁 (69)
- 启动 redis (66)
- redis 时间 (56)
- redis 删除 (67)
- redis内存 (57)
- redis并发 (52)
- redis 主从 (69)
- redis 订阅 (51)
- redis 登录 (54)
- redis 面试 (58)
- 阿里 redis (59)
- redis 搭建 (53)
- redis的缓存 (55)
- lua redis (58)
- redis 连接池 (61)
- redis 限流 (51)