请问从事数据分析方面的工作,都需要一些什么基础理论知识。

2024-12-15 14:15:41
推荐回答(4个)
回答1:

结合自身的学习、面试经验做了一个整理,对于新手来说,掌握以下知识/技能,就足以找到一份初阶的数据分析师(注意,不是数据专员,这两者是有区别的,找工作的小伙伴切记仔细分辨)的工作:

1、统计基础;

2、分析理论

3、Excel

4、SQL

5、R

6、Python

仅仅知道要学什么是不够的,还需要知道学到什么程度才是合适的,这其实才是广大新手村小伙伴最大的困惑!按照笔者的看法,以上每项技能/知识应当掌握的程度如下:

我把每个技能的熟练程度划分为5个等级,依次分别是:1、了解基本概念;2、知道基本理论/会简单操作;3、熟知原理/熟练操作;4、数学、逻辑论证/灵活应用;5、精通、专家/能改进、优化。对于入门者来说,上面这几个知识领域大多只需要掌握2-3的熟练程度即可。

统计基础是每个人都必须掌握的,自然是学的越深入越好,不过对于基础比较差的伙伴来说,也不必太过苛求,大约掌握信息图形化、条件概率、贝叶斯公式、相关与独立、几何分布、二项分布、泊松分布、正态分布、统计抽样、估计、置信区间、假设检验这些,就差不多了。《深入浅出统计学》是一本不错的入门书,但是仅有这一本是不够的,请务必找一本更具严谨性和系统性的教材结合使用。

分析理论也是个绕不开的问题,尤其对于很多自学的伙伴来说,这一块可能比较容易疏忽。笔者作为新手,对这部分内容其实也不熟悉,能给出的建议不多。

大多数企业的内部数据存储在传统的关系型数据库中,作为分析师不可避免的要和数据库打交道,那么SQL是数据分析必备的技能了。好在SQL语言本身非常的简单易学。笔者认为只要会写简单的查询、存储过程就可以了,推荐大家买一本《SQL必知必会》放在手边,随时翻看。

R语言和Python语言应该是当前数据分析领域的双雄了,R语言支持者众多,相关库包极为丰富;Python则胜在灵活易用,通用性更加广泛。在网上,关于这两种语言的争论也从未止息。笔者建议初学者要对这两种语言都有所了解,但选择其中一项作为自己的主力语言。对于R语言来说,学会其命令行用法、掌握基本的数据分析库包(tidyr,dplyr,ggplot2)即可;对于Python语言,需要掌握其基本语法、函数和相关库包(numpy, pandas, matplotlib, sklearn)。

可能很多伙伴经过一段时间学习以后,会对Excel这样一个工具不屑一顾,认为这是个非常低端的工具,完全不如R或者Python一般酷炫。但其实完全不该有此想法。笔者曾爬取拉钩网上数据分析这个岗位的信息并做过统计分析,在整个就业市场上,数据分析岗位对Excel技能的需求量非常之大。

除了SQL之外,Excel是数据分析岗位要求频率最高的技能。好在,这个神器其实是非常简单易学的,并且网络上存在海量的各种教程和教材,随处可得。笔者认为只要学会常见函数的使用、各类基础图表的制作以及数据透视就能满足大部分需求。推荐大家买一本《谁说菜鸟不懂数据分析》放在手边,学习疲惫之余拿出来当故事书看看。

机器学习这一块其实应该算是数据分析岗位的加分项,不一定是必须的,看具体岗位。但是现在越来越多公司的数据分析岗要求对机器学习有一定的认知,笔者认为,关于机器学习算法,能够熟悉常见算法的基本原理、了解其用途和优缺点即可。比如:分类算法里的贝叶斯、决策树、随机森林;回归算法里的线性回归、Adaboost回归;聚类算法里的K-means算法等。另外了解一下用于降维的PCA等。

每个人的情况不同,每个岗位的情况需求也不同,大家还是需要根据自己的实际情况来认真思考,安排好自己的学习方向和计划。

回答2:

小编觉得,学习数据分析,一是要打下坚实的基础,才能屹立于专业之上,不被人看轻;二是根据企业的招聘技能要求情况,有的放矢。为此,小编给出以下建议,希望能帮到你。
(1)SQL数据库的基本操作,会基本的数据管理
(2)会用Excel/SQL做基本的数据分析和展示
(3)会用脚本语言进行数据分析,Python or R
(4)有获取外部数据的能力,如爬虫
(5)会基本的数据可视化技能,能撰写数据报告
(6)熟悉常用的数据挖掘算法:回归分析、决策树、随机森林、支持向量机等。

回答3:

基础的应该:财务基础知识、统计基础知识 具备了以上基本知识以后再懂得你从事行业的相关知识

回答4:

当然是数据方面的