数据分析软件种类繁多,使用难度、场景、效率不一。市面上可分析数据的软件是越来越多了,小编给大家介绍几类数据分析软件,包括以下几类:
1.数据处理软件:Excel和SQL
Excel:在Excel
先说结论:根据需求和软件操作能力,选用SPSS、STATA、SAS、R语言、Python中的一种或多种,这几款都是主流的数据分析和统计软件,对编程能力的要求依次提高,能完成复杂分析的能力、自由度也更高。
1. SPSS
IBM开发的傻瓜式统计软件,能够实现大部分常用的数据分析功能,数据管理和操作都可以依靠点击鼠标完成,学起来也最容易理解,有统计学基础的人熟悉半小时即可使用。
优势:易于学习
弱点:难以完成复杂操作、循环等自动化分析
推荐书目: 张文彤《SPSS统计分析基础教程》
2. Stata
计量经济学专业常用统计软件,大部分操作可以通过点击鼠标完成,但使用编程(do语句)更为快捷,do语句也很简单,容易上手。尤其适合需要对数据进行基本清洗、需要大量回归分析的用户。
此外,stata有自己的社区和期刊,如果英语好几乎能找到需要的所有解答。
优点:逻辑是变量和样本,容易理解;数据管理能力强;直观
缺点:复杂功能的实现不足;图表不美观
推荐书目:陈强《高级计量经济学及Stata应用》
3. SAS
医学、金融常用软件,稳定可靠,有丰富的接口,和Stata类似,SAS也有自己的编程语法,但更为复杂,较难掌握。如果不是工作需要,不建议新手入门。
4. R
开源免费软件,统计软件中冉冉升起的新星。
优势:
功能范围非常大(有很多扩展包可以实现各种各样丰富的功能)
画图非常好看
非常容易自动化和集成(与 Git、LaTeX、ODBC、Oracle 、Apache Hadoop等)
非常好的社区支持,以及通过第三方的支持
广泛的帮助资源免费提供(手册、教程等)
非常强大且灵活的脚本语言(例如支持面向对象的编程)
支持所有通用平台(Windows、Linux、MacOS...)
非常大的、活跃的开发人员社区,面向未来
弱点:
熟悉 R 语法较难
速度不够快
使用非常大的数据集时,对电脑硬件要求高
推荐书目:R语言实战
5. Python
最接近程序语言,统计和数据分析只是它的一小部分功能,不够直观但功能强大。学起来较难。