探索函数可大致分为统计特征函数与统计作图函数。统计特征函数用于计算数据的均值、方差、标准差、分位数、相关系数、协方差等,这些统计特征能反映出数据的整体分布。
Python中探索函数简介Python中用于数据探索的库主要是:
1、Pandas(数据分析)统计分析函数,统计作图函数;
2、Matplotlib(数据可视化)。
基本统计特征函数sum按列计算样本总和;
mean计算样本的算数平均数;
var样本的方差;
std标准差;
corr 计算spearman(Person)相关系数矩阵;
cov协方差矩阵;
skew样本偏值(三阶矩阵);
kurt样本峰度(四阶矩阵);
describe样本的基本描述(均值 标准差)。1
R语言的探索函数mean(X)用于计算数据样本的算数平均数(均值)。样本X可为向量、矩阵或多维数组。
exp(mean(log(X)))用于计算数据样本的几何平均数。样本X可为向量、矩阵或多维数组。
var(X)用于计算数据样本的方差。若X为向量,则计算向量的样本方差;若X为矩阵,则结果为X的各列向量的样本方差构成的行向量。
sd(X)用于计算数据样本的标准差。若X为向量,则计算向量的标准差;若X为矩阵,则结果为X的各列向量的标准差构成的行向量。
cor()函数用于计算数据样本的相关系数矩阵,它的使用格式为:
cor(x, y=NULL,use="everything",method=c("pearson","kendall","spearman"))。2
本词条内容贡献者为:
李晓林 - 教授 - 西南大学