Python这门语言,门槛相对于Java和C++要低一些,零基础的学员入门不是一件困难的事情。近几年来,随着大数据和人工智能的不断发展,在各种应用场景中我们都能看到Python,在互联网市场中Python的岗位需求量也逐渐升高。查看全文>>
两个变量的二元分布可视化也很有用。在Seanborn中最简单的方法是使用jointplot函数,该函数可以创建一个多面板图形,比如散点图、二维直方图、核密度估计等,以显示两个变量之间的双变量关系及每个变量在单独坐标轴上的单变量分布。查看全文>>
在搞清楚“FA与PCA的主要区别是什么?”之前,我们先来了解一下因子分析(Factor Analysis,FA)的定义是什么?它是研究从变量群中提取共性因子的统计方法,这里的共性因子是不同变量之间内在的隐藏因子。查看全文>>
在Pandas对象中,如果它的某一列数据满足不同的划分标准,则可以将该列当做分组键来拆分数据集。例如,创建一个DataFrame对象,具体代码如下。查看全文>>
在NumPy中,all()函数用于判断整个数组中的元素的值是否全部满足条件,如果满足条件返回True,否则返回False。any()函数用于判断整个数组中的元素至少有一个满足条件就返回True,否则返回False。查看全文>>
除了pickle方法,sklearn的externals.Joblib模块同样提供了读写持久化数据对象的方法。示例如下。查看全文>>