数据分析
-
numpy的random模块详细解析详解大数据
随机抽样 (numpy.random) 简单的随机数据 rand(d0, d1, …, dn) 随机值 >>>…
-
pandas(零)数据结构详解大数据
pandas的两个主要的数据结构: Series series是一种类似于一维数组的对象,它由一组数据(NumPy数组类型的数据)和一组与之相关的数据标签(索引)组成。 1 fro…
-
pandas(一)操作Series和DataFrame的基本功能详解大数据
reindex:重新索引 pandas对象有一个重要的方法reindex,作用:创建一个适应新索引的新对象 以Series为例 1 >>> series_obj …
-
pandas(二)函数应用和映射详解大数据
NumPy的ufuncs也可以操作pandas对象 >>> frame one two three four a 0 1 2 3 b 4 5 6 7 c 8 9 …
-
pandas(三)汇总和计算描述统计详解大数据
pandas对象有一些常用的数学和统计的方法,大部分都属于约简或汇总统计。 SUM方法 DataFrame对象的sum方法,返回一个含有列小计的Series >>>…
-
pandas(四)唯一值、值计数以及成员资格详解大数据
针对Series对象,从中抽取信息 unique可以得到Series对象的唯一值数组 >>> obj = Series([‘c’,’a’,’d’,’a’,’a’,…
-
pandas(五)处理缺失数据和层次化索引详解大数据
pandas用浮点值Nan表示浮点和非浮点数组中的缺失数据。它只是一个便于被检测的标记而已。 >>> string_data = Series([‘aardvar…
-
pandas(六)读写文本格式的数据详解大数据
pandas提供的将表格型数据读取为DataFrame对象的函数。 函数 说明 read_csv 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为逗号。 read_ta…
-
pandas(七)数据规整化:清理、转换、合并、重塑之合并数据集详解大数据
pandas对象中的数据可以通过一些内置的方式进行合并: pandas.merge 可根据一个或多个键将不同的DataFrame中的行连接起来。 pandas.conc…
-
pandas(八)重塑和轴向旋转详解大数据
重塑层次化索引 层次化索引为DataFrame的重排提供了良好的一致性操作,主要方法有 stack :将数据的列旋转为行 unstack:将数据的行转换为列 用一个d…