数据中台
-
pandas(一)操作Series和DataFrame的基本功能详解大数据
reindex:重新索引 pandas对象有一个重要的方法reindex,作用:创建一个适应新索引的新对象 以Series为例 1 >>> series_obj …
-
pandas(二)函数应用和映射详解大数据
NumPy的ufuncs也可以操作pandas对象 >>> frame one two three four a 0 1 2 3 b 4 5 6 7 c 8 9 …
-
pandas(三)汇总和计算描述统计详解大数据
pandas对象有一些常用的数学和统计的方法,大部分都属于约简或汇总统计。 SUM方法 DataFrame对象的sum方法,返回一个含有列小计的Series >>>…
-
pandas(四)唯一值、值计数以及成员资格详解大数据
针对Series对象,从中抽取信息 unique可以得到Series对象的唯一值数组 >>> obj = Series([‘c’,’a’,’d’,’a’,’a’,…
-
pandas(五)处理缺失数据和层次化索引详解大数据
pandas用浮点值Nan表示浮点和非浮点数组中的缺失数据。它只是一个便于被检测的标记而已。 >>> string_data = Series([‘aardvar…
-
pandas(六)读写文本格式的数据详解大数据
pandas提供的将表格型数据读取为DataFrame对象的函数。 函数 说明 read_csv 从文件、URL、文件型对象中加载带分隔符的数据。默认分隔符为逗号。 read_ta…
-
pandas(七)数据规整化:清理、转换、合并、重塑之合并数据集详解大数据
pandas对象中的数据可以通过一些内置的方式进行合并: pandas.merge 可根据一个或多个键将不同的DataFrame中的行连接起来。 pandas.conc…
-
pandas(八)重塑和轴向旋转详解大数据
重塑层次化索引 层次化索引为DataFrame的重排提供了良好的一致性操作,主要方法有 stack :将数据的列旋转为行 unstack:将数据的行转换为列 用一个d…
-
pandas(九)数据转换详解大数据
移除重复数据 dataframe中常常会出现重复行,DataFrame对象的duplicated方法返回一个布尔型的Series对象,可以表示各行是否是重复行。还有一个drop_d…
-
Tensorflow 学习笔记(一)TensorFlow入门详解大数据
一、计算模型—-计算图 1.1 计算图的概念:TensorFlow就是通过图的形式绘制出张量节点的计算过程,例如下图执行了一个a+b的操作。 1.2 计算图…