开源 | 第656页

hadoop shell

1、查看帮助 hadoop fs -help <cmd> 2、上传 hadoop fs -put <linux上文件> <hdfs上的路径> 如：hadoop fs -put test.log / 3、查看文件内容 hadoop fs -cat <hdfs上的路径>…

大数据 2021年11月15日

0

import java.io.ByteArrayOutputStream; import java.io.FileInputStream; import java.io.FileOutputStream; import java.io.InputStream; import java.net.URL; import org.apache.hadoop.conf.Configuration; im…

大数据 2021年11月15日

0

Maxwell编译

Maxwell简介 Maxwell是一个能实时读取MySQL二进制日志binlog，并生成 JSON 格式的消息，作为生产者发送给 Kafka，Kinesis、RabbitMQ、Redis、Google Cloud Pub/Sub、文件或其它平台的应用程序。它的常见应用场景有E…

大数据 2021年11月15日

0

Se(11)---Alert

package testWd; import org.openqa.selenium.Alert; import org.openqa.selenium.By; import org.openqa.selenium.WebDriver; import org.openqa.selenium.WebElement; import org.openqa.selenium.chrome.ChromeD…

大数据 2021年11月15日

0

软件工作量评估方法之用例点方法简述

　　用于软件项目工作量估算的方法有以“估”为主的专家法和类推法，以“算”为主的类比法和方程法。在软件估算的实践中，类比法和类推法也是普遍使用的估算方法，但很多人搞不清二者的应用范围和估算步骤，现在笔者就…

大数据 2021年11月15日

0

6.spark core之键值对操作

键值对RDD（pair RDD）是spark中许多操作所需要的常见数据类型，通常用来进行聚合计算。创建Pair RDD spark有多种方式可以创建pair RDD。比如：很多存储键值对的数据格式在读取时直接返回pair RDD；通过map()…

大数据 2021年11月15日

0

再谈循环&迭代&回溯&递归&递推这些基本概念

循环：不断重复进行某一运算、操作。迭代：不断对前一旧值运算得到新值直到达到精度。一般用于得到近似目标值，反复循环同一运算式（函数），并且总是把前一次运算结果反代会运算式进行下一次运算递推：从初值出…

大数据 2021年11月15日

0

10.spark sql之快速入门

前世今生 Hive&Shark 随着大数据时代的来临，Hadoop风靡一时。为了使熟悉RDBMS但又不理解MapReduce的技术人员快速进行大数据开发，Hive应运而生。Hive是当时唯一运行在Hadoop上的SQL-on-Hadoop工具。但是M…

大数据 2021年11月15日

0

Python 极简教程（四）变量与常量

变量和常量在 Python 中没有常量与变量之分。只有约定成俗的做法：全大写字母的名称即为常量： PI = 3.1415926 全小写字母的名称为变量： name = 'nemo' 变量与常量都是用来在程序运行过程中，储存需要用到…

大数据 2021年11月15日

0

从今天开始记录汇编的学习过程

什么是二进制

大数据 2021年11月15日

0