开源
-
你懂集群monitoring么?(一)—— IDC机房有关技术指标获取
背景:公司自建IDC机房,基于IDC机房构建大数据集群;需要对集群资源进行监控,集群采用的是CDH集群,采集主要分两块进行: HDFS和YARN相关的指标进行采集IDC机器自身的指标进行采集 注意: 也许有人会有疑惑,CM界…
-
Hadoop学习之第一章节:Hadoop配置安装
一、配置虚拟机三台 1.网络配置 虚拟化软件: Vmware Workstations 10.7z Linux系统: Centos 6.5-x86_64 采用4台安装Linux环境的机器来构建一个小规模的分布式集群。 集群机器详细信息 1.虚拟…
-
Apache Beam官方文档
1. 概述 为了使用Beam,首先必须使用Beam SDKs其中一个SDK里面的类创建一个驱动程序。驱动程序定义了管道,包括所有的输入,转换以及输出。它还为您的管道设置了执行选项(通常使用命令行选项传递)。…
-
《从Lucene到Elasticsearch:全文检索实战》学习笔记五
今天我给大家讲讲tf-idf权重计算 tf-idf权重计算: tf-idf(中文词频-逆文档概率)是表示计算词项对于一个文档集或语料库中的一份文件的重要程度。词项的重要性随着它在文档中出现的次数成正比,会随着它在文…
-
一张图解析PMP和敏捷ACP的区别
作者:Tracy 微信:Tracy19890201
-
区块链项目开发区块链冲击着支付手段
传统的支付手段是信用卡、银行卡或 PayPal 等,银行或第三方金融机构要为资金的流动负责,同时也要防止交易过程中发生任何盗窃行为,充分保证人们的资金安全。 为了保证资金的正常流动和安全性,银行或第三方金融机…
-
python笔记-数据类型&文件操作
数据类型int标准的长度FloatLong长整型,无限长a = 2**31 2乘以31次方type 查看数据的数据类型布尔:真或假 1或0 文件操作时with as 打开文件readlines 读取多行 strip()函数用于把换行符去掉 def主文件判断python…
-
hadoop2.0中yarn的运行原理
Yarn的简单介绍 我们知道在离线大数据处理领域中,hadoop是目前无可厚非的处理架构,到目前为止hadoop已经有三个大版本,每个版本下都有架构方面的调整。 …
-
Scala笔记整理(八):类型参数(泛型)与隐士转换
[TOC] 概述 类型参数是什么?类型参数其实就是Java中的泛型。大家对Java中的泛型应该有所了解,比如我们有List list = new ArrayList(),接着list.add(1),没问题,list.add("2"),然后我们list.get(1) =…
-
Se(13)buttongroup、breadcrump等
package test; import java.util.List; import org.openqa.selenium.By; import org.openqa.selenium.WebDriver; import org.openqa.selenium.WebElement; import org.openqa.selenium.chrome.ChromeDriver; import…