大数据
-
Spark Shuffle内幕解密(24)
一、到底什么是Shuffle? Shuffle中文翻译为“洗牌”,需要Shuffle的关键性原因是某种具有共同特征的数据需要最终汇聚到一个 计算节点上进行计算。 …
-
三问助你debug
译者按: Debug也要三省吾身! 原文: Three Questions About Each Bug You Find 译者: Fundebug 为了保证可读性,本文采用意译而非直译。另外,本文版权归原作者所有,翻译仅用于学习。 你是否发现:有时候,当某个B…
-
mybatis的xml配置和注解配置
xml配置 spring-application.xml <?xml version = "1.0" encoding = "UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xml…
-
windows下部署Hadoop2.7.4
一、环境 windows 7 64bit jdk 1.8 hadoop 2.7.4 下载地址:http://hadoop.apache.org/releases.html 二…
-
Hadoop学习--测试压缩--day05
import java.io.FileInputStream; import java.io.FileOutputStream; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.io.IOUtils; import org.apache.hadoop.io.compress.CompressionOutp…
-
搭建高可用mongo分布式---具体操作
首先还是上图看看mongodb通过哪些机制实现路由、分片: 从图中可以看到有四个组件:mongos、config server、shard、replica set。 mongos,数据库集群请求的入口,所有的请求都通过mongos进行协调,不需要在应用程…
-
windows 运行 cassandra
线索异常通行 PS D:/apache-cassandra-3.11.3/bin> ./cassandra -f ./cassandra : 无法加载文件 D:/apache-cassandra-3.11.3/bin/cassandra.ps1,因为在此系统上禁止运行脚本。有关详细信息,请参 阅 https:/go.…
-
Pulsar Producers 例子
import java.util.concurrent.TimeUnit; import org.apache.pulsar.client.api.Producer; import org.apache.pulsar.client.api.PulsarClient; import org.apache.pulsar.client.impl.schema.JSONSchema; public cl…
-
hadoop的高可用
hadoopHA 数据类型 结构化数据RDMS 非结构化数据借助算法goole pagerank 半结构算法xmljson通过标签进行。 一般情况下可以通过并行处理机制提高处理数据效率但是对于海量数据的加载是很慢的所以需要使用分布式…
-
LoadRunner汉化
1.汉化之前先把正在运行的LR关闭,然后加载LR汉化包 2.打开安装程序 3.点击安装 4.安装 5.下一步 6.下一步(确认安装) 7.点击“继续” 8.完成