开源

  • centos7 hadoop-2.7.3完全分布式安装配置

    操作系统版本: centos7 64位 hadoop版本: hadoop-2.7.3 hbase版本: hbase-1.2.4 机器: 192.168.11.131 master1             Namenode       ResourceM…

    大数据 2021年11月14日
  • TEZ MRR optimize to MR?

    https://issues.apache.org/jira/browse/HIVE-2340 select userid,count(*) from u_data group by userid order by userid    will product MRR.   I think when the result of  userid,c…

    大数据 2021年11月14日
  • 回顾 | Apache Flink X Apache RocketMQ · 上海站(PPT下载)

    7 月 6 日,Apache Flink Meetup X Apache RocketMQ · 上海站,来自阿里巴巴、网易的 Flink 技术专家与 Apache RocketMQ 社区大咖一起分享关于 Flink、RocketMQ 的应用实践与前沿技术。 cdn.xitu.io/2019/7/9/16bd4…

    大数据 2021年11月14日
  • pg 10 wal 归档同步配置

    一.rsync server(172.16.3.226)  CentOS 7.2 X64 # yum install -y rsync # mkdir -p -m 0700 /db/wal_archive # chown -R postgres.postgres /db/wal_archive 可能存在的问题: 修改目录/db/wal_archive权限…

    大数据 2021年11月14日
  • 解决 Mac OS X 11无法copy文件问题

    1、升级Mac OS X 11之后,想要copy文件到系统目录下。 sudo cp -f test.txt /usr/bin/ 2、发现即使用权限sudo,也有权限问题。 cp: /usr/bin/test: Operation not permitt…

    大数据 2021年11月14日
  • Spark入门及安装与配置

    以下是老男孩教育编写的大数据资料,转载请注明出处:http://www.oldboyedu.com Hadoop Hadoop是分布式计算引擎,含有四大模块,common、hdfs、mapreduce和yarn。 并发和并行 并发通常指针对单个节点的应对多个请求…

    大数据 2021年11月14日
  • device-mapper 块级重删(dm dedup) <3>代码结构(4)

    六、代码结构(4) I/O “小”写流程 上一篇,介绍了dm dedup的写流程,这一篇,介绍它的一个特殊流程 如果我们接收到的对齐bio但是它的size < block_size,那么这时候是不能直接进行hash的。 需要将它的缺少的部分…

    大数据 2021年11月14日
  • Apache Flink 零基础入门(一):基础概念解析

    作者:陈守元、戴资力 一、Apache Flink 的定义、架构及原理 Apache Flink 是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态或无状态的计算,能够部署在各种集群环境,对各种规模大小的数据进行…

    大数据 2021年11月14日
  • 负载产品性能测试——新建测试

    1,网络拓扑: 2,测试仪客户端端配置 1)占用端口 2)load配置 3)action配置 4)客户端网段 5)选择端口 6)联合配置 3,服务器端配置 1)http服务器策略 2)http传输数据配置 3)服务器端网段配置 4)选择端口 5…

    大数据 2021年11月14日
  • 大数据学习路线-甲骨文高级技术总监思维图

    最近有很多人问我如何学习大数据?我也是思考了很多时日才动笔写下此文。一方面我自己还只是大数据学习中的一个小学生,贸然动笔怕贻笑大方;另一方面大数据本身领域博大精深,其涵盖领域之广技术种类之多确实很难…

    大数据 2021年11月14日