开源

  • 大数据hadoop领域技术总体介绍(各个组件的作用)

    2019/2/16 星期六 大数据领域技术总体介绍(各个组件的作用)1、大数据技术介绍大数据技术生态体系:Hadoop 元老级分布式海量数据存储、处理技术系统,擅长离线数据分析Hbase 基于hadoop 的分布式海量数据库,离线…

    大数据 2021年11月5日
  • Selenium IDE工具界面剖析

    资源推荐: 视频资源: 软件测试相关系列视频 社区资源: 自动化测试交流群 Selenium IDE简介     Selenium IDE(Integrated Development Environment),是Selenium工具套件中最简单的…

    大数据 2021年11月5日
  • 一、Flume--数据采集器基本原理和使用

    一、概述 1、flume是什么 1) Flume提供一个分布式的,可靠的,对大数据量的日志进行高效收集、聚集、移动的服务,Flume只能在Linux环境下运行。2) Flume基于流式架构,容错性强,也很灵活简单,架构简单。3) Flume…

    大数据 2021年11月5日
  • HADOOP生态圈以及各组成部分的简介

     重点组件: HDFS:分布式文件系统 MAPREDUCE:分布式运算程序开发框架 Hive:基于大数据技术(文件系统+运算框架)的SQL数据仓库工具 Hbase:基于Hadoop的分布式海量数据库 ZOOKEEPER:分布式协调服务基础组…

    大数据 2021年11月5日
  • Spark如何处理中文字符串

    最近工作中需要用spark对中文的字符提取,由于环境一直是英文的,发现打印出来是乱码。后经研究,需要做一个UTF-8的转换 大概如下: val data_file = sc.textFile(“test.txt”) val item1 …

    大数据 2021年11月5日
  • Django -- URLconf 配置技巧

    本章我们将对视图和URL配置使用一些高超的小技巧。 【流线型化函数导入(streamlining)】 方法一:传统方法 from django.conf.urls.defaults import * from mysite.views import he…

    大数据 2021年11月5日
  • 接口测试是什么&接口测试文档规范

    以下内容选自《大话软件测试-性能、自动化、安全及团队管理》 接口测试是什么?接口测试怎么做?这样的问题几乎每天都会被问到几十次,可见很多朋友对于接口测试并不是十分了解,而接口测试又是现在互联网产品测试…

    大数据 2021年11月5日
  • bigdata - zookeeper笔记(一)

    zookeeper的定义 zookeeper是分布式应用程序的高性能协调服务,顾名思义,zookeeper用来保存分布式应用程序的多个节点之间的状态、配置等信息,以确保分布式程序的正确、高速运行。 zookeeper集群角色:leader、fol…

    大数据 2021年11月5日
  • Lintcode15 Permutations solution 题解

    【题目描述】 Given a list of numbers, return all possible permutations. Notice:You can assume that there is no duplicate numbers in the list. 给定一个数字列表,返回其所有可能的排列。 注意:你可以假设…

    大数据 2021年11月5日