开源

  • hive安装

    Hive只在一个节点上安装即可 1.上传tar包 2.解压 tar -zxvf hive-0.9.0.tar.gz -C /cloud/ 3.安装mysql数据库(切换到root用户)(装在哪里没有限制,只有能联通hadoop集群的节点) mysql安装仅供参考,不同版本mys…

    大数据 2021年11月14日
  • QTP双击事件录不上解决办法

    QTP设置—双击事件录不上的解决办法 在QTP的脚本录制过程中,有时候会不可避免的录制需要鼠标双击才能出来的事件,但是QTP的默认设置中鼠标双击事件得不到响应,如果要录制双击鼠标事件需要更改QTP的默认设置…

    大数据 2021年11月14日
  • Hadoop运维记录系列(二十二)

    今天下午写了一会代码,然后帮同事解决了一个hbase相关的故障分析,定位了问题根源,觉得比较有代表性,记录一下。先说一下问题的发生与背景。这个故障其实是分为两个故障的,第一个比较简单,第二个相对复杂一些。…

    大数据 2021年11月14日
  • 数据分析师必修课--竞品分析

    界定竞争对手的方法:1. 产品是否可替代 2. 看管理者的界定 3. 根据顾客的消费信息4.根据顾客的意见收集竞争对手信息的工具:百度文库、新浪微指数、淘宝指数、 谷歌趋势、中国网络视频指数,以上为免费;取真经、…

    大数据 2021年11月14日
  • 系统批量运维管理工具pexpect

    1、介绍pexpect 通过pexpect我们可以实现对ssh,ftp,passwd,telnet等命令进行自动交互,不需要人工干预达到自动目的。 2、pexpect的组件介绍  2.1、spawn类     作用:启动和控制子应用程序,其构造…

    大数据 2021年11月14日
  • Spark的安装和基础编程

    Linux系统:Ubuntu 16.04 Hadoop: 2.7.1 JDK: 1.8 Spark: 2.4.3 一.下载安装文件 http://spark.apache.org/downloads.html https://archive.apache.org/dist/spark/ hadoop@dblab:/usr/local$ sudo wget http://mir…

    大数据 2021年11月14日
  • yslow各个指标含义

    User fewer HTTP Requests:减少HTTP请求 图片、CSS、JS、flash等这些都需要增加http请求数,减少这些元素的数量能减少响应时间。 把多个JS、CSS尽可能合并压缩(除了JS库,那东西用别的网站上的缓存比较靠谱) 小…

    大数据 2021年11月14日
  • Spark1.4源码走读笔记之模式匹配

    RDD里的模式匹配: def hasNext: Boolean = (thisIter.hasNext, otherIter.hasNext) match {           case (true, true) => true           case (false, …

    大数据 2021年11月14日
  • 如何使用WijmoJS 纯前端设计器,快速生成 Angula

    概述 除了WijmoJS 的可视化在线设计器之外(在这里阅读基于Web的WijmoJS Designer),我们刚刚发布了针对Angular开发的Visual Studio Code的设计器。 在HTML文件中,它在代表WijmoJS纯前端控件的每个标记上方…

    大数据 2021年11月14日
  • java之爬虫

    近期研究爬虫爬取网站链接:1.需要获取所有超链接2.排除已爬取的链接,去重3.爬虫的广度和深度方向研究(ps:目前没有研究彻底)以下是实现代码: import java.io.BufferedReader; import java.io.InputStream; impo…

    大数据 2021年11月14日