开源

  • Flume+Kafka+Storm+Redis构建大数据实时处理系统:实时统计网站PV、UV+展示

    [TOC] 1 大数据处理的常用方法 前面在我的另一篇文章中《大数据采集、清洗、处理:使用MapReduce进行离线数据分析完整案例》中已经有提及到,这里依然给出下面的图示: 前面给出的那篇文章是基于MapReduce的离线数…

    大数据 2021年11月14日
  • IntelliJ IDEA 第一个 Scala 程序

    IntelliJ 安装完成 Scala 插件后,你需要尝试使用 IntelliJ 来创建并且运行第一个程序。 通常这个程序只是简单的输出 Hello World。 创建一个新工程 在文件下面选择新建,然后选择创建工程。 输入工程信息 在…

    大数据 2021年11月14日
  • Hadoop YARN配置参数剖析

    1.  资源分配相关参数 (1)  capacity:队列的资源容量(百分比)。 当系统非常繁忙时,应保证每个队列的容量得到满足,而如果每个队列应用程序较少,可将剩余资源共享给其他队列。注意,所有队列的容量…

    大数据 2021年11月14日
  • win10_java+selenium环境搭建

    之前讲了python+selenium的相关知识,现在开始讲java+selenium相关知识,先来看看环   镜怎么搭建。   下载安装最新版jdk8.0(这个要最新,否则后面安装eclipse会提示你要下载)。 官方下载地址 : http:…

    大数据 2021年11月14日
  • Python输出文件的内容

    import osdocument = open("testfile.txt", "w+")print("文件名: ", document.name);document.write("这是我创建的第一个测试文件!/nwelcome!")# /n表示换行print(docume…

    大数据 2021年11月14日
  • 奇点云数据中台技术汇 | 数据治理——企业数字化转型的基石

    1 为什么要进行数据治理? 首先,数据是有价值的。根据埃森哲发布的“2035年之前各行业的平均GDP增长率”,单纯看自然增长,制造行业只有2.1%,但是通过数据以及由此衍生出来的人工智能加成之后,这个数字就晋升到第…

    大数据 2021年11月14日
  • 性能测试负载模型(七)

       很多情况下,我们要梳理业务场景的系统,是一个全新的产品或者全新的业务。这种情况下在进行场景建模的需求分析的时候,别说什么原始数据,即便是可类比的同类系统也没有,这时候我们就没有数据数据可…

    大数据 2021年11月14日
  • Grails自动数据库移植

    DataSource.groovy文件中的dbCreate属性十分重要,因为它可以用来指定是否自动根据GORM类来创建数据库表。其可选值为: create-drop - 当Grails运行时删除并重新建立数据库 create - 如果数据库不存在则创建数据库…

    大数据 2021年11月14日
  • 在Ambari上添加Kerberos

    一、准备阶段 1.下载jce并解压jce下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jce8-download-2133166.html [root@manager ~]# ls jce_policy-8.zip [root@manager ~]# unzip -o -j -q jce_…

    大数据 2021年11月14日
  • 软件架构设计(第2版)——程序员向架构师转型必备

      软件架构设计(第2版)——程序员向架构师转型必备 温昱 著 ISBN 978-7-121-17087-4 2012年7月出版 定价:39.00元 16开 256页 宣传语:本书内容务实、技能梳理清晰,实乃软件开发者职业生涯…

    大数据 2021年11月14日