大数据

  • SparkSQL的3种Join实现

    引言Join是SQL语句中的常用操作,良好的表结构能够将数据分散在不同的表中,使其符合某种范式,减少表冗余、更新容错等。而建立表和表之间关系的最佳方式就是Join操作。 对于Spark来说有3中Join的实现,每种Join对…

    大数据 2021年11月15日
  • 系统质量之保障 运维外包不可少

      在前面的文章中,我们了解了IT运维外包的概念,本文主要介绍IT运维外包在软件质量保障中的重要作用,希望能给大家带来帮助。 在竞争日益激烈的今天,企业发展主要取决于核心业务的成败,将非核心业务外包给…

    大数据 2021年11月15日
  • python统计文本中的单词数和print的两种写法

    #!/usr/bin/python # - * - coding: utf-8 - * - #作用,分别计算每个文本的单词数,并且输出所有文本的单词总数 a = [] sum = 0 def count_words(filename): #filename = '1.txt' try: with open(filename) as fil…

    大数据 2021年11月15日
  • 数据标注行业知多少

    据相关资料显示,在中国,有10万的全职数据标注员,100万的兼职数据标注员。 看到这个数据,不禁想问数据标注到底是一个怎样的行业? 其实早在1998年第一家标注公司成立的时候,该行业就已经出现,只是那时人工智能…

    大数据 2021年11月15日
  • 正则表达式中/{/} --匹配模式出现的次数

    正则表达式:                 /{/}    匹配字符出现的次数     使用*可匹配所有匹配结果人一次…

    大数据 2021年11月15日
  • 大数据的类型

    “数据”被定义为“由计算机执行操作的数量,字符或符号,其可以以电信号的形式存储和传输并记录在磁,光或机械记录介质上”,作为快速谷歌搜索会显示。 大数据的概念并不复杂; 顾名思义,“大数据”指的是大量数据…

    大数据 2021年11月15日
  • hadoop+spark+scala环境--单实例版

    hadoop+spark环境--单实例版1、修改主机名及关系映射2、关闭防火墙并创建文件夹mkdir /hadoop/tmpmkdir /hadoop/dfs/namemkdir /hadoop/dfs/datamkdir /hadoop/var3、配置Scala环境[root@hadoop conf]#vim /etc/pro…

    大数据 2021年11月15日
  • 纯前端表格控件SpreadJS与Java结合,实现模板上传和下载等功能

    安装部署: 开发环境: 后台服务器端采用 Java 、SpringMVC。 数据存储到 /demo_web/WEB-INF/FileDatabase.txt 文件中,不需要依赖DB。 采用 Eclipse Java EE IDE for Web Developers,Eclipse Version: P…

    大数据 2021年11月15日
  • 设计模式--Command, Template Method, Strategy

     Command--对象行为型模式   意图 将一个请求封装为一个对象,从而使你可用不同的请求对客户进行参数化;对请求排队或记录请求日志,以及支持可撤销的操作。   别名 Action,Transaction   …

    大数据 2021年11月15日
  • deeplearning4j学习一

    源码:https://github.com/deeplearning4j 模块分类: deeplearning4j nd4j:基于jvm的科学计算工具包,类似于python numpy。 DataVec:将数据转换成向量的工具包 dl4j-examples:示例 ScalNet:是在deeplearning4j对k…

    大数据 2021年11月15日