开源
-
大数据技术学习路线,该怎么学?
如果你看完有信心能坚持学习的话,那就当下开始行动吧! 一、大数据技术基础 1、linux操作基础 linux系统简介与安装linux常用命令–文件操作linux常用命令–用户管理与权限linux常用命令–系统管理linux常用命令–免密…
-
linux安装hadoop之安装jdk
在centos上安装jdk. 1、去官网下载安装包。我这里是jdk-7u79-linux-x64.rpm。 2、在centos建立usr/java目录。只需要在usr下mkdir java 即可。 3、上传rpm包。 rz jdk-7u79-linux-x64.rpm。如果不能执行rz命令…
-
hive的视图
创建视图:create view view_piaofang as select * from t_name; 查看视图 :show tables; #既有表又有视图show views #只查看视图 查看视图的详细信息desc formatted|extended 删除视图drop view view_name; 使用…
-
Badboy自动化测试工具9 查看回放结果
在运行脚本时,Badboy提供了Summary功能方便我们监控回放结果状态,如下Summary view: 以下表格对运行情况的各个维度进行解释: 统计点 描述 Played 运行或回放脚本的次数 Succeeded 成功运行或回放脚本的次数 Fai…
-
SparkSQL的3种Join实现
引言Join是SQL语句中的常用操作,良好的表结构能够将数据分散在不同的表中,使其符合某种范式,减少表冗余、更新容错等。而建立表和表之间关系的最佳方式就是Join操作。 对于Spark来说有3中Join的实现,每种Join对…
-
系统质量之保障 运维外包不可少
在前面的文章中,我们了解了IT运维外包的概念,本文主要介绍IT运维外包在软件质量保障中的重要作用,希望能给大家带来帮助。 在竞争日益激烈的今天,企业发展主要取决于核心业务的成败,将非核心业务外包给…
-
python统计文本中的单词数和print的两种写法
#!/usr/bin/python # - * - coding: utf-8 - * - #作用,分别计算每个文本的单词数,并且输出所有文本的单词总数 a = [] sum = 0 def count_words(filename): #filename = '1.txt' try: with open(filename) as fil…
-
数据标注行业知多少
据相关资料显示,在中国,有10万的全职数据标注员,100万的兼职数据标注员。 看到这个数据,不禁想问数据标注到底是一个怎样的行业? 其实早在1998年第一家标注公司成立的时候,该行业就已经出现,只是那时人工智能…
-
正则表达式中/{/} --匹配模式出现的次数
正则表达式: /{/} 匹配字符出现的次数 使用*可匹配所有匹配结果人一次…
-
大数据的类型
“数据”被定义为“由计算机执行操作的数量,字符或符号,其可以以电信号的形式存储和传输并记录在磁,光或机械记录介质上”,作为快速谷歌搜索会显示。 大数据的概念并不复杂; 顾名思义,“大数据”指的是大量数据…