大数据

  • Hadoop应用领域

            Hadoop在百度的应用领域主要包括:大数据挖掘与分析,日志分析平台,数据仓库系统,用户行为分析系统,广告平台等存储与计算服务。目前百度的Hadoop集群规模已经…

    大数据 2021年11月15日
  • 大数据的本质是什么,它的价值可以体现在哪些方面

    根本的原因,互联网***了我们的生活,从线上延伸到线下,人车物都被数据化了,这才使数据的大规模商用成为可能,再包装一个名号大数据。 技术层面无非是把一台机器做不了的事分给很多机器做,并不是主要的进步。主…

    大数据 2021年11月15日
  • MapReduce 初试

    一、境遇     接触Hadoop已经有半年了,从Hadoop集群搭建到Hive、HBase、Sqoop相关组件的安装,甚至Spark on Hive、Phoenix、Kylin这些边缘的项目都有涉及。如果说部署,我自认为可以没有任何…

    大数据 2021年11月15日
  • 什么是bug

        软件缺陷(bug)是指计算机系统和程序中存在任何破坏正常运行能力的问题、错误,或者隐藏的功能缺陷。

    大数据 2021年11月15日
  • 性能压力到一定程度响应上不去的分析过程

    【现象】:今天的直播系统性能测试中,发现系统性能压力当虚拟用户到40,再继续加大压力,响应升到了230/s后上不去。 【分析过程】:根据经验判断,这种情况不是很正常。一般这种情况下,想到的是资源方面的受限,…

    大数据 2021年11月15日
  • 神策数据算法专家:推荐系统的实践与思考(下)

    推荐系统之在线服务 在解决了算法和数据层面的问题之后,我们需要构建一个推荐系统的在线服务,用来响应用户的推荐请求。假设企业初期的 DAU 是 10 万,当 DAU 涨到一百万的时候,希望能够通过增加机器的形式,解决…

    大数据 2021年11月15日
  • OpentTsdb官方文档中文版----存储

      OpenTSDB目前支持Apache HBase作为其主要的存储后端。截止版本2.3,OpenTSDB也可以使用Google云上的Bigtable。选择下面的HBase链接以存储架构或Bigtable以查找用于云中的配置和设置。 HBase Schema Dat…

    大数据 2021年11月15日
  • Spark笔记整理(二):RDD与spark核心概念名词

    [TOC] Spark RDD 非常基本的说明,下面一张图就能够有基本的理解: Spark RDD基本说明 1、Spark的核心概念是RDD (resilient distributed dataset,弹性分布式数据集),指的是一个只读的,可分区的分布式数据集,这…

    大数据 2021年11月15日
  • 重置Jenkins用户权限和密码

    说明 最近在折腾jenkins,配置用户权限时点错了,选择了安全矩阵后没有添加用户,就保存配置了,然后就报错了,提示没有Overall/Read权限。还有另外一个问题,用户的密码忘记了怎么办?   一.重置用户权限 &n…

    大数据 2021年11月15日
  • jmeter将响应结果由Unicode转码成中文展示

    一般,线上的接口返回数据都会经过加密展示,如果想中文展示,则需要添加BeanShell PostProcessor,并加入代码,如下图:并插入如下代码: //获取响应代码Unicode编码的 String s2=new String(prev.getResponseData…

    大数据 2021年11月15日