大数据
-
Hadoop应用领域
Hadoop在百度的应用领域主要包括:大数据挖掘与分析,日志分析平台,数据仓库系统,用户行为分析系统,广告平台等存储与计算服务。目前百度的Hadoop集群规模已经…
-
大数据的本质是什么,它的价值可以体现在哪些方面
根本的原因,互联网***了我们的生活,从线上延伸到线下,人车物都被数据化了,这才使数据的大规模商用成为可能,再包装一个名号大数据。 技术层面无非是把一台机器做不了的事分给很多机器做,并不是主要的进步。主…
-
MapReduce 初试
一、境遇 接触Hadoop已经有半年了,从Hadoop集群搭建到Hive、HBase、Sqoop相关组件的安装,甚至Spark on Hive、Phoenix、Kylin这些边缘的项目都有涉及。如果说部署,我自认为可以没有任何…
-
什么是bug
软件缺陷(bug)是指计算机系统和程序中存在任何破坏正常运行能力的问题、错误,或者隐藏的功能缺陷。
-
性能压力到一定程度响应上不去的分析过程
【现象】:今天的直播系统性能测试中,发现系统性能压力当虚拟用户到40,再继续加大压力,响应升到了230/s后上不去。 【分析过程】:根据经验判断,这种情况不是很正常。一般这种情况下,想到的是资源方面的受限,…
-
神策数据算法专家:推荐系统的实践与思考(下)
推荐系统之在线服务 在解决了算法和数据层面的问题之后,我们需要构建一个推荐系统的在线服务,用来响应用户的推荐请求。假设企业初期的 DAU 是 10 万,当 DAU 涨到一百万的时候,希望能够通过增加机器的形式,解决…
-
OpentTsdb官方文档中文版----存储
OpenTSDB目前支持Apache HBase作为其主要的存储后端。截止版本2.3,OpenTSDB也可以使用Google云上的Bigtable。选择下面的HBase链接以存储架构或Bigtable以查找用于云中的配置和设置。 HBase Schema Dat…
-
Spark笔记整理(二):RDD与spark核心概念名词
[TOC] Spark RDD 非常基本的说明,下面一张图就能够有基本的理解: Spark RDD基本说明 1、Spark的核心概念是RDD (resilient distributed dataset,弹性分布式数据集),指的是一个只读的,可分区的分布式数据集,这…
-
重置Jenkins用户权限和密码
说明 最近在折腾jenkins,配置用户权限时点错了,选择了安全矩阵后没有添加用户,就保存配置了,然后就报错了,提示没有Overall/Read权限。还有另外一个问题,用户的密码忘记了怎么办? 一.重置用户权限 &n…
-
jmeter将响应结果由Unicode转码成中文展示
一般,线上的接口返回数据都会经过加密展示,如果想中文展示,则需要添加BeanShell PostProcessor,并加入代码,如下图:并插入如下代码: //获取响应代码Unicode编码的 String s2=new String(prev.getResponseData…