区块链
-
防止过拟合详解大数据
本文是《Neural networks and deep learning》概览 中第三章的一部分,讲机器学习/深度学习算法中常用的正则化方法。 在训练数据不够多时,或者…
-
Hadoop知识点总结详解大数据
之前自己在慕课网在线学习了关于hadoop的初步知识,在此记录一下: hadoop主要是由两部分构成:1、HDFS,负责存储,为分布式文件系统;2、MapReduce,是并行处理框…
-
Redis在win7上的可视化应用详解大数据
Redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(s…
-
使用Redis保存Spring session(基于XML配置文件)详解大数据
一、Spring-session配置redis方法一: spring session是一种分布式session共享方案,提供了管理用户session信息的接口及实现。 …
-
TensorFlow第二届开发者峰会详解大数据
天体物理学家使用 TensorFlow 分析开普勒任务中的大量数据,以发现新的行星; 医学研究人员利用 TensorFlow 机器学习技术来评估一个人心脏病发作和中风的几率; 科学…
-
人工智能学习笔记详解大数据
专家系统 人工智能并非专家系统,但是却或多或少的与专家系统有关系,可以说专家系统是人工智能很早期的存在形式。专家系统(ES, Expert System)是一种模拟人类专家解决领域…
-
RDD概念、特性、缓存策略与容错详解大数据
一、RDD概念与特性 1. RDD的概念 RDD(Resilient Distributed Dataset),是指弹性分布式数据集。数据集:Spark中的编程是基于RDD的,…
-
[ETL] Flume 理论与demo(Taildir Source & Hdfs Sink)详解大数据
一、Flume简介 1. Flume概述 Flume是Cloudera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,Flume支持在日志系统中定制各类数…
-
Apache Hive 基本理论与安装指南详解大数据
一、Hive的基本理论 Hive是在HDFS之上的架构,Hive中含有其自身的组件,解释器、编译器、执行器、优化器。解释器用于对脚本进行解释,编译器是对高级语言代码进行编译,执…
-
Hive 编程之DDL、DML、UDF、Select总结详解大数据
Hive的基本理论与安装可参看作者上一篇博文《Apache Hive 基本理论与安装指南》。 一、Hive命令行 所有的hive命令都可以通过hive命令行去执行,hive…