开源
-
强大而优雅,API 研发管理 EOLINKER 新版正式发布
EOLINKER 于2019年3月3日正式发布新版本!该版本大幅强化各个产品的功能、着重优化了全站的用户交互体验,并且EOLINKER AMS 产品正式更名为 EOLINKER API Studio ——API 工作室,旨在为您提供API文档管理、自动化测…
-
好程序员大数据学习路线之mapreduce概述
大数据学习路线之mapreduce概述,mapreduce:分布式并行离线计算框架,是一个分布式运算程序的编程框架,是用户开发“基于hadoop的数据分析应用”的核心框架;Mapreduce核心功能是将用户编写的业务逻辑代码和自带…
-
Hadoop2.6.0学习笔记(一)MapReduce介绍
鲁春利的工作笔记,谁说程序员不能有文艺范? Hadoop是大数据处理的存储和计算平台,HDFS主要用来实现数据存储,MapReduce实现数据的计算。 MapReduce内部已经封…
-
hadoop一 ---- 我对hadoop的理解
大数据:海量数据 结构化数据:即行数据,能够存储在二维表中的数据 非结构化数据:无法使用数据的二维逻辑表示数据。如word,ppt,图片 半结构化数据:在结构化与非结构化…
-
基于SpringMVC、Maven以及Mybatis的环境搭建 【转】
搭建环境 1、IDE用的是Eclipse的J2EE版本,要保证装上了Maven,可以使用Eclipse的Install New Software来安装然后点击Next,安装好后重启一次。注意:使用最新版的Eclipse时,可以跳过此步,因为最新版的Eclipse已…
-
hadoop生态的大体介绍
重点组件:HDFS:Hadoop 的分布式文件存储系统MapReduce:Hadoop 的分布式程序运算框架,也可以叫做一种编程模型Hive:基于 Hadoop 的类 SQL 数据仓库工具HBase:基于 Hadoop 的列式分布式 NoSQL 数据库ZooKeeper:…
-
Hadoop2.6.0学习笔记(二)MapReduce通过Eclipse运行
欢迎访问:鲁春利的工作笔记,学习是一种信仰,让时间考验坚持的力量。 系统:Win7 64位 JEE版本的Eclipse:Luna Release (4.4.0) Hadoop:2.6.0 Hadoop-plugin:hadoop-eclipse-plugin-2.2.0.jar 0、写在前面 工作…
-
大数据处理之流式计算简介
简介 Strom是一个开源的分布式流式计算系统,用来处理流式的数据,被称作为流式的hadoop,在电信行业,可以用来做大流量预警、终端营销、访问竞争对手产品从而做挽留等业务。本文将从storm在hadoop生态圈中所处位置…
-
Flask send_from_director 抛异常
最近在做某厂产品开发时调用到了Flask里的send_from_directory接口,调用方法如下:send_from_directory(dirpath, filename, as_attachment = false)运行起来结果却并未达到预期,在执行到这里是抛出了异常。解决过…
-
在pandas的unstack时报ValueError: duplicate entries 错误
pandas是python中用于数据分析和处理的一个基于numpy的基本库工具,是从事python语言数据领域的一个基本入门工具,常见用途有:a提供高级的数据结构和相当丰富的数据操作APIb提高了对复杂矩阵运算的效率(这里的矩…