开源
-
大数据零基础学习hadoop入门教程
1、Hadoop生态概况 Hadoop是一个由Apache基金会所开发的分布式系统集成架构,用户可以在不了解分布式底层细节情况下,开发分布式程序,充分利用集群的威力来进行高速运算与存储,具有可靠、高效、可伸缩的特点 Hado…
-
利用QQ做营销有啥特点?流量星球:分享几个营销技巧吧!
现在QQ是每个人生活中必备的一种沟通方式,有的人只是为了聊天而使用QQ,而目前绝大多数的人都在使用QQ做营销,也就是不断的给用户发推广产品信息,那么究竟是什么原因让QQ营销如此流行呢?这主要是因为QQ营销的几…
-
Jmeter模拟不同带宽进行测试
Jmeter自带模拟带宽设置,前提是当前的带宽>=要模拟的带宽,如:当前4m的宽带,只能模拟4m及以下的带宽; 设置方法:在user.properties文件,增加如下配置: # Define characters per secon…
-
网络爬虫的抓取策略
遍历策略是爬虫的核心问题,在爬虫系统中,待抓取URL队列是很重要的一部分。待抓取URL队列中的URL以什么样的顺序排列也是一个很重要的问题,因为这涉及到先抓取那个页面,后抓取哪个页面而决定这些URL排列顺序的方…
-
Elasticsearch重启前禁止分片移动的方法
重启集群前,先设置集群停止分片移动: curl -XPUT http://localhost:9200/_cluster/settings -d '{"transient" : {"cluster.routing.allocation.enable" : "none"}}' 重启之后,恢…
-
【总结】一不小心的Map端数据倾斜
MapReduce任务的数据倾斜一般指的是Reduce端数据倾斜,Map端怎么还会出现数据倾斜呢。~~ Mapper任务如下图所示,其中一个map任务耗时特别长 跑了一个ETL程序,两个Map分别读取两类数据,一个是lzo格式,另外一个是t…
-
hadoop-2.7.4编译安装
1.protobuf编译安装 [root@hadoop1 ~]# yum install svn autoconf automake libtool cmake ncurses-devel openssl-devel gcc* [root@hadoop1 ~]#&nbs…
-
Citrix XenDesktop
Citrix XenDesktop Citrix®XenDesktop®是一种桌面虚拟化解决方案,可将Windows桌面转变为任何用户随时随地可通过任何设备访问的按需服务,同时实现无与伦比的简便性和可扩展性。 不管用户使用的…
-
数平精准推荐 | OCR技术之系统篇
导语:如果说算法和数据是跑车的发动机和汽油,那么系统则是变速箱,稳定而灵活的变速箱,是图像识别服务向前推进的基础。算法、数据、系统三位一体,随着算法的快速发展和数据的日益积累,系统也在高效而稳定地升…
-
Git 代码管理以及问题
libcdio: Existing folder found. Checking for updates...fatal: unable to access 'https://github.com/ShiftMediaProject/libcdio.git/': Failed to connect to github.com port 443: Timed out 1 获取历史版本…