开源

  • 大数据零基础学习hadoop入门教程

    1、Hadoop生态概况 Hadoop是一个由Apache基金会所开发的分布式系统集成架构,用户可以在不了解分布式底层细节情况下,开发分布式程序,充分利用集群的威力来进行高速运算与存储,具有可靠、高效、可伸缩的特点 Hado…

    大数据 2021年11月14日
  • 利用QQ做营销有啥特点?流量星球:分享几个营销技巧吧!

    现在QQ是每个人生活中必备的一种沟通方式,有的人只是为了聊天而使用QQ,而目前绝大多数的人都在使用QQ做营销,也就是不断的给用户发推广产品信息,那么究竟是什么原因让QQ营销如此流行呢?这主要是因为QQ营销的几…

    大数据 2021年11月14日
  • Jmeter模拟不同带宽进行测试

    Jmeter自带模拟带宽设置,前提是当前的带宽>=要模拟的带宽,如:当前4m的宽带,只能模拟4m及以下的带宽; 设置方法:在user.properties文件,增加如下配置: # Define characters per secon…

    大数据 2021年11月14日
  • 网络爬虫的抓取策略

    遍历策略是爬虫的核心问题,在爬虫系统中,待抓取URL队列是很重要的一部分。待抓取URL队列中的URL以什么样的顺序排列也是一个很重要的问题,因为这涉及到先抓取那个页面,后抓取哪个页面而决定这些URL排列顺序的方…

    大数据 2021年11月14日
  • Elasticsearch重启前禁止分片移动的方法

    重启集群前,先设置集群停止分片移动: curl -XPUT http://localhost:9200/_cluster/settings -d '{"transient" : {"cluster.routing.allocation.enable" : "none"}}' 重启之后,恢…

    大数据 2021年11月14日
  • 【总结】一不小心的Map端数据倾斜

    MapReduce任务的数据倾斜一般指的是Reduce端数据倾斜,Map端怎么还会出现数据倾斜呢。~~ Mapper任务如下图所示,其中一个map任务耗时特别长 跑了一个ETL程序,两个Map分别读取两类数据,一个是lzo格式,另外一个是t…

    大数据 2021年11月14日
  • hadoop-2.7.4编译安装

    1.protobuf编译安装 [root@hadoop1 ~]# yum install svn autoconf automake libtool cmake ncurses-devel openssl-devel gcc* [root@hadoop1 ~]#&nbs…

    大数据 2021年11月14日
  • Citrix XenDesktop

    Citrix XenDesktop Citrix®XenDesktop®是一种桌面虚拟化解决方案,可将Windows桌面转变为任何用户随时随地可通过任何设备访问的按需服务,同时实现无与伦比的简便性和可扩展性。 不管用户使用的…

    大数据 2021年11月14日
  • 数平精准推荐 | OCR技术之系统篇

    导语:如果说算法和数据是跑车的发动机和汽油,那么系统则是变速箱,稳定而灵活的变速箱,是图像识别服务向前推进的基础。算法、数据、系统三位一体,随着算法的快速发展和数据的日益积累,系统也在高效而稳定地升…

    大数据 2021年11月14日
  • Git 代码管理以及问题

    libcdio: Existing folder found. Checking for updates...fatal: unable to access 'https://github.com/ShiftMediaProject/libcdio.git/': Failed to connect to github.com port 443: Timed out 1 获取历史版本…

    大数据 2021年11月14日