大数据 | 第1756页

hadoop的Hive实战操作sogou的日志

动手实战操作搜狗日志文件本节中所用到的内容是来自搜狗实验室，网址为： http://www.sogou.com/labs/dl/q.html 用户可以根据自己的Spark机器实际的内存配置等情况选择下载不同的数据版本，为了让所有的学习者都可…

大数据 2021年11月15日

0

用ndk制作一个安卓so

做个记录打开EclipsFile->New->Project选择安卓应用填写名称mytest2ndk然后一路点下去就行，不用选什么，注意不要勾选 Mark this project as a library，生成so的事情在其他地方处理。然后工程就建好了，接…

大数据 2021年11月15日

0

git tag按照时间排序

打标签 git tag -a v1.2.0 -m "new version" 显示标签以及备注，这个是按照tag的version的顺序排序，并非按照tag的时间顺序 git tag -n 实现标签以及备注，按照打标签的时间排序，这个应该是最可能使用的，反正我版…

大数据 2021年11月15日

0

Apache Pig和Solr问题笔记（一）

记录下最近两天散仙在工作中遇到的有关Pig0.12.0和Solr4.10.2一些问题总共有3个如下 1问题一如何Pig中使用ASCII和十六进制hexadecimal的分隔符进行加载和切分数据注意关于这个问题在Pig中会反应到2个场景中第一 …

大数据 2021年11月15日

0

（第4篇）hadoop之魂--mapreduce计算框架，让收集的数据产生价值

通过前面的学习，大家已经了解了HDFS文件系统。有了数据，下一步就要分析计算这些数据，产生价值。接下来我们介绍Mapreduce计算框架，学习数据是怎样被利用的。 Mapreduce计算框架如果将Hadoop比做一头大象，那么M…

大数据 2021年11月15日

0

kylin通过API增量build

官方文档参考：http://kylin.apache.org/cn/docs21/howto/howto_build_cube_with_restapi.html （写的不详细）账户：我们使用的默认账户：ADMIN/KYLIN的basic认证码为：QURNSU46S1lMSU4= 格式如下：curl -X PUT -H…

大数据 2021年11月15日

0

spark+kafka+redis统计网站访问者IP

*目的是为了防采集。需要对网站的日志信息，进行一个实时的IP访问监控。 1、kafka版本是最新的0.10.0.0 2、spark版本是1.61 3、下载对应的spark-streaming-kafka-assembly_2.10-1.6.1.jar放到spark目录下的lib目录…

大数据 2021年11月15日

0

接口自动化与RPC服务mock平台相结合的应用实践

原文链接：http://mp.weixin.qq.com/s/xESQTuCyuDLKbeLo1HelBg 内容大纲：为何要进行 mock? 1、下游服务接口不稳定，环境缺失导致依赖服务不可用，阻塞联调或测试。2、由于线上环境测试数据无法构造，测试场景单…

大数据 2021年11月15日

0

Pyhon学习笔记4:异常

1.文件的异常处理：try except FileNotFoundError try: open("abc.txt",'r') except FileNotFoundError: print("异常了！") 2.name的异常 try except NameError t…

大数据 2021年11月15日

0

C++中头文件设计

对于小工具程序而言，用C++编写估计也就几个文件，此时很少设计头文件互相包含引发的编译出错问题。但是当软件功能越来越多，功能越来越复杂，各模块之间的调用关系也越来越不明显，此时很有可能会出现A头文件包含B…

大数据 2021年11月15日

0