大数据
-
实时报表 T+0 的实现方案
基于数据库系统的 T+0 全量实时查询,在数据量很大时一般只能进行数据库扩容(包括分库手段),成本高昂;如果采用文件系统和生产数据库混合运算,就可以实现低成本高性能的 T+0 查询,而热导出机制则是这个方案的…
-
R语言计算IV值及使用
更多大数据分析、建模等内容请关注公众号《bigdatamodeling》 在对变量分箱后,需要计算变量的重要性,IV是评估变量区分度或重要性的统计量之一,R语言计算IV值的代码如下: CalcIV <- function(df_bin, key_var…
-
什么是大数据血缘?
今天跟一个测试同事聊天: 我:最近忙什么项目呢?他:在测大数据血缘我:啥?他:血缘啊我:啥血缘?他:大数据血缘啊我:血缘是啥?他:就是数据血缘啊我:... 看看,天就是这么被聊死的,我忍不住内心OS(怪不得…
-
学习日志---打造搜索引擎搜索提示
打包过程 将网站程序打成war包,使用clean package; 将war包放到服务器的tomcat上的webapps中; 在conf的目录下更改server.xml文件: 加上如下编码,更改编码方式,防止乱码 URIEncoding="UTF-8" <Connector&nb…
-
敏捷开发中如何把握项目进度
很多刚刚转向管理岗位的人员,对于项目进度如何把控,往往不知所从。 关于进度,比较容易让人想到的是询问、以及要求写日报、周报之类的。 这些措施首先是不完全的。因为进度管理不仅…
-
LoadRunner下释放所有虚拟IP
使用了LoadRunner的虚拟IP后,向一切恢复如初,需要释放IP,如何进行释放呢,其实很简单。 方法有二: 1.打开IP wizard 点击remove,全部移除之前分配的IP。 2.点击如下图的restore ...单选按钮 无论是方法1或方法2…
-
Loadrunner通过验证码并实现成功登录的方法
需要安装的软件 1、安装ImageMagick安装完成后,将其安装路径添加到环境变量path中 2、安装Tesseract-OCR #define MAX_NAME_LEN 4 //定义验证码字符串的长度,这里是4位 int flen; &nbs…
-
大数据平台架构设计探究
本文首发于 vivo互联网技术 微信公众号 链接:https://mp.weixin.qq.com/s/npRRRDqNUHNjbybliFxOxA 作者:刘延江 近年来,随着IT技术与大数据、机器学习、算法方向的不断发展,越来越多的企业都意识到了数据存在的…
-
一.hadoop伪分布式部署
========一.hadoop伪分布式========= <code> 伪分布式环境配置 需要安装openjdk 和openjdk-devel软件包(用的是1.8.0版本) rpm -ql Java-openjdk-devel-1.8.0 | grep ‘/bin/j…
-
常用的数据可视化工具推荐
在大数据时代,数据对企业和组织的重要性不言而喻,企业和组织也对数据的需求变得纷繁多样。因此随之而来的是各种各样提供数据分析服务的产品,其中数据可视化工具就不得不提这些工具,如:我们常用的excel工具;图…