开源
-
为什么数据基础设施如此重要,这篇白皮书讲透了
一个真实的故事。 某家商业银行为准备国庆长假计划策划大型营销活动,以此来带动老用户消费和挖掘潜客。通常,业务部门通常会与电商、OTA、出行、O2O等平台,甚至保险公司、线下餐饮、影院、购物中心等进行权益合作…
-
LDA主题模型学习相关的书籍介绍
关于LDA主题模型,一度是NLP领域一个非常火的模型,后来深度学习大放异彩,它的热度才慢慢降了下来。 由于数学基础很差,一直没有理解LDA的整个核心。到目前为止,也只是理解了皮毛。记录一下关于LDA主题模型相关的…
-
大数据基础问答
什么是大数据?用于①数据的存储:分布式文件系统(分布式存储)②数据的计算:分布式计算。简单一点就是存储和计算的问题,解决日常海量数据的分析。 学习大数据需要什么基础呢?Java基础(Javase):类、类、继承、I…
-
线上故障处理原则
墨菲定律 任何事情都没有表面看起来那么简单 所有事情的发展都会比你预计的时间长 会出错的事情总会出错 如果担心某个事情发生,那么它更有可能发生 墨菲定律暗示我们,如果担心某种情况会发生,那么它更有可能发生…
-
ETL调度系统及常见工具对比:Azkaban、Oozie、数
最近遇到了很多正在研究ETL及其工具的同学向我们抱怨:同样都在用 Kettle ,起点明明没差异,但为什么别人ETL做的那么快那么好,自己却不断掉坑? 其实,类似于像 Kettle 这样开源的工具,已经覆盖了大部分日常工作…
-
中控集团杭州深蓝数智专场 — 纯前端表格技术应用研讨会
2018 年 6 月 22 日,“赋能开发者,走进你身边——纯前端表格技术应用研讨会”走进了中控集团杭州深蓝数智科技有限公司。西安葡萄城业务总监郭玮、资深前端技术专家姚尧受邀与杭州深蓝技术团队就企业发展、前端技术趋…
-
Pulsar 使用 pulsar-admin 管理 租户、命
Pulsar 的管理可以通过LIC命令行,REST api 、JAVA api管理 以下介绍使用LIC命令行 (pulsar2.4.2上测试) 1 租户 查看有哪些租户(public 是系统默认的租户) $ pulsar-admin tenants list 创建租户 $ pulsar-admin te…
-
10.31PMP试题每日一题
在投资额外的预防/评估成本时,即没有好处,又不具备成本效益,这是:A、预防成本B、评估成本C、失败成本D、最优成本 答案将于明天和新题一起揭晓! 10.30试题答案:A
-
mount samba 目录失败
mount 远程Samba文件失败: [root@node2 ~]# mount //localhost/shares /test/ -o user=michael mount: wrong fs type, bad option, bad superblock on //localhost/shares, missing co…
-
hive 安装
继续上面的文章,安装hive 一、 1、解压 tar -zvxf apache-hive-1.2.1-bin.tar.gz 2、添加环境变量 3、修改 hive-site.xml <property><name>hive.exec.scratchdir</name><value>/tmp/hive&…