开源
-
大数据平台规划
背景 1.“云大开物”,四大热门信息技术 1.1 业务的发展越来越受到技术进步的影响。业务创新离不开技术创新。技术为业务服务? 2.大数据技术栈全景: 分布式编程 分布式文件系统 列数据库(HBase、Cassandra、BigTable…
-
十、MapReduce--InputFormat以及RecordReader抽象类
一、基本原理 在map执行之前,需要将数据进行切片,每个切片对应一个map任务。而每个map任务并不是直接处理这些切片数据的,它是处理KV的。所以问题有两个:数据是如何切片的、切片是如何转为KV给map处理的。 这…
-
selenium-6 测试脚本中等待方法
例1:from selenium import webdriverb = webdriver.Firefox()b.find_element_by_id("kw").send_keys("51cto")b.implicitly_wait(5) #等待五秒b.find_element_by_id("kw1") #此处kw1…
-
“数据治理那点事”系列之一:那些年我们一起踩过的坑
大数据时代,数据成为社会和组织的宝贵资产,像工业时代的石油和电力一样驱动万物,然而如果石油的杂质太多,电流的电压不稳,数据的价值岂不是大打折扣,甚至根本不可用不敢用,因此,数据治理是大数据时代我们用…
-
接口自动化测试系列之PHPUnit-接口测试的步骤
接着上篇文章接口自动化测试系列之PHPUnit-接口测试基础继续来说 接口测试的步骤 接口测试的步骤并没有什么特殊的,但其中比较关键的是阅读接口文档。这里有个特别奇怪的现象,我们作为测试每天都在读各种复杂、不…
-
selenium学习:简单元素操作
WebDriver中常用方法: clear() 清除文本 send_keys(*value) 模拟按键输入 click() 单机元素 网站的登陆 from selenium import webdriver from time import&nb…
-
Rust 1.56.1 发布,解决 Unicode 安全漏洞问题
Rust 1.56.1 现已发布。此版本引入了两个新的 lints,以减轻最近披露的一个安全问题 CVE-2021-42574 的影响: 在 Unicode Specification through 14.0 的双向算法中发现了一个问题。它允许通过控制序列对字符…
-
TensorFlow 2.6.1 发布,机器学习平台
TensorFlow 是一个用于机器学习的端到端开源平台。它有一个全面灵活的工具、库和社区资源所组成的生态,让开发人员轻松建立和部署由 ML 驱动的应用程序。TensorFlow 最初用于进行机器学习和深度神经网络研究。但该…
-
2.3.1.shell awk 入门
awk:好用的数据处理工具 awk 也是一个非常棒的数据处理工具!sed 常常用于一整个行的处理, awk 则比较倾向于一行当中分成数个『栏位』(或者称为一个域,也就是一列)来处理。因此,awk 相当的适合处理小…