数据分析
-
linux redhat7 升级NVIDIA显卡驱动步骤详解大数据
1 背景 前面在redhat7服务器上升级了tensorflow1.0,发现GPU用不了 根据教程,测试GPU: # 新建一个 graph. import tensorflow a…
-
python format 在sql中对 string 和 int 类型的变化详解大数据
今天在使用format拼sql语句时遇到一下问题: 其中数据库中first_16字段是text类型 >>> s = ‘12345’ >>> q0…
-
python Manager对象增加进程详解大数据
问题:启动一个python进程,ps发现还有多个额外进程 说明: 一个multiprocessing.Manager对象会控制一个服务器进程,其他进程可以通过代理的方式来访问这个服…
-
pandas DataFrame操作详解大数据
pandas 处理格式化数据的利器。 本文会不断更新 1. DataFram 1.1 使用字典构造 >>> import pandas as pd >>…
-
语素、词性列表及jieba与哈工大pyltp一个例子对比详解大数据
1 关于语素 百度百科的解释: 语法单位有大有小,最大的语法单位是句子,比句子小的语法单位,依次是短语、词、语素。人类的语言是有声音、有意义的,是语音和语义的结合体,这便是语法单位…
-
哈工大ltp词性标注列表和ICTCLAS词性列表详解大数据
哈工大ltp词性列表 Tag Description Example a adjective 美丽 b other noun-modifier 大型, 西式 c conjuncti…
-
jieba提取关键词时筛选词性时单词性选择的一点注意事项详解大数据
最近又在迭代特征工程,发现jieba提取特征词有个需要注意的地方,直接看例子 例子1 >>> import jieba >>> import j…
-
pandas read_csv 错误: pandas.parser.CParserError: Error tokenizing data. C error详解大数据
今天panda.read_csv时遇到以下错误: File “/root/anaconda2/lib/python2.7/site-packages/pandas/io/parse…
-
理顺主题模型LDA及在推荐系统中的应用详解大数据
1 关于主题模型 使用LDA做推荐已经有一段时间了,LDA的推导过程反复看过很多遍,今天有点理顺的感觉,就先写一版。 隐含狄利克雷分布简称LDA(latent dirichlet…
-
LDA的Gibbs 采样详解大数据
1 马尔可夫链 马尔可夫链(Markov Chain),描述了一种状态序列,其每个状态值取决于前面有限个状态。马尔可夫链是具有马尔可夫性质的随机变量的一个数列。这些变量的范围,即它…