Django的Models详解大数据

Django的数据库配置:

1    django默认支持sqlite,mysql, oracle,postgresql数据库

2.   在django的项目中会默认使用sqlite数据库,如果要使用mysql,可在settings里如下设置:

DATABASES = { 
 
    'default': { 
 
        'ENGINE': 'django.db.backends.mysql',  
 
        'NAME': 'dbname',    
 
        'USER': 'root',   
 
        'PASSWORD': 'root',  
 
        'HOST': '', #,留空默认为localhost 
 
        'PORT': '3306', #你的数据库端口 
 
    } 
 
}

需要注意的是:

 仅仅上述更改还是会报错的:

no module named MySQLdb
这是因为django默认你导入的驱动是MySQLdb,可是MySQLdb对于py3有很大问题,所以我们需要的驱动是PyMySQL 
 
所以,我们只需要找到项目名文件下的__init__,在里面写入: 
 
import pymysql 
pymysql.install_as_MySQLdb()

ORM关系映射

用于操作数据库的创建表以及增删改查等操作。

ORM使我们与数据库的交互变动跟家的简单,省略了直接写sql语句。可以快速的进行开发。

不过在性能上不如原来的SQL语句,并且对于一些复杂的数据库操作不能很好的实现。

表(模型)的创建。
Django的Models详解大数据

 1 from django.db import models<br> 
 2 class Publisher(models.Model): 
 3     name = models.CharField(max_length=30, verbose_name="名称") 
 4     address = models.CharField("地址", max_length=50) 
 5     city = models.CharField('城市',max_length=60) 
 6     state_province = models.CharField(max_length=30) 
 7     country = models.CharField(max_length=50) 
 8     website = models.URLField() 
 9   
10     class Meta: 
11         verbose_name = '出版商' 
12         verbose_name_plural = verbose_name 
13   
14     def __str__(self): 
15         return self.name 
16   
17 class Author(models.Model): 
18     name = models.CharField(max_length=30) 
19     def __str__(self): 
20         return self.name 
21   
22 class AuthorDetail(models.Model): 
23     sex = models.BooleanField(max_length=1, choices=((0, ''),(1, ''),)) 
24     email = models.EmailField() 
25     address = models.CharField(max_length=50) 
26     birthday = models.DateField() 
27     author = models.OneToOneField(Author) 
28   
29 class Book(models.Model): 
30     title = models.CharField(max_length=100) 
31     authors = models.ManyToManyField(Author) 
32     publisher = models.ForeignKey(Publisher) 
33     publication_date = models.DateField() 
34     price=models.DecimalField(max_digits=5,decimal_places=2,default=10) 
35     def __str__(self): 
36         return self.title

但是有两点需要注意:

注意1:记得在settings里的INSTALLED_APPS中加入’app01′,然后再同步数据库。

注意2: models.ForeignKey(“Publish”) & models.ForeignKey(Publish)

模型中常用的字段类型
  1 <1> CharField 
  2         #字符串字段, 用于较短的字符串. 
  3         #CharField 要求必须有一个参数 maxlength, 用于从数据库层和Django校验层限制该字段所允许的最大字符数. 
  4  
  5 <2> IntegerField 
  6        #用于保存一个整数. 
  7  
  8 <3> FloatField 
  9         # 一个浮点数. 必须 提供两个参数: 
 10         # 
 11         # 参数    描述 
 12         # max_digits    总位数(不包括小数点和符号) 
 13         # decimal_places    小数位数 
 14                 # 举例来说, 要保存最大值为 999 (小数点后保存2位),你要这样定义字段: 
 15                 # 
 16                 # models.FloatField(..., max_digits=5, decimal_places=2) 
 17                 # 要保存最大值一百万(小数点后保存10位)的话,你要这样定义: 
 18                 # 
 19                 # models.FloatField(..., max_digits=19, decimal_places=10) 
 20                 # admin 用一个文本框(<input type="text">)表示该字段保存的数据. 
 21  
 22 <4> AutoField 
 23         # 一个 IntegerField, 添加记录时它会自动增长. 你通常不需要直接使用这个字段;  
 24         # 自定义一个主键:my_id=models.AutoField(primary_key=True) 
 25         # 如果你不指定主键的话,系统会自动添加一个主键字段到你的 model. 
 26  
 27 <5> BooleanField 
 28         # A true/false field. admin 用 checkbox 来表示此类字段. 
 29  
 30 <6> TextField 
 31         # 一个容量很大的文本字段. 
 32         # admin 用一个 <textarea> (文本区域)表示该字段数据.(一个多行编辑框). 
 33  
 34 <7> EmailField 
 35         # 一个带有检查Email合法性的 CharField,不接受 maxlength 参数. 
 36  
 37 <8> DateField 
 38         # 一个日期字段. 共有下列额外的可选参数: 
 39         # Argument    描述 
 40         # auto_now    当对象被保存时,自动将该字段的值设置为当前时间.通常用于表示 "last-modified" 时间戳. 
 41         # auto_now_add    当对象首次被创建时,自动将该字段的值设置为当前时间.通常用于表示对象创建时间. 
 42         #(仅仅在admin中有意义...) 
 43  
 44 <9> DateTimeField 
 45         #  一个日期时间字段. 类似 DateField 支持同样的附加选项. 
 46  
 47 <10> ImageField 
 48         # 类似 FileField, 不过要校验上传对象是否是一个合法图片.#它有两个可选参数:height_field和width_field, 
 49         # 如果提供这两个参数,则图片将按提供的高度和宽度规格保存.      
 50 <11> FileField 
 51      # 一个文件上传字段. 
 52      #要求一个必须有的参数: upload_to, 一个用于保存上载文件的本地文件系统路径. 这个路径必须包含 strftime #formatting,  
 53      #该格式将被上载文件的 date/time  
 54      #替换(so that uploaded files don't fill up the given directory). 
 55      # admin 用一个<input type="file">部件表示该字段保存的数据(一个文件上传部件) . 
 56  
 57      #注意:在一个 model 中使用 FileField 或 ImageField 需要以下步骤: 
 58             #(1)在你的 settings 文件中, 定义一个完整路径给 MEDIA_ROOT 以便让 Django在此处保存上传文件.  
 59             # (出于性能考虑,这些文件并不保存到数据库.) 定义MEDIA_URL 作为该目录的公共 URL. 要确保该目录对  
 60             #  WEB服务器用户帐号是可写的. 
 61             #(2) 在你的 model 中添加 FileField 或 ImageField, 并确保定义了 upload_to 选项,以告诉 Django 
 62             # 使用 MEDIA_ROOT 的哪个子目录保存上传文件.你的数据库中要保存的只是文件的路径(相对于 MEDIA_ROOT).  
 63             # 出于习惯你一定很想使用 Django 提供的 get_<#fieldname>_url 函数.举例来说,如果你的 ImageField  
 64             # 叫作 mug_shot, 你就可以在模板中以 {{ object.#get_mug_shot_url }} 这样的方式得到图像的绝对路径. 
 65  
 66 <12> URLField 
 67       # 用于保存 URL. 若 verify_exists 参数为 True (默认), 给定的 URL 会预先检查是否存在( 即URL是否被有效装入且 
 68       # 没有返回404响应). 
 69       # admin 用一个 <input type="text"> 文本框表示该字段保存的数据(一个单行编辑框) 
 70  
 71 <13> NullBooleanField 
 72        # 类似 BooleanField, 不过允许 NULL 作为其中一个选项. 推荐使用这个字段而不要用 BooleanField 加 null=True 选项 
 73        # admin 用一个选择框 <select> (三个可选择的值: "Unknown", "Yes" 和 "No" ) 来表示这种字段数据. 
 74  
 75 <14> SlugField 
 76        # "Slug" 是一个报纸术语. slug 是某个东西的小小标记(短签), 只包含字母,数字,下划线和连字符.#它们通常用于URLs 
 77        # 若你使用 Django 开发版本,你可以指定 maxlength. 若 maxlength 未指定, Django 会使用默认长度: 50.  #在 
 78        # 以前的 Django 版本,没有任何办法改变50 这个长度. 
 79        # 这暗示了 db_index=True. 
 80        # 它接受一个额外的参数: prepopulate_from, which is a list of fields from which to auto-#populate  
 81        # the slug, via JavaScript,in the object's admin form: models.SlugField 
 82        # (prepopulate_from=("pre_name", "name"))prepopulate_from 不接受 DateTimeFields. 
 83  
 84 <13> XMLField 
 85         #一个校验值是否为合法XML的 TextField,必须提供参数: schema_path, 它是一个用来校验文本的 RelaxNG schema #的文件系统路径. 
 86  
 87 <14> FilePathField 
 88         # 可选项目为某个特定目录下的文件名. 支持三个特殊的参数, 其中第一个是必须提供的. 
 89         # 参数    描述 
 90         # path    必需参数. 一个目录的绝对文件系统路径. FilePathField 据此得到可选项目.  
 91         # Example: "/home/images". 
 92         # match    可选参数. 一个正则表达式, 作为一个字符串, FilePathField 将使用它过滤文件名.   
 93         # 注意这个正则表达式只会应用到 base filename 而不是 
 94         # 路径全名. Example: "foo.*/.txt^", 将匹配文件 foo23.txt 却不匹配 bar.txt 或 foo23.gif. 
 95         # recursive可选参数.要么 True 要么 False. 默认值是 False. 是否包括 path 下面的全部子目录. 
 96         # 这三个参数可以同时使用. 
 97         # match 仅应用于 base filename, 而不是路径全名. 那么,这个例子: 
 98         # FilePathField(path="/home/images", match="foo.*", recursive=True) 
 99         # ...会匹配 /home/images/foo.gif 而不匹配 /home/images/foo/bar.gif 
100  
101 <15> IPAddressField 
102         # 一个字符串形式的 IP 地址, (i.e. "24.124.1.30"). 
103 <16># CommaSeparatedIntegerField 
104         # 用于存放逗号分隔的整数值. 类似 CharField, 必须要有maxlength参数.

Field中的一些重要的参数

 null 

blank: django的 Admin 中添加数据时是否可允许空值

 default

 editable:如果为假,admin模式下将不能改写。缺省为真

 primary_key:设置主键,如果没有设置django创建表时会自动加上:
id = meta.AutoField(‘ID’, primary_key=True)

unique

 verbose_name  Admin中字段的显示名称

 validator_list:有效性检查。非有效产生 django.core.validators.ValidationError 错误

 db_column,db_index 如果为真将为此字段创建索引

choices:一个用来选择值的2维元组。第一个值是实际存储的值,第二个用来方便进行选择。
如SEX_CHOICES= (( ‘F’,’Female’),(‘M’,’Male’),)
gender = models.CharField(max_length=2,choices = SEX_CHOICES)

ORM的增删改查

增:有两种方式create和save方法

from app01.models import * 
 
 # create方式 
 Author.objects.create(name='Demon') 
#或者 
dic = {"name":"Demon"} 
Author.objects.create(**dic) 
 
    #save方法 
   author=Author(name="Demon") 
    author.save() 
#OR 
 author=Author() 
 author.name="Demon" 
 author.save()

User.objects.filter(id=1).first().delete()

#高效的update 
 
User.objects.filter(id=1).first().update(name="Jon"#笨拙的save 
user=User.objects.get(id=1) 
user.name="Jon" 
user.save()

ps:执行save的时候会将整行数据更新,效率比较低。

  update方法不能用于get()获取的对象,update是QuerySet对象的方法,而get获取的是model的对象

查的方法(API)

#  <1>filter(**kwargs):      它包含了与所给筛选条件相匹配的对象 
 
#  <2>all():                 查询所有结果 
 
#  <3>get(**kwargs):         返回与所给筛选条件相匹配的对象,返回结果有且只有一个,如果符合筛选条件的对象超过一个或者没有都会抛出错误。 
#<4 >exclude(**kwargs):     它包含了与所给筛选条件不匹配的对象 
 
#-----------下面的方法都是对查询的结果再进行处理:比如 objects.filter.values()-------- 
 
#  <5>values(*field):        返回一个ValueQuerySet——一个特殊的QuerySet,运行后得到的并不是一系列 model的实例化对象,而是一个可迭代的字典序列 
 
#  <6>order_by(*field):      对查询结果排序 
 
#  <7>reverse():             对查询结果反向排序 
 
#  <8>distinct():            从返回结果中剔除重复纪录 
 
#  <9>values_list(*field):   它与values()非常相似,它返回的是一个元组序列,values返回的是一个字典序列 
 
#  <10>count():              返回数据库中匹配查询(QuerySet)的对象数量。 
 
# <11>first():               返回第一条记录 
 
# <12>last():                返回最后一条记录 
 
#  <13>exists():             如果QuerySet包含数据,就返回True,否则返回False。

扩展查询extra

extra(select=None, where=None, params=None, tables=None,order_by=None, select_params=None)
(1)  Entry.objects.extra(select={'is_recent': "pub_date > '2006-01-01'"}) 
(2)  Blog.objects.extra( 
        select=SortedDict([('a', '%s'), ('b', '%s')]), 
        select_params=('one', 'two')) 
 
(3)  q = Entry.objects.extra(select={'is_recent': "pub_date > '2006-01-01'"}) 
     q = q.extra(order_by = ['-is_recent']) 
 
(4)  Entry.objects.extra(where=['headline=%s'], params=['Lennon'])  

惰性机制:Publisher.objects.all()或者.filter()等都只是返回了一个QuerySet(查询结果集对象),它并不会马上执行sql,而是当调用QuerySet的时候才执行。

QuerySet:

users= models.User.objects.all()

       <1>  可迭代的 for user in users

       <2>  可切片取值  users[1:2]


 

原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/tech/bigdata/9253.html

(0)
上一篇 2021年7月19日 09:19
下一篇 2021年7月19日 09:19

相关推荐

发表回复

登录后才能评论