django查询集API
2021-06-23 04:05
标签:postgres aws 事务 this 之间 曲线 重点 publish list 本节将详细介绍查询集的API,它建立在下面的模型基础上,与上一节的模型相同: 在内部,创建、过滤、切片和传递一个QuerySet不会真实操作数据库,在你对查询集提交之前,不会发生任何实际的数据库操作。 可以使用下列方法对QuerySet提交查询操作: QuerySet是可迭代的,在首次迭代查询集时执行实际的数据库查询。 例如, 下面的语句会将数据库中所有Entry的headline打印出来: 切片:如果使用切片的”step“参数,Django 将执行数据库查询并返回一个列表。 Pickling/缓存 repr() len():当你对QuerySet调用len()时, 将提交数据库操作。 list():对QuerySet调用list()将强制提交操作 bool() 测试布尔值,像这样: 注:如果你需要知道是否存在至少一条记录(而不需要真实的对象),使用exists() 将更加高效。 下面是对于QuerySet的正式定义: QuerySet类具有两个公有属性用于内省: ordered:如果QuerySet是排好序的则为True,否则为False。 db:如果现在执行,则返回使用的数据库。 以下的方法都将返回一个新的QuerySets。重点是加粗的几个API,其它的使用场景很少。 filter(**kwargs) 返回满足查询参数的对象集合。 查找的参数(**kwargs)应该满足下文字段查找中的格式。多个参数之间是和AND的关系。 exclude(**kwargs) 返回一个新的QuerySet,它包含不满足给定的查找参数的对象。 查找的参数(**kwargs)应该满足下文字段查找中的格式。多个参数通过AND连接,然后所有的内容放入NOT() 中。 下面的示例排除所有 下面的示例排除所有 annotate(args, *kwargs) 使用提供的聚合表达式查询对象。 表达式可以是简单的值、对模型(或任何关联模型)上的字段的引用或者聚合表达式(平均值、总和等)。 annotate()的每个参数都是一个annotation,它将添加到返回的QuerySet每个对象中。 关键字参数指定的Annotation将使用关键字作为Annotation 的别名。 匿名参数的别名将基于聚合函数的名称和模型的字段生成。 只有引用单个字段的聚合表达式才可以使用匿名参数。 其它所有形式都必须用关键字参数。 例如,如果正在操作一个Blog列表,你可能想知道每个Blog有多少Entry: Blog模型本身没有定义 order_by(*fields) 默认情况下,根据模型的Meta类中的ordering属性对QuerySet中的对象进行排序 上面的结果将按照 注: 若要按照另外一个模型中的字段排序,可以使用查询关联模型的语法。即通过字段的名称后面跟两个下划线( 如果排序的字段与另外一个模型关联,Django将使用关联的模型的默认排序,或者如果没有指定Meta.ordering将通过关联的模型的主键排序。 例如,因为Blog模型没有指定默认的排序: 与以下相同: 如果Blog设置了 还可以通过调用表达式的desc()或者asc()方法: 考虑下面的情况,指定一个多值字段来排序(例如,一个ManyToManyField 字段或者ForeignKey 字段的反向关联): 在这里,每个Event可能有多个排序数据;具有多个children的每个Event将被多次返回到 没有方法指定排序是否考虑大小写。 对于大小写的敏感性,Django将根据数据库中的排序方式排序结果。 可以通过Lower将一个字段转换为小写来排序,它将达到大小写一致的排序: 可以通过检查 每个 reverse() 反向排序QuerySet中返回的元素。 第二次调用reverse()将恢复到原有的排序。 如要获取QuerySet中最后五个元素,可以这样做: 这与Python直接使用负索引有点不一样。 Django不支持负索引,只能曲线救国。 distinct(*fields) 去除查询结果中重复的行。 默认情况下,QuerySet不会去除重复的行。当查询跨越多张表的数据时,QuerySet可能得到重复的结果,这时候可以使用distinct()进行去重。 values(fields, *expressions) 返回一个包含数据的字典的queryset,而不是模型实例。 每个字典表示一个对象,键对应于模型对象的属性名称。 下面的例子将values() 与普通的模型对象进行比较: 该方法接收可选的位置参数 例如: values()方法还有关键字参数 在values()子句中的聚合应用于相同values()子句中的其他参数之前。 如果需要按另一个值分组,请将其添加到较早的values()子句中。 像这样: 注意: 如果你有一个字段foo是一个ForeignKey,默认的 当values()与distinct()一起使用时,注意排序可能影响最终的结果。 如果values()子句位于extra()调用之后,extra()中的select参数定义的字段必须显式包含在values()调用中。 values( 调用后面的extra( 调用将忽略选择的额外的字段。 在values()之后调用only()和defer()不太合理,所以将引发一个NotImplementedError。 可以通过ManyToManyField、ForeignKey 和 OneToOneFiel 属性反向引用关联的模型的字段: values_list(*fields, flat=False) 与values()类似,只是在迭代时返回的是元组而不是字典。每个元组包含传递给 如果只传递一个字段,还可以传递flat参数。 如果为True,它表示返回的结果为单个值而不是元组。 如下所示: 如果有多个字段,传递flat将发生错误。 如果不传递任何值给 常见的情况是获取某个模型实例的特定字段值。可以使用 注意通过ManyToManyField进行查询时的行为: 类似地,当查询反向外键时,对于没有任何作者的条目,返回None。 dates(field, kind, order=‘ASC‘) 返回一个QuerySet,表示QuerySet内容中特定类型的所有可用日期的 field参数是模型的DateField的名称。 kind参数应为"year","month"或"day"。 结果列表中的每个datetime.date对象被截取为给定的类型。 "year" 返回对应该field的所有不同年份值的列表。 "month"返回字段的所有不同年/月值的列表。 "day"返回字段的所有不同年/月/日值的列表。 order参数默认为‘ASC‘,或者‘DESC‘。 它指定如何排序结果。 例子: datetimes(field_name, kind, order=‘ASC‘, tzinfo=None) 返回QuerySet,为datetime.datetime对象的列表,表示QuerySet内容中特定种类的所有可用日期。 kind参数应为"hour","minute","month","year","second"或"day"。 结果列表中的每个datetime.datetime对象被截取到给定的类型。 order参数默认为‘ASC‘,或者‘DESC‘。 它指定如何排序结果。 tzinfo参数定义在截取之前将数据时间转换到的时区。 none() 调用none()将创建一个不返回任何对象的查询集,并且在访问结果时不会执行任何查询。 例子: all() 返回当前QuerySet(或QuerySet子类)的副本。通常用于获取全部QuerySet对象。 union(*other_qs, all=False) Django中的新功能1.11。也就是集合中并集的概念! 使用SQL的UNION运算符组合两个或更多个QuerySet的结果。例如: 默认情况下,UNION操作符仅选择不同的值。 要允许重复值,请使用all=True参数。 intersection(*other_qs) Django中的新功能1.11。也就是集合中交集的概念! 使用SQL的INTERSECT运算符返回两个或更多个QuerySet的共有元素。例如: difference(*other_qs) Django中的新功能1.11。也就是集合中差集的概念! 使用SQL的EXCEPT运算符只保留QuerySet中的元素,但不保留其他QuerySet中的元素。例如: select_related(*fields) 沿着外键关系查询关联的对象的数据。这会生成一个复杂的查询并引起性能的损耗,但是在以后使用外键关系时将不需要再次数据库查询。 下面的例子解释了普通查询和 下面是一个 可以沿着外键查询。 如果有以下模型: 调用 在传递给 在传递给 prefetch_related(*lookups) 在单个批处理中自动检索每个指定查找的相关对象。 与 假设有这些模型: 并运行: 问题是每次QuerySet要求 可以使用 这意味着现在每次 还可以使用正常连接语法来执行相关字段的相关字段。 假设在上面的例子中增加一个额外的模型: 以下是合法的: 这将预取所有属于餐厅的比萨饼,和所有属于那些比萨饼的配料。 这将导致总共3个查询 - 一个用于餐馆,一个用于比萨饼,一个用于配料。 这将获取最好的比萨饼和每个餐厅最好的披萨的所有配料。 这将在3个表中查询 - 一个为餐厅,一个为“最佳比萨饼”,一个为一个为配料。 当然,也可以使用 extra(select=None, where=None, params=None, tables=None, order_by=None, select_params=None) 有些情况下,Django的查询语法难以简单的表达复杂的WHERE子句,对于这种情况,可以在extra()生成的SQL从句中注入新子句。使用这种方法作为最后的手段,这是一个旧的API,在将来的某个时候可能被弃用。仅当无法使用其他查询方法表达查询时才使用它。 例如: 相当于: defer(*fields) 在一些复杂的数据建模情况下,模型可能包含大量字段,其中一些可能包含大尺寸数据(例如文本字段),将它们转换为Python对象需要花费很大的代价。 当最初获取数据时不知道是否需要这些特定字段的情况下,如果正在使用查询集的结果,可以告诉Django不要从数据库中检索它们。 通过传递字段名称到defer()实现不加载: 具有延迟加载字段的查询集仍将返回模型实例。 每个延迟字段将在你访问该字段时从数据库中检索(每次只检索一个,而不是一次检索所有的延迟字段)。 可以多次调用defer()。 每个调用都向延迟集添加新字段: 字段添加到延迟集的顺序无关紧要。对已经延迟的字段名称再次defer()没有问题(该字段仍将被延迟)。 可以使用标准的双下划线符号来分隔关联的字段,从而加载关联模型中的字段: 如果要清除延迟字段集,将None作为参数传递到defer(): defer()方法(及其兄弟,only())仅适用于高级用例,它们提供了数据加载的优化方法。 only(*fields) only()方法与defer()相反。 如果有一个模型几乎所有的字段需要延迟,使用only()指定补充的字段集可以使代码更简单。 假设有一个包含字段biography、age和name的模型。 以下两个查询集是相同的,就延迟字段而言: 每当你调用only()时,它将替换立即加载的字段集。因此,对only()的连续调用的结果是只有最后一次调用的字段被考虑: 由于defer()以递增方式动作(向延迟列表中添加字段),因此你可以结合only()和defer()调用: 当对具有延迟字段的实例调用save()时,仅保存加载的字段。 using(alias) 如果正在使用多个数据库,这个方法用于指定在哪个数据库上查询QuerySet。方法的唯一参数是数据库的别名,定义在DATABASES。 例如: select_for_update(nowait=False, skip_locked=False) 返回一个锁住行直到事务结束的查询集,如果数据库支持,它将生成一个 例如: 所有匹配的行将被锁定,直到事务结束。这意味着可以通过锁防止数据被其它事务修改。 一般情况下如果其他事务锁定了相关行,那么本查询将被阻塞,直到锁被释放。使用 目前,postgresql,oracle和mysql数据库后端支持 raw(raw_query, params=None, translations=None) 接收一个原始的SQL查询,执行它并返回一个 这个RawQuerySet实例可以迭代,就像普通的QuerySet一样。 django查询集API 标签:postgres aws 事务 this 之间 曲线 重点 publish list 原文地址:https://www.cnblogs.com/navysummer/p/10200179.htmlfrom django.db import models
class Blog(models.Model):
name = models.CharField(max_length=100)
tagline = models.TextField()
def __str__(self): # __unicode__ on Python 2
return self.name
class Author(models.Model):
name = models.CharField(max_length=200)
email = models.EmailField()
def __str__(self): # __unicode__ on Python 2
return self.name
class Entry(models.Model):
blog = models.ForeignKey(Blog, on_delete=models.CASCADE)
headline = models.CharField(max_length=255)
body_text = models.TextField()
pub_date = models.DateField()
mod_date = models.DateField()
authors = models.ManyToManyField(Author)
n_comments = models.IntegerField()
n_pingbacks = models.IntegerField()
rating = models.IntegerField()
def __str__(self): # __unicode__ on Python 2
return self.headline
一、QuerySet何时被提交
for e in Entry.objects.all():
print(e.headline)
entry_list = list(Entry.objects.all())
if Entry.objects.filter(headline="Test"):
print("There is at least one Entry with the headline Test")
二、QuerySet
class QuerySet(model=None, query=None, using=None)[source]
三、返回新QuerySets的API
方法名
解释
filter()
过滤查询对象。
exclude()
排除满足条件的对象
annotate()
使用聚合函数
order_by()
对查询集进行排序
reverse()
反向排序
distinct()
对查询集去重
values()
返回包含对象具体值的字典的QuerySet
values_list()
与values()类似,只是返回的是元组而不是字典。
dates()
根据日期获取查询集
datetimes()
根据时间获取查询集
none()
创建空的查询集
all()
获取所有的对象
union()
并集
intersection()
交集
difference()
差集
select_related()
附带查询关联对象
prefetch_related()
预先查询
extra()
附加SQL查询
defer()
不加载指定字段
only()
只加载指定的字段
using()
选择数据库
select_for_update()
锁住选择的对象,直到事务结束。
raw()
接收一个原始的SQL查询
1. filter()
2. exclude()
pub_date
晚于2005-1-3且headline为“Hello” 的记录:Entry.objects.exclude(pub_date__gt=datetime.date(2005, 1, 3), headline=‘Hello‘)
pub_date
晚于2005-1-3或者headline 为“Hello” 的记录:Entry.objects.exclude(pub_date__gt=datetime.date(2005, 1, 3)).exclude(headline=‘Hello‘)
3. annotate()
>>> from django.db.models import Count
>>> q = Blog.objects.annotate(Count(‘entry‘))
# The name of the first blog
>>> q[0].name
‘Blogasaurus‘
# The number of entries on the first blog
>>> q[0].entry__count
42
entry__count
属性,但是通过使用一个关键字参数来指定聚合函数,可以控制Annotation的名称:>>> q = Blog.objects.annotate(number_of_entries=Count(‘entry‘))
# The number of entries on the first blog, using the name provided
>>> q[0].number_of_entries
42
4. order_by()
Entry.objects.filter(pub_date__year=2005).order_by(‘-pub_date‘, ‘headline‘)
pub_date
降序排序,然后再按照headline升序排序。"-pub_date"前面的负号表示降序顺序。 升序是默认的。 要随机排序,使用"?",如下所示:Entry.objects.order_by(‘?‘)
order_by(‘?‘)
可能耗费资源且很慢,这取决于使用的数据库。__
),再加上新模型中的字段的名称,直到希望连接的模型。 像这样:Entry.objects.order_by(‘blog__name‘, ‘headline‘)
Entry.objects.order_by(‘blog‘)
Entry.objects.order_by(‘blog__id‘)
ordering = [‘name‘]
,那么第一个QuerySet将等同于:Entry.objects.order_by(‘blog__name‘)
Entry.objects.order_by(Coalesce(‘summary‘, ‘headline‘).desc())
class Event(Model):
parent = models.ForeignKey(
‘self‘,
on_delete=models.CASCADE,
related_name=‘children‘,
)
date = models.DateField()
Event.objects.order_by(‘children__date‘)
order_by()
创建的新的QuerySet中。 换句话说,用order_by()
方法对QuerySet对象进行操作会返回一个扩大版的新QuerySet对象。因此,使用多值字段对结果进行排序时要格外小心。Entry.objects.order_by(Lower(‘headline‘).desc())
QuerySet.ordered
属性来知道查询是否是排序的。order_by()
都将清除前面的任何排序。 例如下面的查询将按照pub_date
排序,而不是headline:Entry.objects.order_by(‘headline‘).order_by(‘pub_date‘)
5. reverse()
my_queryset.reverse()[:5]
6. distinct()
7. values()
# 列表中包含的是Blog对象
>>> Blog.objects.filter(name__startswith=‘Beatles‘)
*fields
,它指定values()应该限制哪些字段。如果指定字段,每个字典将只包含指定的字段的键/值。如果没有指定字段,每个字典将包含数据库表中所有字段的键和值。>>> Blog.objects.values()
**expressions
,这些参数将传递给annotate()
:>>> from django.db.models.functions import Lower
>>> Blog.objects.values(lower_name=Lower(‘name‘))
QuerySet [{‘lower_name‘: ‘beatles blog‘}]>
>>> from django.db.models import Count
>>> Blog.objects.values(‘author‘, entries=Count(‘entry‘))
QuerySet [{‘author‘: 1, ‘entries‘: 20}, {‘author‘: 1, ‘entries‘: 13}]>
>>> Blog.objects.values(‘author‘).annotate(entries=Count(‘entry‘))
QuerySet [{‘author‘: 1, ‘entries‘: 33}]>
foo_id
参数返回的字典中将有一个叫做foo 的键,因为这是保存实际值的那个隐藏的模型属性的名称。 当调用foo_id
并传递字段的名称,传递foo 或values()都可以,得到的结果是相同的。像这样:>>> Entry.objects.values()
>>> Blog.objects.values(‘name‘, ‘entry__headline‘)
8. values_list()
values_list()
调用的相应字段或表达式的值,因此第一个项目是第一个字段等。 像这样:>>> Entry.objects.values_list(‘id‘, ‘headline‘)
QuerySet [(1, ‘First entry‘), ...]>
>>> from django.db.models.functions import Lower
>>> Entry.objects.values_list(‘id‘, Lower(‘headline‘))
QuerySet [(1, ‘first entry‘), ...]>
>>> Entry.objects.values_list(‘id‘).order_by(‘id‘)
values_list()
,它将返回模型中的所有字段,以在模型中定义的顺序。values_list()
,然后调用get():>>> Entry.objects.values_list(‘headline‘, flat=True).get(pk=1)
‘First entry‘
values()
和values_list()
都用于特定情况下的优化:检索数据子集,而无需创建模型实例。>>> Author.objects.values_list(‘name‘, ‘entry__headline‘)
>>> Entry.objects.values_list(‘authors‘)
9. dates()
datetime.date
对象列表。>>> Entry.objects.dates(‘pub_date‘, ‘year‘)
[datetime.date(2005, 1, 1)]
>>> Entry.objects.dates(‘pub_date‘, ‘month‘)
[datetime.date(2005, 2, 1), datetime.date(2005, 3, 1)]
>>> Entry.objects.dates(‘pub_date‘, ‘day‘)
[datetime.date(2005, 2, 20), datetime.date(2005, 3, 20)]
>>> Entry.objects.dates(‘pub_date‘, ‘day‘, order=‘DESC‘)
[datetime.date(2005, 3, 20), datetime.date(2005, 2, 20)]
>>> Entry.objects.filter(headline__contains=‘Lennon‘).dates(‘pub_date‘, ‘day‘)
[datetime.date(2005, 3, 20)]
10. datetimes()
field_name
应为模型的DateTimeField的名称。11. none()
>>> Entry.objects.none()
QuerySet []>
>>> from django.db.models.query import EmptyQuerySet
>>> isinstance(Entry.objects.none(), EmptyQuerySet)
True
12. all()
13. union()
>>> qs1.union(qs2, qs3)
14. intersection()
>>> qs1.intersection(qs2, qs3)
15. difference()
>>> qs1.difference(qs2, qs3)
16. select_related()
select_related()
查询的区别。 下面是一个标准的查询:# 访问数据库。
e = Entry.objects.get(id=5)
# 再次访问数据库以得到关联的Blog对象。
b = e.blog
select_related
查询:# 访问数据库。
e = Entry.objects.select_related(‘blog‘).get(id=5)
# 不会访问数据库,因为e.blog已经在前面的查询中获得了。
b = e.blog
select_related()
可用于objects任何的查询集:from django.utils import timezone
# Find all the blogs with entries scheduled to be published in the future.
blogs = set()
for e in Entry.objects.filter(pub_date__gt=timezone.now()).select_related(‘blog‘):
# 没有select_related(),下面的语句将为每次循环迭代生成一个数据库查询,以获得每个entry关联的blog。
blogs.add(e.blog)
filter()
和select_related()
的顺序不重要。 下面的查询集是等同的:Entry.objects.filter(pub_date__gt=timezone.now()).select_related(‘blog‘)
Entry.objects.select_related(‘blog‘).filter(pub_date__gt=timezone.now())
from django.db import models
class City(models.Model):
# ...
pass
class Person(models.Model):
# ...
hometown = models.ForeignKey(
City,
on_delete=models.SET_NULL,
blank=True,
null=True,
)
class Book(models.Model):
# ...
author = models.ForeignKey(Person, on_delete=models.CASCADE)
Book.objects.select_related(‘author__hometown‘).get(id=4)
将缓存相关的Person 和相关的City:b = Book.objects.select_related(‘author__hometown‘).get(id=4)
p = b.author # Doesn‘t hit the database.
c = p.hometown # Doesn‘t hit the database.
b = Book.objects.get(id=4) # No select_related() in this example.
p = b.author # Hits the database.
c = p.hometown # Hits the database.
select_related()
的字段中,可以使用任何ForeignKey和OneToOneField。select_related
的字段中,还可以反向引用OneToOneField。也就是说,可以回溯到定义OneToOneField 的字段。 此时,可以使用关联对象字段的related_name
,而不要指定字段的名称。17. prefetch_related()
select_related
类似,但是策略是完全不同的。from django.db import models
class Topping(models.Model):
name = models.CharField(max_length=30)
class Pizza(models.Model):
name = models.CharField(max_length=50)
toppings = models.ManyToManyField(Topping)
def __str__(self): # __unicode__ on Python 2
return "%s (%s)" % (
self.name,
", ".join(topping.name for topping in self.toppings.all()),
)
>>> Pizza.objects.all()
["Hawaiian (ham, pineapple)", "Seafood (prawns, smoked salmon)"...
Pizza.objects.all()
查询数据库,因此self.toppings.all()
将在Pizza Pizza.__str__()
中的每个项目的Toppings表上运行查询。prefetch_related
减少为只有两个查询:>>> Pizza.objects.all().prefetch_related(‘toppings‘)
self.toppings.all()
被调用,不会再去数据库查找,而是在一个预取的QuerySet缓存中查找。class Restaurant(models.Model):
pizzas = models.ManyToManyField(Pizza, related_name=‘restaurants‘)
best_pizza = models.ForeignKey(Pizza, related_name=‘championed_by‘)
>>> Restaurant.objects.prefetch_related(‘pizzas__toppings‘)
>>> Restaurant.objects.prefetch_related(‘best_pizza__toppings‘)
best_pizza
来获取select_related
关系,以将查询数减少为2:>>> Restaurant.objects.select_related(‘best_pizza‘).prefetch_related(‘best_pizza__toppings‘)
18. extra()
>>> qs.extra(
... select={‘val‘: "select col from sometable where othercol = %s"},
... select_params=(someparam,),
... )
>>> qs.annotate(val=RawSQL("select col from sometable where othercol = %s", (someparam,)))
19. defer()
Entry.objects.defer("headline", "body")
# 延迟body和headline两个字段。
Entry.objects.defer("body").filter(rating=5).defer("headline")
Blog.objects.select_related().defer("entry__headline", "entry__body")
# 立即加载所有的字段。
my_queryset.defer(None)
20. only()
Person.objects.defer("age", "biography")
Person.objects.only("name")
# This will defer all fields except the headline.
Entry.objects.only("body", "rating").only("headline")
# Final result is that everything except "headline" is deferred.
Entry.objects.only("headline", "body").defer("body")
# Final result loads headline and body immediately (only() replaces any
# existing set of fields).
Entry.objects.defer("body").only("headline", "body")
21. using()
# queries the database with the ‘default‘ alias.
>>> Entry.objects.all()
# queries the database with the ‘backup‘ alias
>>> Entry.objects.using(‘backup‘)
22. select_for_update()
SELECT ... FOR UPDATE
语句。entries = Entry.objects.select_for_update().filter(author=request.user)
select_for_update(nowait=True)
将使查询不阻塞。如果其它事务持有冲突的锁,那么查询将引发DatabaseError
异常。也可以使用select_for_update(skip_locked=True)
忽略锁定的行。nowait和skip_locked
是互斥的。select_for_update()
。但是,MySQL不支持nowait和skip_locked
参数。23. raw()
django.db.models.query.RawQuerySet
实例。