ResNeXt：Aggregated Residual Transformations for Deep Neural Networks

2021-04-07 14:29

阅读：441

标签：block better The 设定 size gate center rac 模型

作者提出 ResNeXt 的主要原因在于：传统的要提高模型的准确率，都是加深或加宽网络，但是随着超参数数量的增加（比如channels数，filter size等等），网络设计的难度和计算开销也会增加。因此本文提出的
ResNeXt 结构可以在不增加参数复杂度的前提下提高准确率，同时还减少了超参数的数量（得益于子模块的拓扑结构一样，后面会讲）。

作者在论文中首先提到VGG，VGG主要采用堆叠网络来实现，之前的 ResNet 也借用了这样的思想。然后提到 Inception 系列网络，简单讲就是 split-transform-merge 的策略，但是 Inception 系列网络有个问题：网络的超参数设定的针对性比较强，当应用在别的数据集上时需要修改许多参数，因此可扩展性一般。

于是重点来了，作者在这篇论文中提出网络 ResNeXt，同时采用 VGG 堆叠的思想和 Inception 的 split-transform-merge 思想，但是可扩展性比较强，可以认为是在增加准确率的同时基本不改变或降低模型的复杂度。这里提到一个名词cardinality，原文的解释是the
size of the set of transformations，如下图 Fig1 右边是 cardinality=32 的样子，这里注意每个被聚合的拓扑结构都是一样的(这也是和 Inception 的差别，减轻设计负担

技术图片

点明了增加 cardinality 比增加深度和宽度更有效。

当然还有一些数据证明 ResNeXt 网络的优越性，例如原文中的这句话：In particular, a 101-layer ResNeXt is able to achieve better accuracy than ResNet-200 but has only 50% complexity.

Table1 列举了 ResNet-50 和 ResNeXt-50 的内部结构，另外最后两行说明二者之间的参数复杂度差别不大。

接下来作者要开始讲本文提出的新的 block，举全连接层（Inner product）的例子来讲，我们知道全连接层的就是以下这个公式：

技术图片

ResNeXt：Aggregated Residual Transformations for Deep Neural Networks

标签：block better The 设定 size gate center rac 模型

原文地址：https://www.cnblogs.com/ziwh666/p/12483765.html

上一篇：解决.NETMVC(ajax)Json请求太大,无法反序列化(The JSON request was too large to be deserialized)问题

下一篇：jsp原理

文章来自：搜素材网的编程语言模块，转载请注明文章出处。
文章标题：ResNeXt：Aggregated Residual Transformations for Deep Neural Networks
文章链接：http://soscw.com/index.php/essay/72438.html

亲，登录后才可以留言！

ResNeXt：Aggregated Residual Transformations for Deep Neural Networks

评论

热门文章

推荐文章

最新文章

置顶文章