孪生神经网络（Siamese neural network）

2021-05-28 12:03

阅读：687

标签：通过函数 cnn work 就是转换好的 cti image

转自：https://blog.csdn.net/qq_41843384/article/details/110542320

作者：WuBangCai

简单来说，Siamese network就是“连体的神经网络”，神经网络的“连体”是通过共享权值来实现的，如下图所示。

其中，network1 和network2 是两个共享权值的网络，实际上就是两个完全相同的网络。孪生神经网络有两个输入（Input1 and Input2）,将两个输入feed进入两个神经网络（Network1 and Network2），这两个神经网络分别将输入映射到新的空间，形成输入在新的空间中的表示。通过Loss的计算，评价两个输入的相似度。

如果左右两边不共享权值，而是两个不同的神经网络，叫做pseudo-siamese network，伪孪生神经网络。对于pseudo-siamese network，两边可以是不同的神经网络（如一个是lstm，一个是cnn），也可以是相同类型的神经网络。

孪生神经网络用于处理两个输入"比较类似"的情况。伪孪生神经网络适用于处理两个输入"有一定差别"的情况。比如，我们要计算两个句子或者词汇的语义相似度，使用siamese network比较适合；如果验证标题与正文的描述是否一致（标题和正文长度差别很大），或者文字是否描述了一幅图片（一个是图片，一个是文字），就应该使用pseudo-siamese network。也就是说，要根据具体的应用，判断应该使用哪一种结构，哪一种Loss。

其中，loss function 的选择很重要。Softmax当然是一种好的选择，但不一定是最优选择，即使是在分类问题中。传统的siamese network使用Contrastive Loss。损失函数还有更多的选择，siamese network的初衷是计算两个输入的相似度,。左右两个神经网络分别将输入转换成一个"向量"，在新的空间中，通过判断cosine距离就能得到相似度了。Cosine是一个选择，exp function也是一种选择，欧式距离什么的都可以，训练的目标是让两个相似的输入距离尽可能的小，两个不同类别的输入距离尽可能的大

孪生神经网络（Siamese neural network）

标签：通过函数 cnn work 就是转换好的 cti image

原文地址：https://www.cnblogs.com/duowenjia/p/14773821.html

上一篇：ruby http请求组件

下一篇：我的css学习博客（四）

文章来自：搜素材网的编程语言模块，转载请注明文章出处。
文章标题：孪生神经网络（Siamese neural network）
文章链接：http://soscw.com/index.php/essay/88671.html

亲，登录后才可以留言！

孪生神经网络（Siamese neural network）

评论

热门文章

推荐文章

最新文章

置顶文章