MATLAB应用之深度学习网络到底在“看”哪里？

你有没有想过，你经常使用的深度学习网络在看图像的什么部分进行分类？

例如下图：

如果深度学习网络将此图像分类为“圆号”，你认为图片的哪个部分对分类最重要？

我们使用预训练好的 ResNet-50 网络进行此实验。

He, Kaiming, Zhang, Xiangyu, Ren, Shaoqing, Sun, Jian. "Deep Residual Learning for Image Recognition." In Proceedings of the IEEE conference on computer vision and pattern recognition, pp. 770-778. 2016
获取 MATLAB 中 ResNet-50 网络的方法是启动 Add-On Explorer并搜索 resnet。

net = resnet50;

我们需要注意 ResNet-50 需要输入特定尺寸的图像。网络的初始层提供了这一信息：

sz = net.Layers(1).InputSize(1:2)

sz =

   224   224

所需的图像尺寸可以直接传递给 imresize 函数。

rgb = imread(url);
rgb = imresize(rgb,sz);
imshow(rgb)

在网络中调用 classify ，查看图片可能的分类：

classify(net,rgb)

ans = 

  categorical

       French horn

ResNet-50 认为这是圆号。

Birju 在一篇关于卷积神经网络可视化技术的论文中，了解到遮挡敏感性的概念。如果阻挡或遮挡图像的一部分，将如何影响网络的预测得分？遮挡不同的部分又将如何影响结果？

Birju 做了如下尝试：

rgb2 = rgb;
rgb2((1:71)+77,(1:71)+108,:) = 128;
imshow(rgb2)

classify(net,rgb2)

ans = 

  categorical

     notebook

Hmm...估计网络“认为”灰色方块看起来像笔记本。被遮挡的区域对于图像分类来说应该很重要。再试试不同的遮挡位置：

rgb3 = rgb;rgb3((1:71)+15,(1:71)+80,:) = 128;imshow(rgb3)

classify(net,rgb3)

ans = 

  categorical

       French horn

好吧，脑袋并不重要。

Birju 编写了一些 MATLAB 代码来系统地量化不同图像区域对分类结果的相对重要性。他使用 MATLAB 构建了大量图像，并对遮挡不同区域的图像进行批处理。对于遮挡的不同位置，记录预期类（本例为“法国号”）的概率得分。

我们制作一批带有 71x71 遮挡区域的图像。首先计算所有遮挡模块的顶点，用 (X1,Y1) 和 (X2,Y2) 表示。
mask_size = [71 71];[H,W,~] = size(rgb);X = 1:W;Y = 1:H;[X1, Y1] = meshgrid(X, Y);X1 = X1(:) - (mask_size(2)-1)/2;Y1 = Y1(:) - (mask_size(1)-1)/2;X2 = X1 + mask_size(2) - 1;Y2 = Y1 + mask_size(1) - 1;

注意不要让遮挡区域的顶点偏离图像边界。

X1 = max(1, X1);
Y1 = max(1, Y1);

X2 = min(W, X2);
Y2 = min(H, Y2);

批处理：

batch = repmat(rgb,[1 1 1 size(X1,1)]);

for i = 1:size(X1,1)
   c = X1(i):X2(i);
   r = Y1(i):Y2(i);
   batch(r,c,:,i) = 128; % gray mask.
end

注意：这一批包含 50,000 多张图像。你需要大量的 RAM 才能同时创建和处理如此大量的图像。

这里有一些遮挡的图像：

现在，我们将使用 predict（而不是 classify）来获取每个图像在每个类别中的预测分数。MiniBatchSize 参数是用来限制 GPU 内存的使用，意味着 predict 函数将一次发送 64 个图像到 GPU 进行处理。

s = predict(net, batch, 'MiniBatchSize',64);

size(s)

ans =

       50176        1000

我们获得了很多的概率得分！其中 51,529 个图像，共有 1,000 个类别。矩阵 s 具有每个类别和每个图像的预测分数。

我们重点关注预测原始图像类别的预测分数：

scores = predict(net,rgb);
[~,horn_idx] = max(scores);

这里是每一个圆号类别中的图像预测分数：

s_horn = s(:,horn_idx);

将圆号类别的分数转换为图像显示：

S_horn = reshape(s_horn,H,W);
imshow(-S_horn,[])
colormap(gca,'parula')

最亮的区域表示遮挡对概率得分影响最大的遮挡区间。

下面我们找到了最影响圆号概率得分的遮挡位置：

[min_score,min_idx] = min(s_horn);
rgb_min_score = batch(:,:,:,min_idx);
imshow(rgb_min_score)

结果可见，识别圆号的关键在于螺旋形管身和阀键，而不是号嘴。

面包多代码

https://mbd.pub/o/GeBENHAGEN

此外，知乎付费咨询:哥廷根数学学派

擅长现代信号处理(改进小波分析系列，改进变分模态分解，改进经验小波变换，改进辛几何模态分解等等)，改进机器学习，改进深度学习，机械故障诊断，改进时间序列分析(金融信号，心电信号，振动信号等)

展开阅读全文

页面更新：2024-04-15

标签：深度圆号网络遮挡概率得分分数图像类别区域

1 2 3 4 5

MATLAB应用之深度学习网络到底在“看”哪里？

深马开跑 2万跑者用脚步跨越深圳四区感受“科技深马”

SSCMS v7.2.0 版本发布

微信安装包11年来膨胀575倍

活塞队让AI和球迷聊天，NBA版《宝可梦GO》上线｜iSports

浙江闲置核酸采样亭变身骑士加油站

Linux源码学习笔记day3 为访问内存做好哪些准备？

一加和Redmi杠上了，相关打法惹争议，网友：本分不能当饭吃

买手机选华为好还是苹果好？看完评测就明白了

春耕有序有力筑牢粮食丰收之基

作者：新湖南，田老师女汉子

奋进的春天｜企业订单快速增长国际货运市场活跃

尼米兹航母进南海，《人民海军》发布山东舰英文喊话，你细品！

四川省台办主任罗治平调研台资农企推动融合发展助力乡村振兴

千万安家补助+多学科招聘！浙大宁理诚聘海内外英才

央视网删除赵露思所有相关内容，绝望的文盲能够演好戏吗？

宋代女性图像中，各个不同阶层女子，所装扮的发型有何不同

努比亚z50ultra手机壳曝光，摄像头部分区域很大

男用避孕药有新突破，世界首个覆盖五大洲的自动天文台网

10次全明星票王，全明星大赛得分王，詹姆斯还差1个全明星M

深度剖析：中世纪有名的城市有哪些，它们经历了什么变化？

AI文字生成图像Stable Diffusion保姆级教程

上季全明星后得分暴涨4+ 詹姆斯若复刻同样剧情湖人季

走进区域看发展-2022年实现市场交易额1040亿元重庆公

深度分析：《甄嬛传》懂权衡的皇后为何不得皇上的心？还不

得分王大局未定！两人争第一，谁注意得分榜前10，混进了一个