基础概念:图片的卷积可视化结果

news/2024/5/19 2:13:06

1. 前言

        之前介绍过卷积的基本概念,具体的可以参考图片的卷积和池化操作,这里给出可视化的操作,因为卷积在初学的时候比较抽象,现在有时间就写写看,希望可以给初学的同学一点启发吧(这里前提是学过pytorch和相关的图像处理库-opencv、pillow等,最低也要会安装库,不然代码都运行不起来)

2. 开发环境配置

        我使用的是pycharm,IDE根据自己的喜好,没有固定的要求(缺什么库,按照缺的去补,没人会手把手的教你,尽快转变思想,不要还是学生思想,工作了连指导都难)

python   3.6.9
torch                                         1.10.1
torchbiomed  0.0.1
torchfile  0.1.0
torchsummary   1.5.1
torchvision  0.11.2
torchviz 0.0.2
Pillow  8.4.0

3.参考代码

        相关参数的说明:

这里我只定义了一层卷积,像多用几层的,把注释去掉就行(大聪明应该都看得懂的)

(1) 这里的每一个卷积的输出和下一个卷积的输入channels要对上!!!

      比如:conv1:out_channels=9和conv2:in_channels=9要对的上,不然会报错,shape都不对了,肯定不对的,你们说呢。

(2) 那最后的out_channels要怎么定义

    回答:随便几个都行,定义几个就几张图输出(其实就是多少个卷积核的结果)

(3)聪明的你肯定要问了,那这些卷积核怎么来的,为什么有不同的结果

     回答:都是科研人员的经验,大多数都是验证过的参数在里面,比如有一些是提取整体特征,有一些提取边缘特征,反正不用你操心,想要深究去查资料(反正我讲不好,框架已经给你,就用吧)

    self.conv1 = nn.Conv2d(in_channels=3, out_channels=9, kernel_size=3, padding=1)# self.conv2 = nn.Conv2d(in_channels=9, out_channels=12, kernel_size=3, padding=1)# self.conv3 = nn.Conv2d(in_channels=12, out_channels=16, kernel_size=3, padding=1)def forward(self, x):x = self.conv1(x)# x = self.conv2(x)# x = self.conv3(x)return x
import torch.nn as nn
import torchvision.transforms as transforms
from PIL import Image
import matplotlib.pyplot as plt
from pylab import *def get_row_col(num_pic):squr = num_pic ** 0.5row = round(squr)col = row + 1 if squr - row > 0 else rowreturn row, coldef visualize_feature_map(img_batch):feature_map = img_batchfeature_map_combination = []plt.figure()num_pic = feature_map.shape[2]row, col = get_row_col(num_pic)for i in range(0, num_pic):feature_map_split = feature_map[:, :, i]feature_map_combination.append(feature_map_split)plt.subplot(row, col, i + 1)plt.imshow(feature_map_split)axis('off')plt.savefig('feature_map.png')# plt.show()# 读取图像并转换为Tensor
def load_image(image_path):image = Image.open(image_path)transform = transforms.Compose([transforms.Resize((256, 256)),transforms.ToTensor(),])return transform(image).unsqueeze(0)  # 增加一个维度,使其成为batch为1的数据# 定义简单的卷积模型
class SimpleConvNet(nn.Module):def __init__(self):super(SimpleConvNet, self).__init__()self.conv1 = nn.Conv2d(in_channels=3, out_channels=9, kernel_size=3, padding=1)# self.conv2 = nn.Conv2d(in_channels=9, out_channels=12, kernel_size=3, padding=1)# self.conv3 = nn.Conv2d(in_channels=12, out_channels=16, kernel_size=3, padding=1)def forward(self, x):x = self.conv1(x)# x = self.conv2(x)# x = self.conv3(x)return x# 读取图片并进行卷积变换
image_path = 'cat.jpg'  # 替换为你的图片路径'3.jpg'
input_image = load_image(image_path)# 初始化模型并加载预训练的权重(或训练模型)
model = SimpleConvNet()# 进行卷积变换
output_image = model(input_image)
output_image = output_image.detach().numpy()
# print(output_image.shape)
feature = output_image.reshape(output_image.shape[1:]).transpose(1, 2, 0)
# print(feature.shape)
visualize_feature_map(feature)

4. 结果展示

这里的图片你们自己换一个也可以,我这里提供两张,你们试试看

 

4.1 一层卷积的结果

  4.2 两层卷积的结果

  4.3 三层卷积的结果


http://www.mrgr.cn/p/60861534

相关文章

【C++入门到精通】C++入门 —— 类和对象(初始化列表、Static成员、友元、内部类、匿名对象)

目录 一、初始化列表 ⭕初始化列表概念 ⭕初始化列表的优点 ⭕使用场景 ⭕explicit关键字 二、Static成员 ⭕Static成员概念 🔴静态数据成员: 🔴静态函数成员: ⭕使用静态成员的优点 ⭕使用静态成员的注意事项 三、友…

大数据面试题之Elasticsearch:每日三题(七)

大数据面试题之Elasticsearch:每日三题 1.Elasticsearch索引文档的流程?2.Elasticsearch更新和删除文档的流程?3.Elasticsearch搜索的流程? 1.Elasticsearch索引文档的流程? 协调节点默认使用文档ID参与计算(也支持通过routing)&a…

微服务项目,maven无法加载其他服务依赖

微服务项目,导入了工具类工程,但是一直报错,没有该类, 检查maven 这里的Maven的版本与idea版本不匹配可能是导致依赖加载失败的最重要原因 检查maven配置,我这是原来的maven,home 修改之后,就不报错了

秒级体验本地调试远程 k8s 中的服务

点击上方蓝色字体,选择“设为星标” 回复”云原生“获取基础架构实践 背景 在这个以k8s为云os的时代,程序员在日常的开发过程中,肯定会遇到各种问题,比如:本地开发完,需要部署到远程k8s集群,本地…

TCP/IP协议详解(二)

目录内容 TCP协议的可靠性 TCP的三次握手 TCP的四次挥手 C#中,TCP/IP建立 三次握手和四次挥手常见面试题 在上一篇文章中讲解了TCP/IP的由来以及报文格式,详情请见上一篇文章,现在接着来讲讲TCP/IP的可靠性以及通过代码的实现。 在TCP首部的…

算法通过村第二关-链表白银笔记|指定区间反转

文章目录 前言链表反转|指定区间内头插法:穿针引线法: 总结 前言 提示:人啊,果然跟花一样,开花前的等待无比漫长,绽放的魅力却转瞬即逝。 链表反转|指定区间内 参考题目:92. 反转链表 II - 力…

Vue(待续)

概念 一套用于构建用户界面的渐进式JavaScript框架 Vue可以自底向上逐层的应用: 简单应用:只需一个轻量小巧的核心库。 复杂应用:可以引入各式各样的Vue插件。 1.采用组件化模式,提高代码复用率、且让代码更好维护。 2.声明式编码,让编码人员…

【iOS】—— 持久化

文章目录 数据持久化的目的iOS中数据持久化方案数据持久化方式分类内存缓存磁盘缓存 沙盒机制获取应用程序的沙盒路径沙盒目录的获取方式 持久化数据存储方式XML属性列表Preferences偏好设置(UserDefaults)数据库存储什么是序列化和反序列化,…

DAY1,Qt [ 手动实现登录框(信息调试类,按钮类,行编辑器类,标签类的使用)]

1.手动实现登录框&#xff1b; ---mychat.h---头文件 #ifndef MYCHAT_H #define MYCHAT_H#include <QWidget> #include <QDebug> //打印信息 #include <QIcon> //图标 #include <QPushButton> //按钮 #include <QLineEdit> //行编辑器类 #in…

TCP/IP协议

TCP/IP 是一类协议系统&#xff0c;它是用于网络通信的一套协议集合 物理层 所谓的物理层&#xff0c;是指光纤、电缆或者电磁波等真实存在的物理媒介。这些媒介可以传送物理信号&#xff0c;比如亮度、电压或者振幅。对于数字应用来说&#xff0c;我们只需要两种物理信号来分别…

分冶算法 剑指 07 重建二叉树 排序算法:剑指45 把数组排成最小的数 10-I 斐波那契数列

来记录几个注意事项 1.vector容器里利用find&#xff08;&#xff09;函数 不同于map&#xff08;map有find方法&#xff09;&#xff0c;vector本身是没有find这一方法&#xff0c;其find是依靠algorithm来实现的。 所以要包含头文件 #include <iostream> #include <…

特定Adreno GPU的Android设备发生冻屏问题

1&#xff09;特定Adreno GPU的Android设备发生冻屏问题 ​2&#xff09;Unity版本升级后&#xff0c;iOS加载UnityFramework bundle闪退 3&#xff09;关于RectTransfrom.rect在屏幕空间中表示的相关问题 4&#xff09;Unity Mesh泄露问题 这是第345篇UWA技术知识分享的推送&a…

计算机网络——应用层

文章目录 **1 网络应用模型****2 域名系统DNS****3 文件传输协议FTP****4 电子邮件****4.1 电子邮件系统的组成结构****4.2 电子邮件格式与MIME****4.3 SMTP和POP3** **5 万维网WWW****5.1 HTTP** 1 网络应用模型 客户/服务器模型 C/S 服务器服务于许多来自其他称为客户机的主…

ElementUI Select选择器如何根据value值显示对应的label

修改前效果如图所示&#xff0c;数据值状态应显示为可用&#xff0c;但实际上仅显示了状态码1&#xff0c;并没有显示其对应的状态信息。在排查了数据类型对应关系问题后&#xff0c;并没有产生实质性影响&#xff0c;只好对代码进行了如下修改。 修改前代码&#xff1a; <…

CSS鼠标样式(cursor)

CSS cursor 属性值 属性值示意图描述auto默认值&#xff0c;由浏览器根据当前上下文确定要显示的光标样式default 默认光标&#xff0c;不考虑上下文&#xff0c;通常是一个箭头none不显示光标initial将此属性设置为其默认值inherit从父元素基础 cursor 属性的值context-menu…

学习React(四)

学习React&#xff08;四&#xff09; componentWillMount&#xff08;被放弃使用&#xff09;rendercomponentDidMountshouldComponentUpdate(nextProps,nextState)componentWillUpdate&#xff08;被放弃使用&#xff09;componentDidUpdatecomponentWillReceiveProps&#x…

Excel修改日期格式,改变日期的筛选方式

我们有两列日期数据&#xff1a; 左边这一列筛选会显示&#xff1a; 右边这一列筛选会显示&#xff1a; 修改格式&#xff0c;将【日期1】改为【日期2】 将【日期1】的格式修改为文本格式即可 修改格式&#xff0c;将【日期2】改为【日期1】 选中日期2&#xff0c;点击【数据…

7月31日每日两题

第一题:再解炸弹人 小哼最近爱上了“炸弹人”游戏。你还记得在小霸王游戏机上的炸弹人吗?用放置炸弹的方法来消灭敌人。需将画面上的敌人全部消灭后,并找到隐藏在墙里的暗门才能过关。 现在有一个特殊的关卡如下。你只有一枚炸弹,但是这枚炸弹威力超强(杀伤距离超长,可…

铁路关基保护新规:优先采购安全可信的网络产品和服务!

《征求意见稿》第十四条提到&#xff1a;运营者应当加强供应链安全保护&#xff0c;优先采购安全可信的网络产品和服务&#xff1b;采购网络产品和服务影响或者可能影响国家安全的&#xff0c;运营者应当预判网络产品和服务投入使用后可能带来的国家安全风险&#xff0c;按照国…

Openlayers实战:绘制多边形,导出CSV文件

CSV(Comma-Separated Values)是一种常用的数据交换格式,是一种纯文本文件格式。在Openlayers的交互中,经常性的我们要导出一些数据,在这个实战中,演示的是导出CSV文件。 安装依赖 npm install file-saver --save npm install papaparse --save 效果图 导出的文件 源代码…