当前位置: 首页 > news >正文

教电脑“看”图片

教电脑“看”图片

计算机视觉简介

上一篇:《自己DIY首个人工智能模型》

序言:人是如何“看”图片的?人类感知周围世界,主要依赖看、听、闻、触这些感官,而“看”是最普遍和直观的方式。计算机视觉,就是对人类“看”的这一行为的模仿,旨在让计算机能够识别并理解图像或视频。从技术角度来看,我们或许很少认真思考过,人类“看”图片的过程其实也是通过观察颜色、分析图中内容及内容之间的关系来完成的。我们会对图片进行分类,并根据内心的经验或认知作出判断,这也是为什么每个人对同一张图片会有不同理解的原因。请读者关注!关注后您的智慧将更加深邃,不关注的话,那就只能靠颜值了 ^_^。

前一章 介绍了机器学习(即人工智能算法)的基础原理。你已经了解了如何通过编程,使用神经网络将数据与标签进行匹配,并由此推断出区分项目的规则。接下来的合乎逻辑的一步就是将这些概念应用于计算机视觉,让模型学会识别图片中的内容,从而能够“看到”其中的物体。在本章中,你将使用一个流行的服装物品数据集,构建一个能够区分不同服装种类的模型,从而“看”出不同类型的服装之间的差异。

识别服装物品

让我们从第一个例子开始,考虑一下识别图像中服装物品需要什么条件。举例来说,请考虑图2-1中的物品。

图2-1 服装示例

这里有许多不同的服装物品,你能够识别它们。你知道什么是衬衫、外套或连衣裙。但如果要向一个从未见过服装的人解释呢?鞋子呢?图中有两只鞋子,但你该如何向别人描述呢?这是我们在第1章中提到的基于规则的编程可能失效的另一种情况。有时,用规则来描述某些东西是不现实的。

当然,计算机视觉也不例外。但请想一想你是如何学会识别这些物品的——通过看许多不同的例子,并积累它们的使用经验。我们是否可以用计算机做同样的事情?答案是肯定的,但也有一定的局限性。让我们来看一个教计算机识别服装物品的第一个例子,使用一个著名的数据集——Fashion MNIST。

数据集:Fashion MNIST

最基础的学习和基准测试算法之一的数据集是由Yann LeCun、Corinna Cortes和Christopher Burges开发的改进型国家标准与技术研究院(MNIST)数据库。这个数据集包含了70,000个0到9的手写数字图像。图像尺寸为28×28,且是灰度图。

Fashion MNIST设计为可以直接替代MNIST的一个数据集,它具有相同的记录数量、相同的图像尺寸和相同的类别数量——不同的是,Fashion MNIST包含的是10种不同类型的服装图像,而不是0到9的数字图像。你可以在图2-2中看到该数据集的示例,每种服装类型占据三行。

图2-2 探索Fashion MNIST数据集

它包含了各种各样的服装,包括衬衫、裤子、连衣裙和许多种类的鞋子。正如你可能注意到的那样,它是单色的,所以每张图片由一定数量的像素组成,像素值介于0到255之间。这使得数据集更容易管理。

你可以在图2-3中看到数据集中某张图片的特写。

图2-3 Fashion MNIST数据集中一张图片的特写

就像任何图像一样,它是一个由像素组成的矩形网格。在这个例子中,网格大小为28×28,每个像素只是一个值,范围介于0到255之间,正如前面提到的那样。现在让我们看看如何使用这些像素值与我们之前看到的函数。

下一篇:我们讲如何设计和训练一个CNN视神经网络。请读者关注!关注后您的智慧将更加深邃,不关注的话,那就只能靠颜值了 ^_^


http://www.mrgr.cn/news/54331.html

相关文章:

  • 【4046倍频电路】2022-5-15
  • Linux操作系统切换设置系统语言
  • 用HTML标签承载页面内容:前端开发的基础知识
  • [实时计算flink]Flink SQL作业快速入门
  • OpenHarmony中EAP-PEAP认证支持 GTC方式
  • 21世纪当代国学易经起名大师颜廷利:全球知名哲学家思想家
  • JavaWeb——Maven(5/8):依赖管理-依赖配置(Maven 项目中的依赖配置、访问仓库网站、配置依赖的注意事项)
  • 自动机器学习(AutoML)
  • 苹果最新的M4 MacBook Pro
  • python 字符串的格式化与eval()
  • 【Linux-进程间通信】匿名管道+4种情况+5种特征
  • NodeJS 使用百度翻译API
  • 顺序表算法题【不一样的解法!】
  • Lucas带你手撕机器学习——逻辑回归
  • OpenFeign的使用
  • AI学习指南深度学习篇-自编码器的变种
  • 论文精读:PRL 交变磁MnTe中的手性分裂磁振子
  • 场景化运营与定制开发链动 2+1 模式 S2B2C 商城小程序的融合
  • 【74LS48译码器】2022-1-2
  • 每天5分钟玩转C#/.NET之goto跳转语句