AI时代带来的图片造假危机,该如何解决

news/2024/5/15 10:27:11

一、前言

当今,图片造假问题非常泛滥,已经成为现代社会中一个严峻的问题。随着AI技术不断的发展,人们可以轻松地通过图像编辑和AI智能生成来篡改和伪造图片,使其看起来真实而难以辨别,之前就看到过一对硕士夫妻为了骗保竟篡改结婚证、离婚证等信息:

甚至诺贝尔奖获奖者发表的论文中也疑似进行了图像篡改的行为:

这给社会带来了许多负面影响,尤其是在保险、金融、银行等领域,如果将虚假篡改过的信息资料审核通过更是会带来巨大的影响甚至是经济上的损失。

而且在当今AI快速发展的背景下,图像篡改的技术门槛越来越低,效果也越来越逼真。

所以,研究和开发图像篡改和伪造检测技术变得至关重要,推出一种能高效准确的检测出图像造假的方法或工具是迫在眉睫的!

刚好在最近的WAIC2023大会上,合合信息在图像篡改检测、AI图像安全领域上分享了他们的三种策略:图像篡改检测、AIGC判别、OCR对抗攻击技术:

让我们来看看他们是如何解决这些问题的。

二、会议分享

1)图像篡改检测

早在去年的世界人工智能大会上,合合信息”PS篡改检测”技术首次亮相,“像素级”起底修改痕迹,覆盖身份证、护照等多种证照识别类目,吸引了社会各界关注。我也使用过他们提供的PS检测服务来检测身份证伪造的情况,效果也是非常不错的,能够准确的识别出被篡改的部分:

今年合合信息团队对图像篡改检测“黑科技”持续优化升级,应用面也拓展至“截图篡改检测”,此前,图像篡改检测的技术研究对象主要集中于自然场景图像,然而,真正为人们的生活带来风险的通常是被篡改的资质证书、文档、截图等。现在合合信息的AI篡改检测技术还能够对包括转账记录、交易记录、聊天记录等多种截图,无论是从原图中“抠下”关键要素后移动“粘贴”至另一处的“复制移动”图片篡改手段,还是“擦除”、“重打印”等方式,图像篡改检测技术均可“慧眼”识假:

截图防伪检测对于证照检测来讲是更困难的,因为截图的背景没有纹路和底色,整个截图没有光照差异。证件篡改识别尚可通过拍照时产生的成像差异进行篡改痕迹判断,而截图则没有这些“信息”。现有的视觉模型通常难以充分发掘原始图像和篡改图像的细粒度差异特征,因此难以实现令人满意的准确率。为此,合合信息提出了一种基于HRNet的编码器-解码器结构的图像真实性鉴别模型,结合图像本身的信息包括但不限于噪声、频谱等, 从而捕捉到细粒度的视觉差异,达到高精度鉴别目的:

2)生成式图像鉴别

除此之外,合合信息在生成式图像鉴别方面也有所建树

在去年底的时候,我就体验过AIGC的强大,给予AI一段描述,短短几十秒就能生成出与之匹配的画作出来,下图为我使用某平台的AIGC产品生成的画作(描述文字内容为:森林里的蘑菇房子,梦幻仙境、蘑菇花草):

可以看到效果还是非常不错的,符合描述内容。

可是,随着AIGC的爆火后,不少人将它用于灰色或者违法产业,通过AI去生成不符合版权、违规的图片非法获利、混淆视听。严重危害了广大群众的财产,甚至是社会稳定:

庆幸的是,合合信息研发了AI生成图片鉴别技术,用于帮助个人及机构识别判断AI图片是否为生成的,防止“虚拟人”欺诈,通过解决生成式AI面临的部分伦理问题,助力生成式AI的健康发展:

合合信息基于空域与频域关系建模,输入图片后,模型通过多个空间注意力头来关注空间特征,并使用纹理增强模块放大浅层特征中的细微伪影,增强模型对真实人脸和伪造人脸的感知与判断准确度。能够在不用穷举图片的情况下,利用多维度特征来分辨真实图片和生成式图片的细微差异,解决了生成出来的图像场景繁多,不能穷举、有些生成图和真实图片的相似度过高,难以判别的两大难点。

该项技术的出现,在反诈骗、版权保护等领域的应用空间十分广泛。例如在金融行业,不法分子可利用AI合成技术对线上资金进行盗刷,威胁公民财产安全。本项技术可通过对支付环节的干预,降低资金盗刷概率;在传媒行业,某些图片供给方使用软件自动生成海报等图片,故意隐瞒其来源并售卖给第三方,第三方在不知情的情况下进行商用,导致了侵权问题,相关检测技术可在一定程度上解决这些问题。

3)OCR对抗攻击技术

相信大家在日常生活中,出于工作或其他业务的需要几乎都会遇到拍摄自己的证件照发送给第三方的情况,这些图片上承载的个人信息通常都是个人隐私,除了第三方和自己外不希望被别人获取。一但被别有用心的不法分子使用OCR技术识别提取并泄露,那会造成比较大的损失,比如新闻上经常看到的,身份信息被拿来搞电信诈骗,后面追责下来把自己送进监狱了,简直是无妄之灾!

市面上也有此类的对抗攻击技术来避免这样情况的出现,比如通过下面四种方式对图像进行加密,避免OCR的识别:

  1. 图像干扰:攻击者通过添加噪声、模糊化、旋转、变形等操作来干扰OCR系统对图像的识别。为了对抗这种攻击,OCR系统需要通过图像增强、边缘检测等技术来提高对图像的处理能力。

  2. 文字扰乱:攻击者通过在文本中插入其他字符、修改字符间距、改变字体等方式来扰乱OCR系统对文字的识别。为了对抗这种攻击,OCR系统需要通过设计更加鲁棒的字体和字符匹配算法。

  3. 对抗生成网络(GAN):对抗生成网络是一种通过训练生成器和判别器来同时提高生成样本的质量和判别样本真伪的技术。攻击者可以使用GAN生成看似真实但对OCR系统产生干扰的图像。为了对抗这种攻击,OCR系统需要通过对抗性训练、加入额外的鉴别器等方法提高对伪造图像的检测能力。

  4. 对抗样本生成:攻击者可以通过添加特定的噪声或干扰来改变图像,使得OCR系统产生错误的识别结果。为了对抗这种攻击,OCR系统需要采用强大的对抗样本检测算法,以便及时识别并拒绝对抗样本。

合合信息在此基础上也做了进行了创新技术探索,研发了OCR对抗攻击技术来进行文档图片“加密”,以防止不法分子使用OCR技术识别和提取其中的个人信息,该技术可在不影响肉眼观看与判断的情况下,对场景文本或者文档内文本进行扰动,对包含中文、英文、数字等关键信息的内容进行“攻击”,防止第三方通过OCR系统读取并保存图像中所有的文字内容,降低数据泄露的风险,以此达到保护信息的目的:

三、总结

通过AI,可以制作虚假的图片和新闻报道、以此破坏媒体的可信度和新闻的真实性。这可能导致公众对媒体和新闻的信任度下降,影响舆论和社会稳定。毫不夸张的说,AI造假技术对媒体、法律、政治、娱乐、社交媒体和个人安全等多个行业都会带来巨大的影响。

所以,检测这些造假信息的研究和开发对于保护社会安全和维护公正正义具有重要意义。合合信息AI图像内容检测产品的出现,在保护图像真实性和识别文本方面发挥了重要的作用。 通过自动化、高准确性和多样化的检测功能,这些技术能够帮助用户检测和防御图像篡改、生成式图像欺骗和OCR对抗攻击等问题。然而,我们仍然需要不断努力和创新,以应对不断变化和复杂化的篡改和伪造手段。只有这样,我们才能够更好地应对图像篡改和伪造问题,维护社会的稳定和公正。

值得高兴的是,中国信通院已牵头启动了《文档图像篡改检测标准》制定工作,该项标准由中国信通院牵头,上海合合信息科技股份有限公司、中国图象图形学学会、中国科学技术大学等科技创新企业及知名学术机构联合编制。以期为文档图像内容安全提供可靠保障,助力新时代AI安全体系建设。基于产业现状,围绕“细粒度”视觉差异伪造图像鉴别、生成式图像判别、文档图像完整性保护等行业焦点议题,凝聚行业共识,以期为行业提供有效指引,挖掘文档图像篡改检测技术趋势,助力图像产业健康成长。

相信随着该项标准的制定以及这么多顶尖企业的努力,将会为该行业注入更多的安全感和稳定性。


http://www.mrgr.cn/p/30261443

相关文章

七大经典比较排序算法

1. 插入排序 (⭐️⭐️) 🌟 思想: 直接插入排序是一种简单的插入排序法,思想是是把待排序的数据按照下标从小到大,依次插入到一个已经排好的序列中,直至全部插入,得到一个新的有序序列。例如:…

wms三代电子标签操作指导

一、服务器使用 V1.4基站已经内置服务程序,无需搭建服务;可跳至第1.4部分 1、服务器搭建 安装mysql5.7, 创建db_wms数据库并导入原始数据库文件 安装jdk1.8, 配置java环境变量 下载tomca8.0, 部署wms.war到tomcat, 并启动tomcat 2、下载资源 Wind…

【Machine Learning 系列】一文详解强化学习(Reinforcement Learning)

前言 机器学习主要分为三类:有监督学习、无监督学习和强化学习。在本文中,我们将介绍强化学习(Reinforcement Learning)的原理、常见算法和应用领域。 文章目录 前言一、原理二、算法1️⃣Q学习2️⃣SARSA3️⃣深度强化学习4️⃣Actor-Critic 三、应用领…

MySql005——使用SQL创建数据库和表

在《MySql000——MySql数据库的下载、安装以及使用图形化工具创建数据库和表》中,我们使用图形化工具MySQL Workbench创建数据库和表,下面我们将使用SQL来实现这一过程 一、数据库操作 1.1、创建数据库 1.1.1、创建MySQL数据库通用写法 使用 create 命…

OpenCvSharp (C# OpenCV) 二维码畸变矫正--基于透视变换(附源码)

导读 本文主要介绍如何使用OpenCvSharp中的透视变换来实现二维码的畸变矫正。 由于CSDN文章中贴二维码会导致显示失败,大家可以直接点下面链接查看图片: C# OpenCV实现二维码畸变矫正--基于透视变换 (详细步骤 + 代码) 实现步骤 讲解实现步骤之前先看下效果(左边是原图,右边…

【移动机器人运动规划】01 —— 常见地图基础 |图搜索基础

文章目录 前言相关代码整理:相关文章: 可视化网址:常用地图基础Occupancy grid mapOcto-mapVoxel hashingPoint cloud mapTSDF mapESDF mapFree-space RoadmapVoronoi Diagram Map 图搜索基础配置空间图搜索基本概念DijkstraAStarAstar的一些变种&#x…

NoSQL-Redis集群

NoSQL-Redis集群 一、集群:1.单点Redis带来的问题:2.解决:3.集群的介绍:4.集群的优势:5.集群的实现方式: 二、集群的模式:1.类型:2.主从复制: 三、搭建主从复制&#xff…

操作系统专栏1-内存管理from 小林coding

操作系统专栏1-内存管理 虚拟地址内存管理方案分段分页页表单级页表多级页表TLB 段页式内存管理Linux内存管理 malloc工作方式操作系统内存回收回收的内存种类 预读失败和缓存污染问题预读机制预读机制失效解决方案缓存污染 内核对虚拟内存的表示内核对内核空间的表示直接映射区…

网络安全(黑客)自学

前言 1.不要试图以编程为基础的学习开始学习 我在之前的回答中,我都一再强调不要以编程为基础再开始学习网络安全,一般来说,学习编程不但学习周期长,而且实际向安全过渡后可用到的关键知识并不多 一般人如果想要把编程学好再开…

使用docker部署springboot微服务项目

文章目录 1. 环境准备1. 准备好所用jar包项目2.编写相应的Dockerfile文件3.构建镜像4. 运行镜像5. 测试服务是否OK6.端口说明7.进入容器内8. 操作容器的常用命令 1. 环境准备 检查docker是否已安装 [rootlocalhost /]# docker -v Docker version 1.13.1, build 7d71120/1.13.…

SSIS对SQL Server向Mysql数据转发表数据 (完结)

1、对于根据主键进行更新和插入新的数据,根据前面的文章,对于组件已经很熟悉了,我们直接加入一个 查找 组件 ,如下所示 2、右键点击"查找",然后“编辑” ,选择“连接”,选中我们的目标连接器&…

Session、Cookie 与 Application

目录 简介cookiecookie生命周期 sessionsession生命周期 application 简介 cookie、seesion、application三个都会缓存我们用户状态的数据,使得我们在浏览器访问网站时可以更快速的获取到信息。 主要原因在于HTTP协议是无状态的,我们每次访问服务器&…

订单30分钟未支付自动取消怎么实现?

目录 了解需求方案 1:数据库轮询方案 2:JDK 的延迟队列方案 3:时间轮算法方案 4:redis 缓存方案 5:使用消息队列 了解需求 在开发中,往往会遇到一些关于延时任务的需求。最全面的Java面试网站 例如 生…

亚马逊、wish如何构建稳定、高效的自养号测评环境?

我们都知道的跨境几个平台速卖通、shopee、Lazada、亚马逊、wish、煤炉、拼多多Temu、敦煌、eBay、Etsy、Newegg、美客多、Allegro、阿里国际、沃尔玛、OZON、Cdiscount等等如何测评而不会轻易被检测风控呢?需要用到什么样的网络环境?准备哪些资源呢&…

基于单片机的语音识别智能垃圾桶垃圾分类的设计与实现

功能介绍 以51单片机作为主控系统;液晶显示当前信息和状态;通过语音识别模块对当前垃圾种类进行语音识别; 通过蜂鸣器进行声光报警提醒垃圾桶已满;采用舵机控制垃圾桶打开关闭;超声波检测当前垃圾桶满溢程度&#xff1…

c++11 标准模板(STL)(std::basic_ifstream)(二)

定义于头文件 <fstream> template< class CharT, class Traits std::char_traits<CharT> > class basic_ifstream : public std::basic_istream<CharT, Traits> 类模板 basic_ifstream 实现文件流上的高层输入操作。它将 std::basic_istrea…

流控平台Sentinel搭建和接入教程

流量控制和限流是大型系统必不可少的组成部分&#xff0c;Sentinel是Alibaba提供的一款特别好用的专业工具&#xff0c;属于那种看起来很牛&#xff0c;用起来也很牛的工具&#xff0c;下面记录一下接入的过程。 一&#xff0c;搭建平台 1&#xff0c;下载jar包 地址&#x…

报表工具有哪些?奥威BI+方案,快速搞定数据分析

报表工具有很多&#xff0c;如Excel、 Tableau、Power BI、帆软BI、思迈特BI等都是中国企业常用的报表工具&#xff0c;但要说能够成熟使用“BI方案”&#xff0c;更快地完成部署&#xff0c;推动企业大数据分析的却寥寥无几。“奥威BI方案”&#xff0c;低风险、高效率、高性价…

Mysql sql优化

目录 目的 目标 explain 优化 避免使用select * 用union all代替union 小表驱动大表&#xff08;in与exists&#xff09; 批量操作 多使用limit in中值太多 不使用%前缀模糊查询 不在where子句中进行表达式操作 避免隐式类型转换 联合索引遵守最左前缀法则 inne…

文心一言大数据模型-文心千帆大模型平台

官网&#xff1a; 文心千帆大模型平台 (baidu.com) 文心千帆大模型 (baidu.com) 模型优势 1、模型效果优&#xff1a;所需标注数据少&#xff0c;在各场景上的效果处于业界领先水平 2、生成能力强&#xff1a;拥有丰富的AI内容生成&#xff08;AIGC&#xff09;能力 3、应用…