AI 绘画神器 Fooocus 本地部署指南:简介、硬件要求、部署步骤、界面介绍

news/2024/5/20 16:47:31

在这里插入图片描述

本文收录于《AI绘画从入门到精通》专栏,专栏总目录:点这里,订阅后可阅读专栏内所有文章。

大家好,我是水滴~~
随着人工智能技术的飞速发展,AI 绘画逐渐成为创意领域的新宠。Fooocus 作为一款免费开源的 AI 绘画工具,凭借其简单易用、高质量图像生成的特点,吸引了众多用户的关注。本文将详细介绍 Fooocus 的本地部署过程,帮助用户轻松搭建自己的 AI 绘画环境。
文章内容包含大量的图例,希望能够帮助新手同学快速入门。

一、了解 Fooocus

Fooocus 是一款 AI 绘画工具,其最大的特点是简单易操作,由 ControlNet 的作者 lllyasviel(真实身份是斯坦福大学博士生张吕敏)开发。
Fooocus 结合了 Stable Diffusion 和 Midjourney 的优点,它保留了 Stable Diffusion 的开源属性,可以免费部署到本地使用。同时,它也向 Midjourney 学习,简化了操作界面,省去了复杂的参数调节,让用户可以更专注于提示和图像的创作。
Fooocus 的界面非常简洁,只包含图像展示窗口、正向提示词和生成按钮三个部分。它使用了最新推出的SDXL 1.0 模型,可以通过简单的提示词生成各种风格的高质量图像。此外,Fooocus 还包含了 100 多种不同的预设风格,涉及写实、胶片、电影质感、动漫、水彩、黏土、3D、等距、像素、霓虹、赛博朋克、波普、纸艺等各个方面,让用户可以轻松生成更多样、更具艺术性的图像。
image.png
只输入了a girl, garden两个提示词,就生成了精美的图片。

二、硬件要求

在部署 Fooocus 之前,用户需要确保自己的电脑满足以下要求:

  • 操作系统:Windows、Linux 或 macOS 均可(本文使用 Windows)。
  • 处理器:支持 CUDA 加速的 NVIDIA 显卡(可选,但强烈推荐)。
  • 显存:至少 4GB(推荐 8GB 或以上)。
  • 内存:至少 8GB(推荐 16GB 或以上)。
  • 存储空间:预留至少 10GB 的硬盘空间用于下载模型和生成图片。

下面是官方给出的最低配置表,该表根据在不同的操作系统和不同的 GPU 型号下的最低配置:

操作系统GPU型号最低显存最低内存备注
Windows/LinuxNvidia RTX 4XXX4GB8GB最快
Windows/LinuxNvidia RTX 3XXX4GB8GB通常比 RTX 2XXX更快
Windows/LinuxNvidia RTX 2XXX4GB8GB通常比 GTX 1XXX更快
Windows/LinuxNvidia GTX 1XXX8GB8GB公比 CPU 快一点点
Windows/LinuxNvidia GTX 9XX8GB8GB比 CPU 更快或更慢
Windows/LinuxNvidia GTX < 9XX不支持//
WindowsAMD GPU8GB8GB通过 DirectML,比 Nvidia RTX 3XXX 慢约 3 倍
LinuxAMD GPU8GB8GB通过 ROCm,比 Nvidia RTX 3XXX 慢约 1.5 倍
MacM1/M2 MPS共享共享比 Nvidia RTX 3XXX 慢约 9 倍
Windows/Linux/Mac只使用CPU0GB32GB比 Nvidia RTX 3XXX 慢约 17 倍

三、部署步骤

本文介绍在 Windows 环境下的部署步骤,在提供的 Fooocus 安装包中已经集成了 Python 和 Git 环境,我们直接下载使用即可,并且它还会自动更新至最新版本。

3.1 下载 Fooocus 安装包

可以通过下面直接下载 Fooocus:
https://github.com/lllyasviel/Fooocus/releases/download/release/Fooocus_win64_2-1-831.7z
如果速度慢,也可以从我分享的网盘中下载:
https://pan.quark.cn/s/5b972ab4e26f
image.png

下载完后,可以看到这样的一个压缩文件:
image.png
我们直接解压即可,下面是解压缩后的内容:
image.png

3.2 下载模型

第一次启动程序时,Fooocus 会自动下载一些默认模型,但这些模型都放在国外的服务器,需要科学上网才能下载。不过我已经将这些模型都放到网盘中了,在这里分享给大家:
https://pan.quark.cn/s/5b972ab4e26f
这些模型需要我们提前下载好,然后放到对应目录下:
image.png
checkpoints 目录中的模型为大模型,下载后放到本地 Fooocus\models\checkpoints文件夹中。
image.png
loras 目录中的模型为 LoRA 模型,下载后放到本地 Fooocus\models\loras文件夹中。

3.3 运行 Fooocus

Fooocus 提供了三个运行程序:run.batrun_anime.batrun_realistic.bat
image.png
这三个程序都可以运行,它们主要区别是使用的大模型不同,不同的大模型也具有不同的风格:

类型程序命令行参数大模型
通用run.batjuggernautXL_v8Rundiffusion
漫画run_anime.bat–preset realisticrealisticStockPhoto_v20
写实run_realistic.bat–preset animeanimaPencilXL_v100

实际上我们只运行 run.bat 即可,到高级选项里面还能进行切换 preset(预设)

双击 run.bat 来启动程序,等待一会后,出现下面提示表示启动成功:
image.png
程序会自动进入 Fooocus 界面,如果没有,在浏览器中输入:http://127.0.0.1:7865/,按回车键后就会进入主界面:
image.png
此时,我们输入一个简单的提示词 a girl,然后点击【Generate】按钮就可以生成图像了:
image.png
这是 Fooocus 最简单的用法了。

四、界面介绍

Fooocus 的界面非常简洁,主要包括主界面、高级界面和输入图像界面。

4.1 主界面

主界面主要用于输入提示词,然后输出图片的地方:
image.png

  • 图像展示区域:这是主要的工作区域,用于展示生成的图像。
  • 提示词输入区域:这是用户输入正向提示词的地方,用于指导 AI 绘画模型生成符合需求的图片。
  • 生成按钮:点击此按钮,Fooocus 将根据用户输入的提示词开始生成图片。
  • 高级选项:勾选后会展开高级界面,可以做一些更高级的设置。
  • 输入图像选项:勾选后会展开输入图像界面,可以根据上传的图片做一系列的操作。

4.2 高级界面

勾选【Advanced】高级选项后,就可以在右侧展开高级界面了,该界面主要包括:Setting(设置)、Style(风格)、Model(模型)、Advanced(高级)四个选项卡:
image.png

  • Setting(设置):主要功能可以修改预设、修改生成速度、修改宽高比、图片生成数量、图片输出格式、填写负向提示词、设置随机种子、查看生成历史等。
  • Style(风格):默认有 100 多种风格可供选择。
  • Model(模型):可以修改主模型、精练模型、LoRA 模型。
  • Advanced(高级):可以调整指导量表、图像清晰度、开发者高度模式。

4.3 输入图像界面

勾选【Input Image】输入图像选项后,会在下方展开输入图像界面,该界面主要包括:Upscale or Variation(图片放大)、Image Prompt(图片提示)、Inpaint or Outpaint(局部修复)、Describe(提示词反推)、Metadata(原数据)五个选项卡:
image.png

  • Upscale or Variation(图片放大):可以将图片放大,增强、微调。
  • Image Prompt(图片提示):可以结合提示词和输入图片来生成新的图片,相当于 ControlNet 功能。
  • Inpaint or Outpaint(局部修复):对图片做一些局部调整。
  • Describe(提示词反推):根据输入图片反推出提示词。
  • Metadata(原数据):获取由 AI 生成图像的原数据,包括提示词、模型等信息。

至于更高级的用法,会在后续文章中讲解,欢迎订阅


http://www.mrgr.cn/p/08688464

相关文章

一文玩转Vue3参数传递——全栈开发之路--前端篇(8)

全栈开发一条龙——前端篇 第一篇&#xff1a;框架确定、ide设置与项目创建 第二篇&#xff1a;介绍项目文件意义、组件结构与导入以及setup的引入。 第三篇&#xff1a;setup语法&#xff0c;设置响应式数据。 第四篇&#xff1a;数据绑定、计算属性和watch监视 第五篇 : 组件…

测试项目实战——安享理财1(测试用例)

说明&#xff1a; 1.访问地址&#xff1a; 本项目实战使用的是传智播客的安享理财项目&#xff08;找了半天这个项目能免费用且能够满足测试实战需求&#xff09; 前台&#xff1a;http://121.43.169.97:8081/ 后台&#xff1a;http://121.43.169.97:8082/ &#xff08;点赞收藏…

20240503解决Ubuntu20.04和WIN10双系统下WIN10的时间异常的问题

20240503解决Ubuntu20.04和WIN10双系统下WIN10的时间异常的问题 2024/5/3 9:33 缘起&#xff1a;因为工作需要&#xff0c;编译服务器上都会安装Ubuntu20.04。 但是因为WINDOWS强悍的生态系统&#xff0c;偶尔还是有必须要用WINDOWS的时候&#xff0c;于是也安装了WIN10。 双系…

什么是虚拟货币?

随着科技的进步&#xff0c;虚拟货币逐渐进入公众视野&#xff0c;其影响深远且复杂。本文将从专业角度分析虚拟货币的发展现状、未来趋势&#xff0c;以及面临的挑战&#xff0c;并尝试提出一些思考。 一、虚拟货币的定义与现状 虚拟货币是一种基于区块链技术的数字资产&…

欧洲杯/奥运会-云直播

欧洲杯/奥运会要来了&#xff0c;如何升级自己的网站让你的顾客都能观赏直播已提高用户量呢&#xff1f;&#xff01; 【功能完善、平滑兼容】 云直播支持 RTMP 推流、 HLS 源站等多种直播源接入方式&#xff0c;提供直播 SDK&#xff0c;支持多终端适配&#xff0c;上行码率…

【C++】详解STL容器之一的deque和适配器stack,queue

目录 deque的概述 deque空间的结构 deque的迭代器 deque的数据设计 deque的优缺点 适配器的概念 ​编辑 stack的概述 stack的模拟实现 queue的概述 queue的模拟实现 deque的概述 deque的设计参考了另外两大容器vector和list。可参考下面两篇文章 详解vector&#x…

【LLM 论文】Least-to-Most Prompting 让 LLM 实现复杂推理

论文&#xff1a;Least-to-Most Prompting Enables Complex Reasoning in Large Language Models ⭐⭐⭐ Google Research, ICLR 2023 论文速读 Chain-of-Thought&#xff08;CoT&#xff09; prompting 的方法通过结合 few-show prompt 的思路&#xff0c;让 LLM 能够挑战更具…

漏洞管理是如何在攻击者之前识别漏洞从而帮助人们阻止攻击的

漏洞管理 是主动查找、评估和缓解组织 IT 环境中的安全漏洞、弱点、差距、错误配置和错误的过程。该过程通常扩展到整个 IT 环境&#xff0c;包括网络、应用程序、系统、基础设施、软件和第三方服务等。鉴于所涉及的高成本&#xff0c;组织根本无法承受网络攻击和数据泄露。如果…

【springboot基础】如何搭建一个web项目?

正在学习springboot&#xff0c;还是小白&#xff0c;今天分享一下如何搭建一个简单的springboot的web项目&#xff0c;只要写一个类就能实现最基础的前后端交互&#xff0c;实现web版helloworld &#xff0c;哈哈&#xff0c;虽然十分简陋&#xff0c;但也希望对你理解web运作…

python 和 MATLAB 都能绘制的母亲节花束!!

hey 母亲节快到了&#xff0c;教大家用python和MATLAB两种语言绘制花束~这段代码是我七夕节发的&#xff0c;我对代码进行了简化&#xff0c;同时自己整了个python版本 MATLAB 版本代码 function roseBouquet_M() % author : slandarer% 生成花朵数据 [xr,tr]meshgrid((0:24).…

STM32使用L9110驱动电机自制小风扇

1.1 介绍&#xff1a; 该电机控制模块采用L9110电机控制芯片。该芯片具有两个TTL/CMOS兼容输入端子&#xff0c;并具有抗干扰特性&#xff1a;具有高电流驱动能力&#xff0c;两个输出端子可直接驱动直流电机&#xff0c;每个输出端口可提供750800mA动态电流&#xff0c;其峰值…

AlphaFold3: Google DeepMind的的新突破

AlphaFold 3的论文今天在Nature期刊发表啦!这可是AI在生物领域最厉害的突破的最新版本。AlphaFold-3的新招就是用扩散模型去"画出"分子的结构。它一开始先从一团模模糊糊的原子云下手,然后慢慢透过去噪把分子变得越来越清楚。 Alphafold3 我们活在一个从Llama和Sora那…

【C++】string类的使用

目录 string类对象的默认成员函数 string类对象的容量操作 string中元素访问及遍历 遍历方式1&#xff1a;下标[] 遍历方式2: 迭代器 遍历方式3: 范围for string类对象的修改操作 string类非成员函数 总结 string&#xff0c;也就是串或者字符数组&#xff0c;可以扩容&a…

第十届山东省大学生程序设计竞赛题解(A、F、M、C)

部分代码define了long long,请记得开long long A. Calandar 把年份、月份、单个的天数全都乘以对应的系数转化成单个的天数即可,注意最后的结果有可能是负数,要转化成正数。发现技巧是:(ans % 5 + 5) % 5。? 还有注意不能这样写,答案不正确。或许是因为取模运算没有这样的…

jmeter后置处理器提取到的参数因为换行符导致json解析错误

现象&#xff1a; {"message":"JSON parse error: Illegal unquoted character ((CTRL-CHAR, code 10)): has to be escaped using backslash to be included in string value; nested exception is com.fasterxml.jackson.databind.JsonMappingException: Ill…

网页主题自动适配:网页跟随系统自动切换主题

主题切换是网站设计中一个非常有趣的功能&#xff0c;它允许用户在多种预先设计的样式之间轻松切换&#xff0c;以改变网站的视觉表现。最常见的就是白天和黑夜主题的切换&#xff0c;用户可以根据自己的喜好进行设置。 除了让用户手动去切换主题外&#xff0c;如果能够让用户第…

(七)JSP教程——session对象

浏览器和Web服务器之间的交互通过HTTP协议来完成&#xff0c;HTTP协议是一种无状态的协议&#xff0c;服务器端无法保留浏览器每次与服务器的连接信息&#xff0c;无法判断每次连接的是否为同一客户端。为了让服务器端记住客户端的连接信息&#xff0c;可以使用session对象来记…

基于springboot+jsp+Mysql的商务安全邮箱邮件收发

开发语言&#xff1a;Java框架&#xff1a;springbootJDK版本&#xff1a;JDK1.8服务器&#xff1a;tomcat7数据库&#xff1a;mysql 5.7&#xff08;一定要5.7版本&#xff09;数据库工具&#xff1a;Navicat11开发软件&#xff1a;eclipse/myeclipse/ideaMaven包&#xff1a;…

定时将系统时间更新在日志文件中

获取当前系统时间,把时间转换为特定格式”yy年mm月dd日 星期x tt:mm:ss”,并每隔1s写入到本地磁盘中一个叫做log.txt的文本中,如果文本不存在则创建V1.0 2024年5月9日 发布于博客园实现:设计程序,获取当前系统时间,把时间转换为特定格式”yy年mm月dd日 星期x tt:mm:ss”,…

jQuery-1.语法、选择器、节点操作

jQuery jQueryJavaScriptQuery&#xff0c;是一个JavaScript函数库&#xff0c;为编写JavaScript提供了更高效便捷的接口。 jQuery安装 去官网下载jQuery&#xff0c;1.x版本练习就够用 jQuery引用 <script src"lib/jquery-1.11.2.min.js"></script>…