Midjourney AI 怎么用?2026 年新手一步步上手指南

最后更新: 2025-12-24 14:25:35

Midjourney 正在重新定义数字艺术的创作方式——只需输入简单的文字描述,几秒钟就能生成惊艳、专业级的图像。无论你是寻找灵感的设计师、需要高质量视觉素材的营销人员,还是对 AI 绘画充满好奇的新手,这份全面的 Midjourney 教程都将带你从零基础入门,成长为得心应手的创作者。

我从 2023 年初开始持续使用 Midjourney,用于客户项目、产品视觉和内容创作。一路下来发现,新手最容易踩的坑并不在工具本身,而是在提示词的写法上。

在这份指南中,你将系统掌握 Midjourney 的完整上手流程:从创建账号、了解订阅方案开始,到深入学习提示词写法与提示词工程,再到灵活运用许多教程都忽略的高级功能,真正高效地生成高质量 AI 图像。

什么是 Midjourney AI?

Midjourney 是一款通过自然语言描述(也就是「提示词」)生成图片的 AI 绘画工具。它由旧金山的独立研究实验室开发,创始人是 David Holz(Leap Motion 联合创始人)。凭借出色的出图质量和艺术表现力,Midjourney 已迅速成长为最受欢迎的 AI 图片生成平台之一,与 DALL·E 和 Stable Diffusion 并列。

Midjourney 最突出的优势在于它独特而高级的审美风格。它擅长生成具有艺术表现力的画面,电影感光影、绘画般的质感都非常出色,成图往往看起来就像出自专业艺术家之手。因此,它在以下场景中特别有价值:

  • 概念设计与插画:快速将游戏、电影或书籍创意可视化
  • UI/UX 设计:生成线框稿、图标和设计灵感
  • 营销与广告:为活动和社交媒体打造独特视觉素材
  • 产品摄影:生成生活方式场景图和产品视觉展示
  • 个人创作项目:无需绘画基础,也能把想象变成作品

Midjourney 是免费的吗?一文看懂订阅方案

先回答大家最关心的问题:Midjourney 已经不再提供免费使用。由于用户需求激增以及系统被滥用,官方在 2023 年 4 月正式取消了免费试用。不过,从出图质量和创作效率来看,Midjourney 的订阅方案依然物超所值,能带来非常高水准的 AI 生成图片体验。

Midjourney 定价方案(2026)


套餐价格 / 月高速 GPU 时长适合人群
Basic$103.3 小时(约 200 张图片)兴趣玩家、轻度使用者
Standard$3015 小时 + 无限 Relax 模式稳定创作者、设计师
Pro$6030 小时 + 无限 Relax 模式专业用户 + 隐身模式
Mega$12060 小时 + 无限 Relax 模式高频使用者、团队 / 工作室
专业建议:选择年付可节省 20%。如果你打算长期使用 Midjourney,Standard 套餐(年付约 $24/月)在支持无限 Relax 出图的前提下,性价比最高。

Midjourney 新手入门:一步步完成设置

使用 Midjourney 有两种方式:通过 midjourney.com 的网页端,或在 Discord 中使用。网页版本更新、更直观,也更适合新手入门。下面我们将分别介绍这两种使用方法。

方法一:通过网页版使用 Midjourney(推荐)

Midjourney 于 2024 年推出了全新的 Web 网页版,相比在 Discord 里使用更加直观、友好。下面带你快速上手:

  1. 访问 midjourney.com,点击“登录”或“开始使用”
  2. 使用 Google、Discord 或邮箱完成账号注册
  3. 选择适合你的订阅方案(可随时升级)
  4. 进入 Create 页面,在顶部可以看到 Imagine 输入栏
  5. 输入你的第一个提示词,描述你想生成的画面
  6. 按下回车,Midjourney 将自动生成四张不同风格的图片

网页端带来多重优势:实时生成预览、图片整理更轻松、内置编辑工具齐全,并且无需受 Discord 聊天刷屏干扰,工作流更加清爽高效。

方法二:在 Discord 上使用 Midjourney

如果你更习惯用 Discord,或需要使用某些社区功能,按下面流程设置即可:

  1. 如果还没有账号,先到 discord.com 注册一个 Discord 账号
  2. 访问 midjourney.com,点击「Join the Beta」加入 Midjourney 官方服务器
  3. 在侧边栏找到 #newbies 新手频道(或创建你自己的私人服务器使用)
  4. 输入 /imagine,然后写下你的提示词描述
  5. 等待大约 60 秒,即可生成 4 张图片

搭建你的专属 Discord 私人服务器:为了避开公共频道的刷屏干扰,在 Discord 中点击“+”新建一个服务器,然后从 Midjourney 官方服务器邀请 Midjourney Bot 进来。这样你就能拥有一个安静、专注的创作空间,随时安心出图。

创建你的第一张 Midjourney 图片

完成设置后,生成图片其实非常简单。每一次创作都从「提示词」开始——也就是用文字清楚地告诉 Midjourney 你想要生成什么样的画面。

理解图片网格

提交提示词后,Midjourney 会一次性生成四张不同风格的图片组成的网格。在图片下方,你会看到两排操作按钮:

  • U1、U2、U3、U4(Upscale 放大):将选中的图片提升分辨率,生成更清晰、更精细的版本
  • V1、V2、V3、V4(Variations 变体):基于选中的图片生成新的变体风格和构图
  • 🔄(Re-roll 重新生成):使用相同提示词再次生成,获得完全不同的新结果

完成放大后,你还可以使用更多进阶选项,如 Vary(细微)、Vary(强烈)、Zoom Out(缩放拉远)和 Pan(平移),在保留原有风格的同时,对画面进行精细调整或进一步扩展创作空间。

第一个提示词:越简单越好

第一次生成图片时,建议从简单、清晰的描述开始:

一只金毛幼犬在秋日落叶中玩耍,柔和的阳光

这个提示词之所以效果好,是因为它清楚地包含了主体(金毛幼犬)、动作(玩耍)、场景(秋天的落叶)以及光线条件(柔和的阳光)。在这些关键信息的引导下,Midjourney 会自动补全艺术细节,生成高质量画面。

掌握 Midjourney 提示词:提示词工程的艺术

出图质量很大程度取决于你的提示词写法。和偏好详细指令的 ChatGPT 不同,Midjourney 更擅长理解简洁、有画面感的描述。下面教你如何写出高质量提示词,轻松生成惊艳作品。

提示词公式

即使只用单个词,Midjourney 也能生成效果;但使用结构化的提示词,能让你获得更高的可控性。不妨参考下面这个框架:

  1. 主体(Subject):画面核心是什么?(武士、未来城市、一杯咖啡)
  2. 媒介(Medium):以什么形式呈现?(照片、油画、3D 渲染、水彩)
  3. 环境(Environment):场景在哪里?(竹林中、火星上、水下、温馨咖啡馆)
  4. 光影(Lighting):整体氛围如何?(黄金时刻、戏剧化阴影、霓虹灯、柔和漫射光)
  5. 风格 / 美学(Style/Aesthetic):想要什么感觉?(电影感、极简、复古、赛博朋克、吉卜力风格)
  6. 技术细节(Technical details):相机或绘画参数(35mm 镜头、浅景深、广角)

提示词示例:从基础到进阶

基础提示词:

一只猫

优化后的提示词:

一只毛茸茸的橘猫坐在窗台上,午后阳光洒落,温馨舒适的氛围

高级提示词:

一只毛茸茸的橘色虎斑猫坐在维多利亚风格的窗台上,金色时刻的阳光透过蕾丝窗帘洒入,光束中可见细微的尘埃,油画风格,暖色调,私密而温馨的氛围   ar 3:4   s 750

可以看到,每一层级都在保持简洁的同时,逐步增加了更多细节。进阶版本还加入了参数( ar 和  s),我们将在下一节详细讲解。

真正有效的提示词技巧

  1. 具体胜过冗长。“Dramatic lighting”往往比“营造强烈戏剧感与张力的灯光”更有效。
  2. 善用艺术参考。提到“in the style of Studio Ghibli”或“Baroque painting”等风格,能更精准地引导整体美学。
  3. 避免否定式描述。与其写“no trees”,不如直接强调你想要的元素,Midjourney 往往会忽略否定词。
  4. 为写实效果补充相机细节。“shot on Canon 5D, 85mm f/1.4, shallow depth of field”等描述能显著提升真实感。
  5. 使用质量增强词。加入“highly detailed”“8k”“professional photography”或“masterpiece”,有助于提升整体出图质量。

你必须了解的 Midjourney 核心参数

参数是在提示词末尾(以两个短横线开头)添加的特殊指令,用来控制 Midjourney 的出图方式。掌握这些参数,你就能更精细地掌控画面风格、细节和整体效果,让创作真正符合你的预期。

常用参数


参数用法说明
arar-16:9画面比例。常见:1:1(方形)、16:9(宽屏)、9:16(竖屏)、3:2(照片)
s 或 stylizes-750艺术风格强度(0–1000)。数值越高越偏艺术化,越低越贴近文字描述
chaoschaos-50随机变化幅度(0–100)。数值越高,4 张结果之间差异越大
qq-2质量参数(.25、.5、1、2)。数值越高,细节更丰富,但消耗更多 GPU 时间
nono text, watermark反向提示词,用于排除不希望出现的元素
seedseed-12345复现结果用。同一 seed + 相同提示词,可生成相似画面
tiletile生成可无缝平铺的图案,适合纹理和背景设计

进阶参考参数

这些强大的参数让你可以用图片来引导生成结果:

  • sref(Style Reference,风格参考):匹配参考图片的视觉风格。可搭配 sw(style weight,风格权重)使用,精确控制风格影响力度。
  • cref(Character Reference,角色参考):在多次生成中保持角色一致性。对故事创作、IP 打造和品牌视觉尤为关键。
  • iw(Image Weight,图片权重):在使用图片提示词时,控制参考图片对最终效果的影响强度(0~2)。

带风格参考的示例:

日落时分的山地风景   sref https://example.com/style image.jpg   sw 100

Midjourney 高级功能

图生图生成

除了文字提示词,你还可以使用图片作为输入,来引导 Midjourney 的出图效果:

  • 图像提示(Image Prompts):将图片拖入提示词输入框,再补充文字描述。图片会直接影响画面构图和生成内容。
  • Blend 融合:在 Discord 中使用 /blend,或在网页版使用 Blend 功能,将 2–5 张图片融合成一张全新的作品。
  • Describe 反向解析:上传一张图片,Midjourney 会自动生成可复现该风格的提示词,非常适合拆解与学习图片风格。

局部重绘与编辑

Vary(Region)功能让你可以只针对生成图片的局部进行修改与重绘,实现更精细、更可控的创作调整:

  • 先对图片进行 Upscale 放大
  • 点击 "Vary (Region)"
  • 使用选择工具框选你想修改的区域
  • 输入新的提示词,描述要替换成的内容

这在修复手部、替换背景或添加特定元素时非常实用,无需重新生成整张图片。

缩放与平移

让你的图片突破原有边界,扩展出更多画面细节:

  • Zoom Out:在保留画面中心主体不变的情况下,向外扩展画布范围。支持 1.5x 和 2x 两种缩放选项。
  • Pan:按指定方向(上、下、左、右)扩展画面,延伸场景内容,呈现更多画面细节。

这些功能非常适合用来生成更宽广的风景、为人像扩展更多背景,或灵活调整主体位置。

个性化与风格调校器

Midjourney 会逐步学习你的审美偏好:

  • 图片评分:经常对你喜欢或不喜欢的图片进行评分,帮助算法学习你的个人审美偏好。
  • Style Tuner:从系统生成的多种风格中进行选择,创建专属的风格代码(sref),并可分享给他人使用。
  • 使用 p 参数:在任意提示词中添加 p,即可直接应用你个性化的风格偏好。

实战应用场景与提示词模板

为 UI/UX 设计师打造

冥想类 App 的移动端界面设计,干净简约的 UI,柔和渐变配色,iOS 风格,浅色模式  ar 9:19

分析平台仪表盘设计,深色模式,数据可视化,现代 SaaS 美学风格   ar 16:9

用于产品摄影

奢华香水瓶置于大理石台面上,柔和的棚拍灯光,编辑级产品摄影风格,极简构图   ar 4:5

无线耳机悬浮,动感水花飞溅,高速摄影,戏剧性光影,科技产品拍摄   ar 1:1

用于营销与社交媒体

现代咖啡馆里用笔记本电脑工作的年轻职场人,抓拍式生活方式摄影,暖色调,真实自然,4:5 比例

抽象几何背景,品牌配色蓝色与珊瑚色,动感造型,现代企业美学   ar 16:9   tile

用于概念艺术与插画

隐藏在巨树内部的古老图书馆,奇幻概念艺术,体积光,史诗级尺度,精细的环境设计  ar 21:9

角色设计设定表,赛博朋克街头武士,正面 / 侧面 / 背面视图,细致的服装设计,动漫风格   ar 16:9

值得了解的 Midjourney 替代方案

虽然 Midjourney 在艺术表现力方面表现出色,但在某些特定需求下,你也可以考虑以下免费的替代方案:

  • DALL·E 3(通过 Bing Image Creator):免费使用,文字渲染效果出色,与微软生态产品深度集成。
  • Stable Diffusion:开源方案,可本地运行,无限免费生成,支持社区模型,高度可定制。
  • Adobe Firefly:商业使用更安心(基于授权内容训练),无缝集成 Creative Cloud 应用。
  • Leonardo AI:提供免费套餐,擅长游戏素材与 3D 风格渲染。
  • Ideogram:文字生成表现极强,角色一致性出色。

每款工具都有各自的优势。Midjourney 依然是艺术质量和审美表现上的首选,而其他替代方案则可能在特定工作流程或预算条件下更合适。

常见问题解答

Midjourney 生成的图片可以用于商业用途吗?

是的,所有付费订阅用户都拥有自己生成的图片版权,并可用于商业用途。但如果你是为年营收超过 100 万美元的公司生成图片,则需要订阅 Pro 或 Mega 计划。

如何在多张图片中保持角色一致性?

将角色图片与   cref(character reference,角色参考)参数一起使用,例如:“my character in a forest   cref [image URL]”。  cw 参数用于控制角色一致性的严格程度。

为什么我的手看起来不对劲?

AI 图像生成器一直不太擅长画手。实用技巧:在提示词中加入“细节丰富的手部”或“解剖结构准确的手部”,使用   q 2 提升画质,并借助 Vary (Region) 工具只对手部进行重新生成。

不通过 Discord 也能使用 Midjourney 吗?

没错!现在直接通过 midjourney.com 的网页端即可使用全部功能,无需再依赖 Discord。对大多数用户来说,这也是官方更推荐的 Midjourney 使用方式。

Fast 模式和 Relax 模式有什么区别?

Fast 模式会消耗你套餐内的 GPU 时长,通常约 60 秒即可生成图片;Relax 模式(仅限 Standard 套餐及以上)不限制使用次数,但生成速度较慢,具体耗时会根据当前使用高峰而有所变化。

如何让我的生成内容保持私密?

默认情况下,Midjourney 生成的所有图片都会公开显示在官方画廊中。如果你希望进行私密生成,需要订阅 Pro 或 Mega 套餐,这两个方案都包含 Stealth Mode(隐身模式)。

立即开始创作

Midjourney 让数字艺术创作真正走向大众,只需几分钟,任何人都能生成专业水准的图片。想要玩得好,关键在于多尝试:不断测试不同的提示词,灵活调整参数,勇于反复迭代,你会发现出图质量会越来越高。

在开启你的 Midjourney 之旅时,请牢记以下核心原则:

  • 从简单开始,再逐步打磨。先用基础提示词入手,理解效果后再逐渐叠加细节与复杂度。
  • 掌握关键参数。优先学会 ar、s 和 chaos,它们对出图效果影响最大。
  • 研究成功案例。多逛 Midjourney Explore 页面,看看其他创作者哪些提示词真正奏效。
  • 持续迭代优化。高质量作品往往来自在好图基础上的反复 variations 和 re rolls。
  • 加入社区交流。Midjourney 的 Discord 和论坛是获取技巧与灵感的宝贵资源。

无论是为下一个项目打造概念设计、生成营销视觉素材,还是单纯释放创意灵感,Midjourney 都为你提供了一个极其强大的创作画布,唯一的限制只有你的想象力。

准备好开始了吗?前往 midjourney.com,选择适合你的订阅方案,今天就生成你的第一张图片。