[카테고리:] 미분류

  • 미드저니 이미지 생성 과정과 모델 알고리즘 추정

    핵심 요약
    미드저니가 디스코드 채팅창에 이미지를 점진적으로 “블러 처리→선명화” 형태로 보여주는 것은 바로 잠재 공간(Latent Space) 기반 디퓨전(Diffusion) 모델의 작동 방식 때문입니다. 내부 모델은 공개되지 않았으나, 여러 정보에 따르면 미드저니는 잠재 디퓨전(Latent Diffusion) 계열 모델을 자체 학습 데이터에 맞춰 파인튜닝하고, 빠른 생성을 위해 프로그레시브 디스틸레이션(Progressive Distillation) 기법을 적용한 것으로 추정됩니다[1][2].

    1. 왜 블러 처리 후 선명해지는가?

    1. 잠재 디퓨전(Latent Diffusion) 모델 작동
    • 이미지를 직접 픽셀 공간에서 생성하지 않고, 낮은 차원의 잠재 표현(latent representation)에 잡음을 입히고(Forward 과정), 이를 다시 제거(Reverse 과정)하며 이미지를 복원합니다.
    • 생성 과정 중간 단계에서는 잠재 벡터가 여전히 “잡음이 남아 있는” 상태이므로 뿌옇게(블러 처리) 보여지다가, 단계가 진행될수록 노이즈가 제거되며 최종 선명한 이미지가 완성됩니다.
    1. 프로그레시브 디스틸레이션
    • 미드저니는 생성 속도를 높이기 위해 디퓨전 과정을 압축(distillation)하여 일부 초기 단계(특히 노이즈 제거의 앞단계)를 건너뛰는 최적화 기법을 사용합니다. 이로 인해 중간 뷰가 보다 빠르게, 그러나 잠시 블러 상태로 노출된 뒤 샤프닝됩니다[2].
    1. 업스케일링 & 샤프닝
    • 초기 GRID(512×512 등)에서 생성된 저해상도 이미지를 베타 업스케일러(2×, 4×)로 확대하며 디테일을 보강합니다. 이 과정에서도 일종의 디노이징 및 샤프닝 처리가 포함되어, 최종 결과물에서 선명도가 높아집니다[3].

    2. 미드저니 내부 모델 아키텍처 추정

    요소추정 내용출처
    기반 모델잠재 디퓨전 모델(Latent Diffusion) 계열[1]
    훈련 데이터LAION-2B 유사 데이터 + 자체 큐레이션 아트셋[2]
    가이드클래시파이어-프리(Classifier-Free) 가이드 디퓨전[2]
    속도 최적화프로그레시브 디스틸레이션(Progressive Distillation)[2]
    추가 기법프롬프트 어규멘테이션·커스텀 CLIP 인코더 활용 가능성[2]
    • Latent Diffusion 모델: Stable Diffusion의 모태가 된 방식으로, 텍스트 인코더(CLIP)로부터 얻은 임베딩을 조건으로 잠재 공간에서 노이즈를 점진 제거하며 이미지 생성.
    • 프로프레시브 디스틸레이션: 여러 디퓨전 단계를 통합(distill)해 빠른 샘플링을 가능케 하는 기법.

    제한: 미드저니는 내부 아키텍처·파라미터·트레이닝 세부를 비공개로 유지하므로, 위 내용은 커뮤니티·논문·공개 토론을 기반으로 한 추정입니다. 정확한 구조는 미드저니 팀만이 알고 있습니다.

    3. 결론 및 활용 팁

    • 생성 과정을 이해하면/prefer option set resolution raw 등 파라미터 조정 시, 중간 블러 단계에 불필요하게 멈추지 않고 최적의 Fast GPU 시간을 활용할 수 있습니다.
    • 보다 빠르고 선명한 이미지를 원한다면 “–v 6” 등 최신 버전 모델을 선택하고, 베타 업스케일러를 적극 활용하세요.
    • 미드저니의 블러→샤프닝 생성을 모델 내부 동작으로 이해하면, 업스케일·리마스터·리믹스 기능을 활용한 후처리 전략 수립에 도움이 됩니다.

    출처
    [1] 추천] 내가 써보고 추천하는 Midjourney – With AI(인공지능) Life https://with-ai-life.tistory.com/16
    [2] [D] Is Midjourney AI more-or-less the same architecture as DALL-E 2 … https://www.reddit.com/r/MachineLearning/comments/xpb2c5/d_is_midjourney_ai_moreorless_the_same/
    [3] Legacy Features – Midjourney https://docs.midjourney.com/hc/en-us/articles/33329788681101-Legacy-Features
    [4] How to unblur Midjourney image https://unblurimage.ai/blog/unblur-midjourney-image/
    [5] Generative AI Meets Architecture: Using Midjourney to … – Maket.ai https://www.maket.ai/post/generative-ai-meets-architecture-using-midjourney-to-generate-innovative-ideas
    [6] Midjourney vs. Stable Diffusion: Which Should You Use? – Viso Suite https://viso.ai/deep-learning/midjourney-stable-diffusion/
    [7] How to make less blurry images ? : r/midjourney – Reddit https://www.reddit.com/r/midjourney/comments/10l9474/how_to_make_less_blurry_images/
    [8] How to use Midjourney for architect? – Future Architecture https://futurearchi.blog/en/midjourney-architect/
    [9] Why are my Path Tracing renders blurry … – Unreal Engine Forums https://forums.unrealengine.com/t/why-are-my-path-tracing-renders-blurry-while-my-path-tracing-screenshots-are-clear/841438
    [10] Midjourney for Architects: The Ultimate Workflow for Design and … https://www.youtube.com/watch?v=UVNP-4U8jxY
    [11] What is Stable Diffusion? (Latent Diffusion Models Explained) https://midjourney.fm/blog-What-is-Stable-Diffusion-Latent-Diffusion-Models-Explained-38942
    [12] Do THIS to fix blurry AI images in Seconds – YouTube https://www.youtube.com/watch?v=GHXGsrDMJwI
    [13] Midjourney v6 in Architecture: Beginner’s Guide – YouTube https://www.youtube.com/watch?v=eOp700fkeLE
    [14] Midjourney vs. Stable Diffusion: A Comprehensive Comparison Guide https://www.aiarty.com/midjourney-guide/midjourney-vs-stable-diffusion.htm
    [15] Midjourney https://www.midjourney.com
    [16] Diffusion과 Transformer의 만남 https://stibee.com/api/v1.0/emails/share/pWS7rQgZifPxwoIXL6UhOm0yJ7upHag
    [17] Midjourney Negative Prompts: Everything You Need to Know https://www.aiarty.com/midjourney-prompts/midjourney-negative-prompts.htm
    [18] Midjourney Architecture – Instagram https://www.instagram.com/midjourney.architecture/
    [19] Stable Diffusion vs Midjourney vs Flux – AI 이미지 생성 툴 완벽 비교 … https://corea777.tistory.com/24
    [20] Midjourney blurry edges style https://sref-midjourney.com/style/blurry%20edges