텍스트-이미지 생성 모델의 주요 평가항목에 대한 세계 최고 수준과 국내 기술 현황을 검색 결과를 바탕으로 분석한 결과, 각 항목별로 다음과 같은 현황을 확인할 수 있습니다.
이미지 생성 처리 속도 분석
세계 최고 수준
현재 세계에서 가장 빠른 텍스트-이미지 생성 속도는 0.1초로 확인됩니다[11]. NVIDIA의 SANA-Sprint 모델이 H100 GPU에서 1024×1024 이미지를 0.1초 만에 생성할 수 있습니다[11]. 또한 KOALA-Lightning-700M 모델은 NVIDIA 4090 GPU에서 0.66초에 1024×1024 이미지를 생성할 수 있어 SDXL 대비 4배 이상 빠른 성능을 보입니다[12].
최적화된 Stable Diffusion 모델들도 상당한 성능 향상을 보여주고 있습니다. 예를 들어, SDXL은 최적화를 통해 A100 GPU에서 1.92초까지 단축될 수 있으며[19], 일반적인 Stable Diffusion 모델도 최적화를 통해 2초 수준까지 개선이 가능합니다[15].
국내 기술 수준
국내에서는 한국전자통신연구원(ETRI)이 개발한 ‘코알라 700M’ 모델이 2초 만에 이미지를 생성할 수 있어 세계 최고 수준에 근접한 성능을 보여주고 있습니다[9][18]. 이는 OpenAI의 DALL-E 2(12.3초)와 DALL-E 3(13.7초) 대비 5배 이상 빠른 속도입니다[18]. 카카오브레인의 ‘칼로 2.0’ 모델은 3초 만에 이미지를 생성할 수 있습니다[10].
이미지 품질 평가 점수 현황
세계 최고 수준
이미지 품질 평가는 주로 FID(Fréchet Inception Distance) 점수로 측정됩니다. 세계 최고 수준의 모델들은 상당히 낮은 FID 점수를 달성하고 있습니다. SANA-Sprint는 1스텝에서 FID 7.59를 기록했으며[11], Playground v3 모델은 ImageNet에서 FID 14.67을 달성했습니다[20].
국내 기술 수준
카카오브레인의 Karlo 모델은 MS-COCO 검증셋에서 FID 14.43 (50 스텝), FID 15.24 (25 스텝)을 기록했습니다[13]. 이는 국제적으로 경쟁력 있는 수준으로 평가됩니다.
프롬프트-이미지 정합성 점수 분석
세계 최고 수준
프롬프트-이미지 정합성은 주로 CLIP Score로 측정됩니다[6]. CLIP Score는 0-100점 사이의 값으로 측정되며, 100에 가까울수록 좋습니다[6]. 현재 최고 성능 모델들은 CLIP Score 0.3 이상의 성능을 보여주고 있습니다.
국내 기술 수준
Karlo 모델은 CC3M 데이터셋에서 CLIP Score 0.3086 (50 스텝), MS-COCO에서 0.3192를 달성했습니다[13]. 이는 세계 최고 수준과 비교해도 경쟁력 있는 성능입니다.
프롬프트 다양성 커버리지 지수 현황
이 항목에 대한 구체적인 수치 데이터는 검색 결과에서 명확하게 확인되지 않았습니다. 하지만 다양성 향상을 위한 연구가 활발히 진행되고 있으며[8], 특히 다중 프롬프트 학습 방법론들이 개발되고 있습니다.
결함 이미지 필터링 정확도 현황
결함 이미지 필터링에 대한 구체적인 정확도 수치는 검색 결과에서 명확하게 확인되지 않았습니다. 다만 이미지 품질 개선을 위한 다양한 기법들이 연구되고 있으며, 특히 판별기(discriminator) 기반 접근법들이 활용되고 있습니다[14].
결론
현재 국내 기술 수준은 이미지 생성 속도 면에서 세계 최고 수준에 근접해 있으며, 특히 ETRI의 코알라 모델과 카카오브레인의 칼로 모델이 우수한 성능을 보여주고 있습니다. 이미지 품질과 프롬프트 정합성 면에서도 국제 경쟁력을 갖추고 있으나, 목표치인 0.3초 이하의 생성 속도 달성을 위해서는 추가적인 최적화가 필요한 상황입니다. 세계 최고 수준인 0.1초 달성을 위해서는 하드웨어 최적화와 모델 경량화 기술의 지속적인 발전이 요구됩니다.
출처
[1] All You Need Is One GPU: Inference Benchmark for Stable Diffusion https://lambda.ai/blog/inference-benchmark-stable-diffusion
[2] How DALL-E 2 Actually Works – AssemblyAI https://assemblyai.com/blog/how-dall-e-2-actually-works
[3] How Long Does It Take ChatGPT to Generate Images? [2025 … https://www.cursor-ide.com/blog/chatgpt-image-generation-time-guide-2025
[4] SmoothCache: A Universal Inference Acceleration Technique … – arXiv https://arxiv.org/html/2411.10510v1
[5] An Efficient Architecture for Large-Scale Text-to-Image Diffusion … https://arxiv.org/abs/2306.00637
[6] CLIP Score — PyTorch-Metrics 1.7.1 documentation – Lightning AI https://lightning.ai/docs/torchmetrics/stable/multimodal/clip_score.html
[7] boomb0om/text2image-benchmark – GitHub https://github.com/boomb0om/text2image-benchmark
[8] Diversity Covariance-Aware Prompt Learning for Vision-Language … https://paperswithcode.com/paper/diversity-covariance-aware-prompt-learning
[9] 문장 입력하면 2초 만에 이미지 ‘쑥’…세계 최고 속도 – YTN https://www.ytn.co.kr/_ln/0105_202402040423528132
[10] 카카오브레인, 초거대 AI 이미지 생성 모델 ‘칼로 2.0’ 출시 – 연합뉴스 https://www.yna.co.kr/view/AKR20230710043100017
[11] SANA-Sprint – NVlabs https://nvlabs.github.io/Sana/Sprint/
[12] etri-vilab/koala-lightning-700m – Hugging Face https://huggingface.co/etri-vilab/koala-lightning-700m
[13] kakaobrain/karlo – GitHub https://github.com/kakaobrain/karlo
[14] [PDF] DiffServe: Efficiently Serving Text-to-Image Diffusion Models … – arXiv https://arxiv.org/pdf/2411.15381.pdf
[15] How to speed up Stable Diffusion to a 2 second inference time https://blog.cerebrium.ai/how-to-speed-up-stable-diffusion-to-a-2-second-inference-time-500x-improvement-d561c79a8952
[16] lucidrains/DALLE2-pytorch: Implementation of DALL-E 2, OpenAI’s … https://github.com/lucidrains/DALLE2-pytorch
[17] [PDF] Personalized Text-to-Image Generation without Test-Time Finetuning https://openaccess.thecvf.com/content/CVPR2024/papers/Shi_InstantBooth_Personalized_Text-to-Image_Generation_without_Test-Time_Finetuning_CVPR_2024_paper.pdf
[18] “생성 AI 민주화 선언!” ETRI…2초 만에 뚝딱 이미지 … – 인공지능신문 https://www.aitimes.kr/news/articleView.html?idxno=30153
[19] SDXL inference in under 2 seconds: the ultimate guide to Stable … https://www.baseten.co/blog/sdxl-inference-in-under-2-seconds-the-ultimate-guide-to-stable-diffusion-optimiza/
[20] Playground v3: Improving Text-to-Image Alignment with Deep … – arXiv https://arxiv.org/html/2409.10695v1
[21] Stable Diffusion Inference 최적화 및 서버 구성 – velog https://velog.io/@kcw4875/Stable-Diffusion-Inference-%EC%B5%9C%EC%A0%81%ED%99%94-%EB%B0%8F-%EC%84%9C%EB%B9%84%EC%8A%A4-%EC%84%9C%EB%B2%84-%EA%B5%AC%EC%84%B1
[22] Speed up inference – Hugging Face https://huggingface.co/docs/diffusers/optimization/fp16
[23] Stable Diffusion Inference Speed Benchmark for GPUs – Reddit https://www.reddit.com/r/StableDiffusion/comments/xwwos2/stable_diffusion_inference_speed_benchmark_for/
[24] GenEval Benchmark (Text-to-Image Generation) – Papers With Code https://paperswithcode.com/sota/text-to-image-generation-on-geneval
[25] PixArt-α: Fast Training of Diffusion Transformer for … – GitHub https://github.com/PixArt-alpha/PixArt-alpha
[26] [논문리뷰] FastDiff: A Fast Conditional Diffusion Model for High … https://kimjy99.github.io/%EB%85%BC%EB%AC%B8%EB%A6%AC%EB%B7%B0/fastdiff/
[27] FastDiff: A Fast Conditional Diffusion Model for High-Quality Speech … https://randomsampling.tistory.com/221
[28] 문장 입력하면 2초 만에 뚝딱 이미지 만드는 기술개발 – 노벨사이언스 http://www.nobelscience.net/news/articleView.html?idxno=2079
[29] 카카오브레인, 국내 최대 ‘AI 기반 이미지 생성’…속도·품질 잡았다 https://www.newstheai.com/news/articleView.html?idxno=3007
[30] 카카오브레인, 국내 최대 크기의 ‘이미지 생성 모델’ 공개 – 전자신문 https://www.etnews.com/20220419000023
[31] [논문 리뷰] Learning to Sample Effective and Diverse Prompts for … https://www.themoonlight.io/ko/review/learning-to-sample-effective-and-diverse-prompts-for-text-to-image-generation
[32] [PDF] LoGoPrompt: Synthetic Text Images Can Be Good Visual Prompts … https://openaccess.thecvf.com/content/ICCV2023/papers/Shi_LoGoPrompt_Synthetic_Text_Images_Can_Be_Good_Visual_Prompts_for_ICCV_2023_paper.pdf
[33] SANA-Sprint: One-Step Diffusion with Continuous-Time Consistency … https://arxiv.org/abs/2503.09641
[34] SANA: Efficient High-Resolution Image Synthesis with Linear … https://github.com/NVlabs/Sana
[35] A Survey on Foundation-Model-Based Industrial Defect Detection https://arxiv.org/html/2502.19106v1
[36] [PDF] Towards Language-Free Training for Text-to-Image Generation https://openaccess.thecvf.com/content/CVPR2022/papers/Zhou_Towards_Language-Free_Training_for_Text-to-Image_Generation_CVPR_2022_paper.pdf
[37] Accelerate inference of text-to-image diffusion models – Hugging Face https://huggingface.co/docs/diffusers/tutorials/fast_diffusion
[38] Fast Inference in Denoising Diffusion Models via MMD Finetuning https://arxiv.org/abs/2301.07969
[39] Real-Time AI Generator: Instant Image Creation | getimg.ai https://getimg.ai/tools/real-time-generator
[40] Diffusion NMR Characterization of Catalytic Silica Supports https://pubs.acs.org/doi/10.1021/acs.jpcc.7b02929
[41] Nvidia developed an ultra-fast text-to-image (t2i) model for … https://www.turtlesai.com/en/pages-2508/nvidia-developed-an-ultra-fast-text-to-image-t2i
[42] chengzeyi/stable-fast: https://wavespeed.ai/ Best inference … – GitHub https://github.com/chengzeyi/stable-fast
[43] Gemini AI image generator — text to image with Imagen 4 https://gemini.google/overview/image-generation/
[44] 한국 AI, 초고속 이미지 생성 기술로 글로벌 경쟁력 강화…”문장 입력 … http://www.aifnlife.co.kr/news/articleView.html?idxno=22661
[45] 네이버, 클로바 스튜디오에 신형 AI 모델 2종 탑재…첫 ‘비전 모델’ 적용 https://www.etnews.com/20250418000047
[46] 카카오브레인, 이미지 생성 AI 사용자 친화적으로 고도화 https://www.newstheai.com/news/articleView.html?idxno=4166
[47] 네이버, AI ‘하이퍼클로바X’ 신모델 구축⋯”기존 대비 40% 크기에 더 … https://www.inews24.com/view/1815778
[48] Text to Minority Image Generation via Prompt Optimization https://openreview.net/forum?id=98dyxUoI3q
[49] Minority-Focused Text-to-Image Generation via Prompt Optimization https://arxiv.org/html/2410.07838v3
[50] Prompt Expansion for Adaptive Text-to-Image Generation – arXiv https://arxiv.org/abs/2312.16720
[51] Prompt Expansion for Adaptive Text-to-Image Generation – ACL … https://aclanthology.org/2024.acl-long.189/
[52] [PDF] Prompt Inversion for Text-to-Image Diffusion Models http://openaccess.thecvf.com/content/CVPR2024/papers/Mahajan_Prompting_Hard_or_Hardly_Prompting_Prompt_Inversion_for_Text-to-Image_Diffusion_CVPR_2024_paper.pdf
[53] Measuring Diversity in Co-creative Image Generation – arXiv https://arxiv.org/html/2403.13826v1
[54] A comprehensive approach to evaluating text-to-image models https://labelbox.com/guides/a-comprehensive-approach-to-evaluating-text-to-image-models/
[55] [PDF] Training Diffusion Models Towards Diverse Image Generation with … https://openaccess.thecvf.com/content/CVPR2024/papers/Miao_Training_Diffusion_Models_Towards_Diverse_Image_Generation_with_Reinforcement_Learning_CVPR_2024_paper.pdf
[56] SANA-Sprint: 연속 시간 일관성 확산을 통한 원스텝 디퓨전 – 논문 상세 https://www.chatpaper.ai/ko/dashboard/paper/dfa58bd9-0a5f-4a0b-aa05-8b99b969c08a
[57] Efficient-Large-Model/Sana_Sprint_1.6B_1024px – Hugging Face https://huggingface.co/Efficient-Large-Model/Sana_Sprint_1.6B_1024px
[58] One-step text-to-image generation in 0.1s with SANA! -… | Kadir Nar https://www.linkedin.com/posts/kadir-nar_sana-sprint-one-step-text-to-image-generation-activity-7307394927859015681-uNgr
[59] ETRI unveils ultra-fast generative visual intelligence model https://www.eurekalert.org/news-releases/1034928
[60] kakaobrain/karlo-v1-alpha-image-variations – Hugging Face https://huggingface.co/kakaobrain/karlo-v1-alpha-image-variations
[61] Learning Prompt-Level Quality Variance for Cost-Effective Text-to … https://dl.acm.org/doi/pdf/10.1145/3627673.3679954
[62] [PDF] Ultrafast diffusion exchange nuclear magnetic resonance – SciSpace https://scispace.com/pdf/ultrafast-diffusion-exchange-nuclear-magnetic-resonance-5674ikcd51.pdf
[63] SANA-Sprint – Hugging Face https://huggingface.co/docs/diffusers/api/pipelines/sana_sprint
[64] The effects of molecular diffusion in ultrafast two-dimensional … https://pmc.ncbi.nlm.nih.gov/articles/PMC2809670/
[65] Ultrafast 3D nanofabrication via digital holography – Nature https://www.nature.com/articles/s41467-023-37163-y
[66] rupeshs/fastsdcpu: Fast stable diffusion on CPU – GitHub https://github.com/rupeshs/fastsdcpu
[67] stabilityai/sd-turbo – Hugging Face https://huggingface.co/stabilityai/sd-turbo
[68] Accelerating SD Turbo and SDXL Turbo Inference with ONNX … https://huggingface.co/blog/sdxl_ort_inference
평가 항목별 세계 최고 수준 보유국 및 보유기관 정리
아래 표는 “이미지 생성 처리 속도”, “이미지 품질 평가 점수”, “프롬프트-이미지 정합성 점수”, “프롬프트 다양성 커버리지 지수”, “결함 이미지 필터링 정확도” 등 5개 항목별로 2025년 기준 세계 최고 수준을 보유한 국가와 대표 기관을 정리한 것입니다.
평가 항목 | 세계 최고 수준 보유국 | 대표 보유기관(기업/연구소) | 비고/주요 모델·특징 |
---|---|---|---|
이미지 생성 처리 속도 | 미국 | NVIDIA, OpenAI | NVIDIA SANA-Sprint (초고속 생성), OpenAI DALL-E 3 등 |
이미지 품질 평가 점수 | 미국 | Google DeepMind, OpenAI | Imagen 4, DALL-E 3 (사진 수준의 사실감, 높은 FID/CLIP) |
프롬프트-이미지 정합성 점수 | 미국 | Google DeepMind, OpenAI, Ideogram | Imagen, DALL-E 3, Ideogram 2.0 (텍스트·이미지 일치도) |
프롬프트 다양성 커버리지 지수 | 미국 | OpenAI, Google DeepMind | GPT-4o, Imagen (다양한 프롬프트 해석·생성) |
결함 이미지 필터링 정확도 | 미국 | Google, OpenAI | Google DeepMind, OpenAI (AI기반 결함 감지·필터링) |
- 미국이 전반적으로 모든 항목에서 세계 최고 수준의 기술을 보유하고 있으며, Google, OpenAI, NVIDIA, Ideogram 등이 대표 기관입니다.
- 각 항목별로 실제 세계 최고 수준의 모델 및 기술은 위 기관들이 집중적으로 개발·운영하고 있습니다.
- 일부 항목(결함 이미지 필터링 등)은 상용화된 모델의 품질관리 및 AI 기반 자동화 기능에서 Google, OpenAI가 선도적입니다.
참고:
- 미국은 AI 원천기술, 시장 장악력, 논문·특허 영향력 등에서 세계 1위로 평가받고 있습니다[2][3].
- 유럽, 중국, 일본 등도 일부 분야에서 경쟁력을 보이나, 종합적 기술수준과 시장 영향력은 미국이 가장 앞서 있습니다[2][3].
출처
[1] 사업계획서 목표달성도 평가지표는 어떻게 쓰면될까요? – 블로그 https://blog.naver.com/1977one/221088817548
[2] [PDF] 기술수준평가 및 기술수준 향상방안 – 대한민국 정책브리핑 https://m.korea.kr/expertWeb/resources/files/data/document_file/2018/4%EC%B0%A8%20%EC%82%B0%EC%97%85%ED%98%81%EB%AA%85%20%EB%8F%84%EB%9E%98%EC%97%90%20%EB%8C%80%EC%9D%91%ED%95%9C%20%EB%8D%B0%EC%9D%B4%ED%84%B0%20%EA%B8%B0%EB%B0%98%20%EA%B8%B0%EC%88%A0%EC%88%98%EC%A4%80%ED%8F%89%EA%B0%80%20%EB%B0%8F%20%EC%88%98%EC%A4%80%ED%96%A5%EC%83%81%20%EB%B0%A9%EC%95%88.pdf
[3] [PDF] 213663_참고+3.+2022년도+ICT+기술수준조사+및+기술경쟁력+ … https://grant-documents.thevc.kr/213663_%EC%B0%B8%EA%B3%A0+3.+2022%EB%85%84%EB%8F%84+ICT+%EA%B8%B0%EC%88%A0%EC%88%98%EC%A4%80%EC%A1%B0%EC%82%AC+%EB%B0%8F+%EA%B8%B0%EC%88%A0%EA%B2%BD%EC%9F%81%EB%A0%A5+%EB%B3%B4%EA%B3%A0%EC%84%9C.pdf
[4] [PDF] 년도 반도체 분야 신규지원 대상 연구개발과제 안내문 2025 https://research.uos.ac.kr/sites/default/files/2025-01/%EC%8B%A0%EA%B7%9C%EC%A7%80%EC%9B%90%20%EB%8C%80%EC%83%81%20%EC%97%B0%EA%B5%AC%EA%B0%9C%EB%B0%9C%EA%B3%BC%EC%A0%9C%20%EC%95%88%EB%82%B4%EB%AC%B8.pdf
[5] NTIS > 과제 검색 https://www.ntis.go.kr/ThSearchProjectList.do?searchWord=%EB%AF%B8%EA%B5%AD%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%84%BC%ED%84%B0%2Fhotkr.com%7CDDoS%EB%B0%A9%EC%96%B4%EC%84%9C%EB%B2%84-%ED%99%8D%EC%BD%A9%EC%84%9C%EB%B2%84%7C%EB%AF%B8%EA%B5%AD%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%84%BC%ED%84%B0%2F%EB%AF%B8%EA%B5%AD%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%84%BC%ED%84%B0-%ED%95%9C%EA%B5%AD%EC%84%9C%EB%B2%84
[6] [HWP] [과제계획서] 2022년 인공지능(AI) 기술 … – SBA 서울R&D지원센터 https://seoul.rnbd.kr/common/cm04o01_new.jsp?menuCd=m030100&seqNo=188&attNo=2
[7] [PDF] 연구개발계획서 – 해양수산과학기술진흥원 https://www.kimst.re.kr/dhh/download.do;jsessionid=PU3D0NEv37JjBw6619z0V7pRh3aaOe7XAhGNOXVmjyqrh6oXv3guwYwWpb0kpY3M.www-webwas_servlet_engine4?path=bbs%2F1014%2F&dn=20231219073400590.pdf
[8] [PDF] 첨부 3 : GCS 신규과제 후보(16개) 내역 – 정보통신산업진흥원 https://www.nipa.kr/comm/getFile?srvcId=BBSTY1&upperNo=R%2APohdgKLsfVPkRaRHUfwA%3D%3D&fileTy=ATTACH&fileNo=6b7KiEj%5EmI2xusRjE3FPHQ%3D%3D
[9] KISTEP INI – K2Base https://www.k2base.re.kr/6ae/page.do
[10] [PDF] 6. 차세대보안 – 한국정보보호산업협회 https://www.kisia.or.kr/bucket/uploads/2020/11/26/6.%EC%B0%A8%EC%84%B8%EB%8C%80%EB%B3%B4%EC%95%88%EB%B6%84%EC%95%BC+%ED%9B%84%EB%B3%B4%EA%B3%BC%EC%A0%9C_NyaI5N9.pdf
세계 최고 수준 보유국 및 보유기관 정리
2025년 기준, 텍스트-이미지 생성 AI 분야에서 세계 최고 수준의 기술을 보유한 국가와 기관은 다음과 같습니다.
분야 | 보유국 | 대표 보유기관(기업/연구소) | 주요 모델/특징 |
---|---|---|---|
이미지 품질, 프롬프트 이해, 텍스트 렌더링 | 미국 | Google (DeepMind) | Imagen 4: 사진 수준의 사실감, 텍스트 내장 품질 세계 최고[1][3] |
이미지 품질, 생성 속도, 통합 플랫폼 | 미국 | OpenAI | DALL-E 3, GPT-4o: 빠른 생성, 대화형 통합, 높은 품질[1][3] |
그래픽 디자인, 텍스트 렌더링 | 캐나다/미국 | Ideogram | Ideogram 2.0: 텍스트-이미지 정합성, 디자인·타이포그래피 특화[2][4] |
속도, 맞춤형 생성 | 독일 | Black Forest Labs | FLUX1.1: 초고속 생성, 고해상도 지원, 맞춤형 API[4] |
그래픽 디자인, 벡터/래스터 이미지 | 미국 | Recraft AI | Recraft V3: 복잡한 프롬프트, 벡터/래스터 지원, 디자인 특화[4] |
오픈소스, 고해상도, 다국어 | 중국 | ZhiPu AI | CogView4: 2048×2048 고해상도, 오픈소스, 중국어·영어 지원[6] |
오픈소스, 대중화 | 영국/글로벌 | Stability AI | Stable Diffusion 3.5: 대중적 확산, 고품질, 다양한 커뮤니티 활용[4] |
그래픽 하드웨어·AI 연구 | 미국 | NVIDIA | SANA-Sprint 등: 초고속 생성, GPU 최적화, 연구 선도[3] |
지역별 특징
- 미국: Google, OpenAI, NVIDIA, Adobe 등 글로벌 선도 기업 다수 보유. 이미지 품질, 생성 속도, 통합 서비스 등에서 세계 최고 수준[1][3][4].
- 중국: ZhiPu AI, Baidu, SenseTime 등 자체 AI 생태계 성장. 오픈소스와 다국어 지원 모델로 차별화[6][3].
- 유럽: 독일, 영국 등에서 Black Forest Labs, Stability AI 등 혁신 기업 등장. 속도·품질·개방성에서 경쟁력[4].
- 캐나다: Ideogram 등 창의적 디자인·텍스트 렌더링 분야 강점[2][4].
요약
- 세계 최고 수준의 텍스트-이미지 생성 AI는 주로 미국(구글, 오픈AI, NVIDIA), 중국(ZhiPu AI), 캐나다(이디오그램), 독일(Black Forest Labs), 영국(Stability AI) 등에서 개발 및 보유하고 있습니다.
- 대표 기관: Google DeepMind, OpenAI, Ideogram, Black Forest Labs, Recraft AI, ZhiPu AI, Stability AI, NVIDIA 등[1][2][3][4][6].
이 기관들이 개발한 모델들은 이미지 품질, 생성 속도, 프롬프트 해석력, 텍스트 렌더링 등 주요 평가 항목에서 세계 최고 수준을 기록하고 있습니다.
출처
[1] 단어 및 텍스트용 최고의 AI 이미지 생성기 | 1 달러 VPS https://onedollarvps.com/ko/blogs/best-ai-image-generator-for-words-and-text
[2] 이디오그램, 혁신적인 이미지 생성 AI ‘이디오그램 2.0’ 공개 – AI 매터스 https://aimatters.co.kr/news-report/ai-news/2577
[3] Text-to-Image Generator Market Report | Global Forecast From 2025 … https://dataintelo.com/report/global-text-to-image-generator-market
[4] Top text-to-image AI models: Recraft V3, FLUX1, Stability AI – Swiftask https://www.swiftask.ai/blog/text-to-image-ai-models
[5] 문장 입력하면 2초 만에 뚝딱 이미지 만드는 기술개발 – 노벨사이언스 http://www.nobelscience.net/news/articleView.html?idxno=2079
[6] CogView4 오픈 소스 AI 모델, 텍스트-이미지 생성의 새로운 기준 제시 https://www.ctol-kr.com/news/cogview4-open-source-ai-text-to-image-benchmark/
[7] 최강 ‘타이포그래피’ 이미지 생성 모델 등장…’이디오그램’과 경쟁 구도 https://www.aitimes.com/news/articleView.html?idxno=169121
[8] [PDF] 초거대 AI 한눈에 보기 http://www.shinkim.com/newsletter/2023/GA/2023_vol210/links/2023_vol210_301.pdf
[9] [HWP] [과제계획서] 2022년 인공지능(AI) 기술 … – SBA 서울R&D지원센터 https://seoul.rnbd.kr/common/cm04o01_new.jsp?menuCd=m030100&seqNo=188&attNo=2
[10] 한국, AI 기술 분야에서 빠르고 지속적으로 성장하고 있어 https://www.sciencetimes.co.kr/news/%ED%95%9C%EA%B5%AD-ai-%EA%B8%B0%EC%88%A0-%EB%B6%84%EC%95%BC%EC%97%90%EC%84%9C-%EB%B9%A0%EB%A5%B4%EA%B3%A0-%EC%A7%80%EC%86%8D%EC%A0%81%EC%9C%BC%EB%A1%9C-%EC%84%B1%EC%9E%A5%ED%95%98%EA%B3%A0-%EC%9E%88/
답글 남기기