NVIDIA FrameView

그래픽 성능을 논할 때 여전히 평균 FPS만으로 결론을 내리는 경우가 많다. 그러나 실제 체감은 평균이 아니라 프레임 타임 분포(퍼센타일), PC Latency(지연), 그리고 동일 성능을 얼마나 적은 전력으로 내는지, 즉 **성능 대 전력 효율(Perf-Per-Watt)**에 의해 좌우된다. 이러한 핵심 지표를 실시간 오버레이와 로그로 동시에 수집·분석하기 위해 NVIDIA가 제공하는 도구가 FrameView다. FrameView는 앱 형태로 배포되지만, 내부적으로 PresentMon 기반의 프레임 이벤트 수집드라이버/API를 통한 전력·클럭 텔레메트리를 결합해 동작한다. 결과적으로 DX9~12, Vulkan, OpenGL, UWP까지 폭넓은 렌더링 경로에서 낮은 오버헤드로 측정이 가능하다. (NVIDIA Images)

FrameView가 수집하는 것과 “작동 원리”의 핵심

FrameView는 두 층위의 데이터를 합친다.

  1. 프레임 타이밍·지연(PC Latency)
    Windows의 Present 이벤트 계열을 추적하는 PresentMon을 통해, 렌더링·디스플레이 스케줄링 지표(프레임 타임, 1%/0.1% Low, Rendered FPS vs Displayed FPS 등)를 가져온다. 일부 타이틀은 **PC Latency(‘OS가 클릭을 처리한 시점부터 완성된 프레임이 디스플레이로 넘어가기까지’)**를 노출하는 PCL Stats/Latency Markers를 지원하며, 이 경우 추가 하드웨어 없이 FPS와 PC Latency를 동시 기록할 수 있다. (NVIDIA Images)
  2. 전력·클럭·온도(텔레메트리)
    전력과 클럭, 온도는 공개 API를 통해 수집한다. NVIDIA GPU의 경우 **칩 전력(GPU-only)**과 **보드 전력(Total Board Power/TGP)**까지 **드라이버 API(NVAPI)**로 구분 기록할 수 있어 Perf-Per-Watt(F/J) 산출이 정밀하다. 반면 AMD는 공개 API가 칩/보드 전력을 명확히 분리하지 못해 보드 전력 및 PPW 비교가 부정확할 수 있으며, 이때는 PCAT 같은 하드웨어 인서포저를 병행해야 정확한 보드 전력/PPW 비교가 가능하다. (NVIDIA Images)

정리하면, FrameView는 PresentMon(프레임 이벤트) + **드라이버 API(전력·클럭)**의 이중 수집으로 지연·프레임 품질·전력 효율을 한 화면과 한 로그로 엮어낸다. NVIDIA는 이를 **“최소 오버헤드로의 정확한 측정”**을 표방한다. (NVIDIA)

주요 지표를 제대로 해석하는 방법

  • Average FPS vs Percentile FPS(1%/0.1% Low)
    평균 FPS가 동일해도 1% Low가 낮으면 마이크로스턴터가 체감된다. 리뷰·튜닝에서는 평균과 함께 1% Low를 항상 함께 보아야 한다. FrameView는 퍼센타일까지 오버레이/로그에 기본 제공한다. (NVIDIA Images)
  • Rendered FPS vs Displayed FPS
    렌더링 파이프라인 어디에서 병목이 일어나는지 파악할 때 중요하다. 예컨대 V-Sync/VRR 조건, 큐잉, 디스플레이 스케줄링의 영향으로 렌더링된 프레임과 실제 디스플레이된 프레임이 달라질 수 있다. FrameView는 두 지표를 분리해 표기한다. (NVIDIA Images)
  • PC Latency(지연)
    지원 타이틀에서 클릭 처리 → 프레임 완료·전송 사이의 순수 PC 지연을 수치화한다(마우스·디스플레이 지연은 제외). Reflex 활성화 등 설정 변경이 FPS가 큰 차이 없이도 체감 응답성을 개선하는지 즉시 확인 가능하다. (NVIDIA Images)
  • Perf-Per-Watt(F/J)
    성능을 전력으로 나눈 효율 지표다. 동일 FPS라면 전력이 낮을수록 유리하다. NVIDIA GPU는 칩 전력·보드 전력을 사실상 소프트웨어만으로 분해 기록할 수 있어 PPW 비교 신뢰도가 높다. AMD 비교 시에는 PCAT 등 하드웨어 계측 병행을 권장한다. (NVIDIA Images)

실무 벤치마크 워크플로(권장 절차)

  1. 측정 환경 고정
    전원 계획(고성능), 백그라운드 앱, 드라이버/OS 버전, 그래픽 옵션·해상도를 고정한다. 가능하면 오버레이는 벤치 구간에서 숨김 처리해 오버헤드를 최소화한다. FrameView는 핫키로 벤치 시작 시 오버레이를 자동 숨김 처리한다. (NVIDIA Images)
  2. 벤치 시나리오 재현성 확보
    타이틀 내장 벤치나 동일 동선의 캡처를 3회 이상 반복하고, 요약 파일 + CSV 로그를 함께 보관한다. FrameView는 실행마다 타임스탬프 기반 파일을 생성해 관리가 쉽다. (NVIDIA Images)
  3. 퍼센타일·지연·전력 동시 검토
    평균 FPS만 보지 말고 1% Low, PC Latency, GPUOnlyPwr/TotalBoardPwr를 함께 차트화한다. 지연이 낮으면서 1% Low가 높은 구성이 체감 최적점이다. (NVIDIA Images)
  4. 멀티벤더 비교 시 유의
    NVIDIA↔AMD **전력·PPW의 ‘정확 비교’**는 공개 API 한정으로는 한계가 있다. 하드웨어 인서포저(예: PCAT) 로그를 병행해 동일 조건에서 보드 전력을 계측하면 결론의 신뢰도를 높일 수 있다. (NVIDIA Images)

FrameView와 PresentMon을 직접 쓰는 경우의 선택지

  • 바로 쓰는 도구가 필요하다면 FrameView 앱을 설치해 오버레이·로그를 즉시 활용하는 것이 가장 빠르다. NVIDIA는 공식 페이지에서 PresentMon을 분석 백엔드로 활용한다고 명시한다. (NVIDIA)
  • 임베디드/자동화 파이프라인이 필요하면, **PresentMon(오픈소스)**을 독립적으로 호출해 프레임 타이밍·지연 데이터를 수집하고, 전력·클럭은 드라이버 API(NVAPI/NVML 등) 또는 시스템 인터페이스로 보완하는 구성이 일반적이다. PresentMon은 멀티 API·UWP 앱까지 폭넓게 동작하는 표준급 수집기다. (GitHub)

흔한 오해와 실전 팁

  • “평균 FPS가 같으니 체감도 같을 것이다”는 오해
    1%/0.1% Low가 낮고 프레임 타임 분산이 크면, 동일 평균에서도 끊김 체감이 커진다. 리뷰나 최적화 레포트에 퍼센타일과 분포를 반드시 포함해야 한다. (NVIDIA Images)
  • “지연은 별도 장비가 있어야 측정된다”는 오해
    지원 타이틀의 PC Latency 통계(PCL Stats)와 Latency Markers 덕분에, 하드웨어 없이도 PC 지연을 측정할 수 있다. Reflex 설정 변화에 따른 응답성 차이도 수치로 비교 가능하다. (NVIDIA Images)
  • “전력은 소프트웨어로 모두 정확히 잴 수 있다”는 오해
    NVIDIA는 칩/보드 전력을 소프트웨어만으로 꽤 정확하게 구분 기록할 수 있지만, 벤더 간 절대 비교 정확도를 확보하려면 PCAT 등 하드웨어 계측을 병행하는 것이 안전하다. 특히 AMD 보드 전력 비교는 공개 API만으로는 정확하지 않다는 점을 공식 문서가 분명히 밝힌다. (NVIDIA Images)

마무리: 측정 문화의 표준화

FrameView는 FPS·퍼센타일·지연·전력동일 타임라인에서 수집해, 체감과 수치 간의 간극을 메워 준다. 측정 오버헤드를 억제하고(벤치 시 오버레이 자동 숨김), CSV/요약 파일로 결과를 남겨 회귀 테스트와 보고서 자동화를 단순화한다. PresentMon 기반 프레임 분석 + 드라이버 API 전력 텔레메트리라는 접근은, 요란한 벤치 대신 재현성과 설명 가능한 지표를 중시하는 최신 성능/전력 평가 흐름에 부합한다. (NVIDIA Images)


참고 문서

  • NVIDIA, FrameView App 개요·릴리스 노트: PresentMon을 백엔드로 사용함을 명시. (NVIDIA)
  • NVIDIA, FrameView 1.4 User Guide: PC Latency 정의, 오버레이·로그 항목, NVIDIA/AMD 전력 계측 차이, PCAT 연동 등 상세. (NVIDIA Images)
  • Intel, PresentMon 저장소·사이트: 멀티 API 지원 프레임 타이밍/지연 수집 도구. (GitHub)
  • NVIDIA, FrameView Power & Performance Benchmarking 안내: 40+ 지표 수집, 데이터 분석 워크플로. (NVIDIA)

코멘트

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다