Life Logs

  • OCR 기술 도입 비용 분석 보고서

    1. 도입 방식별 비용 구조

    상용 소프트웨어 도입

    • 단일 사용자 라이선스: 100만원 ~ 500만원
    • 기업용 라이선스: 1,000만원 ~ 5,000만원
    • 사용자 수와 처리량에 따라 비용 변동
    • 연간 갱신 비용 발생 (통상 구매가의 20~30%)

    자체 개발 시스템 구축

    개발 기간 1년 기준, 대규모 프로젝트 비용:

    A. 인력 비용 (9.45억원)

    • 소프트웨어 엔지니어 (5명): 5.5억원
    • 1인당 연봉 평균 1.1억원
    • 데이터 사이언티스트 (2명): 2.7억원
    • 1인당 연봉 평균 1.35억원
    • 프로젝트 매니저 (1명): 1.25억원

    B. 인프라 구축 비용 (2.25억원)

    • 클라우드 서비스: 9,000만원/년
    • 월 평균 750만원 (컴퓨팅, 스토리지 포함)
    • 온프레미스 서버: 1.25억원
    • 하드웨어 구입 및 1년 유지보수 비용

    C. 데이터 처리 비용 (4억원)

    • 데이터 수집 및 레이블링: 2.5억원
    • 모델 학습 및 테스트: 1.5억원

    D. 유지보수 비용 (1.15억원/년)

    • 시스템 유지보수: 7,500만원
    • 사용자 지원: 4,000만원

    2. 총 소요 비용 (1년 기준)

    대규모 자체 개발 프로젝트

    • 총 예상 비용: 16.85억원
    • 초기 개발 비용: 15.7억원
    • 연간 운영 비용: 1.15억원

    중규모 프로젝트

    • 예상 비용: 5억원 ~ 20억원
    • 커스터마이징 정도
    • 통합 시스템 규모에 따라 변동

    소규모 프로젝트

    • 예상 비용: 500만원 ~ 5,000만원
    • 상용 소프트웨어 도입
    • 최소한의 커스터마이징

    3. 비용 절감 전략

    단기적 접근

    1. 상용 솔루션 시범 도입 후 단계적 확장
    2. 클라우드 서비스 활용으로 초기 인프라 비용 절감
    3. 오픈소스 솔루션 (예: Tesseract) 활용

    장기적 접근

    1. 하이브리드 방식 채택 (상용 + 자체 개발)
    2. 단계적 기능 확장으로 리스크 관리
    3. 정부 지원 사업 활용

    4. 투자 회수 기간 추정

    • 소규모 프로젝트: 6개월 ~ 1년
    • 중규모 프로젝트: 1년 ~ 2년
    • 대규모 프로젝트: 2년 ~ 3년

    위 비용은 2024년 2월 기준 추정치이며, 프로젝트의 구체적인 요구사항과 환경에 따라 조정이 필요할 수 있습니다.

    12억으로 진행해 본 결과, 손글 씨 및 조도, 문서상태, 형태, 문서의 구부러짐, 빛 굴절, 노이즈, 해상도 등… 사람이 직접 보는 수준의 OCR 기술은 아직 갈 길이 남았다는 결론에 이르렀습니다.