1. 도입 방식별 비용 구조
상용 소프트웨어 도입
- 단일 사용자 라이선스: 100만원 ~ 500만원
- 기업용 라이선스: 1,000만원 ~ 5,000만원
- 사용자 수와 처리량에 따라 비용 변동
- 연간 갱신 비용 발생 (통상 구매가의 20~30%)
자체 개발 시스템 구축
개발 기간 1년 기준, 대규모 프로젝트 비용:
A. 인력 비용 (9.45억원)
- 소프트웨어 엔지니어 (5명): 5.5억원
- 1인당 연봉 평균 1.1억원
- 데이터 사이언티스트 (2명): 2.7억원
- 1인당 연봉 평균 1.35억원
- 프로젝트 매니저 (1명): 1.25억원
B. 인프라 구축 비용 (2.25억원)
- 클라우드 서비스: 9,000만원/년
- 월 평균 750만원 (컴퓨팅, 스토리지 포함)
- 온프레미스 서버: 1.25억원
- 하드웨어 구입 및 1년 유지보수 비용
C. 데이터 처리 비용 (4억원)
- 데이터 수집 및 레이블링: 2.5억원
- 모델 학습 및 테스트: 1.5억원
D. 유지보수 비용 (1.15억원/년)
- 시스템 유지보수: 7,500만원
- 사용자 지원: 4,000만원
2. 총 소요 비용 (1년 기준)
대규모 자체 개발 프로젝트
- 총 예상 비용: 16.85억원
- 초기 개발 비용: 15.7억원
- 연간 운영 비용: 1.15억원
중규모 프로젝트
- 예상 비용: 5억원 ~ 20억원
- 커스터마이징 정도
- 통합 시스템 규모에 따라 변동
소규모 프로젝트
- 예상 비용: 500만원 ~ 5,000만원
- 상용 소프트웨어 도입
- 최소한의 커스터마이징
3. 비용 절감 전략
단기적 접근
- 상용 솔루션 시범 도입 후 단계적 확장
- 클라우드 서비스 활용으로 초기 인프라 비용 절감
- 오픈소스 솔루션 (예: Tesseract) 활용
장기적 접근
- 하이브리드 방식 채택 (상용 + 자체 개발)
- 단계적 기능 확장으로 리스크 관리
- 정부 지원 사업 활용
4. 투자 회수 기간 추정
- 소규모 프로젝트: 6개월 ~ 1년
- 중규모 프로젝트: 1년 ~ 2년
- 대규모 프로젝트: 2년 ~ 3년
위 비용은 2024년 2월 기준 추정치이며, 프로젝트의 구체적인 요구사항과 환경에 따라 조정이 필요할 수 있습니다.
12억으로 진행해 본 결과, 손글 씨 및 조도, 문서상태, 형태, 문서의 구부러짐, 빛 굴절, 노이즈, 해상도 등… 사람이 직접 보는 수준의 OCR 기술은 아직 갈 길이 남았다는 결론에 이르렀습니다.