[데이터 구축]영유아 발음 교정 서비스를 위한 립리딩 음성 인식 데이터 구축

2024-07-25


프로젝트 개요

  • 프로젝트 명: 영유아 발음 교정 서비스를 위한 립리딩 음성 인식 데이터 구축 프로젝트

  • 데이터 출처: 직접 수집 데이터

  • 납품형태: JSON



고객사가 겪은 문제사항

해당 프로젝트는 영유아의 입 모양과 음성을 분석하여 발음 교정 AI서비스를 위한 립리딩 데이터 구축 프로젝트입니다.

고객사는 다양한 연령대의 영유아 립리딩 데이터가 필요했습니다. 그러나 6세에서 12세 사이의 영유아 약 200명을 대상으로 다양한 방향에서 촬영한 데이터를 확보하는 것에 어려움이 있었습니다. 또한, 수집된 데이터를 고품질 립리딩 데이터로 정제하고 가공하는것에 대해 어려움을 겪었습니다.



프로젝트 요청 사항

  • 영유아 스크립트 추출하여 음성 발화 진행
  • mp4 형식의 다양한 방향으로 영유아 립리딩 수집
  • 발화 내용 전사 및 정제
  • wav 형식의 음성 파일 별도 추출
  • mp4영상과 wav 음성 데이터 일치 가공작업 필요



젠데이터 해결 방안

데이터 수집

영유아 추천도서에서 AI모델 학습에 필요한 스트립트를 추출하여, 영유아 약 200명을 대상으로 음성 발화 촬영을 통해 수집 진행하였습니다.

발화자의 얼굴을 다양한 방향에서 촬영하여 총 900건의 영유아 립리딩 수집했습니다. 

쾌적한 장소 제공과 운영 노하우를 통해서 아동들의 참여율을 높이고 이를 통해 고품질 원천 데이터를 확보하였습니다.



데이터 정제

수집된 데이터의 발화 내용을 전사하여 오류부분을 체크하고 메타데이터 태깅을 통해 데이터 정제 했습니다. 

평균 11개 문장을 기준으로 총 약 2,000건의 문장 전사했습니다.



데이터 가공

젠데이터에서 보유한 어노테이션 툴을 사용하여, 정제된 데이터를 기반으로 발화자의 mp4형식 립리딩 촬영 영상과 wav형식 음성 데이터가 일치되도록 가공 하였습니다.



프로젝트 결과

이번 프로젝트에서 영유아 참여자를 성공적으로 모집한 사례입니다. 영유아의 민감한 개인정보 보호와 법적규제로 인하여 영유아 데이터를 확보하는 건 매우 어려운 프로젝트입니다. 그러나 젠데이터는 다양한 AI프로젝트를 수행하며 쌓아온 노하우를 통해 영유아 데이터를 성공적으로 수집 하였으며, 데이터 정제 및 가공 작업을 통해 고품질 데이터셋을 확보 했습니다. 

이 과정에서 법적 문제가 발생하지 않도록 부모님 동의 및 제3자 제공 동의서, 초상권 동의서 등을 작성하여 고객사에게 전달하여 성공적으로 프로젝트를 마무리했습니다.


감사합니다.

상호명: (주)젠데이터   ㅣ 사업자번호 : 449-87-02752 

T. 070-4895-5550 ㅣ  E. info@gendata.kr
본사. 광주광역시 동구 금남로 193-22,

광주에이아이창업캠프 3층 308호


연구소. 서울특별시 금천구 가산디지털1로 84

에이스하이엔드타워8차 3층 310호


COPYRIGHT ⓒ (주)젠데이터 ALL RIGHT RESERVED

상호명: (주)젠데이터 ㅣ 사업자번호 : 449-87-02752 | T. 070-4895-5550 ㅣ E. info@gendata.kr
본사. 광주광역시 동구 금남로 193-22, 광주에이아이창업캠프 3층 308호

연구소. 서울특별시 금천구 가산디지털1로 84 에이스하이엔드타워8차 3층 310호
COPYRIGHT ⓒ (주)젠데이터 ALL RIGHT RESERVED