박정규 멘토님

병렬로 작업을 진행하면 좋을 것 같다.

구글 크롬 내장 STT엔진을 활용해서 텍스트를 추출하고

해당 텍스트를 발음기호로 파싱한후 발음기호에 맞는 이미지를 매핑하자.

Levenshtein Distance 알고리즘을 이용하여 발음 정확도 측정
- 단어는 다르게 표현될 수 있지만, 발음기호는 비슷하게 표현되기 때문에 발음기호화 해서 이미지매핑을 하면 더 높은 정확도를 보일 것 같다.

필요한 환경

래퍼런스가 없다면 5개월

있다면 3개월 정도가 필요할 것 같다...