박정규 멘토님
병렬로 작업을 진행하면 좋을 것 같다.
- 모델링
- 텍스트 파싱 → 이미지 매핑
- 이거는 구글 STT 엔진을 활용해서 테스트 해보면 좋을 듯
구글 크롬 내장 STT엔진을 활용해서 텍스트를 추출하고
해당 텍스트를 발음기호로 파싱한후 발음기호에 맞는 이미지를 매핑하자.
- Levenshtein Distance 알고리즘을 이용하여 발음 정확도 측정
- 단어는 다르게 표현될 수 있지만, 발음기호는 비슷하게 표현되기 때문에 발음기호화 해서 이미지매핑을 하면 더 높은 정확도를 보일 것 같다.
필요한 환경
래퍼런스가 없다면 5개월
있다면 3개월 정도가 필요할 것 같다...