목록CSE/캡스톤디자인 (2)
밍경송의 E.B
[졸업프로젝트] 리액트- 텍스트를 MP3파일로 변환하고 이를 순차적으로 재생하는 기능의 구현
졸업 프로젝트로 라는 보이스 위로 전달 감성 웹서비스를 기획 및 개발하게 됐습니다.저는 기획/디자인 및 프론트로 참여하였고, 리액트를 이용해 개발을 진행했습니다. 이번 글에서는 텍스트 댓글을 댓글 작성자의 가상보이스와 합성하여 MP3 파일 형태로 만들고, 이것을 유저에게 순차적으로 재생해주는 기능을 구현하는 방법에 대해 다루고자 합니다. 자세한 서비스 내용은 생략하겠습니다. 목표 : 유저가 작성한 게시글을 음반처럼 보여주고 보이스 댓글을 음악처럼 들려주기감성 웹 서비스인 만큼, 디자인에 신경을 더 쓰려고 노력했습니다. 청각과 관련이 깊은 서비스인 만큼, 게시글 하나를 LP판처럼 나타내고 싶어서! 저작권이 없는 감성적인 이미지 약 10개를 찾아서 백에 넘겨주고 이미지 URL을 응답으로 넘겨받도록 했습니다..
CSE/캡스톤디자인
2024. 5. 21. 22:45
End-to-End TTS(Text-To-Speech)의 이해
감자인 상태로 졸업프로젝트에 던져진 3망년..! 첫 대면 팀플을 했던 동기들이랑 졸업프로젝트까지 함께하게 되었숩니다. 인공지능의 ㅇ자도 모르는 제가 .! TTS 기술을 활용한 프로젝트를 기획하게 되었습니다. TTS에 대해서 아는 것이 없기 때문에 기본적인 공부가 필요했는데요. 많은 TTS 모델들 중 최신 모델이면서 성능이 뛰어난 VITS2 모델에 관한 논문을 읽으며 음성 분야에 대한 기본 지식을 쌓고자 했습니다. 아래는 제가 읽은 논문의 제목과 저자, 그리고 논문의 원본입니다. 모든 내용의 저작권과 출처는 아래 논문에 있음을 밝힙니다. ..
CSE/캡스톤디자인
2023. 11. 24. 17:21