뉴노멀 시대를 맞이하면서, 라이브 커머스 시장은 2023년까지 약 10조 시장으로 성장하는 추세를 보이고 있습니다.[그림1] 그러나 라이브 커머스는 기존 홈쇼핑 방송과 달리 시청자와 쌍방향 소통이 이뤄져야 한다는 특징을 가지고 있습니다. 하지만 기존의 홈쇼핑에 익숙한 호스트들이 새로운 환경에 익숙치 못한체 투입되는 게 현실입니다.
위 문제점 해결을 위해 실시간 채팅을 딥러닝 모델이 분석하여 , 그날의 반응 보고서를 호스트들에게 제공하고자합니다.
또한, 아직 규제의 사각지대에 놓여있다보니, 욕설·음란·사기 등 범죄 혐의가 의심되는 경우에만 사후 제재가 가해질 뿐 많은 변수가 존재하고 있습니다. 이러한 문제점은 궁극적으로 매출 저하로 이어질 수 있기때문에 문제를 해결하기 위한 욕설, 혐오발언 탐지 딥러닝 모델을 제공하고자 합니다.
그림1. 라이브커머스 시장 전망
기존 방식의 한계
기존의 한계점 | |
---|---|
넥슨 NDC(18.7) | 자신들이 만든 Test set에 대해서만 유효함 |
네이버 클린봇(21.11) | 모든 데이터를 마스킹해버림. 동향 파악 불가 [그림2] |
룰베이스 기반 | 의미론적 욕설을 잡아내기 어려움 (e.g. 너희 어머니는 살아 계시니?) |
직접 댓글 반응 탐지 | 사람을 고용해 일일이 수작업으로 체크해야함 |
그림2. 네이버 클린봇
판매자에게 통계 데이터를 제공함으로 인한 플랫폼 점유율 상승
사회적 윤리 문제 감소
그림3. 작업 흐름도
그림4. 프로토타입 흐름 (욕설, 보고서)