일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 크롤링
- 조건문
- Beautifulsoup
- 매개변수
- 함수
- 데이터사이언티스트
- Loop
- 텍스트마이닝
- 마이닝
- CRAWL
- Request
- if
- Python
- 파이썬3.5
- Def
- mysql
- 입문
- 데이터
- 텍스트
- for
- 반복문
- 시각화
- 파이썬
- 코딩교육
- 프로그래밍
- urllib
- 기초
- 클린코드
- 인수
- Pycharm
- Today
- Total
IT is Smart
텍스트마이닝 필요 사례 본문
지금은 거의 모든 상품을 온라인에서 살 수 있다.
구매자가 해당 상품을 살지 말지 결정하는데 있어서 기존의 구매리뷰는 매우 중요한 영향을 준다.
구매자는 판매자가 제공하는 정보보다 다른 고객이 제공하는 정보를 더 객관적이라고 판단하고 신뢰한다. 그래서 제품리뷰 점수는 판매량의 증가로 이어지기도 한다.
하지만, 한번이라도 인터넷으로 물건을 구매해본 사람이라면 제품의 종류가 다양하고 고객리뷰도 너무 많아서 혼란을 느낀 적이 있을 것이다. 정보가 너무 많아서 도리어 구입하려고 했던 제품의 모든 리뷰를 읽고 장단점을 파악하기가 힘들어진 것이다.
결국 온라인 쇼핑몰 사이트에서는 고객이 리뷰를 다시 평가하는 투표시스템을 적용했다.
긍정적이라는 평가를 많이 받은 리뷰를 표시해 줌으로써 고객이 좋은 리뷰와 나쁜 리뷰를 구별할 수 있게 해준 것이다.
하지만 이런 투표시스템의 결과는 어떤 신빙성의 근거도 제시하지 않기 때문에 새로운 기법이 다시 연구되고 있다.
텍스트마이닝을 리뷰분석에 적용하는 사례이다.
리뷰의 길이가 길면 리뷰의 내용이 긍정적인 내용이건, 부정적인 내용이건 간에 일반적으로 '의미있는' 리뷰라고 판단할 수 있다.
또 리뷰를 작성하는 고객의 과거구매이력이나 리뷰평가를 통해 이번 리뷰도 신뢰할 만한지를 판단할 수 있을 것이다.
이 2가지 판단을 정황적 판단이라고 할 수 있다.
또 리뷰 내용 자체를 분석해서 사용된 단어를 통해 장점을 언급한 것인지, 단점을 언급한 것인지 추정할 수 있다.
리뷰가 등록된지 얼마나 지났는지, 단어수나 문장의 길이가 긴지 짧은지 등을 요소들로 각각의 리뷰에 다른 가중치를 줄 수도 있다. 이런 판단은 의미적 판단이라고 할 수 있다.
이와 같은 리뷰분석기법은 온라인쇼핑몰의 제품리뷰에도 적용될 수 있고, 영화리뷰나 책리뷰에도 적용할 수 있다.
또 Q&A게시판에도 적용해서 비슷한 질문을 찾아서 자주하는 질문을 묶어서 FAQ로 만들 수도 있고 유사한 질문에 자동으로 답변하는 시스템으로도 구현할 수 있다.
이런 방법은 별도의 설문조사를 진행하는 비용을 절감하고, 별도의 조사과정을 거치지 않고도 실시간으로 의사결정을 할 수 있게 해준다.
'Case Study > Thinking' 카테고리의 다른 글
빅데이터 플랫폼 Big Data Platform (0) | 2017.12.02 |
---|---|
텍스트마이닝이 어려운 이유 (0) | 2017.11.13 |
데이터와 텍스트 Data & Text (2/2) (0) | 2017.11.13 |
데이터와 텍스트 Data & Text (1/2) (0) | 2017.11.12 |
소셜 네트워크 분석 Social Network Analysis (0) | 2017.11.11 |