IT is Smart
텍스트마이닝이 어려운 이유 본문
반응형
어려운 점
① 해당언어에 대한 깊이있는 이해, 문화나 습관에 대한 이해가 필요하다.
② 문장과 문장 사이에 숨어 있는 정보를 이해하기 어렵다.
정보재료가 후보자 이름으로 검색한 결과를 모은 것일때
A 후보자와 관련된 내용이 90%이고 B 후보자에 대한 내용이 10%로 언급되었다면
그 기사는 누구의 기사일까?
③ 긍정적 견해와 부정적 견해의 정의는 무엇인가?
- 직접 분석 진행하는 것과 결과를 이해하는 것은 차원이 다른 일이다.
- 과정의 어려움을 잘 모른다. 결과에 대한 적절한 보상이 어렵다.
극복방안
① 타겟 도메인(대상)을 좁혀서 관심을 집중할 수 있게 한다.
② Context Analysis, Sentimental Analysis 기법 사용을 통한 보완
반응형
'Case Study > Thinking' 카테고리의 다른 글
텍스트마이닝 절차 Text Mining Process (0) | 2017.12.02 |
---|---|
빅데이터 플랫폼 Big Data Platform (0) | 2017.12.02 |
텍스트마이닝 필요 사례 (0) | 2017.11.13 |
데이터와 텍스트 Data & Text (2/2) (0) | 2017.11.13 |
데이터와 텍스트 Data & Text (1/2) (0) | 2017.11.12 |