목록문화 (1)
IT is Smart
텍스트마이닝이 어려운 이유
어려운 점 ① 해당언어에 대한 깊이있는 이해, 문화나 습관에 대한 이해가 필요하다. ② 문장과 문장 사이에 숨어 있는 정보를 이해하기 어렵다. 정보재료가 후보자 이름으로 검색한 결과를 모은 것일때 A 후보자와 관련된 내용이 90%이고 B 후보자에 대한 내용이 10%로 언급되었다면 그 기사는 누구의 기사일까? ③ 긍정적 견해와 부정적 견해의 정의는 무엇인가? - 직접 분석 진행하는 것과 결과를 이해하는 것은 차원이 다른 일이다. - 과정의 어려움을 잘 모른다. 결과에 대한 적절한 보상이 어렵다. 극복방안 ① 타겟 도메인(대상)을 좁혀서 관심을 집중할 수 있게 한다. ② Context Analysis, Sentimental Analysis 기법 사용을 통한 보완
Case Study/Thinking
2017. 11. 13. 06:00