일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- urllib
- 마이닝
- 매개변수
- 클린코드
- Request
- 인수
- 기초
- 데이터사이언티스트
- 시각화
- for
- 반복문
- 조건문
- Python
- 프로그래밍
- 파이썬3.5
- 입문
- 코딩교육
- if
- 파이썬
- 텍스트
- CRAWL
- 텍스트마이닝
- mysql
- Beautifulsoup
- 데이터
- 크롤링
- 함수
- Loop
- Pycharm
- Def
Archives
- Today
- Total
IT is Smart
텍스트마이닝이 어려운 이유 본문
반응형
어려운 점
① 해당언어에 대한 깊이있는 이해, 문화나 습관에 대한 이해가 필요하다.
② 문장과 문장 사이에 숨어 있는 정보를 이해하기 어렵다.
정보재료가 후보자 이름으로 검색한 결과를 모은 것일때
A 후보자와 관련된 내용이 90%이고 B 후보자에 대한 내용이 10%로 언급되었다면
그 기사는 누구의 기사일까?
③ 긍정적 견해와 부정적 견해의 정의는 무엇인가?
- 직접 분석 진행하는 것과 결과를 이해하는 것은 차원이 다른 일이다.
- 과정의 어려움을 잘 모른다. 결과에 대한 적절한 보상이 어렵다.
극복방안
① 타겟 도메인(대상)을 좁혀서 관심을 집중할 수 있게 한다.
② Context Analysis, Sentimental Analysis 기법 사용을 통한 보완
반응형
'Case Study > Thinking' 카테고리의 다른 글
텍스트마이닝 절차 Text Mining Process (0) | 2017.12.02 |
---|---|
빅데이터 플랫폼 Big Data Platform (0) | 2017.12.02 |
텍스트마이닝 필요 사례 (0) | 2017.11.13 |
데이터와 텍스트 Data & Text (2/2) (0) | 2017.11.13 |
데이터와 텍스트 Data & Text (1/2) (0) | 2017.11.12 |