IT is Smart
텍스트마이닝 절차 Text Mining Process 본문
반응형
텍스트마이닝 절차 간략정리 3단계
① 텍스트 수집 : 외부 소셜미디어, 인터넷카페, 언론매체, 블로그, 게시판
댓글, 포탈 등
② 텍스트 분석 : 분석엔진을 사용 Concept 키워드사전, Categorizer 총량 긍정/부정, Duplication Check,Text Miner 연관어 도출
③ 결과의 활용 : Dashboard, Insight Report, Social Consulting
등
텍스트마이닝 절차 정리 4단계
① 데이터 수집 : Crawling
↓
② 어휘 추출 : 형태소분석, TF/DF 문서분해
↓
③ 정보 추출 : 필요정보 추출
↓
④ 정보 분석 : 빈도, 분류, 클러스터링(그룹핑), 컨셉링크(관계연결) 등
분석프로세스
① 텍스트 수집, 가공과 정제 과정
문법, 철자 등 오류가 포함된 원본 텍스트를 수집하여 분석목적에 맞게 가공/정재하는 프로세스이다.
ex.. 재밌다. 잼있따. 재미나다 등 → '재미있다'로
② 용어 추출 과정
분석문서와 단어 갯수 줄이기
단어별 빈도분석
③ 정보 추출 과정
텍스트 속 공통화제 추출
주제에 따라 관련규정, 문서항목 등
- 단일어 토픽
- 다중어 토픽
- 토픽 상관 관계
④ 정보분석
분석결과
① 워드 클라우드
② 컨셉링크
③ 군집분석
④ 로지스틱 회귀분석
반응형
'Case Study > Thinking' 카테고리의 다른 글
빅데이터 플랫폼 Big Data Platform (0) | 2017.12.02 |
---|---|
텍스트마이닝이 어려운 이유 (0) | 2017.11.13 |
텍스트마이닝 필요 사례 (0) | 2017.11.13 |
데이터와 텍스트 Data & Text (2/2) (0) | 2017.11.13 |
데이터와 텍스트 Data & Text (1/2) (0) | 2017.11.12 |