IT is Smart

텍스트마이닝 절차 Text Mining Process 본문

Case Study/Thinking

텍스트마이닝 절차 Text Mining Process

달인최선 2017. 12. 2. 21:06
반응형

텍스트마이닝 절차 간략정리 3단계
① 텍스트 수집 : 외부 소셜미디어, 인터넷카페, 언론매체, 블로그, 게시판 댓글, 포탈 등
② 텍스트 분석 : 분석엔진을 사용 Concept 키워드사전, Categorizer 총량 긍정/부정, Duplication Check,Text Miner 연관어 도출
③ 결과의 활용 : Dashboard, Insight Report, Social Consulting

 

텍스트마이닝 절차 정리 4단계
① 데이터 수집 : Crawling

② 어휘 추출 : 형태소분석, TF/DF 문서분해

③ 정보 추출 : 필요정보 추출

④ 정보 분석 : 빈도, 분류, 클러스터링(그룹핑), 컨셉링크(관계연결)

 

분석프로세스

① 텍스트 수집, 가공과 정제 과정
문법, 철자 등 오류가 포함된 원본 텍스트를 수집하여 분석목적에 맞게 가공/정재하는 프로세스이다.
ex..
재밌다. 잼있따. 재미나다 등 → '재미있다'

② 용어 추출 과정
분석문서와 단어 갯수 줄이기
단어별 빈도분석

③ 정보 추출 과정
텍스트 속 공통화제 추출
주제에 따라 관련규정, 문서항목 등
-
단일어 토픽
-
다중어 토픽
-
토픽 상관 관계

④ 정보분석

 

분석결과

① 워드 클라우드
② 컨셉링크
③ 군집분석
④ 로지스틱 회귀분석

반응형