일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Python
- 텍스트마이닝
- 데이터
- 클린코드
- Loop
- 인수
- 반복문
- 프로그래밍
- mysql
- Def
- 텍스트
- Pycharm
- CRAWL
- 함수
- Request
- 데이터사이언티스트
- urllib
- 코딩교육
- 파이썬
- 크롤링
- Beautifulsoup
- for
- 파이썬3.5
- 매개변수
- 조건문
- 시각화
- 마이닝
- 입문
- 기초
- if
Archives
- Today
- Total
IT is Smart
텍스트마이닝 절차 Text Mining Process 본문
반응형
텍스트마이닝 절차 간략정리 3단계
① 텍스트 수집 : 외부 소셜미디어, 인터넷카페, 언론매체, 블로그, 게시판
댓글, 포탈 등
② 텍스트 분석 : 분석엔진을 사용 Concept 키워드사전, Categorizer 총량 긍정/부정, Duplication Check,Text Miner 연관어 도출
③ 결과의 활용 : Dashboard, Insight Report, Social Consulting
등
텍스트마이닝 절차 정리 4단계
① 데이터 수집 : Crawling
↓
② 어휘 추출 : 형태소분석, TF/DF 문서분해
↓
③ 정보 추출 : 필요정보 추출
↓
④ 정보 분석 : 빈도, 분류, 클러스터링(그룹핑), 컨셉링크(관계연결) 등
분석프로세스
① 텍스트 수집, 가공과 정제 과정
문법, 철자 등 오류가 포함된 원본 텍스트를 수집하여 분석목적에 맞게 가공/정재하는 프로세스이다.
ex.. 재밌다. 잼있따. 재미나다 등 → '재미있다'로
② 용어 추출 과정
분석문서와 단어 갯수 줄이기
단어별 빈도분석
③ 정보 추출 과정
텍스트 속 공통화제 추출
주제에 따라 관련규정, 문서항목 등
- 단일어 토픽
- 다중어 토픽
- 토픽 상관 관계
④ 정보분석
분석결과
① 워드 클라우드
② 컨셉링크
③ 군집분석
④ 로지스틱 회귀분석
반응형
'Case Study > Thinking' 카테고리의 다른 글
빅데이터 플랫폼 Big Data Platform (0) | 2017.12.02 |
---|---|
텍스트마이닝이 어려운 이유 (0) | 2017.11.13 |
텍스트마이닝 필요 사례 (0) | 2017.11.13 |
데이터와 텍스트 Data & Text (2/2) (0) | 2017.11.13 |
데이터와 텍스트 Data & Text (1/2) (0) | 2017.11.12 |