일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- Python
- 시각화
- 프로그래밍
- 데이터
- 파이썬
- for
- 파이썬3.5
- Beautifulsoup
- Pycharm
- 데이터사이언티스트
- 조건문
- Def
- 클린코드
- mysql
- 함수
- 인수
- 입문
- 반복문
- 매개변수
- 텍스트마이닝
- urllib
- 기초
- 텍스트
- 크롤링
- CRAWL
- 마이닝
- if
- 코딩교육
- Loop
- Request
- Today
- Total
목록비정형 (2)
IT is Smart
텍스트마이닝은 텍스트 형태로 이루어진 비정형 데이터를 자연어처리 방식을 이용하여 정보를 추출하는 기법입니다. 텍스트마이닝을 활용하면 텍스트 정보에서 문맥을 파악하고 텍스트 간 연계를 분석하는 등 비정형화된 문서에서 정보를 얻을 수 있다는 장점이 있습니다. 텍스트마이닝은 비정형 데이터에서 특정 키워드나 문맥을 기반으로 의미를 추출해 내는 기법을 의미합니다. 텍스트마이닝은 웹문서에서 키워드와 매칭되는 단어를 찾아 인덱싱하는 검색 기법에서 발전되어 왔으며, 점차 데이터의 숨은 맥락을 파악하는데 활용되고 있습니다. 특히 텍스트마이닝이 두드러지는 분야는 뉴스기사 분석으로, 기사에서 특정 단어와 관련된 논조를 분석하는데 활용된 사례가 있습니다. 텍스트마이닝은 주로 작성이 완료된 뉴스기사나 잡지 등을 분석하는데 활용..
인터넷과 스마트폰이 보급되면서 세상에는 그 어느때 보다 많은 정보가 생겨나고 있습니다. 기하급수적으로 늘어나는 정보에서 중요한 정보와 중요하지 않은 정보를 구분하는 것이 무어보다 중요한 일이 되었습니다. 정보는 크게 정형화된 데이터와 정형화되지 않은 데이터로 구분됩니다. 데이터를 반복해서 사용할 목적으로 일정한 형식으로 구조화한 데이터를 정형화데이터(Structured Data)라고 합니다. 정형화된 데이터에서 정보를 찾는 방법을 데이터마이닝(Data Mining)이라고 하는데 현재 가장 많이 사용하는 데이터베이스 시스템과 정보분류체계에 활용되고 있습니다. 비정형데이터는 그림이나 사진 같은 이미지나 동영상, 텍스트문서처럼 형태와 구조가 다른 구조화 되지 않은 데이터를 말합니다. 책, 음성 정보, 영상 정..