IT is Smart

5.6 파이썬 파일럿 프로젝트 - 심플 텍스트 분석기 제작 본문

Programming/Python for Beginners

5.6 파이썬 파일럿 프로젝트 - 심플 텍스트 분석기 제작

달인최선 2017. 11. 5. 06:57
반응형

1. 파이썬 소개, Introduction to Python

2. 파이썬의 특징, Features of Python (1/2)

2. 파이썬의 특징, Features of Python (2/2)

3. 파이썬 설치하기, Python Setup

3.1 파이썬 버전 선택하기, Select Python version

3.2 OS Bit 버전 선택하기, Select OS Bit

3.3 설치파일 형태 선택하기, Select Setup File

3.4 설치하기, Setup (1/2)

3.4 설치하기, Setup (2/2)

4.1 파이썬 Interactive Shell 사용하기 (1/3)

4.1 파이썬 Interactive Shell 사용하기 (2/3)

4.1 파이썬 Interactive Shell 사용하기 (3/3)

4.2 파이썬 File Editor 사용하기

4.2 파이썬 File Editor 사용하기-주석처리

4.2 파이썬 File Editor 사용하기-출력하기

4.2 파이썬 File Editor 사용하기-입력받기

4.2 파이썬 File Editor 사용하기-입력값 출력하기

4.2 파이썬 File Editor 사용하기-str(), int(), float() 함수 사용하기

4.3 파이썬 프로그램 만들어보기

4.3 파이썬 프로그램 만들어보기-if문

4.3 파이썬 프로그램 만들어보기-while문

4.3 파이썬 프로그램 만들어보기-for문

4.3 파이썬 프로그램 만들어보기-continue & break문

4.3 파이썬 프로그램 만들어보기-try~except/finally문

4.4 파이썬 재사용할 수 있는 프로그램 만들기

4.4 파이썬 재사용할 수 있는 프로그램 만들기-함수(Function)

4.4 파이썬 재사용할 수 있는 프로그램 만들기-클래스(Class)

4.5 파이썬 모듈 사용하기-모듈(Modules)

4.5 파이썬 모듈 사용하기-pip사용

4.6 파이썬 직접 모듈 만들기

5.1 파이썬으로 파일 다루기-입출력 처리

5.2 파이썬으로 파일 다루기-파일 열기와 닫기

5.3 파이썬으로 파일 다루기-파일 읽기

5.4 파이썬으로 파일 다루기-파일 쓰기

5.5 파이썬으로 파일 다루기-파일 닫기


그동안 배운 내용을 종합하여 작지만 완전하게 동작하는 하나의 프로그램을 만들어 보겠습니다

이 프로그램은 알파벳 문자가 저장된 파일을 읽어서 각각의 알파벳이 전체 글자 중에 몇 퍼센트를 차지하는지 계산하는 기능을 하게 됩니다.


소스코드는 다음과 같습니다.



소스파일 URL : https://github.com/wonbird/Short-Term-Python-for-Beginners/blob/master/stp4b_21_make_text_analyzer.py


코드는 크게 4부분으로 구성되어 있습니다.


문자의 개수를 카운트하는 count_char()함수를 정의한 부분, 파일을 입력 받는 부분, 입력 받은 파일을 읽어 들이는 부분 그리고 알파벳 별로 사용 비율을 계산해서 출력하는 부분입니다.


6라인의 count += 1 count = count + 1과 같은 문장입니다

동일한 변수를 반복해서 사용할 필요 없도록 만들어진 연산자입니다. -=, *=, /=도 사용이 가능합니다.


20라인에서는 문자열을 처리하는 format()함수를 사용하였습니다

format이란 말 그대로 형식을 정해준다는 의미로 여기서는 “{0} – {1}”이 문자의 순서와 배치를 지정하는 표현식입니다. 첫번째 문자를 출력하고 한 칸 띄우고 ‘-‘를 출력한 후 다시 한 칸을 띄우고 두번째 문자를 출력한다는 표현인 거죠

format()의 인자로 전달된 charround(percent, 2)가 각각 첫번째 문자와 두번째 문자가 되는 것입니다.



이 소스코드와 같은 경로에는 filename.txt라는 파일을 미리 만들어 두었습니다. ‘This is an amazing and beautiful story for you.’라는 문장을 저장해 두었습니다.


소스코드를 실행하면 읽어 들일 파일 이름을 입력하도록 하고, 파일 이름이 입력되면 파일을 내용을 읽어서 출력합니다. 그리고, 알파벳 a부터 z까지 전체 문자에서 사용된 비율을 출력해줍니다.

 

이상으로 이 다음부터 나오는 파이썬으로 구현한 텍스트마이닝 프로그램을 이해하는데 필요한 내용들은 대부분 알아봤습니다


파이썬 프로그래밍을 잘 하기 위해서는 더 많은 학습이 필요하겠지만 이번 블로깅에서는 파이썬 소스코드를 이해하는데 꼭 필요한 정도만 압축해서 설명을 했습니다. 이 블로그를 통해 충분히 파이썬의 매력을 느끼게 된다면 그 다음부터 파이썬 실력을 쌓아나가는 것은 전혀 어려운 일이 아닐 것입니다.

 

다음 장에서는 파이썬 프로그래밍을 좀더 효율적으로 할 수 있도록 도와주는 전문 개발 도구에 대해 알아보겠습니다.



5.6 파이썬 파일럿 프로젝트 - 심플 텍스트 분석기 제작

6.1 파이썬 개발도구 PyCharm 사용하기

6.2 파이썬 개발도구 PyCharm 설치하기

6.3 파이썬 개발도구 PyCharm Project 만들기



반응형