IT is Smart

파이썬 requests모듈 사용하기, use requests module 본문

Programming/Python Basic

파이썬 requests모듈 사용하기, use requests module

달인최선 2016. 9. 9. 21:54
반응형

앞에서 인터넷 자원에 접근할 수 있도록 해주는 urllib에 대해 알아봤었습니다. (여기참조)

urllib는 파이썬에 기본적으로 내장되어 있기 때문에 python을 설치하면 바로 사용할 수 있었습니다. 하지만 urllib패키지는 사용법이 쉽지 않고 간단한 처리에도 꽤 많은 라인의 코딩을 해야 하곤 합니다. 그래서 최근에는 urllib패키지 대신에 requests모듈도 많이 이용되고 있습니다. 


requests모듈은 별개로 개발된 open source 라이브러리이기 때문에 Python설치 후에 추가로 설치작업을 해줘야 합니다. requests에 대해 좀더 자세히 알고 싶으면 여기를 참조하세요.

c:\>pip install requests

위와 같이 pip를 이용해서 간단하게 설치할 수 있습니다.

requests모듈을 이용해서 코딩을 해보겠습니다.

BeautifulSoup4도 아직 설치하지 않은 경우는 아래와 같이 설치해 주면 됩니다.

c:\>pip install beautifulsoup4

코딩을 해보겠습니다.

import requests from bs4 import BeautifulSoup def trade_spider(max_pages): page = 1 while page <= max_pages: url = 'http://itissmart.tistory.com/' source_code = requests.get(url, allow_redirects=False) plain_text = source_code.text soup = BeautifulSoup(plain_text,'html.parser') for link in soup.findAll('a', {'class': 'link_post'}): href = link.get('href') title = link.findAll('strong') for t in title: print(t.text) print(href) page += 1 trade_spider(1)

코드를 실행하면 해당 URL에서 게시글의 제목과 URL주소를 출력해주는 것을 확인할 수 있습니다.


--------------------
Source Code from thenewboston Tutorials
좋은 코드는 볼수록 Insight를 주고, 반복할수록 내 것과 같이 된다.




반응형