목록파이썬 (77)
IT is Smart
1. 파이썬 소개, Introduction to Python 우리나라에서는 IT업계에서 Java를 사용하는 비율이 압도적으로 많기 때문에 아직 파이썬이 많이 알려져 있지 않습니다만, 해외에서는 오래 전부터 뜨거운 관심과 함께 실제 비즈니스에 활용되는 사례들이 늘어나면서 최근에는 국내에서도 주목을 받기 시작했습니다. 우리나라에서는 프로그래밍을 처음 배우려고 하면 C로 시작해서 C++이나 Java로 넘어가는 것이 루틴처럼 인식되고 있지만, 해외에서는 파이썬으로 프로그래밍의 개념을 처음 익히고 실제 업무에서도 파이썬을 많이 사용한다고 합니다. 이는 파이썬이 배우기 쉬우면서도 다양한 분야에서 활용할 수 있을 만큼 강력한 기능들을 가지고 있기 때문입니다. 파이썬의 장점과 단점을 좀더 상세히 이해함으로써 파이썬을 ..
파이썬(Python)은 수학과 컴퓨터과학을 연구하는 네덜란드의 CWI라는 연구소에서 일하던 귀도 반 로섬이 고안해서 1991년 세상에 처음 발표된 프로그래밍 언어입니다. 귀도는 C보다 쓰기 쉬우면서도 강력한 스크립트 언어를 필요로 했지만 적당한 언어가 없었기 때문에 직접 파이썬을 만들었다고 합니다.귀도 반 로섬은 구글을 거쳐 현재 드롭박스에 몸담고 있지만, 파이썬은 오픈소스 프로젝트로 개방적인 파이썬 커뮤니티를 통해 지속적으로 성장하고 있습니다. 세상의 많은 개발자들이 자발적으로 참여해서 파이썬을 개선해 나가고 있습니다. java나 C, C++에서 가능한 기능을 파이썬에서도 사용할 수 있게 되면서 파이썬은 더욱 강력해지고 있습니다.프로그래밍에 익숙하지 않은 초보자들도 쉽게 배울 수 있다는 특징 때문에 미..
필요한 정보를 수집하기 위해 크롤링 작업을 수행하다보면 어떤 주소는 웹브라우저에 직접 입력하면 페이지를 확인할 수 있는데 크롤러를 돌리면 HTTP 403 Forbidden 에러를 띄우고 크롤링이 되지 않는 경우를 만날 수 있습니다. 이는 각 사이트마다 비정상적인 접근을 차단하기 위한 조치 때문에 발생하는 현상입니다. 정상적으로 웹브라우저를 통해 접근하면 우리쪽에서 상대방 사이트서버로 HTTP Request메시지를 보내게 되는데 이때 우리쪽의 작업환경에 대한 정보를 보내줍니다. 사이트에서는 이 정보를 이용해서 접속자들의 OS, 브라우저1 종류나 버전 등을 파악해서 대응하게 되는 거죠. 근데 python과 같은 도구를 사용해서 사이트에 접속하게 되는 경우 브라우저를 통해 접속하는 경우와 다른 HTTP Req..
요즘은 다국어를 처리해야 하는 상황이 매우 일반적입니다. 여러 나라의 문자를 저장할 수 있도록 UTF-8 character set이 대부분 지원이 되는데 UTF-8모드에서도 에러가 발생하는 경우를 발견하여 조치방법을 정리해둡니다.저의 경우 중국어 기사를 크롤링해서 database에 저장하는 프로그래밍을 하고 있는데 대부분의 기사들이 정상적으로 저장되는데 일부 기사가 에러로 떨어지는 경우가 있었습니다. 아래와 같은 에러메시지입니다. (1366, "Incorrect string value: '\\xF0\\x9F\\x98\\x82' for column 'article' at row 1") 먼저 해당 에러를 일으킨 기사 내용을 뽑아 봤습니다. wuli艺术家崔塔塔ins更新照片一张,这个照片原型是电影老无所依里的杀手安..
파이썬 Class 구현하기 다시 보기 이번에는 Class를 초기화하는 좀더 고급진 방법을 알아보겠습니다. class Enemy: def __init__(self, x): self.energy = x def get_energy(self): print(self.energy) jason = Enemy(5) sandy = Enemy(18) jason.get_energy() sandy.get_energy() Class를 선언할 때 변수를 선언하고 변수값을 지정하는 것으로 초기화하는 방법과 함께 __init__() 메소드를 선언해서 사용하는 방법이 있습니다. __init__() 메소드는 별도로 호출을 하지 않아도 Class의 Instance가 생성이 되는 순간 자동으로 실행됩니다. 해당 Instance를 초기화하기..