본문 바로가기

python2

[ Python ] 웹 크롤링을 이용한 데이터 시각화 Python 을 이용하여 네이버 뉴스 IT/과학을 크롤링 후 데이터를 시각화 해보았습니다. 1. 네이버 뉴스 IT/과학 카테고리 웹 크롤링 네이버 뉴스 중 관심분야인 IT/과학 카테코리의 코드를 크롤링 해왔습니다. 웹 크롤링시 가장 많이 사용하는 BeautifulSoup를 import 하여 사용했습니다. 원래 requests.get에 headers를 넣지 않아도 되지만, 네이버 뉴스의 메인페이지 이외에 카테고리에는 크롤링을 막아 놓아서 추가로 넣어주었습니다. 데이터 수집을 할 때 종종 웹페이지에서 크롤링을 통한 데이터수집을 막아놓는 경우가 있습니다. 이것을 "안티 크롤링" 이라 부릅니다. 이때 아래의 코드처럼requests.get()함수 안에 headers={'User-Agent':'Mozilla/5.0.. 2021. 3. 31.
[ Python ] 진짜 진짜 기본 언젠가 볼 전공필기 시험을 위해, 내가 시험 전에 참고로 보기위한 간단한 정리 ( 참고로 나는 파이썬을 써본 경험이 거의 없음🥲 ) 1. 파이썬의 주석은 #으로 표시 # 주석 주석 주석 2. 파이썬의 input() 함수는 문자 형식으로 값을 받음, 숫자를 입력받아 계산하기 위해서는 타입변환이 필요함 a = input("숫자를 입력 : ") # 1입력 # 숫자를 입력 : 1 print(type(a)) # str a = int(a) # 문자 타입의 a를 숫자로 변환 print(type(a)) # int 3. 콤마를 이용해 여러 값을 출력할 수 있음, 구분자(sep) 사용 가능 print(111, "안녕", 345) # 구분자가 따로 지정되어있지 않다면 공백 기준으로 구분 # 111 안녕 345 print(1.. 2021. 3. 11.