Python (2) 썸네일형 리스트형 [Python] 크롤링 기본 ( BeautifulSoup - 1 ) 웹 크롤링을 하기 위해서는 HTML 기본 구조를 알아야 한다. 아래 링크에 HTML 기본 구조 내용을 작성해 두었다. https://omhdydy.tistory.com/8 1. Beatiful Soup이란? HTML 및 XML 파일에서 데이터를 가져오기 위한 Python 라이브러리로, 선호하는 Parser와 함께 작동하여 구문 분석트리를 탐색, 검색, 수정 하는 관용적 방법을 제공 함. 2. 설치 방법 필자는 pip를 통한 설치를 진행하였음. $ pip install beautifulsoup4 3. 코드 작성 >>> from bs4 import BeautifulSoup >>> >>> html_doc = """ ... ... ... The Dormouse's story ... ... Once upon a .. [Python] 크롤링 기본 ( HTML 구조 ) 1. HTML이란? 웹 페이지를 만들기 위한 표준 마크업 언어 - Hyper Text Markup Language의 표준 - 웹 페이지를 만들기 위한 마크업 언어 표준 - 웹 페이지의 구조를 설명 함 - 일련의 element로 구성 됨. - element는 콘텐츠를 표시하는 방법으로 브라우저(Chrome, Explorer 등)에 알려 줌 - "이것이 제목이다", "이것이 단락이다" 등과 같은 콘텐츠에 레이블링 함. 2. HTML 구조 설명 My First Heading My first paragraph. HTML 5 문서임을 정의 함 HTML 페이지의 root element임 HTML 페이지에 대한 메타 정보를 표시 함. HTML 페이지의 제목을 지정함( 브라우저의 제목 표시 또는 탭에 표시 됨 ) 문서.. 이전 1 다음