본문 바로가기

Python

[Python] 크롤링 기본 ( HTML 구조 )

1. HTML이란?

웹 페이지를 만들기 위한 표준 마크업 언어

 - Hyper Text Markup Language의 표준

 - 웹 페이지를 만들기 위한 마크업 언어 표준

 - 웹 페이지의 구조를 설명 함

 - 일련의 element로 구성 됨.

 - element는 콘텐츠를 표시하는 방법으로 브라우저(Chrome, Explorer 등)에 알려 줌

 - "이것이 제목이다", "이것이 단락이다" 등과 같은 콘텐츠에 레이블링 함.

 

2. HTML 구조 설명

 

<!DOCTYPE html>
<html>
<head>
<title>Page Title</title>
</head>
<body>

<h1>My First Heading</h1>
<p>My first paragraph.</p>

</body>
</html>

<!DOCTYPE html> HTML 5 문서임을 정의 함

<html> HTML 페이지의 root element임

<head> HTML 페이지에 대한 메타 정보를 표시 함.

<title> HTML 페이지의 제목을 지정함( 브라우저의 제목 표시 또는 탭에 표시 됨 )

<body> 문서의 본문을 정의하며 머리글, 단락, 이미지, 하이퍼 링크, 표, 목록 등과 같은 표시되는 모든 컨텐츠의 컨테이너임.

<h1> 큰 제목을 정의함

<p> 단락을 정의 함.

 

3. HTML element 설명

HTML element는 start tag, content, end tag에 의해서 정의 됨.

<tagname> content 내용 </tagname>

<h1> my first heading</h1>

<p>my first paragraph</p>

 

Start tag Element content End tag
<h1> My First Heading </h1>
<p> My First paragraph </p>
<br> none none

 

4. HTML 페이지 구조

HTML 페이지 구조는 아래와 같음.

html 구조

 

참조 페이지 : https://www.w3schools.com/html/html_intro.asp

 

'Python' 카테고리의 다른 글

[Python] 크롤링 기본 ( BeautifulSoup - 1 )  (1) 2021.06.20