dom은 웹페이지의 문서 객체 모델이라고도 불린다
html, xml등 문서의 프로그래밍 인터페이스이다
즉, 프로그래밍 언어를 통해 html문서에 접근할 수 있도록 해준다
dom == 문서를 하나의 구조화된 형식으로 표현하므로 구조를 통해 원하는 동작 할 수 있다
dom은 객체로 표현하는데 object란 자바스크립트에서 사용되는 데이터 구조 중 하나이다
파이썬에서는 자바스크립트의 object와 비슷한 dictionary 존재한다
dom을 통해 프로그래밍 언어에서 사용할 수 있는 데이터 구조 형태로 작업 수행
dom 메소드
개발자 도구 열어 콘솔 창으로 들어가 자바스크립트
document.querySelctorAll('p')
위 코드 실행하면 nodelist라는 p태그 사용하는 요소들을 담은 유사배열 받게 된다
dom 기능
- getelementbytagnamer- 태그 이름으로 문서 요소 리턴
- getelementbyid - id 일치하는 요소 리턴
- getelementsbyclassname- 클래스 일치하는 요소 리턴
- queryselector- 셀렉터들과 일치하는 요소 리턴
- queryselectorall - 셀렉터과 일치하는 모든 요소들 리턴
dom과 크롤링
웹페이지를 텍스트 형식으로 사용하는 것이 아니라 dom 활용해라
예시
<!DOCTYPE html>
<html>
<head>
</head>
<body>
<h1> h1태그 </h1>
<p> p태그 </ㅔ>
</body>
</html>