오답노트
[XPath] XPath 본문
XPath
XPath는 XML에서 사용하는 요소나 속성을 지정할 수 있다.
scrapy에서는 XPath를 통해 Element를 지정할 수 있다.
문법
- // : 최상위 Element = css selector : (.class p)
- *[@class = "class_sample"] : 속성값으로 Element 선택, @는 지정할 속성 " " 에는 속성에 대한 속성명이 입력된다.
- / : 한 단계 하위 Element = css selector : (.class > p)
- [n] : n 번째 Element
예시로 크롬 개발자 도구를 사용해 XPath를 가져오고 문법에 따른 관계를 살펴보자
Element에 우클릭 -> Copy -> Copy XPath 를 하면 클립보드에 XPath가 저장된다.
//*[@id="NM_FAVORITE"]/div[1]/ul[1]/li[2]/a
최상위 엘리먼트중에서
id가 "NM_FAVORITE 인 Element 아래
div 태그 중 첫번째 아래
ul 태그 중 첫번째 아래
li 태그 중 첫번째 아래
a 태그
가 복사해온 태그의 XPath다.
'Python > Web Crawling' 카테고리의 다른 글
네이버 카페 크롤링 (0) | 2022.12.05 |
---|---|
[scrapy] XPath로 정적 페이지 웹 크롤링 (0) | 2022.08.06 |
[selenium] 정적 페이지와 정적 페이지 웹 크롤링 (0) | 2022.08.05 |
[selenium] selenium 간단 사용법 (0) | 2022.08.05 |
[BeautifulSoup] 정적 페이지와 정적 페이지 웹 크롤링 (0) | 2022.08.05 |