본문 바로가기

유용한 정보

[문과 파이썬 학습] Beautiful Soup 과 Selenium 차이

728x90
반응형

Beautiful Soup과 Selenium은 웹사이트에서 정보를 가져오는 두 가지 도구임. 이 두 가지는 서로 다른 방식으로 동작하며, 각각의 장단점이 있음.

차이점 쉽게 설명:

  1. Beautiful Soup:
    • 웹페이지에서 **"HTML 파일"**을 읽어와서 원하는 정보를 찾아주는 도구임.
    • 웹사이트가 한 번에 다 로드되는 정적(Static) 페이지에 적합.
    • 예를 들어, 신문 기사처럼 페이지가 한 번에 다 뜨는 사이트에서 특정 부분의 텍스트를 추출할 때 사용.
  2. Selenium:
    • 실제 웹 브라우저(크롬, 파이어폭스 등)를 자동으로 열고, 사람이 하는 것처럼 페이지를 조작해주는 도구임.
    • 동적(Dynamic) 페이지, 즉 버튼을 누르거나 스크롤을 해야 더 많은 정보를 보여주는 웹사이트에 적합.
    • 예를 들어, 쇼핑몰에서 계속 스크롤을 내려야 상품 목록이 더 나오는 사이트에서 사용.

더 구체적인 차이:

  1. 사용 용도:
    • Beautiful Soup: 주로 HTML 파일에서 텍스트나 이미지 같은 고정된 정보를 가져올 때 사용.
    • Selenium: 웹사이트에서 버튼 클릭, 로그인, 스크롤 등 사용자 동작이 필요한 작업을 자동으로 실행.
  2. 속도:
    • Beautiful Soup: 단순한 페이지 정보를 가져오기 때문에 빠름.
    • Selenium: 실제 브라우저를 실행하기 때문에 더 느림.
  3. 설치와 사용:
    • Beautiful Soup: 설치가 간단하고, 비교적 쉽게 쓸 수 있음.
    • Selenium: 웹 브라우저 드라이버 설치가 필요해서 설정이 좀 더 복잡함.
  4. 동작 방식:
    • Beautiful Soup: 단순히 HTML 소스 코드를 읽어와서 필요한 데이터를 찾음.
    • Selenium: 브라우저에서 웹사이트가 실제로 표시되는 화면을 컨트롤함.
  5. 자바스크립트 처리:
    • Beautiful Soup: 자바스크립트로 바뀌는 내용은 처리 못함.
    • Selenium: 자바스크립트로 만들어지는 동적인 콘텐츠도 가져올 수 있음.

결론:

  • 정적인 정보만 있는 웹페이지에서는 Beautiful Soup을 사용하는 것이 더 빠르고 간편함.
  • 동적인 정보가 필요하거나, 웹사이트에서 직접 무언가를 조작해야 하는 경우에는 Selenium이 더 적합함.
728x90
반응형

}