일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 밑바닥부터시작하는딥러닝
- 예제중심HTML&자바스크립트&CSS
- 비지도학습
- Apache
- 셀레니움
- Selenium
- 논문리뷰
- image
- aws
- 한빛아카데미
- 가비아
- Lamp
- Crawling
- MySQL
- 소스설치
- AndroidStudio를활용한안드로이드프로그래밍
- 생활코딩
- 수동설치
- attention
- CBOW
- word2vec
- jupyter
- 한빛미디어
- 크롤링
- deeplearning
- 밑바닥부터시작하는딥러닝2
- 컴파일설치
- 머신러닝
- 딥러닝
- 프로그램새내기를위한자바언어프로그래밍
- Today
- Total
목록Crawling (2)
안녕, 세상!
( 본 글의 크롤링은 크롤링이라기보다 스크래핑이 더 가깝습니다. 보통 사람들이 스크래핑도 크롤링이라고 부르는 경향이 있는 것 같습니다. 저도 일단 대중적인 표현으로 크롤링이라고 표현하겠습니다만 이 부분을 염두해주고 봐주시면 감사하겠습니다. ) (1) 셀레니움이란? 셀레니움은 웹 애플리케이션 테스트를 위한 프레임워크입니다. 웹에 하는 명령을 코드화시켜서 작동시킵니다. 다양한 브라우저 작동을 지원하며 크롤링에도 활용됩니다. 현존하는 거의 모든 웹브라우저를 다양한 언어를 통해 제어 가능합니다. 크롤링에서는 정적, 동적 페이지 크롤링으로도 접근이 불가능한 데이터에 접근할 때 유용하게 사용됩니다. 필자는 크롬 환경에서 파이썬으로 제어하겠습니다. (2) 셀레니움 Setting 셀레니움을 사용하려면 사용하려는 브라우..
( 본 글의 크롤링은 크롤링이라기보다 스크래핑이 더 가깝습니다. 보통 사람들이 스크래핑도 크롤링이라고 부르는 경향이 있는 것 같습니다. 저도 일단 대중적인 표현으로 크롤링이라고 표현하겠습니다만 이 부분을 염두해주고 봐주시면 감사하겠습니다. ) (1) 크롤링이란 크롤러(crawler)는 자동화된 방법으로 웹을 탐색하는 컴퓨터 프로그램을 말합니다. ① 웹 크롤러(web crawling) 웹 서비스 내 정보를 수집하는 일입니다. 웹에서 필요한 정보가 있다면 API를 확인하고, API가 없다면 직접 크롤링을 해야 합니다. 다만 직접 크롤링을 하는 것은 웹 서비스 제공자의 입자에서는 별로 좋지 않을 것입니다. ② 웹 크롤링의 전반적인 과정 1. 정보를 가져오고자 하는 url 정의 2. url 정보로 request..