Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- 3D프린터
- 3D프린터 입문
- OnlineIDE
- github
- 3D 프린터 용어
- 네이버클라우드
- 데이터 직렬화 포맷
- C언어
- NAS HDD교체
- docker container
- Notification
- Jenkins
- 코틀린개발환경
- git
- nas
- 3D모델링
- Kotlin
- 3d프린터 초보
- ci/cd
- docker
- data serialization formats
- gitlab
- linux job
- kubernetes
- 리눅스 파일동기화
- IoTNetwork
- 3D
- 3D프린터입문
- octoprint
- Token인증방식
Archives
- Today
- Total
0과 1을 공부하다.
[Web] 웹 데이터 수집 및 가공 관련 용어정리 본문
728x90
웹에 존재하는 데이터를 처리하는 프로그램을 작성하기 위해 데이터 수집 및 가공의 과정을 거치게 된다.
데이터를 수집 및 가공하는 과정에서 파싱, 크롤링, 스크래핑 등 용어를 사용하는데, 본 포스팅에서는 웹에서 데이터를 수집 및 가공과 관련된 용어에 대해 정리한다.
파싱(Parsing)
분석하다(parse)의 사전적 의미로, 웹페이지 내에서 특정 패턴, 순서로 데이터를 추출하여 데이터를 가공하는 것.
크롤링(Crawling)
기어가다(Crawl)의 사전적 의미로, 광대한 웹사이트에서 필요한 정보를 수집/분류/저장하여 사용자가 필요한 시기에 쉽게 참조 할 수 있도록하는 일련의 로봇임.
스크래핑(Scraping)
조각/단편의 정보(scrap)의 사전적 의미로,
데이터(자료)를 수집하는 모든 과정. 크롤링도 스크래핑의 일부분이다.
정리하자면 크롤링과 스크래핑을 구분은 큰 의미가 없으며, 둘다 웹상에서의 정보를 수집하는 일을 의미하며, 파싱은 사용자가 원하는 데이터를 추출하여 가공하는 일을 의미한다.
웹 데이터 수집관련 용어정리 끝.
* CopyRight 2021. Jay Park All rights reserved.
728x90
'Study > ETC' 카테고리의 다른 글
[E-Mail] 이메일 시스템 구조 및 용어 정리 (0) | 2022.03.01 |
---|---|
[Server] 서버 시설관리 수칙 (Data Center) (0) | 2022.02.04 |
[E-Mail] Telnet과 OpenSSL을 이용한 SMTP 메일 발송 (0) | 2022.02.03 |
[Math] 진법변환 (2진수, 8진수, 10진수, 16진수) (0) | 2021.09.27 |
[ETC] 함수와 관련 용어 정리 (0) | 2021.09.13 |
Comments