목차
17 처지: Archive.is, CiteSeer, CURL, 마이크로포맷, 봇, 까치네 (검색 엔진), 네이버 마토메, 너치, HTML 요소, 크롤 (동음이의), 크롤러, 인터넷 봇, 사용자 에이전트, 플래시겟, 웹 서버, 웹사이트, Wget.
Archive.is
archive.is(이전 명칭 archive.today)는 개인이 설립한 디지털 타임캡슐 사이트로, 데이터 서버는 프랑스 노르파드칼레에 있. 소프트웨어로 아파치 하둡과 아파치 어큐물로를 이용.
CiteSeer
CiteSeer란 과학 문학 디지털 도서관과 컴퓨터 및 정보 과학 문헌에 주로 초점을 맞추고 있는 검색엔진이.
CURL
cURL(/kɝl/ 또는 /kə:l/)은 다양한 통신 프로토콜을 이용하여 데이터를 전송하기 위한 라이브러리와 명령 줄 도구를 제공하는 컴퓨터 소프트웨어 프로젝트이.
보다 웹 크롤러와 CURL
마이크로포맷
마이크로포맷(microformat)은 웹 페이지 및 RSS와 같은 HTML 또는 XHTML 기반의 정보군에서 사용될 수 있는, 특정 마크업을 사용하여 정보를 메타데이터 형태로 가공하는 방식으로 구현되는 정보 포맷 방식을 뜻. 줄여서 μF, uF.
봇
봇의 다른 뜻은 다음과 같.
보다 웹 크롤러와 봇
까치네 (검색 엔진)
1996년 대구대학교에 재학 중이던 김성훈이 개발한 국내 최초의 한글 웹 크롤러를 이용한 인터넷 검색 엔진으로, 2016년 현재에는 폐쇄되어 있. 현재 김성훈은 홍콩과기대 컴퓨터 공학과 교수로 재직하고 있.
네이버 마토메
이버 마토메(ネイバーまとめ|네이바 마토메)는 대한민국의 IT 기업 네이버의 자회사, LINE 주식회사가 운영하는 CGM형의 웹 큐레이션 서비스이.
너치
(Nutch)는 루씬을 기반으로 하여 만든 오픈 소스 검색 엔진이.
보다 웹 크롤러와 너치
HTML 요소
HTML 요소(HTML 엘리먼트, HTML element)는 HTML 문서나 웹 페이지를 이루는 개별적인 요소를 의미하며, 문서 객체 모델(DOM)으로 파싱.
크롤 (동음이의)
(crawl) 또는 크롤링(crawling)은 다음을 가리.
크롤러
의 다른 뜻은 다음과 같.
보다 웹 크롤러와 크롤러
인터넷 봇
인터넷 봇(Internet bot), 웹 로봇(web robot), WWW 로봇(WWW robot), 단순히 봇(bot)은 인터넷 상에서 자동화된 작업(스크립트)를 실행하는 응용 소프트웨어이.
보다 웹 크롤러와 인터넷 봇
사용자 에이전트
사용자 에이전트(使用者—, User agent)는 사용자를 대신하여 일을 수행하는 소프트웨어 에이전트이.
플래시겟
시겟(FlashGet, 이전 이름은 제트카-JetCar)은 마이크로소프트 윈도용 프리웨어 다운로드 관리자이.
보다 웹 크롤러와 플래시겟
웹 서버
세계 최초의 웹 서버 웹 서버(web server)는 다음의 두 가지 뜻 가운데 하나이.
보다 웹 크롤러와 웹 서버
웹사이트
웹사이트()는 인터넷 프로토콜 기반의 네트워크에서 도메인 이름이나 IP 주소, 루트 경로만으로 이루어진 일반 URL을 통하여 보이는 웹 페이지 (Web Page)들의 의미 있는 묶음이.
보다 웹 크롤러와 웹사이트
Wget
GNU Wget(간단히 Wget, 이전 이름: Geturl)는 웹 서버로부터 콘텐츠를 가져오는 컴퓨터 프로그램으로, GNU 프로젝트의 일부이.
보다 웹 크롤러와 Wget
또한 검색 로봇, 검색 봇, 검색로봇로 알려져 있다.