인터넷에서 정보 검색

인터넷은 매우 빠른 속도로 성장하고 있으므로 필요한 정보수천억 개의 웹 페이지와 수억 개의 파일 중에서 점점 더 어려워지고 있습니다. 정보를 검색하기 위해 수억 대의 인터넷 서버에서 웹 페이지 및 파일의 위치에 대한 지속적으로 업데이트되는 정보를 포함하는 특수 검색 엔진이 사용됩니다.

검색 엔진은 데이터베이스에 있는 World Wide Web의 정보 자원에 대해 주제별로 그룹화된 정보를 포함합니다. 특수 프로그램 로봇은 주기적으로 인터넷 웹 서버를 "우회"하고, 발생한 모든 문서를 읽고, 키워드를 강조 표시하고, 문서의 인터넷 주소를 데이터베이스에 입력합니다.

대부분의 검색 엔진에서는 웹 사이트 작성자가 등록 양식을 작성하여 데이터베이스에 정보를 입력할 수 있습니다. 설문지를 작성하는 과정에서 사이트 개발자는 사이트 주소, 이름, 간단한 설명사이트의 내용과 사이트를 가장 쉽게 찾을 수 있는 키워드.

키워드 검색.검색 엔진의 데이터베이스에서 문서 검색은 쿼리를 입력하여 수행됩니다. 검색 창.

요청에는 이 문서의 주요 키워드인 하나 이상의 키워드가 포함되어야 합니다. 예를 들어 인터넷 검색 엔진 자체를 검색하려면 " 러시아 시스템인터넷에서 정보 검색 "(그림 6.21).

요청을 보낸 후 얼마 후 검색 엔진은 지정된 키워드가 있는 문서의 인터넷 주소 목록을 반환합니다. 브라우저에서 이 문서를 보려면 해당 문서를 가리키는 링크를 활성화하는 것으로 충분합니다(그림 6.22).

키워드가 성공적으로 선택되지 않은 경우 문서 주소 목록이 너무 클 수 있습니다(수만 또는 수십만 개의 링크가 포함될 수 있음). 목록을 좁히려면 검색 필드에 추가 키워드를 입력하거나 검색 엔진 디렉토리를 사용할 수 있습니다.

가장 완벽하고 강력한 검색 엔진 중 하나인 Google(www.google.ru)은 데이터베이스에 80억 개의 웹 페이지를 저장하고 매월 로봇에 의해 500만 개의 새로운 페이지가 입력됩니다. Runet(인터넷의 러시아 부분)에는 각각 Yandex(www.yandex.ru) 및 Rambler(www.rambler.ru) 검색 엔진이 있는 2억 개의 문서가 포함된 광범위한 데이터베이스가 있습니다.

계층적 디렉토리 시스템에서 검색합니다.검색 엔진 데이터베이스에서 웹 사이트는 다음과 같이 그룹화됩니다. 계층적 주제 디렉토리, 도서관의 주제 카탈로그와 유사합니다.

최상위 주제 섹션, 예: 인터넷, 컴퓨터, 과학 및 교육등등, 중첩된 디렉토리를 포함합니다. 예를 들어 인터넷 디렉토리에는 하위 디렉토리가 포함될 수 있습니다. 검색, 메일및 기타(그림 6.23).

디렉토리에서 정보를 검색하는 것은 특정 디렉토리를 선택하는 것으로 축소되며, 그 후에 사용자는 가장 많이 방문하고 의미 있는 웹 사이트의 인터넷 주소에 대한 링크 목록이 표시됩니다. 각 링크에는 일반적으로 주석이 달려 있습니다. 즉, 문서 내용에 대한 짧은 설명이 포함되어 있습니다.

Aport 검색 엔진(www.aport.ru)에는 러시아어 인터넷 리소스의 가장 완벽한 다단계 계층적 주제 카탈로그가 있습니다. 카탈로그에는 웹 사이트 내용에 대한 자세한 주석과 지리적 위치 표시가 포함되어 있습니다.

파일 검색.파일 보관 서버에서 파일을 검색하기 위해 FileSearch 검색 엔진(www.filesearch.ru)을 비롯한 특수 검색 엔진이 있습니다. 파일을 검색하려면 검색 필드에 파일 이름을 입력해야 하며 검색 엔진은 주어진 이름으로 파일을 저장하는 파일 보관 서버의 인터넷 주소를 반환합니다.

대부분의 검색 엔진(Google, Rambler, Aport, Applex 및 Research 파일 검색 엔진)을 사용하여 인터넷의 러시아어 사용 부분에서 정보 검색은 통합 검색 엔진 Gogle.ru를 사용하여 수행할 수 있습니다(그림 6.24). 이렇게하려면 검색 창에 키워드를 입력하고 스위치를 사용하여 필요한 정보 유형을 설정하고 검색 엔진 Gogle.ru의 이름이있는 버튼을 클릭하십시오 (그림 6.24). 이렇게 하려면 검색 창에 키워드를 입력하고 스위치를 사용하여 필요한 정보 유형을 설정하고 검색 엔진 이름이 있는 버튼을 클릭하기만 하면 됩니다.


쌀. 6.24. 통합 검색 엔진 Google.ru

인터넷 검색 방법

인터넷을 검색하는 세 가지 방법

일반적으로 인터넷, 특히 World Wide Web은 상상할 수 없는 양의 정보를 저장하는 수천 개의 서버와 수백만 개의 웹 페이지에 대한 액세스를 가입자에게 제공합니다. 이 "정보의 바다"에서 길을 잃지 않는 방법은 무엇입니까? 이렇게하려면 네트워크에서 필요한 정보를 검색하고 찾는 방법을 배워야합니다.

이미 언급했듯이 인터넷에서 정보를 찾는 세 가지 주요 방법이 있습니다.

1. 페이지 주소를 지정합니다.이것이 가장 빠른 길단, 문서의 정확한 주소를 알고 있는 경우에만 사용할 수 있습니다.

2. 하이퍼링크를 통한 탐색.이것은 현재 문서와 의미가 가까운 문서만 검색하는 데 사용할 수 있으므로 가장 편리한 방법입니다. 예를 들어 현재 문서가 음악 전용인 경우 이 문서의 하이퍼링크를 사용하면 스포츠 전용 사이트로 이동하는 것이 거의 불가능합니다.

3. 검색 서버 호출 검색 엔진) . 검색 엔진을 사용하는 것이 정보를 찾는 가장 편리한 방법입니다. 현재 다음 검색 서버는 인터넷의 러시아어 사용 지역에서 널리 사용됩니다.

    얀덱스;
    램블러;
    아포트.

다른 검색 엔진도 있습니다. 예를 들어, 효율적인 시스템서버에서 구현된 검색 우편 서비스메일.루.

서버 검색

에서 정보를 검색하는 가장 접근하기 쉽고 편리한 방법 월드 와이드 웹검색 엔진을 사용하는 것입니다. 동시에 정보는 카탈로그뿐만 아니라 검색된 텍스트 문서를 특징짓는 일련의 키워드로 검색할 수 있습니다.

검색 서버의 사용을 더 자세히 고려하십시오. 검색 서버가장 많은 링크가 포함되어 있습니다. 각종 서류, 이러한 모든 링크는 주제별 디렉토리로 구성됩니다. 예: 스포츠, 영화, 자동차, 게임, 과학 등. 또한 이러한 링크는 서버에서 독립적으로 설정됩니다. 자동 모드 World Wide Web에 나타나는 모든 웹 페이지를 정기적으로 봅니다. 또한 검색 서버는 사용자에게 키워드로 정보를 검색할 수 있는 기능을 제공합니다. 키워드를 입력한 후 검색 서버는 다른 웹 서버에서 문서 탐색을 시작하고 지정된 단어가 있는 문서에 대한 링크를 표시합니다. 일반적으로 검색 결과는 주어진 문서가 검색 기준과 얼마나 일치하는지 또는 웹에서 요청되는 빈도를 나타내는 특수 문서 등급에 따라 내림차순으로 정렬됩니다.

검색 엔진 쿼리 언어

쿼리 언어를 사용하여 특정 규칙에 따라 형성된 키워드 그룹을 검색 서버에 대한 요청이라고 합니다. 다른 검색 엔진에 대한 쿼리 언어는 매우 유사합니다. 원하는 검색 서버의 "도움말" 섹션을 방문하여 이에 대해 자세히 알아볼 수 있습니다. 예를 들어 Yandex 검색 엔진을 사용하여 쿼리를 생성하는 규칙을 고려하십시오.

연산자 구문 연산자는 무엇을 의미합니까 요청 예시
공백 또는 & 논리 AND(문장 내) 물리치료
&& 논리 AND(문서 내) 레시피 &&(가공 치즈)
| 논리적 OR 사진 | 사진 | 스냅샷 | 사진 이미지
+ 발견된 문서에 단어의 필수 존재 +되기 또는 +없기
() 그룹화 단어 (기술 | 생산) (치즈 | 코티지 치즈)
~ 이항 연산자 AND NOT(문장 내) 은행 ~ 법률
~~
또는
_
이진 AND NOT 연산자(문서 내) 파리여행가이드~~ (대리점|투어)
/(nm) 단어 단위 거리(빼기(-) - 뒤로, 더하기(+) - 앞으로) 공급업체 /2 커피 음악 /(-2 4) 교육 공석 ~ /+1 학생
" " 구문 검색 "작은 빨간 망토" 동등하게: 빨강 / +1 망토
&&/(nm) 문장의 거리(빼기(-) - 뒤로, 더하기(+) - 앞으로) 은행 && /1 세금

얻기 위해 최고 점수검색, 당신은 몇 가지를 기억해야 간단한 규칙:

    1. 하나의 키워드로 정보를 검색하지 마십시오.

    2. 키워드를 대문자로 입력하면 소문자로 작성된 동일한 단어가 검색되지 않을 수 있으므로 키워드를 입력하지 않는 것이 가장 좋습니다.

    3. 검색 결과가 반환되지 않으면 검색 결과가 있는지 확인하십시오. 키워드 x 철자 오류.

최신 검색 엔진은 의미 분석기의 생성된 요청에 연결할 수 있는 기능을 제공합니다. 도움을 받아 단어를 입력하여 다양한 경우, 시제 등으로 이 단어의 파생어가 있는 문서를 선택할 수 있습니다.

시험 문제

1. 키워드로 문서를 검색하는 방법은 무엇입니까? 디렉토리 시스템에서?

자기실현을 위한 과제

6.8 실용과제. 다른 검색 엔진을 사용하여 키워드별로 문서에 대한 검색 결과를 비교합니다(통합 Google 검색 엔진 사용).

6.9 실제 작업. 파일 보관 서버에서 WinAmp 미디어 플레이어 파일을 검색합니다.

그들은 모든 것이 인터넷에 있다고 말합니다. 사실은 그렇지 않습니다. 웹에 게시할 자료는 실제 사람들이 준비한 것이므로 게시하는 데 필요하다고 생각되는 내용만 찾을 수 있습니다. 그러나 강은 개울에 의해 공급되며 그들의 창의성 덕분에 오늘날 약 20억 개의 웹 페이지가 이미 인터넷에 형성되었습니다. 결과적으로 웹에서 사용할 수 있는 리소스의 목록을 작성하는 것이 주요 문제가 되었습니다. 수천 개의 조직에서 문제를 처리하고 있음에도 불구하고 해결에 가까워지지 않을 뿐만 아니라 점점 심각해지고 있습니다. 목록화된 자원의 비율은 꾸준히 감소하고 있습니다. 에 지난 몇 년이번 가을은 재앙이었다. 따라서 1999년에 목록화된 자원의 비율이 40%에 도달했다면 다음 해에는 25%로 떨어졌습니다.

결론은 간단합니다. 웹 공간이 체계화되는 것보다 더 빨리 채워집니다.

불행히도 가까운 장래에 어떤 것이든 더 나은 방향으로 바뀔 수 있다고 가정할 이유가 없습니다. 결과적으로 인터넷에서 정보를 검색하는 것은 가장 어려운 작업 중 하나로 간주될 수 있습니다.

관심 있는 정보를 검색하려면 해당 정보가 있는 웹 페이지의 주소를 브라우저에 알려야 합니다. 이것은 가장 빠르고 안정적인 검색 유형입니다. 을 위한 빠른 접근리소스에 액세스하려면 브라우저를 실행하고 주소 표시줄에 페이지 주소를 입력하기만 하면 됩니다.

웹 페이지 주소는 특별 디렉토리, 인쇄된 출판물에 제공되며 인기 있는 라디오 방송국과 TV 화면에서 방송됩니다.

주소를 모르는 경우 인터넷에서 정보를 검색하려면 검색 엔진, 인터넷 리소스에 대한 정보를 포함합니다.

각 검색 엔진은 검색된 웹 페이지와 관련된 키워드의 대규모 데이터베이스입니다. 원하는 정보로 서버 주소를 검색하려면 검색 엔진 필드에 키워드, 몇 단어 또는 구문을 입력해야 합니다. 따라서 검색 엔진에 쿼리를 보냅니다. 검색 결과는 이러한 단어가 나오는 웹 페이지 주소 목록으로 제공됩니다.

일반적으로 검색 엔진은 세 부분으로 구성됩니다. 로봇, 색인 및 요청 처리 프로그램.

로봇(Spider, Robot 또는 Bot)은 웹 페이지를 방문하여 콘텐츠 전체 또는 일부를 읽는 프로그램입니다.

검색 엔진 로봇은 웹 페이지의 콘텐츠를 분석하기 위한 개별 체계가 다릅니다.

인덱스는 로봇이 방문한 모든 페이지의 복사본을 포함하는 데이터 저장소입니다.

각 검색 엔진의 색인은 정보가 저장되는 양과 방식이 다릅니다. 주요 검색 엔진의 데이터베이스는 수천만 개의 문서에 대한 정보를 저장하고 있으며 색인 볼륨은 수백 기가바이트입니다. 인덱스는 주기적으로 업데이트 및 보완되므로 동일한 쿼리를 사용하는 한 검색 엔진의 작업 결과가 다른 시간에 검색된 경우 다를 수 있습니다.

쿼리 핸들러는 사용자의 요청에 따라 인덱스에서 필요한 정보를 "찾아보고" 찾은 문서에 대한 링크를 반환하는 프로그램입니다.

시스템 출력에 있는 링크 세트는 요청에 대한 링크의 일치도가 가장 높은 것부터 가장 낮은 것까지 내림차순으로 프로그램에 의해 배포됩니다.

러시아에서 가장 일반적인 검색 엔진은 다음과 같습니다.

  • 램블러(www.rambler.ru);
  • 얀덱스(www.yandex.ru);
  • 메일 (www.mail.ru).

해외에는 더 많은 검색 엔진이 있습니다. 가장 인기있는 것은 다음과 같습니다.

  • 알타 비스타(www.altavista.com);
  • 빠른 검색(www.alltheweb.com);
  • 오로라 (www.northernlight.com).

Yandex는 아마도 러시아 인터넷에서 최고의 검색 엔진일 것입니다. 이 데이터베이스에는 약 200,000개의 서버와 최대 3,000만 개의 문서가 포함되어 있으며 시스템은 몇 초 안에 이를 스캔합니다. 이 시스템의 예에서는 정보를 검색하는 방법을 보여줍니다.

정보 검색은 특수 프레임에 키워드를 입력하고 프레임 오른쪽의 "찾기" 버튼을 눌러 설정합니다.

검색 결과는 몇 초 안에 나타나며 중요도에 따라 순위가 매겨집니다. 가장 중요한 문서는 목록의 맨 위에 놓입니다. 이 경우 검색된 문서의 순위는 문서에서 키워드가 위치한 위치(문서의 제목이 다른 어떤 곳보다 중요함)와 해당 키워드의 언급 횟수( 언급이 많을수록 순위가 높아집니다.)

따라서 목록의 첫 번째 위치에 있는 사이트는 내용적 관점에서가 아니라 실질적으로 키워드 언급 빈도와 관련하여 선두를 달리고 있습니다. 이와 관련하여 검색 엔진에서 제안한 처음 10개 사이트를 보는 것으로 제한되어서는 안 됩니다.

사이트의 내용은 검색 엔진이 사이트 주소 아래에 배치한 간략한 설명에 의해 간접적으로 평가될 수 있습니다. 일부 파렴치한 사이트 작성자는 웹 페이지가 검색 엔진의 첫 번째 위치에 표시될 가능성을 높이기 위해 의도적으로 문서에 키워드의 의미 없는 반복을 포함합니다. 그러나 검색 엔진이 그러한 "쓰레기" 문서를 감지하는 즉시 데이터베이스에서 해당 문서를 자동으로 제외합니다.

키워드 또는 단어에 대한 응답으로 검색 엔진이 제공하는 문서의 순위 목록조차도 거의 압도적일 수 있습니다. 이와 관련하여 Yandex(및 기타 강력한 검색 엔진)는 첫 번째 목록 내에서 검색 목적을 보다 정확하게 반영하는 문서, 즉 검색 결과를 수정하거나 개선할 수 있는 기회를 제공합니다. 예를 들어 키워드당 34,899개의 웹 페이지 목록이 있습니다. "찾은 위치에서 검색" 명령에 한정 키워드를 입력하면 목록이 750페이지로 줄어들고 이 명령에 다른 한정 단어를 입력하면 목록이 130웹 페이지로 줄어듭니다.

검색 디렉토리는 다른 인터넷 리소스에 대한 링크의 체계적인 모음(선택)입니다. 링크는 다음과 같이 구성됩니다. 테마 루브리케이터, n 필요한 정보를 찾을 수 있는 계층 구조를 나타냅니다.

Yandex 검색 인터넷 카탈로그의 구조를 예로 들어 보겠습니다.

이것은 거의 모든 가능한 방향으로 인터넷 리소스에 대한 링크를 포함하기 때문에 범용 디렉토리입니다. 이 디렉토리에는 다음이 포함됩니다. 주제:

  • 비즈니스 및 경제;
  • 사회와 정치;
  • 과학 및 교육;
  • 컴퓨터 및 통신;
  • 핸드북 및 링크
  • 집과 가족;
  • 오락 및 레크리에이션;
  • 문화와 예술.

주제많은 것을 포함 하위 섹션 , 그리고 그들은 차례로 다음을 포함합니다. 표제등.

승리의 날 행사를 준비 중이고 인터넷에서 Bulat Okudzhava의 유명한 군사 노래 "당신은 장화 소리가 들리는 소리가 들립니다."의 가사를 검색하려고 한다고 가정해 보겠습니다. 검색은 다음과 같이 구성할 수 있습니다.

Yandex > 카탈로그 > 문화 및 예술 > 음악 > 작가의 노래

이 검색 방법은 매우 빠르고 효율적입니다. 마지막에 몇 가지 링크만 제공되며 그 중 유명한 음유시인의 노래가 있는 사이트에 대한 링크가 있습니다. 사이트에서 B. Okudzhava의 가사가 있는 아카이브를 찾고 원하는 텍스트를 선택하는 것만 남아 있습니다.

또 다른 예. 휴대 전화를 구입하려고 하고 다른 회사의 장치 특성을 비교하려고 한다고 가정합니다. 검색은 다음 카탈로그 제목에서 수행할 수 있습니다.

Yandex > 카탈로그 > 컴퓨터 및 통신 > 모바일 연결> 휴대전화

받은 한정 수량링크를 통해 기업의 특성과 기기의 변형을 검토하여 빠르게 조회하고 휴대폰을 선택할 수 있습니다.

대부분의 검색 엔진에는 키워드로 검색할 수 있는 기능이 있습니다. 이것은 가장 일반적인 검색 유형 중 하나입니다.

키워드로 검색하기 위해서는 검색하고자 하는 단어 또는 여러 단어를 특수창에 입력하고 찾기 버튼을 클릭해야 합니다.

검색 엔진은 데이터베이스에서 이러한 단어를 포함하는 문서를 찾아 표시합니다. 이러한 문서가 많을 수 있지만 이 경우 많다고 반드시 좋은 것은 아닙니다.

검색 엔진으로 몇 가지 실험을 해보자. 수족관을 시작하기로 결정하고 이 주제에 대한 정보에 관심이 있다고 가정합니다. 언뜻보기에 가장 간단한 것은 "수족관"이라는 단어를 검색하는 것입니다. 예를 들어 Yandex 검색 엔진에서 이것을 확인합시다. 검색 결과는 큰 금액페이지 - 엄청난 수의 링크. 게다가, 좀 더 자세히 살펴보면 그 중에는 B. Grebenshchikov의 수족관 그룹을 언급하는 사이트, 같은 이름의 쇼핑 센터 및 비공식 협회, 그리고 수족관 물고기와 관련이 없는 훨씬 더 많은 사이트가 있을 것입니다.

그러한 검색은 소박한 사용자조차도 만족시킬 수 없다고 추측하기 쉽습니다. 제안된 모든 문서 중에서 우리가 필요로 하는 주제와 관련된 문서를 선택하는 데 너무 많은 시간이 소요될 것이며, 그 내용을 파악하는 데에는 더욱 많은 시간이 소요될 것입니다.

문서, 웹 페이지 또는 사이트의 주제를 한 단어로 결정하는 것은 매우 어렵기 때문에 일반적으로 한 단어로 검색하는 것은 바람직하지 않다는 결론을 즉시 내릴 수 있습니다. 예외는 해당 주제 영역 밖에서는 거의 사용되지 않는 희귀 단어와 용어입니다.

원하는 영역에 가장 일반적인 용어 집합이 있으면 고급 검색을 사용할 수 있습니다. 무화과에. Yandex 검색 엔진의 고급 검색 창이 표시됩니다. 이 모드에서 쿼리 언어의 기능은 양식으로 구현됩니다. 사전 필터를 포함한 유사한 서비스가 거의 모든 검색 엔진에서 제공됩니다.

검색 조건을 명확히하고 "수족관 물고기"라는 문구를 입력합시다. 링크 수가 20배 이상 감소합니다. 이 결과는 우리에게 더 적합하지만 모두 동일합니다. 예를 들어 물고기 이미지가 있는 일치 레이블의 러시아 기념품 세트, 컴퓨터 바탕 화면 화면 보호기 컬렉션, 사진이 있는 수족관 물고기 카탈로그 및 수족관과 같이 제안된 링크 중에서 만날 수 있습니다. 액세서리 가게. 수색조건을 개선하는 방향으로 계속 나아가야 할 것은 자명하다.

검색을 보다 생산적으로 만들기 위해 모든 검색 엔진에는 특별한 쿼리 언어 자체 구문으로. 이 언어들은 여러 면에서 유사합니다. 모든 것을 배우는 것은 매우 어렵지만 모든 검색 엔진에는 원하는 언어를 마스터할 수 있는 도움말 시스템이 있습니다.

다음은 Yandex 검색 엔진에서 요청을 생성하기 위한 몇 가지 간단한 규칙입니다.

쿼리의 키워드는 소문자(소문자)로 작성해야 합니다.

이렇게 하면 대문자로 시작하는 키워드뿐만 아니라 모든 키워드가 검색됩니다.

검색은 쿼리의 단어 형식에 관계없이 러시아어 규칙에 따라 모든 형식의 단어를 고려합니다.

예를 들어 쿼리에 "know"라는 단어가 지정된 경우 "know", "know" 등의 단어도 검색 조건을 충족합니다.

안정적인 구를 검색하려면 단어를 따옴표로 묶으십시오.

예: "도자기 접시".

정확한 단어 형태로 검색하려면 단어 앞에 느낌표를 붙여야 합니다.

예를 들어, 속격에서 "September"라는 단어를 검색하려면 "!September"라고 작성합니다.

단일 문장 내에서 검색하려면 쿼리의 단어를 공백이나 & 기호로 구분합니다.

예: "모험 소설" 또는 "모험 및 소설". 공백으로 구분하여 쿼리에 입력된 여러 단어는 검색되는 문서의 한 문장에 모두 포함되어야 함을 의미합니다.

쿼리에 지정된 모든 단어가 나오는 문서만 선택하려면 각 문서 앞에 더하기 기호 "+"를 입력합니다. 반대로 검색 결과에서 단어를 제외하려면 이 단어 앞에 빼기 "-"를 넣으십시오. "+" 및 "-" 기호는 이전 단어의 공백과 다음 단어와 함께 작성해야 합니다.

예를 들어 "Volga-car"라는 검색어는 "car"가 아닌 "Volga"라는 단어가 포함된 문서를 찾습니다.

의미가 가까운 동의어나 단어를 검색할 때 단어 사이에 세로 막대 "|"를 넣을 수 있습니다.

예를 들어 "자식 | 아이 | baby"는 이러한 단어가 포함된 문서를 찾습니다.

쿼리의 한 단어 대신 전체 표현식을 대체할 수 있습니다. 이렇게 하려면 대괄호로 묶어야 합니다.

예: "(어린이 | 아기 | 어린이 | 아기) + (돌봄 | 교육)".

"~"(물결표) 문자를 사용하면 첫 번째 단어는 포함하지만 두 번째 단어는 포함하지 않는 문장이 있는 문서를 찾을 수 있습니다.

예를 들어, "books ~ shop"을 검색하면 (문장 내에서) "shop"이라는 단어 옆에 없는 "books"라는 단어가 포함된 모든 문서를 찾습니다.

연산자가 한 번 반복되면(예: & 또는 ~) 문장 내에서 검색이 수행됩니다. 이중 연산자(&&,~~)는 문서 내에서 검색합니다.

예를 들어 "암 ~~ 점성술"을 검색하면 점성술과 관련이 없는 "암"이라는 단어가 포함된 문서를 찾습니다.

수족관 물고기의 예로 돌아가 보겠습니다. 검색 엔진이 제공하는 여러 문서를 읽은 후 인터넷에서 정보 검색을 시작해서는 안 된다는 것이 분명해졌습니다. 수족관은 특별한 지식, 시간 및 심각한 투자가 필요한 복잡한 생물학적 시스템입니다.

수신 된 정보를 기반으로 인터넷에서 검색을 수행하는 사람은 연구중인 문제와 관련된 특수 문헌을 연구하기로 결정하여 추가 검색 전략을 근본적으로 변경할 수 있습니다.

문헌 또는 전체 텍스트 문서를 검색하기 위해 다음 쿼리가 가능합니다.

"+ (수족관 | 수족관 | 수족관) + 초보자용 + (조언 | 문학) + (기사 | 논문 | 전문) - (가격 | 상점 | 배송 | 카탈로그)".

검색 엔진의 요청을 처리한 후 결과는 매우 성공적이었습니다. 이미 첫 번째 링크는 필요한 문서로 연결됩니다.

이제 검색 결과를 요약하고 특정 결론을 도출하고 가능한 조치를 결정할 수 있습니다.

  • 여러 가지 이유로 수족관의 유지 관리는 당신의 힘을 넘어서므로 더 이상 검색을 중지하십시오.
  • 제안 된 기사를 읽고 수족관 배치를 진행하십시오.
  • 햄스터나 앵무새에 대한 자료를 검색합니다.
  1. 가장 빠르고 안정적인 검색 유형은 무엇입니까?
  2. 사용자는 웹 페이지 주소를 어디에서 찾을 수 있습니까?
  3. 검색 엔진의 주요 목적은 무엇입니까?
  4. 검색 엔진의 부품은 무엇입니까?
  5. 어떤 검색 엔진을 알고 있습니까?
  6. 검색 엔진의 루브리케이터에 의한 검색 기술은 무엇입니까?
  7. 키워드 검색 기술이란?
  8. 검색 기준에 + 또는 -를 언제 사용해야 합니까?
  9. Yandex의 검색 기준은 다음 구문으로 설정됩니다.

    (보모|교육자|거버넌스)++(돌봄|교육|감독) ?

  10. 복잡한 쿼리를 구성할 때 기호(~ 또는 ++)를 두 배로 늘리는 것은 무엇을 의미합니까?

운동.

작업 1. 디렉토리에서 검색합니다.

검색 엔진 디렉토리를 사용하여 다음 정보를 찾으십시오(교사의 지시에 따름):

  1. 대중 음악 그룹의 노래 가사
  2. 이번 주 마린스키 극장 레퍼토리
  3. 형질 최신 모델 휴대전화잘 알려진 회사 (선택)
  4. 만두와 우크라이나어 보르시 조리법
  5. 해당 지역의 장기 일기 예보(최소 10일)
  6. 좋아하는 현대 노래 아티스트의 사진
  7. 대략적인 비용 멀티미디어 컴퓨터(가격)
  8. 귀하의 지역 또는 도시의 비서직 공석에 대한 정보
  9. 오늘의 조디악 별자리 운세

검색 결과를 바탕으로 Word로 보고서 작성: 문서에서 발견, 복사 및 서식이 지정된 자료를 표시합니다. 보고서를 교사에게 제출합니다.

작업 2. 정확한 제목 또는 견적 요청의 형성.

문서의 정확한 제목(예: "개인용 전자 컴퓨터 및 작업 조직에 대한 위생 요구 사항")을 알고 있습니다. 인터넷에서 문서의 전체 텍스트를 검색하는 쿼리를 공식화하십시오.

검색 결과를 폴더에 저장합니다. 선생님께 선물하세요.

작업 3. 복잡한 쿼리 형성.

  • 모든 검색 엔진에서 러시아 목욕탕에 대한 정보 검색을 요청하십시오. 서비스 제안, 목욕 액세서리 광고 및 기타 광고를 제거합니다. 러시아 목욕이 신체에 미치는 영향에 집중하십시오.
  • 집고양이 돌보기에 대한 정보를 검색하기 위해 복잡한 쿼리를 작성하십시오. 큰 고양이(예: 사자)는 물론 구매, 판매 제안, 배경 화면용 사진 등을 검색에서 제외합니다.
  • 요청 내용과 검색 결과를 Word로 작성하여 교사에게 제시합니다.
작업 4. 주제별 검색.

당신이 아는 모든 방법으로 컴퓨터 기술의 역사에 대한 정보를 인터넷에서 검색하십시오. 다양한 방향으로 검색: 역사적 배경, 기술, 인물. 프레젠테이션 형식으로 검색 결과를 제공합니다. 프레젠테이션에서 하이퍼링크 형식의 다단계 목차를 사용합니다.

검색 문제 및 조직 수단

인터넷에서 사용할 수 있는 방대한 양의 정보는 다음을 포함합니다. 필요한 정보를 찾는 문제를 매우 적절하고 복잡하게 만듭니다. 필요한 정보를 검색하는 속도는 인터넷 사용자의 전문성을 크게 결정합니다. ϶ᴛᴏth 작업을 자동화하기 위해 다양한 외국 및 국내 시스템특별한 종류의 웹 페이지인 검색. 동시에 수많은 검색 자동화 도구를 사용할 수 있음에도 불구하고 이 작업은 사용자가 자신의 주제 영역에서 사용되는 용어에 대한 특정 경험, 직관 및 지식을 필요로 하는 매우 힘든 작업입니다.

1999년 7월 8일 네이처 저널에 발표된 추정치에 따르면 공개적으로 색인된 웹 페이지의 수는 8억 개였으며, 1년 후 연구의 저자(NEC 연구소의 스티브 로렌스)는 그 수가 거의 두 배나 증가했다고 믿었습니다. 최고의 검색 엔진도 6페이지 중 1페이지 이상 색인을 생성하지 않습니다. 추출하기 위해 말할 가치가 있습니다. 유용한 정보인터넷에서 검색할 위치와 방법을 알아야 합니다.

Internet Explorer의 검색 도구는 검색 도구에 대한 액세스를 단순화하여 검색 엔진의 주소를 알 필요가 없습니다. 이 경우 ϲᴏᴏᴛʙᴇᴛϲᴛʙ 페이지를 로드하여 검색 엔진에 직접 연락하는 것이 좋습니다.

검색 구성 방법 및 제공된 기능에 따라 모든 검색 도구는 조건부로 다음 그룹으로 나눌 수 있습니다.

카탈로그 및 전문 데이터베이스;

검색 엔진;

메타 검색 시스템.

카탈로그 및 데이터베이스

WWW의 카탈로그는 체계적인 도서관 카탈로그와 유사합니다. 디렉토리 검색은 제목 또는 카테고리라는 링크의 계층적 목록을 통해 순차적으로 이동하는 것으로 구성됩니다. 디렉토리의 첫 페이지에는 문화 및 예술과 같은 주요 주제에 대한 링크가 포함되어 있습니다. 의학 및 건강; 사회와 정치; 비즈니스 및 경제; 엔터테인먼트 등 ϲᴏᴏᴛʙᴇᴛϲᴛʙ 링크(카테고리)를 클릭하면 선택한 주제(루브릭)를 자세히 설명하는 링크가 포함된 페이지가 열립니다. 세부 카테고리 아래로 이동하면 원하는 정보가 있는 페이지를 찾을 수 있습니다. 어떤 식으로든 카탈로그를 통해 이동할 때 열리는 각 페이지에는 표시된 중첩 제목의 순서가 표시됩니다(예: Business World: Finance: Analytics 등).

모든 카탈로그는 서지 작성자가 라이브러리 카탈로그를 편집하고 유지 관리하는 것과 같은 방식으로 전문가가 수동으로 만들고 최신 상태로 유지 관리합니다. 문서의 설명은 목록의 편집자 또는 저자에 의해 수행된다는 점에 유의하는 것이 적절합니다. ϶ᴛᴏmu 덕분에 카탈로그에 포함된 페이지의 내용은 할당된 제목에 가장 적합합니다. 그러나 보충 속도와 인터넷 정보의 변화를 감안할 때 카탈로그를 유지 관리하는 "수동"방법은이 주제에 대한 인터넷 리소스의 실제 상태를 동등하게 반영하는 것을 허용하지 않습니다.

검색 엔진

(검색 엔진, 검색 엔진, 검색 로봇)

인터넷 검색을 전담하는 수십 개의 크고 수천 개의 작고 전문화된 웹 사이트가 있습니다. ϶ᴛᴏth 그룹의 검색 도구를 사용하면 특정 규칙에 따라 사용자가 필요한 정보에 대한 요구 사항을 공식화할 수 있습니다(쿼리 언어를 사용하여 쿼리 생성).» 검색 엔진인 ϲᴏᴏᴛʙᴇᴛʙᴇᴛϲᴛʙ는 사용자 정의 요구 사항(쿼리와 관련됨)을 따릅니다. ) 검색 노드는 자신의 인터넷 인덱스를 사용할 수 있으며, 스파이더(스파이더)라는 특수 프로그램에 의해 지속적으로 업데이트됩니다. 스파이더 프로그램은 웹을 검사하여 주어진 페이지의 각 링크를 확인한 다음 페이지 주소가 지정된 링크 등을 확인하고 모든 정보를 소유자에게 알립니다. 후속 인덱싱을 위한 페이지.

검색 결과 쿼리와 관련된 문서(웹 페이지)에 대한 링크가 포함된 하나 이상의 페이지가 생성됩니다.각 링크에 대해 문서 생성 날짜, 문서의 양, 관련성 정도는 말할 가치가 있습니다. 쿼리에 문서의 내용을 특징짓는 텍스트 조각도 일반적으로 표시됩니다. 이러한 링크를 클릭하면 관심 있는 페이지를 다운로드할 수 있습니다. 매우 많은 수의 문서가 발견된 경우 쿼리를 구체화하고 ϲᴏᴏᴛʙᴇᴛϲᴛʙ에서 검색을 반복할 수 있지만 선택한 페이지에서만(이러한 검색은 다른 시스템에서 다르게 호출되지만 일반적으로 ϶ᴛᴏ - 검색 찾은 것에서) 많은 검색 엔진에서 특정 방법을 사용하여 콘텐츠가 귀하의 요구에 가장 적합한 페이지로 링크를 변경하고 검색을 반복하여 유사한 것을 검색하도록 요구할 수 있습니다.

자동 검색의 장점은 사실 인터넷에서 사용할 수 있는 매우 많은 양의 정보를 볼 수 있다는 것입니다. 이 순간. 동시에 귀하의 정보 요구 사항을 적절하게 반영하는 요청에 대한 정확한 설명의 복잡성과 조회된 페이지 요청의 ϲᴏᴏᴛʙᴇᴛϲᴛʙ의 정도를 자동으로 결정하는 작업의 훨씬 더 큰 복잡성으로 인해 "처음 실행할 때" 선택한 페이지 수는 일반적으로 매우 작거나 너무 큽니다. 일반적으로 검색 엔진을 사용한 검색은 반복적인(다중 패스) 프로세스로, 그 결과 쿼리 형식이 점차 개선됩니다.

메타 검색 엔진

위에서 언급했듯이 모든 검색 엔진은 특정 서버 집합을 살펴보고 자체 기준에 따라 ϲᴏᴏᴛʙᴇᴛϲᴛʙii의 문서를 선택합니다. 결과적으로 동일한 키워드에 대해 다른 시스템으로 검색하면 다른 결과가 나타납니다. 이것은 자체적으로 아무것도 검색하지 않고 한 번에 여러 검색 엔진에 도움을 요청하는 소위 메타 검색(또는 다중 검색) 시스템을 만드는 아이디어로 이어졌습니다. 각 메타 검색 엔진에는 ϲʙᴏ 번째 쿼리 언어가 있습니다. 시스템은 해당 언어로 공식화된 쿼리를 각 검색 엔진에서 사용하는 쿼리 언어로 번역합니다. 또한, 모든 시스템의 검색 결과는 ϲᴏᴏᴛʙᴇᴛϲᴛʙ 형식으로 결합되어 표시됩니다. 당연히 메타 검색 엔진을 사용한 검색은 기존 검색 엔진보다 시간이 더 오래 걸립니다.

가장 인기 있는 검색 엔진 개요

인터넷에는 수많은 검색 엔진이 있으며 각 사용자는 익숙하거나 동료가 조언한 검색 엔진에 의해 안내됩니다. 우리는 사이트 중 하나에서 제공되는 가장 인기있는 검색 엔진에 대한 간략한 설명을 사용할 것입니다.

1. Google(www.google.com) 가장 빠르고 가장 큰 검색 엔진. 13억 개 이상의 페이지가 인덱싱되었습니다(이 중 7억 개가 조금 넘는 페이지가 완전히 색인되었으며 나머지는 주소와 링크 텍스트만 알려져 있음). 특정 사이트 및/또는 도메인의 결과를 포함/제외할 수 있습니다. 대부분의 검색 엔진과 달리 Google은 다른 페이지에서 해당 리소스로 연결되는 링크의 수로 리소스의 인기도를 평가합니다. 주제별 검색(Apple Macintosh, BSD UNIX, Linux, 미국 정부 및 대학 검색)이 주요 과학 및 교육 기관의 리소스에서 검색됩니다.

2. Yandex(www.yandex.ru) 국내 최고의 검색엔진. ϶ᴛᴏm은 능력 면에서 외국 시스템보다 열등하지 않은 반면, 주로 러시아어 자원을 색인화합니다. 검색은 사이트 또는 해당 하위 디렉토리를 나타내는 날짜로 제한되는 모든 단어 형식으로 또는 정확하게 수행할 수 있습니다. 소위 인용 색인을 기반으로 검색하고 이미지, 스크립트, 애플릿을 검색할 수 있습니다. 문서의 언어를 설정합니다. 필요한 링크는 일반적으로 처음 10개의 결과에서 찾을 수 있습니다. http://www.ya.ru에 "라이트" 버전(최소한의 디자인 요소 포함)이 있습니다.

3. AltaVista(www.altavista.com) 검색 기준을 크게 확장합니다. 고급 검색에는 리소스 생성 또는 수정 날짜, 25개 언어 지원을 포함하는 시간 간격 선택이 있습니다. 사이트당 하나의 결과를 발행할 가능성이 있습니다(϶ᴛᴏ 품질 저하 없이 검색 범위를 좁힙니다). Power search에는 표준 기능 세트가 있습니다. 최근까지 AV는 대규모 포털이었으나 재정적(뿐만 아니라) 이유로 인해 서비스 수를 크게 줄였습니다.

4 야후! (www.yahoo.com) 인터넷 최초의 검색 엔진 중 하나라는 점에 유의하는 것이 중요합니다. 와는 별개로 표준 세트기능을 사용하면 날짜별로 리소스를 선택할 수 있습니다(4년, 1, 3, 6개월, 주, 1, 3일) 키워드의 문자 시퀀스 대신 "*" 기호를 지정하는 기능을 지원합니다. 야후! 카테고리 (카테고리)의 큰 구조화 된 카탈로그가 컴파일되었습니다. 먼저 검색이 수행 된 다음 자체 아카이브에서 수행 된 다음 - 사용 구글 시스템. 범주에서 검색하면 좋은 결과를 얻을 수 있습니다.

5. Lycos (www.lycos.com) 최근 - 가장 인기있는 시스템 중 하나입니다. 이 모든 것을 통해 "AND" "OR", 구문 검색, 단어의 필수 존재 / 부재와 같은 특별한 기능을 제공하지 않습니다. 고급 기능 - 제목, URL, 호스트 이름 및/또는 도메인 이름에서 검색 러시아어를 포함한 25개 언어 - 한마디로 전체 "일반적으로 허용되는" 세트입니다. 자동, 책, ftp, 다운로드, 뉴스 등 리소스의 콘텐츠 유형을 지정할 수 있습니다. 분명히 라이코스의 인기는 ϶ᴛᴏth 주요 프로젝트의 규모의 결과입니다.

6. Rambler (www.rambler.ru) 최근까지 가장 유명한 러시아 검색 엔진. 고급 검색은 구문 검색을 허용하지 않으며 1999년 2월까지의 일반 검색에서는 거의 만족할 만한 결과가 나오지 않았습니다. 2월부터 ϶ᴛᴏ 시스템은 개선된 검색 엔진을 사용하고 있으며 디자인이 변경되었지만 Rambler의 품질은 여전히 ​​Yandex 및 Aport와 동일하지 않습니다(검색 엔진을 분석하는 저자에 따르면) 사이트에는 다음과 같은 등급 카탈로그가 있습니다. Rambler 상위 100개 리소스, 인터넷 프로젝트에 대한 통계 정보의 인정된 출처 중 하나.

7. Aport (www.aport.ru) 또 다른 좋은 러시아어 검색 엔진. 검색은 다음을 사용하여 텍스트(모든 단어 형식에서만) 및 URL로 수행됩니다. 논리 연산자및 연산자 "..."(단, 구의 불용어는 여전히 무시됨), 날짜별 및 별도의 필드(제목, 설명 등), 메타 문자 * 및! 검색 결과의 표시는 다른 러시아 검색 엔진에 비해 가장 잘 설계되었습니다. 약간의 의구심은 분명히 정보로 가득 찬 메인 페이지의 디자인으로 인해 발생합니다. http://aport.ru에 약간 "가벼운" 버전이 있습니다.

검색 엔진을 선택하는 방법

인터넷을 검색할 때 두 가지 구성 요소가 중요합니다. 완전성(손실된 것이 없음)과 정확성(추가로 발견된 것이 없음)입니다.

1. 커버리지와 깊이

커버리지는 검색 엔진 데이터베이스의 양을 말하며 색인된 정보의 총량, 고유 서버 수 및 고유 문서 수의 세 가지 지표로 측정됩니다. 깊이는 페이지 수 또는 한 서버에 중첩되는 디렉토리 깊이에 제한이 있는지 여부로 이해됩니다.

확인 방법: 일부 기계는 이 사이트에서 로봇 통계를 작성합니다. 그러나 직접 확인할 수 있습니다. 몇 가지 질문이 필요합니다. 검색어, 한 단어로 구성되며(공간에 대한 다양한 해석을 포함하여 쿼리 언어의 영향을 배제하기 위해 ɥᴛᴏ), ϶ᴛᴏm이 기계에서 발행한 결과의 통계를 볼 때 - 일반적으로 목록의 시작 부분에 표시됩니다. 총 몇 개의 문서가 발견되었습니다. 단어가 다른 지역에서 나와야 한다는 사실 외에도 희귀, "중간" 및 "무거운"(자주)의 단어를 가져와서 찾은 수를 비교하는 것도 좋습니다. 특히 무거운 단어는 검색 엔진의 전체 텍스트(문서의 모든 단어 인덱싱)를 테스트합니다.

로봇의 보행 깊이를 확인하는 것이 더 어렵습니다. ϶ᴛᴏ의 경우 분기 아카이브 구조와 같은 일부 사이트를 가져와 문서가 색인화되었는지 확인해야 합니다. 링크를 6번 클릭하면 됩니다.

2. 크롤링 속도 및 링크 관련성

웹 탐색 ​​속도는 새로 추가된 리소스가 얼마나 빨리 인덱싱되고 데이터베이스의 정보가 얼마나 빨리 업데이트되는지 보여줍니다. 검색 엔진(로봇)의 품질에 대한 중요한 지표는 새로운 영역을 포착할 뿐만 아니라 이미 포함된 영역의 상태를 모니터링하는 것임을 잊지 마십시오. 서버가 사라지고 유지되고 서버의 페이지가 업데이트됩니다. 검색 엔진이 찾은 목록에서 제공한 링크는 먼저 존재해야 하며, 두 번째로 해당 콘텐츠가 요청과 일치해야 합니다.

확인 방법: 서버 로그를 분석하여 객관적인 정보를 얻을 수 있습니다. 검색 엔진 로봇은 일반적으로 기계 이름(또는 이와 유사한 이름)으로 표시되므로 서버를 방문하는 빈도, 조회한 페이지 수, 등. 불행히도 일반적으로 그의 사이트의 ϲʙᴏ의 로그만 연구에 사용할 수 있으므로 실험 방법이 남아 있습니다.

크롤링 속도를 결정하려면 어딘가에 텍스트 페이지를 만들고 검색 엔진에 추가하고 얼마나 빨리 나타나기 시작하는지 확인해야 합니다. 또는 기존 페이지를 변경합니다. 링크의 관련성을 결정하려면 최소한 여러 쿼리에 대해 찾은 목록의 첫 번째 페이지에서 문서를 확인해야 합니다. 메시지 찾을 수 없음문서가 더 이상 존재하지 않음을 나타냅니다.

3. 검색 품질(주관적 지표)

각 검색 엔진에는 ϲʙᴏ와 검색 결과를 정렬하는 알고리즘이 있습니다. 필요한 문서가 목록의 맨 위에 가까울수록 관련성이 높아집니다.

확인 방법: 실험에 의해서만. 비교를 위해 다른 길이로 요청하는 것이 좋습니다. 쿼리 언어를 사용할 수도 있지만 설명 읽기를 꺼리는 ϶ᴛᴏm은 확장 쿼리 페이지를 사용할 수 있습니다(Aport 및 Yandex의 "고급 검색", Rambler의 "상세 쿼리" - 러시아어로 번역 옵션 "고급 검색") )

관련성 외에도 중요한 사용자 특성이 있습니다.

4. 검색 속도

검색 엔진이 느리게 응답하면 작업하는 것이 비효율적입니다. 사용자가 보는 속도는 검색 엔진 자체뿐만 아니라 인터넷 채널에도 달려 있다는 점을 추가할 가치가 있습니다.

확인 방법: 실험을 통해 - 다양한 길이, 다른 요청을 찾아야 합니다.<тяжести>단어 및 하루 중 다른 시간에 (서버 로드는 하루 종일 상당히 고르지 않으며 피크는 오후 3-4시 정도)

5. 검색 기능(문서 언어, 쿼리 언어로 작업)

또 다른 비교 포인트는 검색 엔진이 색인에 정확히 무엇을 어떻게 기여하는지입니다. 전체 텍스트 검색 엔진이 사용자에게 표시되는 텍스트의 모든 단어를 색인화한다는 것은 가치가 있습니다. 형태학의 존재는 모든 변화 또는 활용에서 원하는 단어를 찾는 것을 가능하게 합니다. ϶ᴛᴏgo 외에도 HTML 언어검색 엔진에서도 처리할 수 있는 태그가 있습니다(제목, 링크, 이미지 캡션 등).

거의 모든 기계에는 표준 논리 연산자(AND, OR, NOT) 형식의 쿼리 언어가 있습니다. 일부는 주어진 거리에서 구나 단어를 검색할 수 있습니다. ϶ᴛᴏ는 종종 합리적인 결과를 얻는 데 중요합니다. 추가 기능은 제목, 링크, 키워드(META KEYWORDS) 등 문서 영역에서 검색하는 것입니다. 추가 기능쿼리 언어 - 연산자에 대한 지식이 필요하지 않은 자연어 쿼리입니다.

확인 방법: 일반적으로 이 정보는 검색 엔진의 서버에 게시됩니다(도움말 "e). 그럼에도 불구하고 때때로 원하는 것이 유효한 것으로 제공되기 때문에 실제 쿼리를 확인하는 것이 좋습니다.

6. 부대시설

검색 엔진이 사용자에게 제공하는 추가 기능입니다. 여기에는 모든 종류의 검색 옵션(특화 페이지, 유사한 문서 검색, 검색 범위 제한), 검색된 서버 목록, 날짜 및 서버별 검색이 포함됩니다. 사용자 친화적 인 인터페이스검색 엔진 및 개인화 가능성.

확인 방법: 검색 엔진의 서버에 정보가 부분적으로 게시될 수 있지만 이러한 기능을 직접 사용하는 것이 가장 좋습니다.

이 분석에는 시간이 걸릴 것이 분명합니다. 그 외에 다른 인터넷과 마찬가지로 검색 엔진도 가만히 있지 않습니다. 동시에 정보 검색이 중요한 구성 요소 중 하나라는 점을 감안할 때 컴퓨터 기술, ϶ᴛᴏ는 충분한 주의를 기울여야 합니다. 최소한 로컬 네트워크에서 작업할 수 있는 능력 이상이어야 합니다.

Yandex.ru에서 설문 조사가 수행되었습니다. 인터넷이 필요한 이유와 부족한 점 (http://www.yandex.ru/polling/9.html) 설문 조사 데이터를 내림차순으로 배포했습니다. 인터넷은 다음과 같습니다. 디렉토리(23, 76%), 조사 도구(15.45%), 엔터테인먼트(14.15%), 4위만 사용 - 뉴스 매체(12.32%) 사용자의 10%는 항상, 73%는 낙관적으로 들렸습니다. 종종 필요한 정보를 찾는 데 성공합니다. 그리고 인터넷에 없는 것: 정보, 좋은 검색 및 질서(포함: 질서, 구조, 구조, 구조화, 구조화 및 시스템, 체계화, 체계화, 체계화 및 체계화)

질문에 답하십시오:

인터넷에서 검색을 구성하는 방법은 무엇입니까?

카탈로그 및 데이터베이스에서 정보는 어떻게 검색됩니까?

정보는 카탈로그와 데이터베이스에 어떻게 입력됩니까?

인터넷 검색 엔진이란 무엇입니까?

검색 엔진에서 정보 데이터베이스는 어떻게 형성됩니까?

검색 엔진의 정보 검색은 어디에서 시작됩니까?

요청이란 무엇입니까?

검색 엔진에서 정보는 어떻게 검색됩니까?

쿼리 관련성은 무엇을 의미합니까?

추가 검색 중에 매우 많은 수의 문서가 발견된 경우 어떻게 해야 합니까?

메타 검색 엔진이란 무엇입니까?

메타 검색 엔진과 기존 검색 엔진의 근본적인 차이점은 무엇입니까?

다음 시스템 중 메타 검색 엔진이 될 시스템은 무엇입니까?

국내 인기 검색엔진은?

가장 인기있는 외국 검색 엔진은 무엇입니까?

인터넷에서 정보를 검색할 때 어떤 두 가지 구성 요소가 중요합니까?

인터넷에서 정보를 검색할 때 검색 엔진의 효율성을 결정하는 특성은 무엇입니까?

이용약관:
자료에 대한 지적 재산권 - 정보 제공 컴퓨터 네트워크- Borisov N.A., Lukin A.A. 저작자에게 속합니다. 이 설명서/책은 상업적 유통에 관여하지 않고 정보 제공의 목적으로만 게시됩니다. 모든 정보("테마 3. 인터넷에서 정보 검색" 포함)는 공개 소스에서 수집되거나 사용자가 무료로 추가합니다.
게시된 정보를 최대한 활용하기 위해 사이트 프로젝트 관리는 책/매뉴얼 Information Computer Networks - Borisov N.A., Lukin A.A.를 구매할 것을 강력히 권장합니다. 모든 온라인 상점에서.

태그 블록: 정보 컴퓨터 네트워크 - Borisov N.A., Lukin A.A., 2015. 주제 3. 인터넷에서 정보 검색.

(다) 법적 리포지토리 사이트 2011-2016

인터넷을 검색하는 세 가지 방법

일반적으로 인터넷, 특히 World Wide Web은 상상할 수 없는 양의 정보를 저장하는 수천 개의 서버와 수백만 개의 웹 페이지에 대한 액세스를 가입자에게 제공합니다. 이 "정보의 바다"에서 길을 잃지 않는 방법은 무엇입니까? 이렇게하려면 네트워크에서 필요한 정보를 검색하고 찾는 방법을 배워야합니다.

이미 언급했듯이 인터넷에서 정보를 찾는 세 가지 주요 방법이 있습니다.

1. 페이지 주소를 지정합니다.가장 빠른 검색 방법이지만 문서의 주소를 정확히 알고 있는 경우에만 사용할 수 있습니다.

2. 하이퍼링크를 통한 탐색.현재 문서와 의미가 유사한 문서만 검색할 수 있으므로 가장 편리한 방법입니다. 예를 들어 현재 문서가 음악 전용인 경우 이 문서의 하이퍼링크를 사용하면 스포츠 전용 사이트로 이동하는 것이 거의 불가능합니다.

3. 검색 서버에 접속(검색 엔진). 검색 엔진을 사용하는 것이 정보를 찾는 가장 편리한 방법입니다. 현재 다음 검색 서버는 인터넷의 러시아어 사용 지역에서 널리 사용됩니다. Yandex; 램블러.

다른 검색 엔진도 있습니다. 예를 들어, 효율적인 검색 시스템은 mail.ru 메일 서비스 서버에서 구현됩니다.

서버 검색

World Wide Web에서 정보를 찾는 가장 접근하기 쉽고 편리한 방법은 검색 엔진을 사용하는 것입니다. 동시에 정보는 카탈로그뿐만 아니라 검색된 텍스트 문서를 특징짓는 일련의 키워드로 검색할 수 있습니다.

검색 서버의 사용을 더 자세히 고려하십시오. 검색 서버다양한 문서에 대한 많은 링크가 포함되어 있으며 이러한 모든 링크는 주제별 디렉토리에 체계화되어 있습니다. 예: 스포츠, 영화, 자동차, 게임, 과학 등. 또한 이러한 링크는 World Wide Web에 나타나는 모든 웹 페이지를 정기적으로 확인함으로써 서버에서 독립적으로 자동으로 설정됩니다. 또한 검색 서버는 사용자에게 키워드로 정보를 검색할 수 있는 기능을 제공합니다. 키워드를 입력한 후 검색 서버는 다른 웹 서버에서 문서 탐색을 시작하고 지정된 단어가 있는 문서에 대한 링크를 표시합니다. 일반적으로 검색 결과는 주어진 문서가 검색 기준과 얼마나 일치하는지 또는 웹에서 요청되는 빈도를 나타내는 특수 문서 등급에 따라 내림차순으로 정렬됩니다.

검색 엔진 쿼리 언어

쿼리 언어를 사용하여 특정 규칙에 따라 형성된 키워드 그룹을 검색 서버에 대한 요청이라고 합니다. 다른 검색 엔진에 대한 쿼리 언어는 매우 유사합니다. 원하는 검색 서버의 "도움말" 섹션을 방문하여 이에 대해 자세히 알아볼 수 있습니다. Yandex 검색 엔진의 예에 대한 쿼리 생성 규칙을 고려하십시오.

연산자 구문 연산자는 무엇을 의미합니까 요청 예시
공백 또는 & 논리 AND(문장 내) 고정 틀니
&& 논리 AND(문서 내) 유형 &&(고정 틀니)
| 논리적 OR 사진 | 사진 | 스냅샷 | 사진 이미지
+ 발견된 문서에 단어의 필수 존재 +되기 또는 +없기
() 그룹화 단어 (기술 | 생산) (치즈 | 코티지 치즈)
~ 이진 연산자 AND NOT(문장 내) 은행 ~ 법률
~ 또는 _ 이진 AND NOT 연산자(문서 내) 파리여행가이드~~ (대리점|투어)
/(nm) 단어 단위 거리(빼기(-) - 뒤로, 더하기(+) - 앞으로) 공급업체 /2 커피 음악 /(-2 4) 교육 공석 ~ /+1 학생
« « 구문 검색 "고정 의치"에 해당하는 항목: 고정 /+1 의치
&&/(nm) 문장의 거리(빼기(-) - 뒤로, 더하기(+) - 앞으로) 의학 && /1 틀니

일반 정보.

현재 인터넷은 수십억 개의 서로 다른 사이트와 다양한 종류의 정보를 포함하는 개별 파일을 호스팅하는 수억 대의 서버를 통합합니다. 그것은 정보의 거대한 저장소입니다. 인터넷에서 정보를 검색하는 방법은 다양합니다.

알려진 주소로 검색합니다. 필요한 주소는 디렉토리에서 가져옵니다. 주소만 알면 입력 주소 표시 줄브라우저.

www.gov.ru - 러시아 국가 당국의 서버.

사용자에 의한 주소 구성. 인터넷 주소 생성 시스템을 알면 웹 사이트를 검색할 때 주소를 구성할 수 있습니다.

키워드(회사명, 기업명, 단체명 또는 간단한 영문명사)에 주제나 지리적 영역을 추가해야 하며, 직관력이 연결되어야 합니다.

상업 웹사이트 주소:

www.cnn.com (CNN 월드 뉴스),

www.sony.com 소니),

www.mtv.com (MTV 음악 뉴스).

교육 기관 주소:

www.ntu.edu(미국 국립 대학교).

지역 서버 주소:

www.poland.net(폴란드),

www.israil.net(이스라엘).

인터넷 검색 엔진

인터넷에서 정보를 검색하기 위해 특수 정보 검색 시스템이 개발되었습니다. 검색 엔진은 일반 주소를 가지며 검색 구성을 위한 특수 도구(검색 문자열, 주제 카탈로그, 링크)가 포함된 웹 페이지로 표시됩니다. 검색 엔진을 호출하려면 브라우저의 주소 표시줄에 해당 주소를 입력하기만 하면 됩니다.

정보 검색 시스템은 정보를 구성하는 방법에 따라 분류(루브리케이터)와 사전의 두 가지 유형으로 나뉩니다.

루브리케이터(분류기)는 정보의 계층적(나무와 같은) 구성을 사용하는 검색 엔진입니다. 정보를 검색할 때 사용자는 주제별 제목을 살펴보고 점차적으로 검색 필드를 좁힙니다(예: 단어의 의미를 찾아야 하는 경우 먼저 분류기에서 사전을 찾은 다음 그 안에서 찾아야 합니다. 옳은 말).

사전 검색 시스템은 강력한 자동 소프트웨어 및 하드웨어 시스템입니다. 그들의 도움으로 인터넷의 정보가 표시됩니다(스캔). 이 정보 또는 그 정보의 위치에 대한 데이터는 특별 참고 도서 색인에 입력됩니다. 요청에 대한 응답으로 쿼리 문자열에 따라 검색이 수행됩니다. 그 결과, 사용자는 스캐닝 당시 검색된 단어 또는 단어 그룹이 발견된 주소(URL)를 제공받습니다. 제안된 링크 중 하나를 선택하면 찾은 문서로 이동할 수 있습니다. 대부분의 최신 검색 엔진은 혼합되어 있습니다.

가장 유명하고 인기 있는 검색 엔진:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

검색을 전문으로 하는 시스템이 있습니다. 정보 자원다양한 방향으로.

인터넷에서 사람 검색:

www.whowhere.ru www. 빅풋닷컴

뉴스 그룹으로 검색(유즈넷):

www.dejanews.com

주제 검색 엔진:

검색 소프트웨어:

파일 아카이브에서 검색:

http://ftpseach.com city.ru, http://ftpsearch. licos.com

카탈로그(주석이 있는 주제별 링크 모음):

http://www.atrus.ru

종종 정보에 대한 효과적인 검색은 도시 또는 지역의 기업 또는 웹 리소스에 대한 데이터를 포함하는 특수 서버인 지역 카탈로그를 사용하여 수행할 수 있습니다. 예를 들어, St. Petersburg의 경우 이러한 카탈로그는 http://www.spb.ru에 있습니다.

IPS 목록은 www.monk에서 찾을 수 있습니다. newmail.ru

검색 엔진 및 디렉토리의 자세한 목록은 표에 나와 있습니다. 3.2.

쿼리 실행 규칙

각 검색 엔진의 도움말 섹션에서 검색 방법, 쿼리 문자열 구성 방법에 대한 정보를 얻을 수 있습니다. 다음은 일반적인 "평균" 쿼리 언어에 대한 정보입니다.

간단한 요청입니다.

검색 주제를 정의하는 한 단어를 입력하십시오. 예를 들어 Rambler.ru 검색 엔진에서는 자동화를 입력하는 것으로 충분합니다.

요청에 지정된 단어가 포함된 문서를 찾았습니다. 모든 형태의 러시아어 단어가 인식되며 일반적으로 문자의 경우는 무시됩니다.

쿼리에 "*" 또는 "?" 문자를 사용할 수 있습니다. 징후 "?" 키워드에서 한 문자가 대체되고 그 자리에서 모든 문자가 대체될 수 있으며 문자 "*"는 일련의 문자입니다.

예를 들어 automaton* 쿼리는 automatic, automatic 등의 단어가 포함된 문서를 찾습니다.

복잡한 요청.

보다 구체적인 정보를 얻기 위해 키워드를 결합해야 하는 경우가 종종 있습니다. 이 경우 추가 연결어, 기능, 연산자, 기호, 대괄호로 구분된 연산자의 조합이 사용됩니다.

예를 들어, music & (beatles | beatles) 쿼리는 사용자가 music 및 beatles 또는 music 및 beatles라는 단어가 포함된 문서를 찾고 있음을 의미합니다.

표 3.1은 Aport 시스템(http://www.aport.ru)에서 채택한 요청 생성 규칙을 보여줍니다.

표 3.1

요청을 형성하기 위한 연산자

운영자 동의어 논평
그리고 그리고 & 쿼리는 두 키워드가 모두 포함된 문서를 찾습니다. 써도 되고 안 써도 됩니다. 예를 들어 쿼리: 컴퓨터 과학 및 교과서는 컴퓨터 과학 교과서와 동일합니다.
또는 또는 | 지정된 단어 중 하나 또는 두 단어를 동시에 사용하는 문서 검색
아니다 아니-~ 연산자 뒤에 지정된 단어가 포함되지 않은 문서로 검색이 제한됩니다.
" " " " 큰따옴표나 작은따옴표를 사용하면 구를 찾을 수 있습니다.
날짜= 날짜:날짜= 검색은 지정된 날짜 간격에 속하는 문서로 제한됩니다(예 1. 통화 날짜=01/02/2002-01/03/2002). 이 요청은 "currency"라는 단어를 포함하고 날짜가 2002년 2월 1일에서 2002년 3월 1일 사이인 문서를 반환합니다. 예 2. date=01/03/2002 currency 예 3. 날짜:<02/03/2002 валюта

표 3.2

검색 서버 및 디렉토리 목록

주소 설명
www.excite.com 노드 리뷰 및 가이드가 있는 검색 엔진
www.alta-vista.com 검색 서버, 고급 검색 기능 사용 가능
www.hotbot.com 검색 서버
www.poland.net www.israil.net 폴란드, 이스라엘의 지역 검색 서버
www.ifoseek.com 검색 서버(사용하기 쉬운)
www.ipl.org 월드빌리지 사업의 일환으로 운영되는 공공도서관 인터넷공공도서관
www.wisewire.com WiseWire - 인공 지능을 사용한 검색 구성
www.webcrawler.com WebCrawler - 사용하기 쉬운 검색 서버
www.yahoo.com AltaVista 서버에서 전체 텍스트 검색에 액세스하기 위한 웹 카탈로그 및 인터페이스
www.aport.ru Aport - 러시아어 검색 서버
www.yandex.ru Yandex - 러시아어 검색 서버
www.rambler.ru Rambler - 러시아어 검색 서버
인터넷 도움말 리소스
www.yellow.com 인터넷 옐로우 페이지
수도사. newmail.ru 다양한 프로필의 검색 엔진
www.top200.ru 상위 200개 웹사이트
www.allru.net
www.ru 러시아 인터넷 리소스 카탈로그
www.allru.net/z09. htm 교육 자료
www.students.ru 러시아 학생 서버
www.cdo.ru/index_new. ASP 원격 학습 센터
www.open. 교류 영국 오픈 유니버시티 영국
www.ntu.edu 미국 국립 대학교
www.translate.ru 전자 텍스트 번역기
www.pomorsu.ru/guide. library.html 넷 라이브러리에 대한 링크 목록
www.library.ru 과학 전자 도서관
www.citforum.ru 전자도서관
www.infamed.com/psy 심리 테스트
www.pokoleniye.ru 인터넷교육연맹 홈페이지
www.method. people.ru 교육 자료
www.spb. www.osi.ru/ic/distant 인터넷에서 원격 학습
www.examen.ru 시험 및 시험
www.kbsu.ru/~책/ 컴퓨터 과학 교과서
메가. km.ru 백과사전 및 사전

인터넷에서 정보 검색: 함정

표면에 존재하지 않는 문제는 탐사 작업의 특정 단계가 완료되고 결과에 따라 이미 일부 결정이 내려진 후에 "회고"적으로만 느껴지게 되는 경우가 많습니다. 이것 또는 그 정보 검색 시스템(IPS)의 운영 초기부터 상황을 투명하게 만드는 것을 방해하는 것은 무엇입니까? 대답은 매우 간단합니다. 개발자 측에서 이러한 종류의 포괄적인 정보가 부족합니다. 이것의 직접적인 결과는 수신된 데이터의 신뢰성과 통제할 수 없는 손실입니다. 일부 "문서화되지 않은" 기능이 없는 검색 엔진을 웹에서 찾는 것은 드뭅니다. 사용자는 다음과 같은 많은 정보가 필요하지 않은 것 같습니다.

IPS 데이터베이스가 어떻게 채워지고 그 볼륨은 얼마입니까?

시스템의 검색 언어의 모든 가능성;

검색 결과 표시의 주요 기능, 주로 검색 쿼리에 대한 응답 목록에서 레코드의 순위를 지정하는 알고리즘입니다.

아아, 이러한 정보의 출처는 일반적으로 검색 서버의 기본 페이지에서 사용할 수 있는 문서가 아니라 웹, 책 및 컴퓨터 잡지에 흩어져 있는 개별 저자의 출판물입니다. 이러한 상황의 원인에는 개발자의 부주의뿐만 아니라 마케팅 정책이라는 요인도 포함됩니다. 간단히 말해서 검색 엔진에 자체에 대한 가장 완전한 정보를 제공하는 것이 항상 순위에 긍정적인 영향을 미치는 것은 아닙니다. 그럼에도 불구하고 어떤 경우에는 사용자가 상황을 통제할 수 있습니다. 테스트를 통해 선택한 검색 서비스의 기능을 찾는 것이 종종 가능합니다. 현재 작업에 가장 중요한 시스템 작동 측면을 신속하게 명확히 하는 특수 테스트 쿼리를 작성하는 것은 많은 경우에 사소한 일이 아닙니다. IPS로 작업할 때 몇 가지 문제를 피하는 방법에 대해 논의할 것입니다. 프레젠테이션을 설명하는 예로서 널리 알려진 인터넷 검색 엔진을 고려할 것입니다.