인터넷에서 정보 검색

인터넷은 매우 빠른 속도로 성장하고 있으므로 필요한 정보수천억 개의 웹 페이지와 수억 개의 파일 중에서 점점 더 어려워지고 있습니다. 정보를 검색하기 위해 수억 대의 인터넷 서버에서 웹 페이지 및 파일의 위치에 대한 지속적으로 업데이트되는 정보를 포함하는 특수 검색 엔진이 사용됩니다.

검색 엔진은 데이터베이스에 있는 World Wide Web의 정보 자원에 대해 주제별로 그룹화된 정보를 포함합니다. 특수 프로그램-로봇은 인터넷 웹 서버를 주기적으로 "우회"하고, 발견된 모든 문서를 읽고, 키워드를 강조 표시하고, 문서의 인터넷 주소를 데이터베이스에 입력합니다.

대부분의 검색 엔진에서는 웹 사이트 작성자가 등록 양식을 작성하여 데이터베이스에 정보를 입력할 수 있습니다. 설문지를 작성하는 과정에서 사이트 개발자는 사이트 주소, 이름, 간단한 설명사이트의 내용과 사이트를 가장 쉽게 찾을 수 있는 키워드.

키워드 검색.검색 엔진의 데이터베이스에서 문서 검색은 쿼리를 입력하여 수행됩니다. 검색 필드.

요청에는 이 문서의 주요 키워드인 하나 이상의 키워드가 포함되어야 합니다. 예를 들어 인터넷 검색 엔진 자체를 검색하려면 " 러시아 시스템인터넷에서 정보 검색 "(그림 6.21).

요청을 보낸 후 얼마 후 검색 엔진은 지정된 키워드가 있는 문서의 인터넷 주소 목록을 반환합니다. 브라우저에서 이 문서를 보려면 해당 문서를 가리키는 링크를 활성화하는 것으로 충분합니다(그림 6.22).

키워드가 성공적으로 선택되지 않은 경우 문서 주소 목록이 너무 클 수 있습니다(수만 또는 수십만 개의 링크가 포함될 수 있음). 목록을 좁히려면 검색 필드에 추가 키워드를 입력하거나 검색 엔진 디렉토리를 사용할 수 있습니다.

가장 완벽하고 강력한 검색 엔진 중 하나인 Google(www.google.ru)은 데이터베이스에 80억 개의 웹 페이지를 저장하고 매월 로봇에 의해 500만 개의 새로운 페이지가 입력됩니다. Runet(인터넷의 러시아 부분)에는 각각 Yandex(www.yandex.ru) 및 Rambler(www.rambler.ru) 검색 엔진이 있는 2억 개의 문서가 포함된 광범위한 데이터베이스가 있습니다.

계층적 디렉토리 시스템에서 검색합니다.검색 엔진 데이터베이스에서 웹 사이트는 다음과 같이 그룹화됩니다. 계층적 주제 디렉토리, 도서관의 주제 카탈로그와 유사합니다.

최상위 주제 섹션, 예: 인터넷, 컴퓨터, 과학 및 교육등등, 중첩된 디렉토리를 포함합니다. 예를 들어 인터넷 디렉토리에는 하위 디렉토리가 포함될 수 있습니다. 검색, 메일및 기타(그림 6.23).

디렉토리에서 정보를 검색하는 것은 특정 디렉토리를 선택하는 것으로 축소되며, 그 후에 사용자에게 가장 많이 방문하고 의미 있는 웹 사이트의 인터넷 주소에 대한 링크 목록이 표시됩니다. 각 링크에는 일반적으로 주석이 달려 있습니다. 즉, 문서 내용에 대한 짧은 설명이 포함되어 있습니다.

Aport 검색 엔진(www.aport.ru)에는 러시아어 인터넷 리소스의 가장 완벽한 다단계 계층적 주제 카탈로그가 있습니다. 카탈로그에는 웹 사이트 내용에 대한 자세한 주석과 지리적 위치 표시가 포함되어 있습니다.

파일 검색.파일 보관 서버에서 파일을 검색하기 위해 FileSearch 검색 엔진(www.filesearch.ru)을 비롯한 특수 검색 엔진이 있습니다. 파일을 검색하려면 검색 필드에 파일 이름을 입력해야 하며 검색 엔진은 주어진 이름으로 파일을 저장하는 파일 보관 서버의 인터넷 주소를 반환합니다.

대부분의 검색 엔진(Google, Rambler, Aport, Applex 및 Research 파일 검색 엔진)을 사용하여 인터넷의 러시아어 사용 부분에서 정보 검색은 통합 검색 엔진 Gogle.ru를 사용하여 수행할 수 있습니다(그림 6.24). 이렇게하려면 검색 창에 키워드를 입력하고 스위치를 사용하여 필요한 정보 유형을 설정하고 검색 엔진 Gogle.ru의 이름이있는 버튼을 클릭하십시오 (그림 6.24). 이렇게 하려면 검색 창에 키워드를 입력하고 스위치를 사용하여 필요한 정보 유형을 설정하고 검색 엔진 이름이 있는 버튼을 클릭하기만 하면 됩니다.


쌀. 6.24. 통합 검색 엔진 Google.ru

인터넷 검색 방법

인터넷을 검색하는 세 가지 방법

일반적으로 인터넷, 특히 World Wide Web은 가입자에게 상상할 수 없는 양의 정보를 저장하는 수천 대의 서버와 수백만 개의 웹 페이지에 대한 액세스를 제공합니다. 이 "정보의 바다"에서 길을 잃지 않는 방법은 무엇입니까? 이렇게하려면 네트워크에서 필요한 정보를 검색하고 찾는 방법을 배워야합니다.

이미 언급했듯이 인터넷에서 정보를 찾는 세 가지 주요 방법이 있습니다.

1. 페이지 주소를 지정합니다.이것이 가장 빠른 길단, 문서의 정확한 주소를 알고 있는 경우에만 사용할 수 있습니다.

2. 하이퍼링크를 통한 탐색.이것은 현재 문서와 의미가 가까운 문서만 검색하는 데 사용할 수 있으므로 가장 편리한 방법입니다. 예를 들어 현재 문서가 음악 전용인 경우 이 문서의 하이퍼링크를 사용하면 스포츠 전용 사이트로 이동하는 것이 거의 불가능합니다.

3. 검색 서버 호출 검색 엔진) . 검색 엔진을 사용하는 것이 정보를 찾는 가장 편리한 방법입니다. 현재 다음 검색 서버는 인터넷의 러시아어 사용 지역에서 널리 사용됩니다.

    얀덱스;
    램블러;
    아포트.

다른 검색 엔진도 있습니다. 예를 들어, 효율적인 시스템서버에서 구현된 검색 우편 서비스메일.루.

서버 검색

에서 정보를 검색하는 가장 접근하기 쉽고 편리한 방법 월드 와이드 웹검색 엔진을 사용하는 것입니다. 동시에 정보는 카탈로그뿐만 아니라 검색된 텍스트 문서를 특징짓는 일련의 키워드로 검색할 수 있습니다.

검색 서버의 사용을 더 자세히 고려하십시오. 검색 서버가장 많은 링크가 포함되어 있습니다. 각종 서류, 이러한 모든 링크는 주제별 디렉토리로 구성됩니다. 예: 스포츠, 영화, 자동차, 게임, 과학 등. 또한 이러한 링크는 서버에서 독립적으로 설정됩니다. 자동 모드 World Wide Web에 나타나는 모든 웹 페이지를 정기적으로 봅니다. 또한 검색 서버는 사용자에게 키워드로 정보를 검색할 수 있는 기능을 제공합니다. 키워드를 입력한 후 검색 서버는 다른 웹 서버에서 문서 탐색을 시작하고 지정된 단어가 있는 문서에 대한 링크를 표시합니다. 일반적으로 검색 결과는 특정 문서가 검색 기준과 얼마나 일치하는지 또는 웹에서 요청되는 빈도를 나타내는 특수 문서 등급에 따라 내림차순으로 정렬됩니다.

검색 엔진 쿼리 언어

쿼리 언어를 사용하여 특정 규칙에 따라 형성된 키워드 그룹을 검색 서버에 대한 요청이라고 합니다. 다른 검색 엔진에 대한 쿼리 언어는 매우 유사합니다. 원하는 검색 서버의 "도움말" 섹션을 방문하여 이에 대해 자세히 알아볼 수 있습니다. 예를 들어 Yandex 검색 엔진을 사용하여 쿼리를 생성하는 규칙을 고려하십시오.

연산자 구문 연산자는 무엇을 의미합니까 요청 예시
공백 또는 & 논리 AND(문장 내) 물리치료
&& 논리 AND(문서 내) 레시피 &&(가공 치즈)
| 논리적 OR 사진 | 사진 | 스냅샷 | 사진 이미지
+ 발견된 문서에 단어의 필수 존재 +되기 또는 +없기
() 그룹화 단어 (기술 | 생산) (치즈 | 코티지 치즈)
~ 이항 연산자 AND NOT(문장 내) 은행 ~ 법률
~~
또는
_
이진 AND NOT 연산자(문서 내) 파리여행가이드~~ (대리점|투어)
/(nm) 단어 단위 거리(빼기(-) - 뒤로, 더하기(+) - 앞으로) 공급업체 /2 커피 음악 /(-2 4) 교육 공석 ~ /+1 학생
" " 구문 검색 "작은 빨간 망토" 동등하게: 빨강 / +1 망토
&&/(nm) 문장의 거리(빼기(-) - 뒤로, 더하기(+) - 앞으로) 은행 && /1 세금

얻기 위해 최고 점수검색하려면 몇 가지 간단한 규칙을 기억해야 합니다.

    1. 하나의 키워드로 정보를 검색하지 마십시오.

    2. 키워드를 대문자로 입력하면 소문자로 작성된 동일한 단어가 검색되지 않을 수 있으므로 키워드를 입력하지 않는 것이 가장 좋습니다.

    3. 검색 결과가 반환되지 않으면 검색 결과가 있는지 확인하십시오. 키워드 x 철자 오류.

최신 검색 엔진은 의미 분석기의 생성된 요청에 연결할 수 있는 기능을 제공합니다. 도움을 받아 단어를 입력하여 다양한 경우, 시제 등으로 이 단어의 파생어가 있는 문서를 선택할 수 있습니다.

시험 문제

1. 키워드로 문서를 검색하는 방법은 무엇입니까? 디렉토리 시스템에서?

자기실현을 위한 과제

6.8 실용과제. 다른 검색 엔진을 사용하여 키워드별로 문서에 대한 검색 결과를 비교합니다(통합 Google 검색 엔진 사용).

6.9 실제 작업. 파일 보관 서버에서 WinAmp 미디어 플레이어 파일을 검색합니다.

뭐야

DuckDuckGo는 꽤 잘 알려진 오픈 소스 검색 엔진입니다. 소스 코드. 서버는 미국에 있습니다. 자체 로봇 외에도 검색 엔진은 Yahoo, Bing, Wikipedia와 같은 다른 소스의 결과를 사용합니다.

더 나은

DuckDuckGo는 최고의 개인 정보 보호 및 개인 정보 검색으로 스스로를 포지셔닝합니다. 시스템은 사용자에 대한 어떠한 데이터도 수집하지 않으며, 로그를 저장하지 않으며(검색 기록 없음), 쿠키최대로 제한됩니다.

덕덕고는 이용자의 개인정보를 수집하거나 공유하지 않습니다. 이것은 우리의 개인 정보 보호 정책입니다.

덕덕고 창업자 가브리엘 와인버그

이게 왜 필요해

모든 주요 검색 엔진은 모니터 앞에 있는 사람에 대한 데이터를 기반으로 검색 결과를 개인화하려고 합니다. 이 현상을 "필터 버블"이라고 합니다. 사용자는 자신의 선호도와 일치하거나 시스템이 그렇게 간주하는 결과만 봅니다.

웹에서의 과거 행동에 의존하지 않는 객관적인 그림을 형성하고 주제를 제거합니다. 구글 광고귀하의 요청에 따라 "Yandex". 덕덕고의 도움으로 외국어로 된 정보를 쉽게 검색할 수 있는 반면 구글과 얀덱스는 기본적으로 다른 언어로 검색어를 입력하더라도 러시아어 사이트를 선호한다.


뭐야

not Evil은 익명의 Tor 네트워크를 검색하는 시스템입니다. 이를 사용하려면 예를 들어 전문화 된 .

not Evil은 이러한 종류의 유일한 검색 엔진이 아닙니다. LOOK(Tor 브라우저의 기본 검색, 일반 인터넷) 또는 TORCH(Tor 네트워크에서 가장 오래된 검색 엔진 중 하나) 및 기타. Google에 대한 명백한 암시 때문에 우리는 악이 아닌 것으로 결정했습니다(시작 페이지만 보세요).

더 나은

그는 Google, Yandex 및 기타 검색 엔진이 원칙적으로 액세스가 거부되는 곳을 찾고 있습니다.

이게 왜 필요해

Tor 네트워크에는 준법 인터넷에서 찾을 수 없는 많은 리소스가 있습니다. 그리고 웹 콘텐츠에 대한 당국의 통제가 강화됨에 따라 그 수는 증가할 것입니다. Tor는 소셜 네트워크, 토렌트 트래커, 미디어, 거래 플랫폼, 블로그, 도서관 등.

3. 야시

뭐야

YaCy는 P2P 네트워크 원칙에 따라 작동하는 분산형 검색 엔진입니다. 기본 서버가 있는 각 컴퓨터 소프트웨어 모듈, 자체적으로 인터넷을 검색합니다. 즉, 검색 로봇과 유사합니다. 얻은 결과는 모든 YaCy 참가자가 사용하는 공통 데이터베이스에 수집됩니다.

더 나은

YaCy는 검색 구성에 대한 완전히 다른 접근 방식이기 때문에 여기에서 이것이 더 나은지 더 나쁜지 말하기는 어렵습니다. 단일 서버 및 소유자 회사가 없기 때문에 결과는 누구의 선호도와 완전히 독립적입니다. 각 노드의 자율성은 검열을 배제합니다. YaCy는 딥 웹 및 인덱싱되지 않은 공용 네트워크를 검색할 수 있습니다.

이게 왜 필요해

당신이 오픈 소스 지지자이고 무료 인터넷, 정부 기관 및 대기업의 영향을 받지 않는 경우 YaCy가 귀하의 선택입니다. 또한 기업 또는 기타 자율 네트워크 내에서 검색을 구성하는 데 사용할 수도 있습니다. 그리고 YaCy는 일상 생활에서 그다지 유용하지 않지만 검색 프로세스 측면에서 Google의 가치있는 대안입니다.

4. 피플

뭐야

Pipl은 특정 사람에 대한 정보를 검색하도록 설계된 시스템입니다.

더 나은

Pipl의 저자는 전문화된 알고리즘이 "일반" 검색 엔진보다 더 효율적으로 검색한다고 주장합니다. 특히 프로필이 우선 소셜 네트워크, 의견, 참가자 목록 및 법원 판결 데이터베이스와 같이 사람에 대한 정보가 게시되는 다양한 데이터베이스. 이 분야에서 Pipl의 리더십은 Lifehacker.com, TechCrunch 및 기타 출판물에 의해 확인되었습니다.

이게 왜 필요해

미국에 거주하는 사람에 대한 정보를 찾아야 하는 경우 Google보다 Pipl이 훨씬 효율적입니다. 러시아 법원의 데이터베이스는 분명히 검색 엔진에 액세스 할 수 없습니다. 따라서 그는 러시아 시민들과 잘 대처하지 못합니다.

뭐야

FindSounds는 또 다른 전문 검색 엔진입니다. 집, 자연, 자동차, 사람 등 다양한 소리에 대한 오픈 소스를 검색합니다. 이 서비스는 러시아어 요청을 지원하지 않지만 검색할 수 있는 인상적인 러시아어 태그 목록이 있습니다.

더 나은

소리 만 발행하고 그 이상은 없습니다. 설정에서 원하는 형식과 음질을 설정할 수 있습니다. 발견된 모든 소리를 다운로드할 수 있습니다. 패턴 검색이 있습니다.

이게 왜 필요해

머스킷 총소리, 딱따구리를 빠는 소리 또는 호머 심슨의 외침을 빠르게 찾아야 하는 경우 이 서비스가 적합합니다. 그리고 우리는 사용 가능한 러시아어 쿼리에서만 이것을 선택했습니다. 에 영어스펙트럼은 훨씬 더 넓습니다.

진지하게, 전문화된 서비스는 전문화된 청중을 의미합니다. 하지만 당신에게도 도움이 될까요?

뭐야

Wolfram|Alpha는 컴퓨터 검색 엔진입니다. 키워드가 포함된 기사에 대한 링크 대신 사용자의 요청에 대한 기성 답변을 제공합니다. 예를 들어 검색 양식에 "뉴욕과 샌프란시스코 인구 비교"를 영어로 입력하면 Wolfram|Alpha는 즉시 비교와 함께 테이블과 그래프를 표시합니다.

더 나은

이 서비스는 사실을 찾고 데이터를 계산하는 데 다른 것보다 낫습니다. Wolfram|Alpha는 웹에서 사용할 수 있는 지식을 축적하고 체계화합니다. 다양한 분야과학, 문화 및 엔터테인먼트를 포함합니다. 이 데이터베이스에 준비된 답변이 포함되어 있는 경우 검색어, 시스템은 이를 보여주고, 그렇지 않은 경우 결과를 계산하여 표시합니다. 이 경우 사용자는 더 이상 아무것도 볼 수 없습니다.

이게 왜 필요해

예를 들어 학생, 분석가, 저널리스트 또는 연구원인 경우 Wolfram|Alpha를 사용하여 활동과 관련된 데이터를 찾고 계산할 수 있습니다. 서비스는 모든 요청을 이해하지 못하지만 지속적으로 발전하고 더 똑똑해지고 있습니다.

뭐야

Metasearch 엔진 Dogpile은 검색 엔진의 결합된 결과 목록을 표시합니다. 구글 SERP, 야후 및 기타 인기 있는 시스템.

더 나은

첫째, Dogpile은 더 적은 수의 광고를 표시합니다. 둘째, 이 서비스는 특별한 알고리즘을 사용하여 다양한 검색 엔진에서 최상의 결과를 찾아 표시합니다. Dogpile의 개발자에 따르면 그들의 시스템은 전체 인터넷에서 가장 완전한 문제를 생성합니다.

이게 왜 필요해

Google이나 다른 표준 검색 엔진에서 정보를 찾을 수 없으면 Dogpile을 사용하여 여러 검색 엔진에서 한 번에 찾아보십시오.

뭐야

BoardReader는 포럼, Q&A 서비스 및 기타 커뮤니티를 위한 텍스트 검색 시스템입니다.

더 나은

이 서비스를 사용하면 검색 필드를 소셜 사이트로 좁힐 수 있습니다. 특수 필터 덕분에 언어, 게시 날짜 및 사이트 이름과 같은 기준과 일치하는 게시물과 댓글을 빠르게 찾을 수 있습니다.

이게 왜 필요해

BoardReader는 특정 문제에 대한 대중 매체의 의견에 관심이 있는 PR 전문가 및 기타 미디어 전문가에게 유용할 수 있습니다.

드디어

대체 검색 엔진의 수명은 종종 일시적입니다. Lifehacker는 Yandex Sergey Petrenko 우크라이나 지사의 전 CEO에게 그러한 프로젝트의 장기적 전망에 대해 질문했습니다.


세르게이 페트렌코

Yandex.Ukraine의 전 CEO.

대체 검색 엔진의 운명에 관해서는 간단합니다. 따라서 명확한 상업적 전망이 없거나 반대로 완전히 명확하지 않은 청중이 적은 매우 틈새 프로젝트입니다.

기사의 예를 보면 이러한 검색 엔진이 좁지만 수요가 많은 틈새 시장을 전문으로 한다는 것을 알 수 있습니다. 또는 기존 검색에 아직 적용할 수 없는 순위에서 원래 가설을 테스트하고 있습니다.

예를 들어, Tor 검색이 갑자기 수요가 있는 것으로 판명되면, 즉 적어도 Google 잠재고객의 일정 비율이 거기에서 결과를 필요로 할 것이며, 물론 일반 검색 엔진은 찾아 사용자에게 보여줍니다. 청중의 행동이 상당한 수의 쿼리에서 상당한 비율의 사용자가 더 관련성이 높은 결과, 사용자에 따라 달라지는 요소를 고려하지 않은 데이터로 보이는 경우 Yandex 또는 Google은 이러한 결과를 제공하기 시작할 것입니다.

이 기사의 맥락에서 "더 나은 것"은 "모든 것을 더 잘함"을 의미하지 않습니다. 예, 많은 측면에서 우리의 영웅들은 Yandex와 멀리 떨어져 있습니다(심지어 Bing에서도). 그러나 이러한 각 서비스는 검색 업계의 거물들이 제공할 수 없는 것을 사용자에게 제공합니다. 확실히 당신은 또한 유사한 프로젝트를 알고 있습니다. 우리와 공유하십시오 - 토론합시다.

인터넷에서 정보 검색

인터넷에서 정보 검색

정보를 검색하려면일반적으로 사용되는 세 가지 방법(그림 1 참조). 첫번째그 중 - 주소로 검색하십시오. 사용자가 자신이 필요로 하는 정보를 담고 있는 정보 자원의 주소를 알고 있을 때 사용합니다. 주소별로 정보 검색을 구성할 때(이 경우 주소 형식 - IP, 도메인 또는 URL은 중요하지 않음) 사용자는 브라우저의 해당 필드에 리소스 주소를 입력하기만 하면 됩니다. 네트워크 리소스에 대한 액세스를 제공하도록 설계되었습니다.

쌀. 1. 하이퍼텍스트 데이터베이스에서 정보를 검색하는 방법

- 하이퍼링크 탐색을 사용하여 검색합니다. 이러한 유형의 검색을 사용할 때 사용자는 먼저 해당 데이터베이스와 연결된 서버에 액세스해야 합니다. 그런 다음 하이퍼링크를 사용하여 문서를 찾을 수 있습니다. 분명히 이 방법은 사용자가 리소스의 주소를 모를 때 편리합니다. 이 방법을 구현할 때 검색을 위한 시작점으로 사용하기 위해 웹 포털은 해당 서버에 설치된 정보 리소스를 포함하여 특정 서버 집합에 대한 직접 액세스를 제공하는 서버와 해당 웹 서비스를 구현하는 웹 응용 프로그램을 대상으로 합니다. 포털의 목적. 포털을 통해 액세스할 수 있는 서버는 특정 시스템(예: 기업) 또는 다양한 시스템사이트에 포함된 문서 및 데이터의 특정, 주제 또는 기타 기능에 따라 특별히 선택됩니다. 일반적으로 포털은 클라이언트를 최대한 오래 유지하기 위해 다양한 기능을 결합합니다. 포털의 지배적인 서비스는 서비스입니다. 안내 데스크: 검색, 루브리케이터, 재무지표, 날씨정보 등 웹 사이트는 대부분 정적 웹 페이지의 모음이지만 포털은 소프트웨어 도구특정 사용자의 요청에 따라 이러한 도구가 구조화된 데이터로 전환되는 사전 구조화되지 않은 정보.

제삼검색 방법에는 인터넷 검색 서버의 사용이 포함됩니다. 검색 서버는 인터넷 리소스 데이터베이스를 호스팅하는 컴퓨터인 전용 호스트입니다. 사용자 인터페이스이러한 서버에는 사용자의 관심 주제를 설명하는 키워드를 입력하는 필드가 있습니다(그림 2 참조).

그림 2. Yandex 검색 서버 창의 보기

서버는 이러한 단어를 정보 요청으로 인식하고 이에 따라 리소스를 검색하고 찾은 문서 목록을 사용자에게 제공합니다. 분명히 이 방법을 구현할 때 1종 오류(목표 누락)와 2종 오류(정보 잡음)가 모두 가능합니다. 검색 서버의 두 그룹, 즉 검색 엔진과 주제 디렉토리가 구별된다는 점을 언급해야 합니다. 그들의 차이점은 인터넷 리소스 데이터베이스의 생성 및 후속 보충 방법 때문입니다. 주어진 서버수행 정보 검색. 따라서 검색 엔진은 특별 프로그램- 검색 로봇. 지속적으로 네트워크를 모니터링하고 다음에서 정보를 수집합니다. 웹 페이지, 색인을 생성하고 데이터베이스에서 검색 이미지를 수정합니다. 주제 카탈로그에서 인터넷 문서 데이터베이스는 전문 편집자가 "수동으로" 구성합니다. 인터넷에는 단일 관리가 없기 때문에 정보 자원은 지속적으로 변경됩니다. 새 문서가 나타날 수 있고 기존 문서가 사라질 수 있습니다. 다른 사이트의 문서에서 정보를 업데이트하는 빈도는 다릅니다. 어떤 경우에는 시간당 여러 번, 어떤 경우에는 하루, 하루, 한 달 등에 한 번입니다. 따라서 정보 검색 시스템을 사용하여 인터넷에서 정보를 찾을 때 검색은 웹 문서의 실제 공간이 아니라 일부 모델에서는 내용이 크게 다를 수 있음을 이해하는 것이 매우 중요합니다. 검색 당시 인터넷의 실제 내용. 색인된 리소스의 적용 범위에 따라 검색 엔진은 국제 및 러시아어의 두 그룹으로 나눌 수 있습니다. 전자는 인터넷에 게시된 모든 문서를 연속적으로 색인화합니다. 두 번째는 다음 위치에 있는 리소스를 인덱싱합니다. 도메인 영역러시아어의 우세와 함께. 가장 인기 있는 시스템 목록은 표에 나와 있습니다. 하나.

탭. 1. 가장 인기 있는 검색 엔진

국제적인 러시아어 사용자
Google Yandex(룬넷의 44.4%)
야후! 램블러(룬의 10.6%)
Mail.ru(룬넷의 7.3%)
MSN 니그마(0.5% 룬)
알타비스타 Gogo.ru (0.3% 룬)
묻다 아포트(0.2% 룬)

참고: Runet은 인터넷에서 러시아어를 사용하는 부분으로 이름이 있는 도메인을 구성합니다. 루와 rf.

검색 엔진의 특별한 범주인 메타 검색 엔진이 있음을 언급해야 합니다. 그들의 근본적인 차이점은 검색 엔진주제 카탈로그는 자체 색인 데이터베이스가 없으므로 사용자 요청을 받으면 한 번에 여러 검색 서버로 리디렉션합니다(그림 3 참조).

쌀. 3. 메타서치 시스템의 체계

단일 요청에 대해 여러 검색 엔진을 동시에 사용할 수 있는 기능은 메타 검색 엔진의 명백한 이점입니다. 현재 Metabot.ru 시스템은 광범위한 응용 프로그램을 발견했으며 인터페이스는 그림 1에 나와 있습니다. 4. 이 시스템을 사용하면 국제 및 러시아어 검색 서버를 모두 사용하여 리소스를 검색할 수 있습니다.

지식 기반에서 좋은 작업을 보내는 것은 간단합니다. 아래 양식을 사용하십시오

연구와 업무에 지식 기반을 사용하는 학생, 대학원생, 젊은 과학자들은 매우 감사할 것입니다.

유사한 문서

    인터넷에서 정보 검색 수단. 정보 검색의 기본 요구 사항 및 방법. 검색 서비스의 구조와 특성. 글로벌 검색 엔진 WWW(월드 와이드 웹). 인터넷에서 정보 검색 및 수집 계획.

    초록, 2010년 2월 11일 추가됨

    하이퍼 텍스트 링크, 검색 엔진 및 특수 도구를 사용하여 인터넷에서 정보를 검색하는 방법의 특성. 새로운 인터넷 자원 분석. 서양 및 러시아어 검색 엔진의 출현 및 설명의 역사.

    초록, 2010년 5월 12일 추가됨

    현대 정보 검색 시스템의 설명 및 분류. 하이퍼텍스트 문서. 세계 주요 검색 엔진의 개요 및 등급. 인터넷에서 정보를 검색하는 메커니즘을 보여주는 정보 검색 시스템의 개발.

    2015년 6월 16일에 추가된 논문

    Yandex 및 Google 검색 엔진의 기능 분석, 유용성 비교. 검색 엔진 생성의 역사, 인터페이스의 특성, 검색 도구 및 알고리즘. 질문의 형성과 그에 대한 대답의 기준.

    초록, 2011년 5월 7일 추가됨

    인터넷 검색 엔진을 정보 검색 기능을 제공하는 웹 인터페이스가 있는 소프트웨어 및 하드웨어 복합물로 간주합니다. 검색 엔진 유형: Archie, Wandex, Aliweb, WebCrawler, AltaVista, Yahoo!, Google, Yandex, Bing 및 Rambler.

    초록, 2013년 5월 10일 추가됨

    인터넷 구축, 정보 검색 및 저장의 구조와 원칙. 정보 검색 시스템의 출현 및 분류의 역사. 검색 엔진 Google, Yandex, Rambler, Yahoo의 작동 원리 및 특성. URL로 검색합니다.

    학기 논문, 2013년 3월 29일 추가됨

    글로벌 인터넷의 본질과 작동 원리. 의 매개변수로 정보 검색 구글 시스템. 전문 정보 검색 시스템: "KtoTam", "Tagoo", "Truveo", "Kinopoisk", "Catch-Umov". 검색 엔진의 적절한 사용.

    프레젠테이션, 2015년 2월 16일 추가됨

    인터넷에 데이터를 저장합니다. 하이퍼텍스트 문서, 파일 유형. 그래픽 파일, 해당 유형 및 기능. 검색 엔진 및 정보 검색 규칙. 인터넷 검색 엔진 조사. 검색 엔진 Yandex, Google, Rambler에 관한 모든 것.

    학기 논문, 2011년 3월 26일 추가됨

일반 정보.

현재 인터넷은 수십억 개의 서로 다른 사이트와 다양한 종류의 정보가 포함된 개별 파일을 호스팅하는 수억 대의 서버를 통합합니다. 그것은 정보의 거대한 저장소입니다. 인터넷에서 정보를 검색하는 방법은 다양합니다.

알려진 주소로 검색합니다. 필요한 주소는 디렉토리에서 가져옵니다. 주소만 알면 입력 주소 표시 줄브라우저.

www.gov.ru - 러시아 국가 당국의 서버.

사용자에 의한 주소 구성. 인터넷 주소 생성 시스템을 알면 웹 사이트를 검색할 때 주소를 구성할 수 있습니다.

키워드(회사명, 기업명, 단체명 또는 영문 단순 명사)에 주제나 지리적 영역을 추가해야 하며 직관력이 연결되어야 합니다.

상업 웹사이트 주소:

www.cnn.com (CNN 월드 뉴스),

www.sony.com 소니),

www.mtv.com (MTV 음악 뉴스).

교육 기관 주소:

www.ntu.edu(미국 국립 대학교).

지역 서버 주소:

www.poland.net(폴란드),

www.israil.net(이스라엘).

인터넷 검색 엔진

인터넷에서 정보를 검색하기 위해 특수 정보 검색 시스템이 개발되었습니다. 검색 엔진은 일반 주소를 가지며 검색 구성을 위한 특수 도구(검색 문자열, 주제 카탈로그, 링크)가 포함된 웹 페이지로 표시됩니다. 검색 엔진을 호출하려면 브라우저의 주소 표시줄에 해당 주소를 입력하기만 하면 됩니다.

정보 검색 시스템은 정보를 구성하는 방법에 따라 분류(루브리케이터)와 사전의 두 가지 유형으로 나뉩니다.

루브리케이터(분류기)는 정보의 계층적(나무와 같은) 구성을 사용하는 검색 엔진입니다. 정보를 검색할 때 사용자는 주제별 제목을 살펴보고 점차적으로 검색 필드를 좁힙니다(예: 단어의 의미를 찾아야 하는 경우 먼저 분류기에서 사전을 찾은 다음 그 안에서 찾아야 합니다. 옳은 말).

사전 검색 시스템은 강력한 자동 소프트웨어 및 하드웨어 시스템입니다. 그들의 도움으로 인터넷의 정보가 표시됩니다(스캔). 이 정보 또는 그 정보의 위치에 대한 데이터는 특별 참고 도서 색인에 입력됩니다. 요청에 대한 응답으로 쿼리 문자열에 따라 검색이 수행됩니다. 그 결과, 사용자는 스캐닝 당시 검색된 단어 또는 단어 그룹이 발견된 주소(URL)를 제공받습니다. 제안된 링크 중 하나를 선택하면 찾은 문서로 이동할 수 있습니다. 대부분의 최신 검색 엔진은 혼합되어 있습니다.

가장 유명하고 인기 있는 검색 엔진:

www.aport.ru www.yahoo.com www.rambler.ru www.yandex.ru www.altavista.com www.google.com

검색을 전문으로 하는 시스템이 있습니다. 정보 자원다양한 방향으로.

인터넷에서 사람 검색:

www.whowhere.ru www. 빅풋닷컴

뉴스 그룹으로 검색(유즈넷):

www.dejanews.com

주제 검색 엔진:

검색 소프트웨어:

파일 아카이브에서 검색:

http://ftpseach.com city.ru, http://ftpsearch. licos.com

카탈로그(주석이 있는 주제별 링크 모음):

http://www.atrus.ru

종종 정보에 대한 효과적인 검색은 도시 또는 지역의 기업 또는 웹 리소스에 대한 데이터를 포함하는 특수 서버인 지역 카탈로그를 사용하여 수행할 수 있습니다. 예를 들어, St. Petersburg의 경우 이러한 카탈로그는 http://www.spb.ru에 있습니다.

IPS 목록은 www.monk에서 찾을 수 있습니다. newmail.ru

검색 엔진 및 디렉토리의 자세한 목록은 표에 나와 있습니다. 3.2.

쿼리 실행 규칙

각 검색 엔진의 도움말 섹션에서 검색 방법, 쿼리 문자열 구성 방법에 대한 정보를 얻을 수 있습니다. 다음은 일반적인 "평균" 쿼리 언어에 대한 정보입니다.

간단한 요청입니다.

검색 주제를 정의하는 한 단어를 입력하십시오. 예를 들어 Rambler.ru 검색 엔진에서는 자동화를 입력하는 것으로 충분합니다.

요청에 지정된 단어가 포함된 문서를 찾았습니다. 모든 형태의 러시아어 단어가 인식되며 일반적으로 문자의 경우는 무시됩니다.

쿼리에 "*" 또는 "?" 문자를 사용할 수 있습니다. 징후 "?" 키워드에서 하나의 문자가 대체되며 이는 임의의 문자로 대체될 수 있으며 문자 "*"는 일련의 문자입니다.

예를 들어 automaton* 쿼리는 automatic, automatic 등의 단어가 포함된 문서를 찾습니다.

복잡한 요청.

보다 구체적인 정보를 얻기 위해 키워드를 결합해야 하는 경우가 종종 있습니다. 이 경우 추가 연결어, 기능, 연산자, 기호, 대괄호로 구분된 연산자의 조합이 사용됩니다.

예를 들어, music & (beatles | beatles) 쿼리는 사용자가 music 및 beatles 또는 music 및 beatles라는 단어가 포함된 문서를 찾고 있음을 의미합니다.

표 3.1은 Aport 시스템(http://www.aport.ru)에서 채택한 요청 생성 규칙을 보여줍니다.

표 3.1

요청을 형성하기 위한 연산자

운영자 동의어 논평
그리고 그리고 & 쿼리는 두 키워드가 모두 포함된 문서를 찾습니다. 써도 되고 안 써도 됩니다. 예를 들어 쿼리: 컴퓨터 과학 및 교과서는 컴퓨터 과학 교과서와 동일합니다.
또는 또는 | 지정된 단어 중 하나 또는 두 단어를 동시에 사용하는 문서 검색
아니다 아니-~ 연산자 뒤에 지정된 단어가 포함되지 않은 문서로 검색이 제한됩니다.
" " " " 큰따옴표나 작은따옴표를 사용하면 구를 찾을 수 있습니다.
날짜= 날짜:날짜= 검색은 지정된 날짜 간격에 속하는 문서로 제한됩니다(예 1. 통화 날짜=01/02/2002-01/03/2002). 이 요청은 "currency"라는 단어를 포함하고 날짜가 2002년 2월 1일과 2002년 3월 1일 사이인 문서를 반환합니다. 예 2. date=01/03/2002 currency 예 3. 날짜:<02/03/2002 валюта

표 3.2

검색 서버 및 디렉토리 목록

주소 설명
www.excite.com 노드 리뷰 및 가이드가 있는 검색 엔진
www.alta-vista.com 검색 서버, 고급 검색 기능 사용 가능
www.hotbot.com 검색 서버
www.poland.net www.israil.net 폴란드, 이스라엘의 지역 검색 서버
www.ifoseek.com 검색 서버(사용하기 쉬운)
www.ipl.org 월드빌리지 사업의 일환으로 운영되는 공공도서관 인터넷공공도서관
www.wisewire.com WiseWire - 인공 지능을 사용한 검색 구성
www.webcrawler.com WebCrawler - 사용하기 쉬운 검색 서버
www.yahoo.com AltaVista 서버에서 전체 텍스트 검색에 액세스하기 위한 웹 카탈로그 및 인터페이스
www.aport.ru Aport - 러시아어 검색 서버
www.yandex.ru Yandex - 러시아어 검색 서버
www.rambler.ru Rambler - 러시아어 검색 서버
인터넷 도움말 리소스
www.yellow.com 인터넷 옐로우 페이지
수도사. newmail.ru 다양한 프로필의 검색 엔진
www.top200.ru 상위 200개 웹사이트
www.allru.net
www.ru 러시아 인터넷 리소스 카탈로그
www.allru.net/z09. htm 교육 자료
www.students.ru 러시아 학생 서버
www.cdo.ru/index_new. ASP 원격 학습 센터
www.open. 교류 영국 오픈 유니버시티 영국
www.ntu.edu 미국 국립 대학교
www.translate.ru 전자 텍스트 번역기
www.pomorsu.ru/guide. library.html 넷 라이브러리에 대한 링크 목록
www.library.ru 과학 전자 도서관
www.citforum.ru 전자도서관
www.infamed.com/psy 심리 테스트
www.pokoleniye.ru 인터넷교육연맹 홈페이지
www.method. people.ru 교육 자료
www.spb. www.osi.ru/ic/distant 인터넷에서 원격 학습
www.examen.ru 시험 및 시험
www.kbsu.ru/~책/ 컴퓨터 과학 교과서
메가. km.ru 백과사전 및 사전

인터넷에서 정보 검색: 함정

표면에 존재하지 않는 문제는 탐사 작업의 특정 단계가 완료되고 결과에 따라 이미 일부 결정이 내려진 후에 "회고"로만 느껴지게 되는 경우가 많습니다. 이것 또는 그 정보 검색 시스템(IPS)의 운영 초기부터 상황을 투명하게 만드는 것을 방해하는 것은 무엇입니까? 대답은 매우 간단합니다. 개발자 측에서 이러한 종류의 포괄적인 정보가 부족합니다. 이것의 직접적인 결과는 수신된 데이터의 신뢰성과 통제할 수 없는 손실입니다. 일부 "문서화되지 않은" 기능이 없는 검색 엔진을 웹에서 찾는 것은 드뭅니다. 사용자는 다음과 같은 많은 정보가 필요하지 않은 것 같습니다.

IPS 데이터베이스가 어떻게 채워지고 그 볼륨은 얼마입니까?

시스템의 검색 언어의 모든 가능성;

검색 결과 표시의 주요 기능, 주로 검색 쿼리에 대한 응답 목록에서 레코드의 순위를 지정하는 알고리즘입니다.

아아, 이러한 정보의 출처는 일반적으로 검색 서버의 기본 페이지에서 사용할 수 있는 문서가 아니라 웹, 책 및 컴퓨터 잡지에 흩어져 있는 개별 저자의 출판물입니다. 이러한 상황의 원인에는 개발자의 부주의뿐만 아니라 마케팅 정책이라는 요인도 포함됩니다. 간단히 말해서 검색 엔진에 자체에 대한 가장 완전한 정보를 제공하는 것이 항상 순위에 긍정적인 영향을 미치는 것은 아닙니다. 그럼에도 불구하고 어떤 경우에는 사용자가 상황을 통제할 수 있습니다. 테스트를 통해 선택한 검색 서비스의 기능을 찾는 것이 종종 가능합니다. 현재 작업에 가장 중요한 시스템 작동 측면을 신속하게 명확히 하는 특수 테스트 쿼리를 작성하는 것은 많은 경우에 사소한 일이 아닙니다. IPS로 작업할 때 몇 가지 문제를 피하는 방법에 대해 논의할 것입니다. 프레젠테이션을 설명하는 예로서 널리 알려진 인터넷 검색 엔진을 고려할 것입니다.