Contacte

Motor de căutare unde puteți găsi. Metode de găsire a informațiilor în rețea. Tipuri de motoare de căutare

Găsirea informațiilor de care aveți nevoie pe Internet este adesea dificilă. Internetul se dezvoltă haotic, nu există o structură clar definită în el. Nimeni nu poate garanta că pe un domeniu vor exista doar informații despre un anumit subiect, iar pe de altă parte - informații despre un alt subiect, dar și subiect clar definit. De exemplu, pe domeniile .com puteți găsi nu numai informații comerciale, ci, de exemplu, diverse documentații despre produse software sau chiar anecdote.

Dacă structura domeniului ar fi similară cu structura directorului, de exemplu, în domeniul ru.comp.os.linux (ca în sistemul de știri) ar exista toate informațiile despre sistemul de operare Linux în limba rusă și o organizație moderatoare ar fi asigurați-vă că alte domenii nu oferă toate informațiile despre Linux, atunci căutarea va fi mult mai ușoară. La urma urmei, am ști unde să ne uităm. Vă deschideți browserul, introduceți ru.comp.os.linux și primiți ... milioane de linkuri diferite către articole, HOWTO-uri și alte informații legate de Linux într-un fel sau altul.

Eficiența căutării

    Eficiența căutării depinde de mulți factori:
  • Din informațiile în sine - pot exista o mulțime de informații pe un subiect, dar puțin pe altul. Uneori puteți găsi o mulțime de informații despre un anumit subiect, dar eficiența acestei căutări se va dovedi a fi aproape de 0,0%, dar puteți găsi doar 3-4 linkuri, iar acest lucru va fi exact ceea ce aveți nevoie. Aceasta include, de asemenea, capacitatea webmasterului de a trimite informații corect, astfel încât motoarele de căutare să le poată găsi. Să presupunem că undeva foarte departe există informațiile de care aveți nevoie, dar motorul de căutare nu știe nimic despre acestea. Poate că informațiile tocmai au fost publicate sau doar editorul care le-a publicat nu știe nici măcar existența motoarelor de căutare. Căutați informații folosind un motor de căutare. Dacă nu „cunoaște” informațiile de care aveți nevoie, atunci, în consecință, nici nu veți ști nimic despre ea.
  • De la un motor de căutare - există multe motoare de căutare și toate sunt diferite. Chiar dacă sunt de același tip (vom vorbi despre tipurile de motoare de căutare puțin mai târziu), fără îndoială, fiecare dintre ele va avea propriul algoritm. Dacă nu puteți găsi informații folosind un motor de căutare, încercați să le căutați folosind altul. Nu vă lăsați agățat de un singur motor de căutare, oricât de mult vă place.
  • Multe depind de capacitatea de a utiliza un motor de căutare - de modul în care puteți utiliza un motor de căutare. Dacă nu știți cum să utilizați un motor de căutare, este puțin probabil ca căutarea să fie eficientă.

Cum să căutați informații corect

Deoarece cel mai adesea nu selectați site-ul de care aveți nevoie din directorul motorului de căutare, ci introduceți un anumit cuvânt cheie (sau mai multe cuvinte cheie), atunci trebuie să specificați acest cuvânt cheie cât mai specific posibil. Cu cât definiți mai precis subiectul căutării, cu atât rezultatul va fi mai precis. La urma urmei, un motor de căutare nu vă poate ghici gândurile, trebuie să îi indicați clar ceea ce căutați.

Fiecare motor de căutare are propria sintaxă pe care trebuie să o cunoașteți. Acest capitol va descrie sintaxa motoarelor de căutare Google, Yandex și Rambler. Dacă doriți să utilizați un alt motor de căutare, puteți afla sintaxa acestuia pe propriul site web (de obicei este descris în detaliu).

Motoare de căutare

Acum să vorbim despre motoarele de căutare în sine.

Pe teritoriul fostului CSI, următoarele motoare de căutare sunt cele mai populare, conform SpyLog (Openstat):

  • 1. Yandex (www.yandex.ru);
  • 2. Google (www.google.com);
  • 3. Că[email protected] (go.mail.ru);
  • 3. Rambler (www.rambler.ru);
  • 5. Yahoo! (www.yahoo.com);
  • 6. AltaVista (www.altavista.com);
  • 7. Bing (www.bing.com).

Motoarele de căutare sunt listate în ordinea descrescătoare a popularității. După cum puteți vedea, cel mai popular dintre noi este motorul de căutare Yandex.

Tipuri de motoare de căutare

    Există două tipuri principale de motoare de căutare:
  • index - Google, AltaVista, Rambler, HotBot, Yandex etc.;
  • clasificare (catalog) - Rambler, Yahoo! si etc.

Nu vă mirați că motorul de căutare Rambler este listat de două ori - era atât index, cât și clasificare. Vom reveni la acest lucru mai târziu, dar deocamdată să vorbim despre diferențele dintre aceste două sisteme.

Cum funcționează un motor de căutare index? Motorul de căutare lansează un program special care scanează conținutul serverelor web, indexând informații: introduce în baza sa de date cuvintele cheie ale unei anumite pagini web, unele informații dintr-o pagină web.

O scurtă istorie a Google

Să începem cu titlul. Google este o versiune ușor modificată a cuvântului googol (nu degeaba este adesea numit „google”). La rândul său, acest cuvânt a fost introdus de Milton Sirota, nepotul celebrului matematician Edward Kasner, și apoi a fost popularizat în cartea „Matematica și imaginația” de Kasner și Newman. Cuvântul „googol” afișează un număr cu unul și 100 de zerouri. Numele „Google” reflectă o încercare de a organiza o cantitate uriașă de informații pe web.

Deci, să începem de la bun început. Viitorii dezvoltatori Google, Sergey Brin și Larry Page, s-au întâlnit în 1999 la Universitatea Stanford. Atunci Larry avea 24 de ani, iar Serghei - 23 de ani. Larry era la acel moment student la Universitatea din Michigan și a venit la Stanford câteva zile. Serghei se afla într-un grup de studenți, care trebuia să-i familiarizeze pe oaspeți cu universitatea. De la prima întâlnire, Serghei și Larry, ca să spunem cu blândețe, nu le-au plăcut reciproc - au argumentat despre tot ceea ce ar putea fi argumentat. Deși, în cele din urmă, acest lucru sa dovedit a fi un moment pozitiv, deoarece opiniile lor diferite au condus la crearea unui algoritm pentru rezolvarea uneia dintre cele mai presante probleme ale computerului: găsirea informațiilor necesare într-o gamă imensă de date. În ianuarie 1996, Larry și Sergey au început să lucreze la motorul de căutare BackRub, care trebuia să analizeze legăturile „înapoi” care indicau acest site web. Munca pe acest server a fost efectuată într-o lipsă constantă de fonduri - la urma urmei, în acel moment, Sergey și Larry erau studenți absolvenți ai universității - înțelegeți voi înșivă că studenții absolvenți nu au o mulțime de fonduri. Apropo, Larry a participat pentru prima dată la un proiect atât de serios și înainte a fost angajat în tot felul de proiecte „frivole”, chiar uneori anecdotice, de exemplu, a construit o imprimantă funcțională dintr-un set Lego.

Sintaxa Google de bază

Interfața Google este izbitoare prin simplitatea sa: un câmp de introducere și două butoane. După cum se spune, totul ingenios este simplu.

Sintaxă specifică Google (extinsă)

În plus față de operatorii booleeni, Google vă oferă modificatorii de căutare enumerați în tabel. Modificatorii de căutare sunt numiți sintaxă specială Google. Luați acest tabel în serios: odată ce încercați să căutați ceva folosind modificatori, nu veți renunța la ele.

Utilizarea corectă a modificatorului inurl

Modificatorul inurl este utilizat pentru a căuta adresa URL specificată. Și spre deosebire de modificatorul de site, care vă permite să căutați informații numai pe un singur site sau domeniu, modificatorul inurl vă permite să căutați informații în subdirectoarele site-ului, de exemplu:

inurl: siteskype-zvonim-besplatno

Modificatorul inurl vă permite să utilizați caracterul * pentru a specifica un domeniu, de exemplu:
inurl: „* .redhat.com”

Este cel mai eficient să utilizați inurl împreună cu site-ul. Următoarea solicitare va căuta informații în domeniul gidmir.ru, pe toate subdomeniile sale, cu excepția www:
site: gidmir.ru inurl: "* .gidmir" -inurl: "www.gidmir.ru"

Sintaxă mixtă Google

Google permite sintaxa mixtă, adică o sintaxă care folosește mai mulți modificatori speciali de căutare într-o interogare. Acest lucru vă permite să obțineți cel mai bun rezultat posibil.

Iată cel mai simplu exemplu de sintaxă mixtă:
site: ru inurl: disc

În acest caz, căutarea va fi efectuată pe site-urile domeniului, iar adresa URL trebuie să conțină cuvântul disc.

Iată un alt exemplu:
site: ru -inurl: оrg.ua

Căutarea va fi efectuată pe site-uri din domeniul ru, dar rezultatele căutării nu vor conține pagini situate pe org.ua.

Cum să depășești limita cuvintelor cheie

Pentru majoritatea utilizatorilor obișnuiți de Google, limita de 10 chei nu este vizibilă. Dar fanii termenilor de căutare lungi au observat probabil că Google ia în considerare doar primele 10 cuvinte cheie, iar toate celelalte sunt pur și simplu ignorate.

De ce să căutați fraze lungi? În majoritatea cazurilor, acestea sunt extrase din lucrări. Să presupunem că căutăm lucrarea „Stăpânul și Margarita”. Trebuie remarcat faptul că sintagma cuvântului cheie ar trebui să arate ca „Maestră Margarita”, deoarece cuvintele și, sau, și, de, sau, I, a, și alte câteva sunt ignorate de motorul de căutare. Dacă doriți să forțați unul dintre aceste cuvinte să fie inclus în căutare, precedați cuvântul cu semnul „+”, de exemplu +.

Construcția corectă a interogării permite depășirea limitei de 10 cuvinte. Următoarele linii directoare vă vor ajuta nu numai să vă scurtați durata interogării, ci și să vă îmbunătățiți performanța generală de căutare.

Căutare Google avansată

Tastăm în linia de introducere a browserului adresa - www.google.ru/advanced_search și mergem la căutarea avansată Google.

Cu căutarea avansată, puteți căuta informații aproape la fel de flexibil ca și cu modificatorii de căutare. De ce „aproape”? Interfața de căutare avansată nu oferă acces la toți modificatorii de căutare.

Setarea proprietăților de căutare Google

Nu vreau să vă încurceți capul cu detalii tehnice, așa că vă voi spune pe scurt ce sunt cookie-urile și nu, nu este nimic cu care să le mâncați, ci cum trebuie să lucrați cu ele.

Să ne imaginăm că ne confruntăm cu următoarea sarcină: trebuie să redactăm un raport de vizită individual pentru fiecare client de pe site-ul companiei noastre. Adică, astfel încât utilizatorul să nu vadă numărul total de vizite, știe exact de câte ori a fost pe site-ul nostru. Pentru fiecare adresă IP, trebuie să păstrați înregistrări într-un singur tabel, care este probabil mare, și de aici rezultă că pierdem timpul CPU și spațiul pe disc. Ar fi mult mai corect din partea noastră să folosim acest spațiu cu beneficii mai mari.

Setăm cookie-uri - o variabilă care va fi stocată pe discul utilizatorului. Această variabilă va stoca informații despre vizite. Beneficiile sunt clare. În primul rând, nu avem nevoie de niciun tabel și, în al doilea rând, simplificăm activitatea programului nostru.

Rezultatul căutării Google

Un rezultat al căutării Google nu este doar o colecție de link-uri care corespund termenilor de căutare specificați. Acesta este ceva mai mult care merită o analiză separată. Introduceți cuvântul „rusopen” și faceți clic pe butonul Căutare Google.

În partea de sus, vedem numărul total de rezultate (883.000.000) și timpul total care a durat căutarea, respectiv 0.34 secunde.

    În majoritatea cazurilor, rezultatul este prezentat ca:
  • titlul paginii;
  • descrierea paginii;
  • URL pagină;
  • mărimea paginii;
  • data ultimei indexări a paginii;

Căutare imagini Google

Google Images vă permite să găsiți diverse imagini pe Internet. Deși imaginile în sine nu pot fi indexate, paginile care conțin aceste imagini sunt indexate. Introduceți o descriere a imaginii și veți obține multe, multe link-uri, precum și imaginile în sine, prezentate sub forma unei galerii.

    Pentru o căutare mai eficientă a imaginilor, trebuie să utilizați următorii modificatori de căutare:
  • intitle: - căutați în titlul paginii;
  • tip de fișier: - vă permite să specificați tipul de imagine, puteți specifica următoarele tipuri: JPEG și GIF, nu BMP, PNG, imaginile de alte tipuri nu sunt indexate;
  • inurl: - căutare după adresa URL specificată, de exemplu inurl: www.gidmir.ru;
  • site: Caută domeniul sau site-ul specificat, cum ar fi site: com.

Serviciile Google

Google este un motor de căutare puternic, cu peste 3 miliarde de pagini. Pe lângă paginile web obișnuite, Google indexează fișierele în formatele Word, Excel, PowerPoint, PDF și RTF. De asemenea, puteți utiliza Google pentru a căuta imagini și numere de telefon de la Google Images, respectiv Agendă telefonică. În acest articol, vom vorbi despre serviciile speciale Google.

mail Google

Încercați să utilizați poșta Google. Trebuie remarcat faptul că acesta nu este tocmai e-mailul dvs. obișnuit.

    Printre funcțiile Gmail sunt următoarele:
  • dimensiune imensă a cutiei poștale - mai mult de 7 GB;
  • în loc să ștergeți scrisori, le puteți arhiva - atunci va exista suficient spațiu pentru dvs. pentru o lungă perioadă de timp și puteți restabili scrisorile care au fost primite sau trimise de dvs. acum câțiva ani;
  • posibilitatea de a căuta căsuța poștală cu eficiența Google;
  • organizarea convenabilă a scrisorilor și a răspunsurilor la acestea: toate scrisorile și răspunsurile formează un lanț, ușor de urmărit;
  • protecție bună împotriva spamului;
  • adresa memorabilă [email protected];
  • interfață ușor de utilizat.

Motor de căutare Rambler

Istoria Ramblerului

Totul a început în 1991 în orașul Pushchino, regiunea Moscovei. În acel an îndepărtat, s-a adunat un grup de oameni cu aceleași idei, printre care se numărau Dmitri Kryukov, Sergey Lysakov, Viktor Voronkov, Vladimir Samoilov, Yuri Ershov. Interesul general al acestui grup a fost internetul. Probabil, în 1991, niciunul dintre viitorii dezvoltatori Rambler nu și-a imaginat că vor deveni creatorii unuia dintre cele mai mari și mai cunoscute motoare de căutare de pe Runet. La urma urmei, înainte de aceasta, toți au servit dispozitive radio-tehnice la Institutul de Biochimie și Fiziologie al Microorganismelor din Academia Rusă de Științe. În 1992, a fost creată compania „Stack”, condusă de Serghei Lysakov. Profilul companiei este rețelele locale și Internetul. În esență, Stack a fost un furnizor de servicii de internet. Firma a creat o rețea intra-oraș, apoi a conectat-o ​​pe Pushchino la Moscova și prin aceasta - la Internet. Apropo, acesta a fost primul canal IP în afara Moscovei. Și asta este în 1992! Acum este destul de problematic să stabiliți un canal - vor exista întotdeauna o mulțime de nuanțe, dar apoi cablurile trebuiau așezate independent, manual, subteran și toate acestea s-au făcut iarna.

Cum a funcționat Rambler

Internetul evoluează constant: numărul de site-uri și dimensiunile acestora cresc în fiecare zi. La urma urmei, imaginați-vă: site-urile mari sunt actualizate în fiecare zi, chiar dacă volumul actualizărilor este de 1024 de octeți (1 KB), atunci dacă presupunem că există 10.000 de astfel de site-uri, în fiecare zi motorul de căutare trebuie să proceseze (index) 10.000 Informații KB (aproximativ 10 MB). Numărul 10.000 este luat „din tavan” - de exemplu. Poate fi mai mare sau mai mic - nici măcar site-urile mari nu sunt actualizate în fiecare zi. Dimensiunea actualizării este, de asemenea, extrem de ridicată. Imaginați-vă un site de informații și analize în care sunt publicate articole noi aproape în fiecare zi sau materiale din alte site-uri sunt reimprimate. În acest caz, dimensiunea actualizărilor nu va fi de 1 KB, ci de cel puțin 10. Adăugați la toate aceste știri și alte informații și se dovedește că, cu numărul de site-uri actualizate 10.000, motorul de căutare ar trebui să indexeze 120 MB de text. Și, cu toate acestea, motorul de căutare nu numai că trebuie să afișeze cu precizie rezultatele căutării, ci și să o facă cât mai repede posibil, astfel încât utilizatorul să se simtă confortabil să lucreze cu el. Cine vrea să aștepte 10 minute pentru rezultatele căutării? Exagerez acest lucru, desigur, dar personal nu aș aștepta rezultatele căutării mai mult de 30 de secunde (din momentul în care faceți clic pe butonul Căutare până când apar primele zece rezultate). Se pare că dezvoltatorii de motoare de căutare trebuie să mențină în mod constant la nivelul adecvat nu numai „hardware”, care ar trebui să poată procesa volume în continuă creștere de informații, dar „matematica” nu poate fi luată numai cu hardware. Este necesar să îmbunătățim constant algoritmii de căutare, astfel încât, odată cu creșterea volumului bazei de căutare, timpul de căutare să nu crească (mă refer la o creștere semnificativă a timpului - nu are nicio diferență pentru utilizator cât de lungă va fi căutarea efectuat timp de 2,5 secunde sau 2,0555 secunde, deoarece nu este capabil să estimeze acest timp).

Sintaxa Rambler

O cerere către Rambler ar putea consta din unul sau mai multe cuvinte, iar cererea ar putea conține semne de punctuație. Dezvoltatorii Rambler și-au proiectat motorul de căutare pentru confortul maxim al utilizatorului. Rambler ar putea fi folosit chiar și de un utilizator neexperimentat care nu este deloc familiarizat cu limbajul de interogare. Tot ce trebuia să facă era să introducă o interogare formată din mai multe cuvinte (de exemplu, o frază) și fără semne de punctuație - Rambler însuși a găsit documentele necesare și a făcut-o cât mai eficient posibil. Desigur, dacă limbajul interogării a fost utilizat corect, eficiența a crescut semnificativ, dar chiar și cu o ignoranță completă a limbajului interogării, eficiența căutării a fost la un nivel ridicat. După cum sa menționat deja, cunoașterea limbajului interogării este în interesul dvs., puteți găsi informațiile de care aveți nevoie mult mai rapid.

Motor de căutare Yandex (Yandex)

Referință istorică

În 1990, dezvoltarea software-ului de căutare a început la compania Arcadia, condusă de Arkady Borkovsky și Arkady Volozh. Șase ani mai târziu, a apărut site-ul Yandex. Dar ce s-a întâmplat în acești șase ani?

În doi ani, au fost create două sisteme de recuperare a informațiilor - „Clasificarea internațională a invențiilor” și „Clasificarea bunurilor și serviciilor”. Ambele sisteme au funcționat sub DOS și au permis căutarea unui cuvânt dintr-un dicționar dat folosind operatori logici.

În 1993 Arcadia a devenit o divizie a CompTek. În 1993-1994, tehnologiile de căutare s-au îmbunătățit semnificativ, de exemplu, un dicționar care oferă o căutare luând în considerare morfologia limbii ruse ocupa doar 300 KB, ceea ce înseamnă că se încadrează în mod liber în memoria RAM și lucrul cu aceasta a continuat foarte mult repede. Pe baza acestei noi tehnologii, în 1994, a fost creat „Biblia Computer Directory” - un sistem de recuperare a informațiilor care funcționează cu traduceri ale Vechiului și Noului Testament.

Cum interpretează Yandex cuvintele

Cum va interpreta motorul de căutare cuvântul pe care l-ați introdus?

    Acum vom vorbi despre acest lucru:
  • Regula 1. Se pare că sistemul o interpretează conform regulilor limbii ruse. Exemplu: Dacă ați introdus cuvântul „mașină”, veți obține și rezultate care conțin cuvintele „mașini”, „mașină” etc. Același lucru este valabil și pentru verbe - la cerere „du-te”, vei primi documente care conțin cuvintele „du-te”, „mergând”, „umblat”, „umblat” etc. După cum puteți vedea, motorul de căutare este mai inteligent decât credeați - nu este doar un mijloc de a găsi un anumit cuvânt într-o bază de date.
  • Regula 2. O atenție deosebită este acordată cuvintelor scrise cu majuscule. Dacă un cuvânt este scris cu majusculă și nu este primul dintr-o propoziție, vor fi găsite numai cuvinte cu majuscule. În caz contrar, vor fi găsite cuvinte atât cu majuscule, cât și cu litere mici. Exemplu: la cerere "Dachshund A." vor fi găsite documente care conțin atât „dachshund” (taxă), cât și „dachshund” (prenume), deoarece cuvântul „dachshund”, deși scris cu majusculă, este primul din propoziție. Dar la interogarea „A. Taxa” se vor găsi documente care conțin doar cuvântul „Taxa”, scris cu majusculă.

Sintaxa de bază Yandex

În mod implicit, Yandex folosește operatorul logic ȘI Aceasta înseamnă că, dacă ați introdus interogarea „Samsung TV”, atunci în rezultate veți primi documente în care cuvintele „TV” și „Samsung” vor fi găsite în aceeași propoziție. Dacă doriți să specificați în mod explicit operatorul AND, atunci utilizați ampersand & character. Cu alte cuvinte, interogarea „Samsung TV” este aceeași cu interogarea „TV & Samsung”. De asemenea, puteți utiliza interogarea „TV + Samsung”.

Dacă doriți efectul opus, adică dacă doriți să obțineți documente care conțin separat cuvântul „TV” și separat cuvântul „Samsung”, atunci trebuie să utilizați operatorul OR (|), de exemplu: „TV | Samsung”.

Tilda (~) va găsi documente care au primul cuvânt, dar nu al doilea. De exemplu, interogarea „TV ~ Horizon” va găsi documente care conțin cuvântul „TV”, dar alături (într-o frază) nu există niciun cuvânt „Horizon”. Dar dacă trebuie să găsim documente care nu conțin deloc cuvântul „Orizont”, dar conțin cuvântul „TV”. Pentru a trece de la nivelul propoziției la nivelul documentului, specificați de două ori operatorul dorit, de exemplu && sau ~~. În cazul nostru, interogarea „TV ~~ Horizon” este potrivită.

De foarte multe ori trebuie să găsiți expresia exactă, de exemplu, „Președintele Rusiei”, în care cuvântul „Rusia” este urmat strict imediat după cuvântul „Președinte”. În acest caz, fraza de căutare trebuie să fie inclusă între ghilimele.

Căutare bazată pe distanță în Yandex

Yandex numerotează toate cuvintele din textul documentului în ordine. Distanța dintre cuvintele adiacente este 1 (nu 0!), Iar distanța dintre cuvintele în ordine inversă este -1. Același lucru este valabil și pentru oferte.

Pentru a indica distanța dintre cuvinte, se pune semnul /, urmat imediat de un număr, ceea ce înseamnă că aceasta este distanța dintre cuvinte. De exemplu, interogarea „dezvoltator / 2 programe” va găsi documente care conțin cuvintele „dezvoltator” și „programe”, iar distanța dintre cuvinte nu trebuie să fie mai mare de două cuvinte și toate aceste cuvinte ar trebui să fie într-o singură propoziție. În acest caz, vor fi găsite documente care conțin „dezvoltator de aplicații”, „dezvoltator de software de sistem” etc.

Dacă știm exact distanța și ordinea cuvintelor, atunci putem folosi sintaxa / + n. De exemplu, interogarea „roșu / + 1 limită” va avea ca rezultat un cuvânt în care cuvântul „limită” urmează imediat cuvântul „roșu”. Interogarea „scufița roșie” ar duce la același rezultat.

Folosirea parantezelor la căutarea în Yandex

Parantezele sunt utilizate pentru a reprezenta o expresie întreagă într-o interogare. De exemplu, interogarea „(istorie | tehnologie | programe) / + 1 Linux” va găsi documente care conțin una dintre expresiile „istorie Linux”, „tehnologie Linux”, „programe Linux”.

Zone

Zona este locul unde puteți găsi informațiile de care aveți nevoie. Puteți specifica zona în care doriți să căutați - titluri (zona Titlu), linkuri (ancore) sau adresă (Adresă). De asemenea, puteți utiliza zona all pentru a căuta în întregul document.

Sintaxă: interogare $ zone_name.

De exemplu: interogarea $ title "(! LANG: Microsoft" найдет все документы, в заголовках которых встречается точная фраза "Microsoft".!}

Capacități suplimentare de căutare Yandex

Motorul de căutare Google a făcut posibilă limitarea site-ului de căutare la o anumită listă de servere sau, dimpotrivă, excluderea unor servere din lista de căutare. Exact aceleași capacități sunt disponibile în motorul de căutare Yandex. De asemenea, puteți căuta documente care au linkuri către anumite adrese URL sau imagini. Când specificați o mască pentru un fișier (de exemplu, o imagine), puteți utiliza simbolul *, care înseamnă toate caracterele, de exemplu: "audi- *".

Sintaxa este: # item_name = ”value”.

    Un element poate fi:
  • url - un site specific;
  • link - link;
  • imagine - imagine;
  • cuvinte cheie - cuvinte cheie (*);
  • abstract - abstract (*);
  • indiciu - subtitrare imagine (*).

Găsirea informațiilor pe Internet

Internetul crește într-un ritm foarte rapid, ceea ce face din ce în ce mai dificilă găsirea informațiilor de care aveți nevoie printre sute de miliarde de pagini web și sute de milioane de fișiere. Pentru a găsi informații, sunt utilizate motoare de căutare speciale care conțin informații actualizate constant despre locația paginilor web și a fișierelor pe sute de milioane de servere de internet.

Motoarele de căutare conțin informații grupate tematic despre resursele informaționale ale World Wide Web în baze de date. Programele speciale robotizate „accesează cu crawlere” periodic serverele Web de pe Internet, citesc toate documentele pe care le întâlnesc, selectează cuvinte cheie în ele și introduc adresele de internet ale documentelor în baza de date.

Majoritatea motoarelor de căutare permit autorului site-ului web să introducă informații în baza de date completând un formular de înregistrare. În procesul de completare a chestionarului, dezvoltatorul site-ului introduce adresa site-ului, numele acestuia, o scurtă descriere a conținutului site-ului, precum și cuvinte cheie prin care va fi cel mai ușor de găsit site-ul.

Căutați după cuvinte cheie. Căutarea unui document în baza de date a motorului de căutare se efectuează prin introducerea de interogări în caseta de căutare.

Solicitarea trebuie să conțină unul sau mai multe cuvinte cheie care sunt principalele pentru acest document. De exemplu, pentru a căuta propriile motoare de căutare pe Internet, puteți introduce cuvintele cheie „Sistemul de căutare a informațiilor de internet din Rusia” în câmpul de căutare (Fig. 6.21).

La ceva timp după trimiterea unei cereri, motorul de căutare va returna o listă de adrese de Internet ale documentelor în care au fost găsite cuvintele cheie specificate. Pentru a vizualiza acest document într-un browser, este suficient să activați legătura care îl indică (Fig. 6.22).

Dacă cuvintele cheie au fost alese fără succes, atunci lista adreselor documentului poate fi prea mare (poate conține zeci sau chiar sute de mii de linkuri). Pentru a restrânge lista, puteți introduce cuvinte cheie suplimentare în câmpul de căutare sau puteți utiliza catalogul motorului de căutare.

Unul dintre cele mai complete și mai puternice motoare de căutare este Google (www.google.com), care are 8 miliarde de pagini Web în baza sa de date și 5 milioane de pagini noi de roboți în fiecare lună. În Runet (partea rusă a internetului), motoarele de căutare Yandex (www.yandex.ru) și Rambler (www.rambler.ru) au baze de date extinse care conțin câte 200 de milioane de documente.

Căutați într-un sistem ierarhic de directoare.În baza de date a motorului de căutare, site-urile web sunt grupate în cataloage ierarhice de subiecte, care sunt analogi catalogului tematic din bibliotecă.

Secțiuni tematice de nivel superior, de exemplu: Internet, calculatoare, știință și educație etc., conțin subdirectoare. De exemplu, directorul Internet poate conține subdirectoare Căutare, Mailși altele (Fig. 6.23).

Căutarea informațiilor într-un director se reduce la alegerea unui anumit director, după care utilizatorului i se va prezenta o listă de linkuri către adresele de internet ale celor mai vizitate și semnificative site-uri Web. Fiecare legătură este de obicei adnotată, adică conține un scurt comentariu asupra conținutului documentului.

Cel mai complet catalog tematic ierarhic pe mai multe niveluri al resurselor Internet în limba rusă are sistemul de căutare Aport (www.aport.ru). Directorul conține adnotări detaliate ale conținutului site-urilor web și o indicație a locației geografice a acestora.

Căutați fișiere. Pentru a căuta fișiere pe serverele de arhivare a fișierelor, există motoare de căutare specializate, inclusiv motorul de căutare FileSearch (www.filesearch.ru). Pentru a căuta un fișier, trebuie să introduceți numele fișierului în câmpul de căutare, iar motorul de căutare va afișa adresele de internet ale serverelor de arhivare a fișierelor care stochează fișierul cu numele specificat.

Căutarea informațiilor în partea rusă de vorbire a internetului folosind cele mai multe motoare de căutare: Google, Rambler, Aport, Yaps1ex și motorul de căutare a fișierelor de cercetare se poate face folosind motorul de căutare integrat Gogle.ru (Fig. 6.24). Pentru a face acest lucru, este suficient să introduceți cuvinte cheie în bara de căutare, să utilizați comutatoarele pentru a seta tipul de informații solicitate și să faceți clic pe butonul cu numele motorului de căutare Gogle.ru (Fig. 6.24). Pentru a face acest lucru, este suficient să introduceți cuvinte cheie în bara de căutare, utilizați comutatoarele pentru a seta tipul de informații solicitate și faceți clic pe butonul cu numele motorului de căutare.


Orez. 6.24. Motor de căutare integrat Gogle.ru

Metode de căutare pe internet

Trei moduri de a căuta pe Internet

Internetul în general și World Wide Web în special oferă abonatului acces la mii de servere și milioane de pagini web care stochează o cantitate inimaginabilă de informații. Cum să nu te pierzi în acest „ocean informațional”? Pentru a face acest lucru, trebuie să aflați cum să căutați și să găsiți informațiile de care aveți nevoie pe web.

După cum sa menționat deja, există trei modalități principale de a găsi informații pe Internet.

1. Specificarea adresei paginii. Acesta este cel mai rapid mod de căutare, dar poate fi utilizat numai dacă adresa documentului este cunoscută exact.

2. Navigare prin hyperlinkuri. Acesta este cel mai puțin convenabil mod, deoarece poate fi folosit pentru a căuta documente care au doar o semnificație apropiată de documentul curent. Dacă documentul actual se referă, de exemplu, la muzică, atunci folosind hyperlinkurile din acest document, este puțin probabil să fie posibil să ajungeți la un site dedicat sportului.

3. Referirea la un motor de căutare (motor de căutare)... Folosirea motoarelor de căutare este cel mai convenabil mod de a găsi informații. În prezent, următoarele motoare de căutare sunt populare în partea de limbă rusă a internetului:

    Yandex;
    Hoinar;
    Aport.

Există și alte motoare de căutare. De exemplu, un server de căutare eficient este implementat pe serverul mail.ru.

Căutați servere

Cel mai accesibil și mai convenabil mod de a găsi informații pe World Wide Web este de a utiliza motoarele de căutare. În acest caz, căutarea informațiilor poate fi efectuată prin cataloage, precum și printr-un set de cuvinte cheie care caracterizează documentul text căutat.

Să aruncăm o privire mai atentă la utilizarea motoarelor de căutare. Căutare server conține un număr mare de legături către o mare varietate de documente, iar toate aceste legături sunt sistematizate în directoare tematice. De exemplu: sport, filme, mașini, jocuri, știință etc. În plus, aceste legături sunt instalate de server în mod independent, automat prin vizualizarea regulată a tuturor paginilor web care apar pe World Wide Web. În plus, motoarele de căutare oferă utilizatorului posibilitatea de a căuta informații după cuvinte cheie. După introducerea cuvintelor cheie, motorul de căutare începe scanarea documentelor pe alte servere Web și afișează linkuri către acele documente în care se găsesc cuvintele specificate. De obicei, rezultatele căutării sunt sortate în ordine descrescătoare a unei evaluări speciale a documentelor, care arată cât de bine îndeplinește un anumit document condițiile de căutare sau cât de des este solicitat pe web.

Limba interogării motorului de căutare

Un grup de cuvinte cheie, format conform anumitor reguli - folosind un limbaj de interogare, se numește interogare către un server de căutare. Limbile utilizate pentru interogări către diferite motoare de căutare sunt foarte asemănătoare. Puteți afla mai multe despre acest lucru vizitând secțiunea „Ajutor” a serverului de căutare dorit. Să luăm în considerare regulile pentru formarea interogărilor folosind motorul de căutare Yandex ca exemplu.

Sintaxa operatorului Ce înseamnă operator Solicitați un exemplu
spațiu sau & Logic ȘI (în cadrul unei propoziții) fizioterapie
&& Logic ȘI (în cadrul unui document) rețete && (brânză procesată)
| OR logic fotografie | fotografie | instantaneu | imagine foto
+ Prezența obligatorie a unui cuvânt în documentul găsit + a fi sau + a nu fi
() Gruparea cuvintelor (tehnologie | producție) (brânză | brânză de vaci)
~ Operator binar ȘI NU (în cadrul unei propoziții) banci ~ law
~~
sau
_
Operator binar ȘI NU (în document) Ghid turistic Paris ~~ (agenție | tur)
/ (n m) Distanța în cuvinte (minus (-) - înapoi, plus (+) - înainte) furnizori / 2 muzică pentru cafea / (- 2 4) posturi vacante de educație ~ / + 1 studenți
" " Căutare expresie glugă roșie Echivalent cu pălărie roșie / + 1
&& / (n m) Distanța în propoziții (minus (-) - înapoi, plus (+) - înainte) banca && / 1 taxe

Pentru a obține cele mai bune rezultate ale căutării, există câteva reguli simple de reținut:

    1. Nu căutați informații cu un singur cuvânt cheie.

    2. Este mai bine să nu introduceți cuvinte cheie cu litere mari, deoarece acest lucru poate duce la faptul că aceleași cuvinte scrise cu litere mici nu vor fi găsite.

    3. Dacă nu obțineți rezultate în căutarea dvs., verificați cuvintele cheie pentru erori de ortografie.

Motoarele moderne de căutare oferă posibilitatea de a conecta un analizor semantic la interogarea generată. Cu ajutorul acestuia, prin introducerea unui cuvânt, puteți selecta documente în care există derivate ale acestui cuvânt în diverse cazuri, timpuri etc.

Întrebări de control

1. Cum este căutarea documentelor după cuvinte cheie? În sistemul de directoare?

Sarcini de auto-studiu

6.8 Sarcină practică. Comparați rezultatele căutării documentelor după cuvinte cheie utilizând diferite motoare de căutare (utilizați motorul de căutare integrat Gogle).

6.9 Sarcină practică. Găsiți fișierul media player WinAmp pe serverele de arhivare a fișierelor.

Găsirea informațiilor pe Internet

Găsirea informațiilor pe Internet

Pentru a găsi informațiiîn frecvent utilizate în trei moduri(Vezi Figura 1). Primul dintre ele - căutare după adresă. Este utilizat atunci când utilizatorul cunoaște adresa resursei de informații care conține informațiile de care are nevoie. Atunci când organizează o căutare a informațiilor după adresă (forma adresei - IP, domeniu sau URL - în acest caz nu contează), utilizatorul trebuie doar să introducă adresa resursei în câmpul corespunzător al browserului - un program conceput pentru a oferi acces la resursele rețelei.

Orez. 1. Metode de căutare a informațiilor în baze de date hipertext

Al doilea- căutați folosind navigarea prin hyperlink. Când utilizează acest tip de căutare, utilizatorul trebuie mai întâi să acceseze serverul asociat cu baza de date corespunzătoare. Apoi puteți găsi documentul folosind hyperlinkuri. Evident, această metodă este convenabilă atunci când adresa resursei este necunoscută utilizatorului. Pentru a fi utilizate ca punct de plecare pentru căutare la implementarea acestei metode, sunt destinate portalurile web - servere care oferă acces direct la un set de servere, inclusiv resurse de informații instalate pe acestea, precum și aplicații web care implementează servicii Web corespunzătoare scopului a portalului. Serverele accesibile prin portal pot aparține unui sistem specific (de exemplu, unul corporativ) sau a unor sisteme diferite și pot fi selectate special în funcție de caracteristicile specifice, tematice sau de altă natură ale documentelor și datelor conținute pe site-urile lor. De obicei, portalurile combină o varietate de funcții pentru a menține clientul cât mai mult posibil. Serviciul dominant al portalului este serviciul de asistență: căutare, rubrici, indici financiari, informații meteo etc. În timp ce site-urile web sunt în mare parte colecții de pagini web statice, portalurile sunt colecții de software și informații pre-structurate pe care aceste instrumente le transformă în date structurate atunci când sunt solicitate de utilizatori anumiți.

Al treilea metoda de căutare implică utilizarea motoarelor de căutare pe Internet. Motoarele de căutare sunt computere gazdă dedicate care găzduiesc baze de date cu resurse Internet. Interfața cu utilizatorul unui astfel de server are un câmp pentru introducerea cuvintelor cheie care descriu subiectul de interes pentru utilizator (vezi Fig. 2).

Fig. 2. Vizualizarea ferestrei serverului de căutare Yandex

Serverul percepe aceste cuvinte ca o cerere de informații, conform căreia caută resurse și prezintă o listă a documentelor găsite utilizatorului. Evident, la implementarea acestei metode, sunt posibile erori atât ale primei (omisiuni țintă), cât și ale celei de-a doua (zgomotul informațional). Trebuie menționat faptul că se disting două grupuri de motoare de căutare: motoarele de căutare și directoarele subiectului. Diferența lor se datorează metodei de creare și completare ulterioară a bazei de date a resurselor Internet, pe care acest server efectuează recuperarea informațiilor. Deci, motoarele de căutare includ un program special - un robot de căutare. Monitorizează constant rețeaua, colectează informații de pe paginile web, le indexează și le înregistrează imaginea de căutare în baza sa de date. În cataloagele de subiecte, o bază de date cu documente Internet este formată „manual” de editori specialiști. Deoarece nu există o singură administrație pe Internet, resursele sale informaționale sunt în continuă schimbare. În el pot apărea documente noi, iar documentele existente pot dispărea. Frecvența actualizării informațiilor din documente pentru diferite site-uri este diferită: pentru unii este de câteva ori pe oră, pentru unii - o dată pe zi, zi, lună etc. Prin urmare, este foarte important să înțelegem că atunci când se utilizează sisteme de recuperare a informațiilor pentru a găsi informații pe Internet, căutarea nu se efectuează în spațiul real al documentelor web, ci într-un anumit model, al cărui conținut poate diferi semnificativ de conținutul real al internetului în momentul căutării. În funcție de gradul de acoperire a resurselor indexate, motoarele de căutare pot fi împărțite în două grupuri: internațională și vorbitoare de limbă rusă. Primul indexează toate documentele publicate pe internet la rând. Acesta din urmă indexează resursele situate în zone de domeniu cu predominanță a limbii ruse. Lista celor mai populare sisteme este prezentată în tabel. 1.

Tab. 1. Cele mai populare motoare de căutare

Internaţional Vorbitor de rusă
Google Yandex (44,4% din Runet)
Yahoo! Rambler (10,6% din Runet)
Bing Mail.ru (7,3% Runet)
MSN Nigma (0,5% Runet)
AltaVista Gogo.ru (0,3% Runet)
Cere Aport (0,2% Runet)

Notă: Runetul este partea vorbitoare de limbă rusă a Internetului, constituind domenii cu nume ru și rf.

Trebuie menționat faptul că există o categorie specială de motoare de căutare - motoarele de căutare. Diferența lor fundamentală față de motoarele de căutare și cataloagele de subiecte este că nu au propria bază de date index și, prin urmare, după ce au primit cererea unui utilizator, o redirecționează către mai multe motoare de căutare simultan (vezi Fig. 3).

Orez. 3. Schema sistemului de metacercare

Capacitatea de a utiliza mai multe motoare de căutare în același timp pentru o singură interogare este un avantaj evident al motoarelor de metacautare. În prezent, sistemul Metabot.ru a găsit o aplicație largă, a cărei interfață este prezentată în Fig. 4. Acest sistem vă permite să utilizați atât motoare de căutare internaționale, cât și în limba rusă pentru a căuta resurse.

Căutarea eficientă a informațiilor folosind un computer este o sarcină urgentă care apare nu numai pentru începători, ci și pentru utilizatorii de Internet cu experiență, deoarece cine deține datele, el deține lumea, așa cum se spune în binecunoscutul zical. Astăzi vom analiza modalități de a găsi rapid informațiile necesare și importante pe internetul de limbă rusă... În prezent, există doar trei tipuri de ele:

  1. prin specificarea adresei directe a site-ului unde se află datele și informațiile necesare;
  2. navigarea pe linkuri folosind un computer personal pe internet;
  3. folosind motoare de căutare (mașini) pe internet.

Să luăm în considerare mai detaliat toate modalitățile de a căuta informații relevante în rețea utilizând un computer.

Găsirea informațiilor prin link direct pe web

Dacă știți deja la ce adresă de pe Internet se află informațiile de care aveți nevoie, atunci căutarea cu ajutorul unui computer este vizibil mai ușoară: trebuie doar să conduceți adresa site-ului în linia browserului și să vă familiarizați cu datele propuse. Dacă ați deschis un text voluminos pe o pagină a site-ului web pe Internet și sunteți interesat de doar câteva rânduri ascunse într-o „tonă” de caractere tipărite, atunci puteți utiliza căutarea în pagină. Pentru a face acest lucru, apăsați combinația de taste Ctrl și F (orice aspect al tastaturii computerului), iar în coloana propusă „Găsiți”, tastați o frază sau un cuvânt care este exact conținut în paragraf cu informațiile pe care le căutați , apoi apăsați „Enter”.

În browser, toate cuvintele menționate în pagină și similare cu cuvântul pe care îl căutați vor fi evidențiate într-o altă culoare. Cu toate acestea, destul de des se întâmplă să nu ne amintim sau să nu cunoaștem deloc linkurile cu locația informațiilor pe Internet. În acest caz, este cel mai convenabil să recurgeți la celelalte două tipuri de recuperare a datelor folosind un computer.

Căutați utilizând navigarea pe internet

Navigarea pe internet este o căutare în care se face o tranziție secvențială prin legături de la un site tematic la altul până când se găsește sursa datelor necesare. Avantajul acestei metode de recuperare a datelor pe Internet este fascinația și capacitatea de a stăpâni o cantitate mare de informații de pe diferite site-uri în mod consecvent și temeinic. Printre dezavantajele acestui tip de căutare se numără durata acestuia, precum și faptul că trebuie să ajungeți și la site-ul original de pe care începeți să navigați. Și dacă nu aveți adresa site-ului de pe care să începeți navigarea, atunci aici va trebui să recurgeți la utilizarea unei astfel de metode de căutare ca motoare de căutare.

Modalități de a căuta informații pe web folosind motoarele de căutare

Astăzi, motoarele de căutare precum Yandex.ru, Rambler.ru, Google.ru sunt cunoscute publicului pe Runet. Aceste site-uri vă permit să căutați date despre interogarea introdusă pe toate site-urile de internet. Conform principiului de funcționare, motoarele de căutare sunt de două tipuri: indexuri de căutare și directoare de căutare:

  • Căutați directoare. Aceste site-uri oferă asistență în găsirea datelor pe un anumit subiect pe Internet: informațiile din astfel de directoare sunt clar structurate pe grupuri și subiecte, ceea ce contribuie la găsirea rapidă a rezultatului. În fiecare subiect, utilizatorului i se oferă o serie de linkuri către site-uri unde poate găsi cunoștințele de care este interesat.
  • Căutați indexuri. Acestea sunt site-uri de indexare în care, atunci când introduceți un cuvânt cheie în bara de căutare, utilizatorul primește o serie de linkuri către pagini de pe Internet care conțin cuvântul sau expresia solicitată. Căutați în indexuri căutați utilizând programe speciale numite „păianjeni” care scanează paginile site-urilor de pe Internet pentru obiectul lor. După o astfel de scanare, motorul de căutare le introduce în baza sa de date, din care informațiile sunt ulterior „obținute” atunci când utilizatorul introduce o interogare în termenul de căutare.

Reguli pentru căutarea informațiilor pe internet

Acum vom lua în considerare regulile de bază, dar importante pentru căutarea eficientă a informațiilor relevante pe internetul vorbitor de rusă folosind un computer.

  1. Formați expresia cheie corectă pentru a vă referi la motorul de căutare. Nu puteți utiliza un singur cuvânt de căutare dacă doriți să obțineți un rezultat foarte util și nu ar trebui să introduceți fraze prea mari. Dimensiunea optimă a interogării de căutare este de 2 până la 4 cuvinte. Dacă motorul de căutare găsește prea puține rezultate în rezultatele căutării, atunci ar trebui să încercați să reformulați fraza introdusă, înlocuind unele cuvinte cu sinonime și să verificați, de asemenea, erori de ortografie în cuvinte. Amintiți-vă: nu există astfel de informații care nu sunt disponibile pe Internet. Alegeți cuvintele potrivite, urmați regulile și veți găsi ceea ce căutați.
  2. Folosiți operatori speciali. Căutarea modernă eficientă și rapidă a informațiilor necesare prin intermediul unui motor de căutare și cu ajutorul unui computer personal implică cunoașterea și aplicarea unor trucuri, care sunt abrevieri și simboluri speciale ale operatorului. Operatori - pictograme utilizate la formarea unei interogări într-un motor de căutare și care facilitează găsirea datelor necesare. Să luăm în considerare cei mai comuni operatori și semnificațiile lor care pot fi utile în practică.
  3. Spațiu sau semn & - înseamnă că doriți să căutați documente cu fraza necesară într-o singură propoziție. Un exemplu de intrare în bara de căutare: rețetă delicioasă sau delicios & rețetă.
  4. && - înseamnă necesitatea de a căuta o pagină pe care vor fi menționate cuvinte individuale dintr-o frază în întregul text și nu doar o singură propoziție. Exemplu: rețetă delicioasă &&.
  5. | - vi se vor oferi articole în cadrul cărora va fi utilizat doar 1 dintre cuvintele introduse. Exemplu: căsătorie | dezavantaj | defect.
  6. + - înseamnă căutarea textului cu o combinație obligatorie de cuvinte consecutive introduse între semnul „+”. Exemplu: delicios + rețetă.
  7. „” - căutați un șir de cuvinte fără a-l împărți în cuvinte separate. Exemplu: „Bomboane Krasnaya Polyana”.

Urmând aceste reguli simple atunci când căutați date folosind un computer și Internet, vă va fi mai ușor și veți putea găsi întotdeauna rapid informațiile de care aveți nevoie în orice moment.

16.Găsirea informațiilor pe Internet

Informațiile postate pe World Wide Web sunt calculate într-o cantitate imensă de octeți. Pentru a căuta informații pe World Wide Web, sunt utilizate site-uri web speciale - sisteme de recuperare a informațiilor. Acestea permit cuvintelor cheie să găsească resurse de informații legate de cuvinte cheie. Acesta poate fi text care conține cuvinte cheie sau o imagine grafică a unuia dintre cuvintele cheie. Exemple de sisteme de recuperare a informațiilor sunt Google și Yandex.

Căutați informații- una dintre cele mai solicitate sarcini în practică, pe care orice utilizator de Internet trebuie să o rezolve.

Există trei modalități principale de a găsi informații pe internet:

1. Specificarea adresei paginii.

3. Referindu-ne la motorul de căutare (server de căutare).

Metoda 1: Specificarea adresei paginii

Acesta este cel mai rapid mod de căutare, dar îl puteți utiliza numai dacă cunoașteți adresa exactă a documentului sau a site-ului în care se află documentul.

Nu uitați posibilitatea de a căuta printr-o pagină web deschisă în fereastra browserului (Editați-Găsiți pe această pagină ...).

Acesta este cel mai puțin convenabil mod, deoarece poate fi folosit pentru a căuta documente care au doar o semnificație apropiată de documentul curent.

Metoda 3: Referindu-ne la un motor de căutare

Folosind link-uri hipertext, puteți călători la nesfârșit în spațiul informațional al Web-ului, trecând de la o pagină web la alta, dar având în vedere că au fost create multe milioane de pagini web în lume, este greu de găsit informațiile necesare pe ele în acest fel.

Motoarele de căutare speciale vin în ajutor (sunt numite și motoare de căutare). Adresele motoarelor de căutare sunt bine cunoscute tuturor celor care lucrează pe Internet. În prezent, următoarele motoare de căutare sunt populare în partea de limbă rusă a internetului: Yandex (yandex.ru), Google (google.ru) și Rambler (rambler.ru

Sistem de căutare- un site web care oferă posibilitatea de a căuta informații pe internet.

Majoritatea motoarelor de căutare caută informații pe World Wide Web, dar există și sisteme care pot căuta fișiere pe servere ftp, produse din magazinele online și informații în grupurile de știri Usenet.

Prin principiul acțiunii motoarele de căutare sunt împărțite în două tipuri: directoare de căutare și indexuri de căutare.

Căutați directoare servește pentru căutare tematică.

Informațiile de pe aceste servere sunt structurate pe subiecte și subteme. Cu intenția de a acoperi un subiect restrâns, nu este dificil să găsești o listă de pagini web dedicate acestuia.

Un director de resurse de pe Internet sau un director de resurse de Internet sau pur și simplu un director de Internet este un set structurat de legături către site-uri cu o scurtă descriere a acestora.

Căutați indexuri funcționează ca niște indexuri alfabetice. Clientul specifică un cuvânt sau un grup de cuvinte care îi caracterizează zona de căutare - și primește o listă de linkuri către pagini web care conțin termenii specificați.

Primul motor de căutare pentru World Wide Web a fost Wandex, un index defunct dezvoltat de Matthew Gray de la MIT în 1993.

Cum funcționează indexul de căutare?

Căutați indexuri automat, cu ajutorul unor programe speciale (web spiders), scanați pagini de Internet și indexați-le, adică introduceți-le în imensa lor bază de date.

Robot de căutare(„Web spider”) este un program care face parte integrantă dintr-un motor de căutare și este conceput pentru a accesa cu crawlere pagini de Internet pentru a introduce informații despre acestea (cuvinte cheie) în baza motorului de căutare. În esență, păianjenul seamănă cel mai mult cu un browser obișnuit. Scanează conținutul paginii, îl încarcă pe serverul motorului de căutare pe care îl deține și îl trimite prin linkuri către paginile următoare.

Ca răspuns la o cerere de localizare a informațiilor solicitate, serverul de căutare returnează o listă de hyperlinkuri care duc la pagini web pe care sunt disponibile sau menționate informațiile solicitate. Lista poate fi la fel de largă pe care o doriți, în funcție de conținutul cererii.

http://www.yandex.ru/

Yandex- Sistem rusesc de căutare web. Site-ul companiei, Yandex.ru, a fost lansat pe 23 septembrie 1997. Sediul central al companiei este situat la Moscova. Compania are birouri în Sankt Petersburg, Ekaterinburg, Odessa și Kiev. Numărul de angajați depășește 700 de persoane.

Cuvântul „Yandex” (format din litera „I” și o parte a indexului cuvintelor; faptul că pronumele rusesc „I” corespunde cu engleza „I”) a fost inventat de Ilya Segalovich, unul dintre fondatorii Yandex , ocupă în prezent funcția de director tehnic al companiei.

Căutarea Yandex vă permite să căutați pe Runet documente în rusă, ucraineană, bielorusă, română, engleză, germană și franceză, ținând cont de morfologia limbilor ruse și engleze și de proximitatea cuvintelor dintr-o propoziție. O caracteristică distinctivă a Yandex este capacitatea de a regla fin interogarea de căutare. Acest lucru este implementat printr-un limbaj de interogare flexibil.

În mod implicit, Yandex afișează 10 linkuri pe fiecare pagină cu rezultatele căutării; în setările rezultatelor căutării, puteți crește dimensiunea paginii la 20, 30 sau 50 de documente găsite.

Din când în când, algoritmii Yandex responsabili de relevanța rezultatelor căutării se schimbă, ceea ce duce la modificări ale rezultatelor căutării. În special, aceste modificări sunt direcționate împotriva spamului de căutare, ceea ce duce la rezultate irelevante pentru unele interogări.

http://www.google.ru/

Lider al motoarelor de căutare pe internet, Google ocupă mai mult de 70% din piața mondială. În prezent, înregistrează aproximativ 50 de milioane de interogări de căutare în fiecare zi și indexează peste 8 miliarde de pagini web. Google poate găsi informații în 115 limbi.

Conform unei versiuni, Google este o ortografie distorsionată a cuvântului englez googol. Googol este un termen matematic pentru unul urmat de 100 de zerouri. Termenul a fost inventat de Milton Sirotta, nepotul matematicianului american Edward Kasner și a fost descris pentru prima dată în cartea Matematică și imaginație de Kasner și James Newman. Utilizarea de către Google a acestui termen reflectă provocarea de a organiza cantitățile mari de informații de pe Internet.

Interfața Google conține un limbaj de interogare destul de sofisticat care vă permite să vă limitați căutarea la anumite domenii, limbi, tipuri de fișiere și multe altele.

http://www.rambler.ru/

Rambler Media Group este un holding de Internet care include un motor de căutare, un clasificator de rating al resurselor de internet rusești și un portal de informații ca servicii.

Rambler a fost fondată în 1996.

Motorul de căutare Rambler înțelege și distinge între cuvintele limbilor rusă, engleză și ucraineană. În mod implicit, se caută toate formele unui cuvânt.



Ti-a placut articolul? Împărtășește-l