Контакти

Пошуковик де можна знайти. Способи пошуку інформації у мережі. Типи пошукових машин

Знайти потрібну інформацію в Інтернеті дуже важко. Інтернет розвивається хаотично, у ньому немає чітко виділеної структури. Ніхто не може гарантувати, що на одному домені буде лише інформація певної тематики, а на іншому – інформація іншої, але також чітко визначеної тематики. Наприклад, на доменах.com можна знайти не лише комерційну інформацію, а, наприклад, різну документацію щодо програмних продуктів або навіть анекдоти.

Якби доменна структура була б схожа на структуру каталогу, наприклад, в домені ru.comp.os.linux (як у системі новин) була б вся інформація про операційну систему Linux російською мовою і якась організація-модератор стежила, щоб в інших доменах не викладалася інформація про Linux, тоді пошук був би значно простіше. Адже ми знали б, де шукати. Відкриваєш браузер, вводиш ru.comp.os.linux і отримуєш... мільйони різних посилань на статті, HOWTO-документи та іншу інформацію, так чи інакше пов'язану з Linux.

Ефективність пошуку

    Ефективність пошуку залежить від багатьох факторів:
  • Від самої інформації - на одну тему інформації може бути багато, на іншій - мало. Іноді можна знайти багато інформації по заданій темі, але коефіцієнт корисної дії цього пошуку виявиться близьким до 0,0%, а можна знайти всього 3-4 посилання, і це буде те, що потрібно. Сюди ж відноситься уміння веб-майстра правильно подати інформацію, щоб її могли знайти самі пошукові машини. Припустимо, десь дуже далеко є потрібна вам інформація, але пошукова машина про неї нічого не знає. Можливо, інформація була щойно опублікована або просто веб-майстер, який опублікував інформацію, навіть не підозрює існування пошукових машин. Ви шукайте інформацію за допомогою пошукової машини. Якщо вона не "знає" потрібну вам інформацію, то, отже, і ви про неї нічого не дізнаєтесь.
  • Від пошукової машини – пошукових машин багато і всі вони різні. Навіть якщо вони відносяться до одного типу (про типи пошукових машин ми поговоримо трохи пізніше), безсумнівно, кожна з них матиме свій алгоритм. Якщо ви не знайшли інформацію за допомогою однієї пошукової машини, спробуйте пошукати її за допомогою іншої. Не зациклюйтесь на одній пошуковій машині, хоч би як вона вам подобалася.
  • Від уміння використовувати пошукову машину – від того, як ви вмієте використовувати пошукову машину, залежить дуже багато. Якщо ви не знаєте, як використовувати пошукову машину, навряд пошук буде ефективним.

Як правильно шукати інформацію

Оскільки найчастіше ви не вибираєте потрібний вам сайт з каталогу пошукової машини, а вводите певне ключове слово (або кілька ключових слів), то вам потрібно максимально задати це саме ключове слово. Чим точніше ви визначите предмет пошуку, тим точнішим буде результат. Адже пошукова машина не може вгадати ваші думки, потрібно чітко вказати їй, що ви шукайте.

Кожна пошукова машина має свій синтаксис, який необхідно знати. У цьому розділі буде описано синтаксис пошукових машин Google, Yandex та Rambler. Якщо ви хочете використовувати іншу пошукову машину, то її синтаксис ви зможете дізнатися на її сайті (зазвичай він докладно описаний).

Пошукові машини

А тепер поговоримо про самі пошукові машини.

На території колишнього СНД найбільш популярними є такі пошукові машини, за даними SpyLog (Openstat):

  • 1. Яндекс (www.yandex.ru);
  • 2. Google (www.google.com);
  • 3. Пошук@Mail.ru (go.mail.ru);
  • 3. Рамблер (www.rambler.ru);
  • 5. Yahoo! (www.yahoo.com);
  • 6. AltaVista (www.altavista.com);
  • 7. Bing (www.bing.com).

Пошукові машини вказані в порядку "зменшення популярності". Як бачите, найпопулярнішою у нас є пошукова машина Яндекс.

Типи пошукових машин

    Існують два основні типи пошукових машин:
  • індексні – Google, AltaVista, Rambler, HotBot, Яндекс та ін;
  • класифікаційні (каталогові) – Rambler, Yahoo! та ін.

Не дивуйтеся, що пошукова машина Rambler вказана двічі - вона одночасно була і індексною, і класифікаційною. До цього ми ще повернемося, а поки що поговоримо про відмінності цих двох систем.

Як працює індексна пошукова машина? Пошукова машина запускає спеціальну програму, яка переглядає вміст веб-серверів, індексуючи інформацію: вона заносить до своєї бази даних ключові слова тієї чи іншої веб-сторінки, деяку інформацію з веб-сторінки.

Коротка історія Google

Почнемо із назви. Google - це трохи видозмінений варіант слова googol (недаремно її часто називають "гуглом"). У свою чергу це слово було введено Мілтоном Сиротою, племінником відомого математика Едварда Каснера, а потім було популяризовано у книзі Каснера та Ньюмана "Математика та уява". Слово "googol" відображає число однією одиницею та 100 нулями. Назва Google відображає спробу організувати величезну кількість інформації в Мережі.

Отже, почнемо із самого початку. Майбутні розробники Google Сергій Брін (Sergey Brin) та Леррі Пейдж (Larry Page) познайомилися у 1999 році у Станфордському університеті. Тоді Лері було 24 роки, а Сергію - 23. Лері на той час був студентом університету Мічігану і на кілька днів приїхав до Станфорду. Сергій був у групі студентів, яка мала ознайомити гостей з університетом. З першої зустрічі Сергій і Лері, м'яко кажучи, недолюблювали один одного - вони сперечалися щодо всього, що можна було сперечатися. Хоча в результаті це й виявилося позитивним моментом, оскільки їхні різні думки призвели до створення алгоритму для вирішення одного з найактуальніших комп'ютерних завдань: пошук потрібної інформації серед величезного масиву даних. З січня 1996 року Леррі та Сергій починають роботу над пошуковою машиною BackRub, яка мала аналізувати "зворотні" посилання, що вказують на даний веб-сайт. Роботи над цим сервером велися в постійній нестачі коштів - адже тоді Сергій і Лері були аспірантами університету - самі розумієте, що коштів у аспірантів не дуже багато. До речі, Лері вперше брав участь у такому серйозному проекті, а до цього він займався всякими "несерйозними", навіть іноді анекдотичними проектами, наприклад, він побудував працюючий принтер із конструктора Lego.

Базовий синтаксис Google

Інтерфейс Google вражає своєю простотою: поле для введення та дві кнопки. Як то кажуть, все геніальне просто.

Спеціальний (розширений) синтаксис Google

На додаток до логічних операторів Google надає модифікатори пошуку, перелічені в таблиці. Модифікатори пошуку називаються спеціальним синтаксисом Google. Поставтеся до цієї таблиці з усією серйозністю: спробувавши одного разу пошукати щось із використанням модифікаторів, ви вже не відмовитеся від них.

Правильне використання модифікатора inurl

Модифікатор inurl використовується для пошуку за вказаною URL-адресою. І на відміну від модифікатора site, який дозволяє шукати інформацію тільки на одному сайті або домені, модифікатор inurl дозволяє шукати інформацію в підкаталогах сайту, наприклад:

inurl: сайтskype-zvonim-besplatno

Модифікатор inurl дозволяє використовувати символ * для вказівки домену, наприклад:
inurl: "*.redhat.com"

Найефективніше використовувати inurl у парі з site. Наступний запит буде шукати інформацію в домені gidmir.ru, на всіх його піддоменах, крім www:
site: gidmir.ru inurl: "*.gidmir" -inurl: "www.gidmir.ru"

Змішаний синтаксис Google

Google дає змогу використовувати змішаний синтаксис, тобто. такий синтаксис, у запиті якого використовуються кілька спеціальних модифікаторів пошуку. Це дозволяє досягти найкращого результату.

Ось найпростіший приклад змішаного синтаксису:
site: ru inurl: disc

У цьому випадку пошук буде здійснено на сайтах домену, а URL повинен містити слово disc.

Ось ще один приклад:
site: ru -inurl: оrg.ua

Пошук буде здійснено на сайтах домену ru, але в результатах пошуку будуть відсутні сторінки на org.ua.

Як подолати обмеження на кількість ключових слів

Для більшості рядових користувачів Google ліміт у 10 ключових не помітний. Але любителі довгих запитів, напевно, помітили, що Google бере до уваги лише перші 10 ключових слів, а решта просто ігноруються.

Навіщо слід шукати довгі фрази? Найчастіше - це уривки творів. Припустимо, що ми шукаємо твір "Майстер та Маргарита". Слід зазначити, що ключова фраза має виглядати як "Майстер Маргарита", оскільки слова і, або, and, of, or, I, a, the та деякі інші ігноруються пошуковою машиною. Якщо ви хочете примусово включити одне з цих слів у пошук, поставте перед цим словом знак +, наприклад +the.

Подолати ліміт 10 слів дозволяє правильну побудову запиту. Наведені нижче рекомендації допоможуть вам не тільки скоротити довжину запиту, але й підвищити ефективність пошуку в цілому.

Розширений пошук Google

Набираємо в рядку введення браузера адресу - www.google.ru/advanced_search та переходимо на розширений пошук Google.

За допомогою розширеного пошуку можна шукати інформацію майже так само гнучко, як і за допомогою модифікаторів пошуку. Чому "майже"? Інтерфейс розширеного пошуку надає доступ далеко не всім модифікаторам пошуку.

Встановлення властивостей пошуку в Google

Мені не хочеться забивати вам голову технічними подробицями, тому коротко скажу, що таке Cookies і ні, ні з чим їх їдять, а як з ними потрібно працювати.

Уявімо, що перед нами поставлене таке завдання: потрібно написати індивідуальний звіт відвідування для кожного клієнта нашої компанії. Тобто, щоб користувач не бачив загальної кількості відвідувань, знав, скільки разів саме він був на нашому сайті. Для кожної IP-адреси потрібно вести облік в одній таблиці, яка, швидше за все, буде великою, а з цього випливає, що ми нераціонально використовуємо процесорний час та дисковий простір. Набагато правильніше з нашого боку буде використовувати цей простір із більшою користю.

Ми встановлюємо Cookies - змінну, яка зберігатиметься на диску у користувача. Ця змінна і зберігатиме інформацію про відвідування. Вигода очевидна. По-перше, нам не потрібна жодна таблиця, по-друге, ми спрощуємо роботу нашої програми.

Результат пошуку Google

Результат пошуку Google - це не просто набір посилань, які відповідають умовам пошуку. Це щось більше, що заслуговує на окремий розгляд. Введіть слово "rusopen" і натисніть кнопку Пошук у Google.

У верхній частині ми бачимо загальну кількість результатів (883000000) і загальний час, який зайняв пошук, а саме 0,34 секунди.

    Найчастіше результат представляється як:
  • назву сторінки;
  • опис сторінки;
  • URL-сторінки;
  • розмір сторінки;
  • дата останнього індексування сторінки;

Пошук картинок з Google

Служба Google Images дозволяє знайти різні зображення в Інтернеті. Хоча самі зображення не можна індексувати, індексуються сторінки, які містять ці зображення. Введіть опис зображення і отримайте багато посилань, а також самі зображення, представлені у вигляді галереї.

    Для більш ефективного пошуку картинок потрібно використовувати такі модифікатори пошуку:
  • intitle: - Пошук у заголовку сторінки;
  • filetype: - дозволяє вказати тип картинки, можна вказувати такі типи: JPEG and GIF, BMP, PNG, зображення інших типів не індексуються;
  • inurl: - пошук по вказаному URL, наприклад inurl: www.gidmir.ru;
  • site: пошук на вказаному домені або на сайті, наприклад, site: com.

Служби Google

Google - це найпотужніша пошукова система, що охоплює понад 3 мільярди сторінок. Крім звичайних веб-сторінок, Google індексує файли у форматах Word, Excel, PowerPoint, PDF та RTF. Також Google можна використовувати для пошуку картинок та номерів телефонів: для цього призначені, відповідно, служби Google Images та Phonebook. У цій статті ми поговоримо про спеціальні служби Google.

Пошта Google

Спробуйте використати пошту від Google. Слід зазначити, що це звичайна веб-пошта.

    Серед особливостей Gmail слід виділити такі:
  • величезний розмір поштової скриньки – понад 7 Гбайт;
  • замість видалення листів їх можна архівувати - тоді й місця вистачить вам надовго, і зможете відновити листи, які були отримані або надіслані вами кілька років тому;
  • можливість пошуку поштової скриньки з ефективністю Google;
  • зручна організація листів та відповідей на них: всі листи та відповіді складають один ланцюжок, який легко відстежувати;
  • гарний захист від спаму;
  • адреса, що запам'ятовується, ваше_ім'я@gmail.com;
  • зручний інтерфейс.

Пошукова машина Рамблер (Rambler)

Історія Рамблера

Все почалося далекого 1991 року в місті Пущино Московської області. Того далекого року зібралася група однодумців, серед яких були Дмитро Крюков, Сергій Лисаков, Віктор Воронков, Володимир Самойлов, Юрій Єршов. Спільним інтересом цієї групи став Інтернет. Напевно, в 1991 році жоден з майбутніх розробників Рамблера і не припускав, що вони стануть творцями однієї з найбільших та найвідоміших пошукових машин Рунету. Адже раніше всі вони обслуговували радіотехнічні прилади в Інституті біохімії та фізіології мікроорганізмів РАН. У 1992 році була створена компанія "Стек" на чолі із Сергієм Лисаковим. Профіль компанії - локальні мережі та Інтернет. По суті компанія "Стек" була інтернет-провайдером. Фірма створила внутрішньоміську мережу, потім підключила Пущино до Москви, а вже через неї – до Інтернету. До речі, це був перший IP-канал, що виходить за межі Москви. І це у 1992 році! Зараз прокласти канал досить проблематично - завжди знайдеться безліч нюансів, а тоді кабелі доводилося прокладати самостійно, вручну, під землею, причому все це робилося взимку.

Як працював Рамблер

Інтернет постійно розвивається: кількість сайтів та їх розміри збільшуються з кожним днем. Адже тільки уявіть: великі сайти оновлюються щодня, навіть якщо обсяг оновлень становить 1024 байт (1 Кбайт), то якщо припустити, що таких сайтів 10 000, кожен день пошуковій машині доводиться обробляти (індексувати) 10 000 Кбайт (грубо кажучи, 10 Мбайт) ) інформації. Число 10 000 взято "зі стелі" - заради прикладу. Воно може бути вищим або нижчим - адже навіть великі сайти оновлюються не кожен день. Розмір оновлення також є надуманим. Уявіть інформаційно-аналітичний сайт, на якому практично щодня публікуються нові статті або передруковуються матеріали з інших сайтів. В цьому випадку розмір оновлень буде далеко не 1 Кбайт, а як мінімум 10. Додайте до цього ще новини та іншу інформацію і виходить, що при кількості оновлених сайтів 10 000 пошукова машина повинна проіндексувати 120 Мбайт тексту. І при цьому пошуковик повинен не тільки точно відобразити результати пошуку, але ще й зробити це якнайшвидше, щоб користувачеві було зручно з ним працювати. Кому захочеться чекати на результати пошуку 10 хвилин? Це я, звичайно, утрирую, але особисто я не чекав би результатів пошуку більше 30 секунд (з моменту клацання по кнопці Знайти до появи перших десяти результатів). Виходить, розробникам пошукової машини доводиться постійно підтримувати на належному рівні не тільки "залізо", яке має бути в змозі обробляти обсяги інформації, що постійно зростають, а й "математику" одним залізом не візьмеш. Потрібно постійно вдосконалювати алгоритми пошуку, щоб при збільшенні обсягів пошукової бази час пошуку не збільшувався (мається на увазі істотне збільшення часу - для користувача немає різниці, скільки буде виконуватися пошук 2,5 секунди або 2,0555 секунди, оскільки він не в змозі оцінити це час).

Синтаксис Рамблера

Запит до Рамблера міг складатися з одного або декількох слів, причому запит міг містити розділові знаки. Розробники Рамблера сконструювали свою пошукову машину для максимальної зручності користувача. Рамблер міг використовувати навіть недосвідчений користувач, який зовсім не знайомий із мовою запитів. Все, що йому потрібно було зробити, - це ввести запит, що складається з декількох слів (наприклад, якусь фразу) і без розділових знаків - Рамблер сам знаходив потрібні документи, причому робив це максимально ефективно. Звичайно, якщо правильно використовувати мову запитів, ефективність значно збільшувалася, але навіть за повного незнання мови запитів ефективність пошуку була на високому рівні. Як уже зазначалося, знання мови запитів - у ваших інтересах, ви просто зможете знайти потрібну вам інформацію значно швидше.

Пошукова машина Яндекс (Яndex)

Історична довідка

У далекому 1990 року у компанії «Аркадія», яку очолювали Аркадій Борковський та Аркадій Волож, розпочалася розробка пошукового програмного забезпечення. Через шість років з'явився сайт "Яндекс". Але що сталося за ці шість років?

За два роки було створено дві інформаційно-пошукові системи – «Міжнародна Класифікація Винаходів» та «Класифікатор Товарів та Послуг». Обидві системи працювали під DOS і дозволяли шукати слова із заданого словника з допомогою логічних операторів.

У 1993 році компанія "Аркадія" стала підрозділом CompTek. За 1993-1994 роки значно удосконалилися технології пошуку, наприклад, словник, який забезпечує пошук з урахуванням морфології російської мови, займав лише 300 Кбайт, а це означає, що він вільно поміщався в оперативну пам'ять, і робота з ним відбувалася дуже швидко. На основі цієї нової технології у 1994 році було створено «Біблійний комп'ютерний довідник» – інформаційно-пошукова система, що працює з перекладами Старого та Нового Завітів.

Як Яндекс інтерпретує слова

Як пошукова система інтерпретуватиме введене вами слово?

    Зараз ми про це й поговоримо:
  • Правило 1. Виявляється, система інтерпретує його згідно з правилами російської мови. Приклад: якщо ви ввели слово "машина", також отримаєте результати, що містять слова "машини", "машину" і т.д. Аналогічно і з дієсловами - на запит "йти" отримайте документи, що містять слова "йти", "йде", "йшов", "йшла" і т.д. Як бачите, пошукова система інтелектуальніша, ніж ви думали - це не просто засіб для пошуку певного слова в базі даних.
  • Правило 2. Особлива увага приділяється словам, написаним із великої літери. Якщо слово написано з великої літери і не є першим у реченні, то будуть знайдені лише слова з великої літери. Інакше будуть знайдені слова, написані як з великої, так і з маленької літери. Приклад: за запитом "Такса А." будуть знайдені документи, що містять як "такса" (плата), так і "Такса" (прізвище), оскільки слово "Такса" хоч і написано з великої літери, але воно стоїть першим у реченні. А ось на запит "А. Такса" будуть знайдені документи, що містять тільки слово "Такса", написане з великої літери.

Основний синтаксис Яндекса

За замовчуванням Яндекс використовує логічний оператор І. Це означає, що якщо ви ввели запит "телевізор Samsung", то в результатах отримаєте документи, в яких в одному реченні будуть зустрічатися слова "телевізор" та "Samsung". Якщо ви хочете вказати оператор І явно, використовуйте символ амперсанда &. Іншими словами, запит "телевізор Samsung" аналогічний запиту "телевізор & Samsung". Також можна використовувати запит "телевізор + Samsung".

Якщо вам потрібний зворотний ефект, тобто. ви хочете отримати документи, в яких є окремо слово "телевізор" та окремо слово "Samsung", то вам потрібно використовувати оператор АБО (|), наприклад: "телевізор | Samsung".

Знак тильда (~) дозволить знайти документи, у яких є перше слово, але немає другого. Наприклад, на запит "телевізор ~ Горизонт" будуть знайдені документи, в яких є слово "телевізор", але поруч з ним (в одному реченні) немає слова "Горизонт". А якщо нам потрібно знайти документи, в яких взагалі немає слова "Горизонт", але є слово "телевізор". Щоб перейти з рівня пропозиції на рівень документа, двічі вкажіть потрібний оператор, наприклад: && або ~~. У нашому випадку підійде запит "телевізор ~~ Горизонт".

Дуже часто потрібно знайти точну фразу, наприклад, "президент Росії", в якій слово "Росії" суворо слідує відразу після слова "президент". У цьому випадку потрібну фразу потрібно укласти в лапки.

Пошук з урахуванням відстані в Яндексі

Усі слова у тексті документа Яндекс нумерує по порядку. Відстань між сусідніми словами дорівнює 1 (а не 0!), А відстань між словами у зворотному порядку дорівнює -1. Те саме стосується і пропозицій.

Для вказівки відстані між словами ставиться знак /, за яким одразу стоїть число, отже, це відстань між словами. Наприклад, на запит "розробник /2 програм" будуть знайдені документи, в яких містяться слова "розробник" і "програм", причому відстань між словами має бути не більше двох слів і всі ці слова повинні бути в одному реченні. У цьому випадку буде знайдено документи, що містять "розробник прикладних програм", "розробник системних програм" тощо.

Якщо нам точно відомі відстань і порядок слів, можна скористатися синтаксисом /+n. Наприклад, запит "червона /+1 шапочка" призведе до результату, в якому слово "шапочка" слідує відразу за словом "червона". Такого ж результату привів би запит "червона шапочка".

Використання дужок під час пошуку в Яндекс

Дужки використовуються для подання у запиті цілого виразу. Наприклад, на запит "(історія | технології | програми)/+1 Linux" будуть знайдені документи, що містять одну з фраз "історія Linux", "технології Linux", "програми Linux".

Зони

Зона – це місце пошуку потрібної вам інформації. Ви можете задати зону, в якій ви хочете виконати пошук - заголовки (зона Title), посилання (anchors) або адресу (Address). Можна також використовувати зону all-пошук по всьому документу.

Синтаксис: $ім'я_зони запит.

Наприклад: запит $title "(!LANG:Microsoft" найдет все документы, в заголовках которых встречается точная фраза "Microsoft".!}

Додаткові можливості пошуку Яндекс

Пошукова машина Google дозволяла обмежити місце пошуку певним списком серверів або, навпаки, виключити деякі сервери зі списку пошуку. Такі самі можливості є і в пошуковій машині Яндекс. Ви також можете шукати документи, які мають посилання на певні URL або картинки. Під час завдання маски файлу (наприклад, зображення) можна використовувати символ *, що означає всі символи, наприклад: ”audi-*”.

Синтаксис наступний: #имя_элемента=”значення”.

    Елементом може бути:
  • url – певний сайт;
  • link – посилання;
  • image - картинка;
  • keywords – ключові слова (*);
  • abstract – анотація (*);
  • hint - підпис до зображення (*).

Пошук інформації в Інтернеті

Мережа Інтернет зростає дуже швидкими темпами, тому знайти потрібну інформацію серед сотень мільярдів Web-сторінок та сотень мільйонів файлів стає дедалі складніше. Для пошуку інформації використовуються спеціальні пошукові системи, які містять інформацію, що постійно оновлюється, про місцезнаходження Web-сторінок і файлів на сотнях мільйонів серверів Інтернету.

Пошукові системи містять тематично згруповану інформацію про інформаційні ресурси Всесвітньої мережі в базах даних. Спеціальні програми-роботи періодично "обходять" Web-сервери Інтернету, читають всі документи, що зустрічаються, виділяють у них ключові слова і заносять в базу даних Інтернет-адреси документів.

Більшість пошукових систем дозволяють автору Web-сайту самому внести інформацію до бази даних, заповнивши реєстраційну анкету. У процесі заповнення анкети розробник сайту вносить адресу сайту, його назву, короткий опис змісту сайту, а також ключові слова, за якими найлегше буде знайти сайт.

Пошук за ключовими словами.Пошук документа в базі даних пошукової системи здійснюється за допомогою введення запитів у поле пошуку.

Запит повинен містити одне або кілька ключових слів, які є основними для цього документа. Наприклад, для пошуку самих систем пошуку в Інтернеті можна ввести в ключові слова "російська система пошуку інформації Інтернет" (мал. 6.21).

Через деякий час після надсилання запиту пошукова система поверне список веб-адрес документів, в яких були знайдені задані ключові слова. Для перегляду цього документа в браузері достатньо активізувати посилання, що вказує на нього (рис. 6.22).

Якщо ключові слова були вибрані невдало, список адрес документів може бути занадто великим (може містити десятки і навіть сотні тисяч посилань). Щоб зменшити список, можна ввести додаткові ключові слова або скористатися каталогом пошукової системи в полі пошуку.

Однією з найповніших і найпотужніших пошукових систем є Google (www.google.ru), в базі даних якої зберігаються 8 мільярдів Web-сторінок і щомісяця програми-роботи заносять до неї 5 мільйонів нових сторінок. У Рунеті (російської частини Інтернету) великі бази даних, що містять по 200 мільйонів документів, мають пошукові системи Яndех (www.yandex.ru) та Rambler (www.rambler.ru).

Пошук у ієрархічній системі каталогів.У базі даних пошукової системи Web-сайти групуються в ієрархічні тематичні каталоги, які є аналогами тематичного каталогу у бібліотеці

Тематичні розділи верхнього рівня, наприклад: Інтернет, Комп'ютери, Наука та освітаі т. д., містять вкладені каталоги. Наприклад, каталог Інтернет може містити підкаталоги. Пошук, Поштата ін (рис. 6.23).

Пошук інформації в каталозі зводиться до вибору певного каталогу, після чого користувачеві буде представлений список посилань на Інтернет-адреси відвідуваних та змістовних Web-сайтів. Кожне посилання зазвичай анотована, тобто містить короткий коментар до змісту документа.

Найповніший багаторівневий ієрархічний тематичний каталог російськомовних Інтернет-ресурсів має пошукова система Апорт (www.aport.ru). Каталог містить детальну інструкцію змісту Web-сайтів та вказівку на їх географічне розташування.

Пошук файлів.Для пошуку файлів на серверах файлових архівів є спеціалізовані пошукові системи, у тому числі пошукова система FileSearch (www.filesearch.ru). Для пошуку файлу необхідно ввести ім'я файлу в полі пошуку, і пошукова система видасть веб-адреси серверів файлових архівів, на яких зберігається файл із заданим ім'ям.

Пошук інформації в російськомовній частині Інтернету за допомогою найбільш пошукових систем: Google, Rambler, Апорт, Япс1ех та файлової пошукової системи Research можна проводити з використанням інтегрованої пошукової системи Gogle.ru (рис. 6.24). Для цього достатньо ввести ключові слова в рядок пошуку, за допомогою перемикачів встановити тип необхідної інформації та натиснути на кнопку з назвою пошукової системи Gogle.ru (рис. 6.24). Для цього достатньо ввести ключові слова в рядок пошуку, за допомогою перемикачів встановити тип необхідної інформації та натиснути на кнопку з назвою пошукової системи.


Рис. 6.24. Інтегрована пошукова система Gogle.ru

Способи пошуку в Інтернеті

Три способи пошуку в Інтернеті

Інтернет загалом і Всесвітня павутина, зокрема, надають абоненту доступ до тисяч серверів та мільйонів Web-сторінок, на яких зберігається неймовірний обсяг інформації. Як не загубитися у цьому "інформаційному океані"? Для цього необхідно навчитися шукати та знаходити потрібну інформацію в мережі.

Як уже було сказано, існують три основні способи пошуку інформації в Інтернеті.

1. Вказівка ​​адреси сторінки.Це найшвидший спосіб пошуку, але його можна використовувати лише в тому випадку, якщо точно відома адреса документа.

2. Пересування гіперпосиланнями.Це найзручніший спосіб, тому що з його допомоги можна шукати документи, тільки близькі за змістом поточному документу. Якщо поточний документ присвячений, наприклад, музиці, то, використовуючи гіперпосилання цього документа, навряд чи можна буде потрапити на сайт, присвячений спорту.

3. Звернення до пошукового сервера (пошукової системи). Використання пошукових серверів – найбільш зручний спосіб пошуку інформації. В даний час в російськомовній частині Інтернету популярні такі пошукові сервери:

    Yandex;
    Rambler;
    Апорт.

Існують інші пошукові системи. Наприклад, ефективна система пошуку реалізована на сервері поштової служби mail.ru.

Пошукові сервери

Найбільш доступним та зручним способом пошуку інформації у Всесвітній павутині є використання пошукових систем. При цьому пошук інформації можна здійснювати за каталогами, а також за набором ключових слів, що характеризують текстовий документ, що відшукується.

Розглянемо використання пошукових серверів докладніше. Пошуковий сервермістить велику кількість посилань на різні документи, і всі ці посилання систематизовані в тематичні каталоги. Наприклад: спорт, кіно, автомобілі, ігри, наука та ін. Причому ці посилання встановлюються сервером самостійно, в автоматичному режимі шляхом регулярного перегляду всіх веб-сторінок, що з'являються у Всесвітній павутині. Крім того, пошукові сервери надають користувачеві можливість пошуку інформації за ключовими словами. Після введення ключових слів пошуковий сервер починає переглядати документи на інших веб-серверах та виводити на екран посилання на ті документи, в яких зустрілися зазначені слова. Зазвичай результати пошуку сортуються за спаданням спеціального рейтингу документів, який показує, наскільки повно заданий документ відповідає умовам пошуку або наскільки часто він запитується в мережі.

Мова запитів пошукової системи

Група ключових слів, сформована за певними правилами – за допомогою мови запитів, називається запитом до пошукового сервера. Мови запитів до різних пошукових серверів дуже схожі. Докладніше про це можна дізнатися, відвідавши розділ "Допомога" потрібного пошукового сервера. Розглянемо правила формування запитів з прикладу пошукової системи Яndex.

Синтаксис оператора Що означає оператор Приклад запиту
пробіл або & Логічне І (у межах пропозиції) лікувальна фізкультура
&& Логічне І (у межах документа) рецепти && (плавлений сир)
| Логічне АБО фото | фотографія | знімок | фотозображення
+ Обов'язкова наявність слова у знайденому документі +бути або +не бути
() Групування слів (технологія | виготовлення) (сиру | сиру)
~ Бінарний оператор І НЕ (у межах пропозиції) банки ~ закон
~~
або
_
Бінарний оператор І НЕ (у межах документа) путівник по Парижу ~~ (агентство | тур)
/(n m) Відстань у словах (мінус (-) – назад, плюс (+) – вперед) поставщики /2 кофе музыкальное /(-2 4) освіта вакансії ~ /+1 студентів
" " Пошук фрази "червона шапочка" Еквівалентно: червона /+1 шапочка
&&/(n m) Відстань у пропозиціях (мінус (-) – назад, плюс (+) – вперед) банк && /1 податки

Щоб отримати найкращі результати пошуку, необхідно запам'ятати кілька простих правил:

    1. Не шукати інформацію лише за одним ключовим словом.

    2. Краще не вводити ключові слова з великої літери, оскільки це може призвести до того, що не будуть знайдені ті самі слова, написані з малої літери.

    3. Якщо в результаті пошуку ви не отримали жодних результатів, перевірте, чи немає ключових слів орфографічних помилок.

Сучасні пошукові системи надають можливість підключення до сформованого запиту семантичного аналізатора. З його допомогою можна, ввівши якесь слово, вибрати документи, в яких зустрічаються похідні від цього слова в різних відмінках, часах та ін.

Контрольні питання

1. Яким чином здійснюється пошук документів за ключовими словами? У системі каталогів?

Завдання для самостійного виконання

6.8 Практичне завдання. Порівняти результати пошуку документів за ключовим словом за допомогою різних пошукових систем (скористатися інтегрованою пошуковою системою Gogle).

6.9 Практичне завдання. Знайти на серверах файлових архівів файл медіапрогравача WinAmp.

Пошук інформації в Інтернеті

Пошук інформації в Інтернеті

Для пошуку інформаціїзазвичай використовуються три способи(Див. мал.1). Першийїх - пошук за адресою. Він застосовується, коли користувачеві відома адреса інформаційного ресурсу, що містить необхідну інформацію. При організації пошуку інформації за адресою (форма адреси – IP, доменний або URL – у цьому випадку значення не має) користувачеві досить просто ввести адресу ресурсу у відповідне поле браузера – програми, призначеної для забезпечення доступу до мережевих ресурсів.

Рис. 1. Способи пошуку інформації у гіпертекстових базах даних

Другий- Пошук за допомогою навігації через гіперзв'язки. При використанні цього виду пошуку випадку користувач спочатку повинен отримати доступ до сервера, пов'язаного з БД. Після цього можна знайти документ, використовуючи гіперпосилання. Очевидно, що цей спосіб зручний, коли адреса ресурсу невідома користувачеві. Для використання як вихідну точку для пошуку при реалізації цього способу призначені Web-портали - сервери, що надають прямий доступ до деякої множини серверів, включаючи встановлені на них інформаційні ресурси, а також Web-додатки, які реалізують Web-сервіси, що відповідають призначенню порталу. Доступні через портал сервери можуть належати до певної системи (наприклад - корпоративної) або різних систем і бути спеціально підібрані за видовою, тематичною або іншими ознаками документів та даних, що містяться на їх сайтах. Зазвичай портали поєднують у собі різноманітні функції з метою утримати клієнта якомога довше. Домінуючим сервісом порталу є сервіс довідкової служби: пошук, рубрикатори, фінансові індекси, інформація про погоду тощо. Якщо Web-сайти в більшості випадків є наборами статичних Web-сторінок, то портали є сукупністю програмних засобів і заздалегідь неструктурованої інформації, яку ці засоби перетворюють на структуровані дані на запит конкретних користувачів.

ТретійМетод пошуку передбачає використання пошукових серверів Інтернету. Пошуковими серверами називають виділені хост - комп'ютери, у яких розміщуються бази даних ресурсів Інтернету. Інтерфейс користувача такого сервера має поле для введення ключових слів, що описують тему, що цікавить користувача (Див. мал. 2).

Рис.2. Вид вікна пошукового сервера системи Яндекс

Ці слова сервер сприймає як інформаційний запит, відповідно до якого він здійснює пошук ресурсів та представляє список знайдених документів користувачеві. Вочевидь, що з реалізації цього методу можливі помилки як 1-го (перепустка мети), і 2-го роду (інформаційний шум). Слід згадати, що розрізняються дві групи пошукових серверів: пошукові машини та предметні каталоги. Їхня відмінність обумовлена ​​способом створення та подальшого поповнення бази даних ресурсів Інтернету, якою даний сервер здійснює інформаційний пошук. Так, пошукові машини мають у своєму складі спеціальну програму – пошуковий робот. Вона здійснює постійний моніторинг мережі, збирає інформацію з Web-сторінок, індексує їх та фіксує їх пошуковий образ у своїй базі даних. У предметних каталогах база даних про документи Інтернету формується «вручну» спеціалістами-редакторами. Оскільки в Інтернеті немає єдиного адміністрування, остільки його інформаційні ресурси постійно змінюються. У ньому можуть з'являтися нові та зникати існуючі документи. Частота оновлення інформації в документах для різних сайтів різна: для деяких це кілька разів на годину, для деяких раз на добу, день, місяць і т.д. Тому дуже важливо розуміти, що при використанні інформаційно-пошукових систем для знаходження інформації в Інтернеті пошук здійснюється не на реальному просторі документів Мережі, а в деякій моделі, зміст якої може значно відрізнятися від дійсного змісту Інтернет в момент проведення пошуку. За ступенем охоплення індексованих ресурсів пошукові системи можна поділити на дві групи: міжнародні та російськомовні. Перші індексують усі опубліковані в Інтернеті документи поспіль. Другі індексують ресурси, розташовані в доменних зонах з величезним переважанням російської. Список найпопулярніших систем наведено в Табл. 1.

Табл. 1. Найбільш популярні пошукові системи

Міжнародні Російськомовні
Google Яндекс (44,4% Рунету)
Yahoo! Rambler (10,6% Рунету)
Bing Mail.ru (7,3% Рунету)
MSN Nigma (0,5% Рунету)
AltaVista Gogo.ru (0,3% Рунету)
Ask Aport (0,2 % Рунету)

Примітка: Рунет - це російськомовна частина Інтернету, що становить домени з іменами ru та рф.

Необхідно згадати, що є особлива категорія пошукових серверів - метапошукові системи. Їхня важлива відмінність від пошукових машин і предметних каталогів полягає в тому, що у них відсутня власна індексна база даних, і тому вони, отримавши запит користувача, перенаправляють його відразу до декількох пошукових серверів (див. рис. 3).

Рис. 3. Схема роботи метапошукової системи

Можливість одночасного використання кількох пошукових серверів за одним запитом є очевидною перевагою метапошукових систем. В даний час широке застосування знайшла система Metabot.ru, інтерфейс якої представлений на Рис. 4. Ця система дозволяє використовуватиме пошуку ресурсів як міжнародні, і російськомовні пошукові сервери.

Ефективний пошук інформації з використанням комп'ютера - актуальне завдання, що виникає не тільки перед початківцями, а й досвідченими користувачами мережі інтернет, адже хто володіє даними - той володіє світом, як усім добре відома приказка. Сьогодні ми розберемо способи швидкого пошуку необхідної та важливої ​​інформації у російськомовному інтернеті. На даний момент їх виділяють лише три види:

  1. через вказівку прямої адреси сайту, де розміщені потрібні дані та необхідна інформація;
  2. серфінг за посиланнями за допомогою персонального комп'ютера в Інтернеті;
  3. за допомогою пошукових систем (машин) до інтернету.

Розглянемо більш розгорнуто всі засоби пошуку актуальної інформації в мережі за допомогою комп'ютера.

Пошук інформації щодо прямого посилання в мережі

Якщо ви вже знаєте, за якою адресою в інтернеті розміщена потрібна вам інформація, то пошук за допомогою комп'ютера помітно полегшується: досить просто вбити адресу сайту в браузерний рядок і ознайомитися із запропонованими даними. Якщо перед вами відкрився об'ємний текст на сторінці сайту в інтернеті, а вас цікавить буквально кілька рядків, захованих у «тонні» друкованих символів, то можете скористатися внутрісторінковим пошуком. Для цього натисніть клавіші Ctrl і F (будь-який розкладки клавіатури комп'ютера), а в запропоновану графу «Знайти» вбийте фразу або слово, яке точно міститься в абзаці з інформацією, яку шукаєте, після чого натисніть «Enter».

У браузері підсвічуються іншим кольором усі слова, що згадуються на сторінці та схожі на те слово, яке ви шукаєте. Проте часто трапляється так, що ми не пам'ятаємо або взагалі не знаємо посилання з місцезнаходженням інформації в інтернеті. У цьому випадку найзручніше вдатися до інших двох видів пошуку даних за допомогою комп'ютера.

Пошук за допомогою інтернет серфінгу

Інтернет серфінг - пошук, при якому здійснюється послідовний перехід за посиланнями з одного тематичного сайту на інший доти, доки не буде знайдено джерело потрібних даних. Перевага такого способу інтернет-пошуку даних полягає в його захоплюючості та можливості освоїти великий обсяг інформації з різних сайтів послідовно та ґрунтовно. Серед недоліків цього виду пошуку є його тривалість, а також те, що на початковий сайт, з якого почнеться ваш серфінг, теж потрібно якось потрапити. А якщо ви не маєте адреси сайту, з якого почнете серфінг, то тут вам доведеться вдатися до допомоги такого способу пошуку, як пошукові системи.

Способи пошуку інформації в мережі за допомогою пошукових систем

Сьогодні широко відомі публіці Рунета такі пошукові системи, як Яндекс.ru, Rambler.ru, Google.ru. Ці сайти дозволяють шукати дані по запиту на всіх сайтах інтернету. За принципом роботи пошукові системи бувають двох видів: пошукові індекси та пошукові каталоги:

  • Пошукові каталоги. Ці сайти надають допомогу в пошуку даних певної тематики в мережі інтернет: інформація в таких каталогах чітко структурована за групами та темами, що сприяє швидкому знаходженню результату. У кожній темі користувачеві пропонується ряд посилань на сайти, де можна знайти цікаві для нього знання.
  • Пошукові індекси. Це сайти-покажчики, в яких при введенні ключового слова в рядок пошуку, користувач отримує ряд посилань на сторінки в інтернеті, де міститься запитане слово або фраза. Пошукові індекси здійснюють пошук за допомогою спеціальних програм, званих «павуками», що сканують сторінки сайтів в інтернеті на предмет їхньої тематики. Після такого скану пошуковик заносить їх у свою базу, з якої пізніше і «дістається» інформація при введенні користувачем запиту в термін пошуку.

Правила пошуку інформації в мережі інтернет

Наразі розглянемо основні, але важливі правила ефективного пошуку актуальної інформації в російськомовній мережі інтернет за допомогою комп'ютера.

  1. Формуйте правильну ключову фразу для звернення до пошукової системи. Не можна використовувати тільки одне слово для пошуку, якщо ви хочете отримати дійсно корисний результат, а також не варто вводити занадто великі фрази. Оптимальний розмір запиту становить від 2 до 4 слів. Якщо в результатах пошуку пошуковою системою знайдено дуже мало результатів, то варто спробувати переформулювати введену фразу, замінивши деякі слова синонімами, а також перевірити наявність орфографічних помилок у словах. Запам'ятайте: немає такої інформації, якої немає в Інтернеті. Просто підбирайте правильні слова, дотримуйтесь правил і ви знайдете те, що шукаєте.
  2. Використовуйте спеціальні оператори. Сучасний ефективний і швидкий пошук будь-якої необхідної інформації за допомогою пошуковика та за допомогою персонального комп'ютера передбачає знання та застосування деяких хитрощів, якими є скорочення та спеціальні символи-оператори. Оператори – значки, що використовуються для формування запиту в пошуковій системі та полегшують пошук необхідних даних. Розглянемо найпоширеніші оператори та їх значення, які можуть стати в нагоді на практиці.
  3. Пробіл або знак & - означає, що потрібно шукати документи з необхідним словосполученням у межах однієї пропозиції. Приклад введення в пошуковий рядок: смачний рецепт або смачний рецепт.
  4. && - означає необхідність пошуку сторінки, на якій будуть згадані окремі слова із словосполучення в межах всього тексту, а не лише однієї речення. Приклад: смачний рецепт.
  5. | - Вам будуть запропоновані статті, в межах яких буде вжито лише 1 із введених слів. приклад: шлюб | нестача | дефект.
  6. + – означає пошук тексту з обов'язковим поєднанням підряд слів, введених між знаком «+». Приклад: смачний рецепт.
  7. “ ” – пошук ланцюжка слів без її розбивання окремі слова. Приклад: "цукерки "Червона Поляна"".

Дотримуючись цих простих правил при пошуку даних за допомогою комп'ютера та інтернету, ви полегшите собі завдання і завжди швидко зможете знайти інформацію, необхідну вам у будь-який момент часу.

16.Пошук інформації в інтернеті

Інформація, розміщена у Всесвітній мережі, обчислюється величезною кількістю байт. Для пошуку інформації у Всесвітній мережі використовують спеціальні веб-сайти – інформаційно-пошукові системи. Вони дозволяють за ключовими словами знайти інформаційні ресурси, пов'язані з ключовими словами. Це може бути текст, який містить ключові слова, або графічне зображення одного з ключових слів. Прикладами інформаційно-пошукових систем є системи Google та Yandex.

Пошук інформації- одне з найбільш затребуваних на практиці завдань, яке доводиться вирішувати будь-якому користувачеві Інтернету.

Існують три основні способи пошуку інформації в Інтернеті:

1. Вкажіть адресу сторінки.

3. Звернення до пошукової системи (пошукового сервера).

Спосіб 1:Вказівка ​​адреси сторінки

Це найшвидший спосіб пошуку, але його можна використовувати тільки в тому випадку, якщо точно відома адреса документа або сайту, де розташований документ.

Не варто забувати про можливість пошуку по відкритій у вікні браузера web-сторінці (Правка-Знайти на цій сторінці…).

Це найзручніший спосіб, оскільки з його допомогою можна шукати документи, лише близькі за змістом поточному документу.

Спосіб 3:Звернення до пошукової системи

Користуючись гіпертекстовими посиланнями, можна довго подорожувати в інформаційному просторі Мережі, переходячи від однієї web-сторінки до іншої, але якщо врахувати, що у світі створено багато мільйонів web-сторінок, то знайти на них потрібну інформацію таким способом навряд чи вдасться.

На допомогу приходять спеціальні пошукові системи (ще називають пошуковими машинами). Адреси пошукових серверів добре відомі всім, хто працює в Інтернеті. В даний час в російськомовній частині Інтернету популярні наступні пошукові сервери: Яндекс (yandex.ru), Google (google.ru) і Rambler (rambler.ru)

Пошукова система- Веб-сайт, що надає можливість пошуку інформації в Інтернеті.

Більшість пошукових систем шукають інформацію на сайтах Всесвітньої павутини, але існують також системи, які здатні шукати файли на ftp-серверах, товари в інтернет-магазинах, а також інформацію в групах новин Usenet.

За принципом діїпошукові системи діляться на два типи: пошукові каталоги та пошукові індекси.

Пошукові каталогислужать для тематичного пошуку.

Інформація на цих серверах структурована за темами та підтемами. Маючи намір висвітлити якусь вузьку тему, легко знайти список web-сторінок, їй присвячених.

Каталог ресурсів в Інтернеті або каталог інтернет-ресурсів або просто інтернет-каталог - структурований набір посилань на сайти з коротким їх описом.

Пошукові індексипрацюють як алфавітні покажчики. Клієнт задає слово або групу слів, що характеризують його область пошуку, і отримує список посилань на web-сторінки, що містять зазначені терміни.

Першою пошуковою системою для Всесвітньої павутини був «Wandex», що вже не існує індекс, розроблений Метью Грейм з Массачусетського технологічного інституту в 1993 році.

Як працює пошуковий індекс?

Пошукові індекси автоматично, за допомогою спеціальних програм (веб-павук), сканують сторінки Інтернету та індексують їх, тобто заносять у свою величезну базу даних.

Пошуковий робот(«веб-павук») - програма, що є складовою пошукової системи та призначена для обходу сторінок Інтернету з метою занесення інформації про них (ключові слова) в базу пошуковика. По суті павук найбільше нагадує звичайний браузер. Він сканує вміст сторінки, закидає його на сервер пошукової машини, якій належить та надсилається за посиланнями на наступні сторінки.

У відповідь на запит, де знайти потрібну інформацію, пошуковий сервер повертає список гіперпосилань, що ведуть web-сторінок, на яких потрібна інформація є або згадується. Обширність списку може бути будь-якою залежно від змісту запиту.

http://www.yandex.ru/

Яндекс- Російська система пошуку у Мережі. Сайт компанії Yandex.ru був відкритий 23 вересня 1997 року. Головний офіс компанії знаходиться у Москві. Компанія має офіси в Санкт-Петербурзі, Єкатеринбурзі, Одесі та Києві. Кількість працівників перевищує 700 осіб.

Слово «Яндекс» (що складається з літери «Я» і частини слова index; обіграний той факт, що російський займенник «Я» відповідає англійському «I») вигадав Ілля Сегалович, один із засновників Яндекса, який зараз займає посаду технічного директора компанії.

Пошук Яндекса дозволяє шукати по Рунету документи російською, українською, білоруською, румунською, англійською, німецькою та французькою мовами з урахуванням морфології російської та англійської мов та близькості слів у реченні. Відмінна риса Яндекса - можливість точного настроювання пошукового запиту. Це реалізовано рахунок гнучкої мови запитів.

За замовчуванням Яндекс виводить по 10 посилань на кожній сторінці видачі результатів, в налаштуваннях результатів пошуку можна збільшити розмір сторінки до 20, 30 або 50 знайдених документів.

Іноді алгоритми Яндекса, відповідальні за релевантність видачі, змінюються, що зумовлює змін у результатах пошукових запитів. Зокрема, ці зміни спрямовані проти пошукового спаму, що веде до нерелевантних результатів за деякими запитами.

http://www.google.ru/

Лідер пошукових машин Інтернету, Googleзаймає понад 70% світового ринку. Зараз реєструє щодня близько 50 млн пошукових запитів та індексує понад 8 млрд веб-сторінок. Google може знаходити інформацію 115 мовами.

За однією з версій, Google – спотворене написання англійського слова googol. "Googol (гугол)" - це математичний термін, що позначає одиницю зі 100 нулями. Цей термін був придуманий Мілтоном Сіроттою, племінником американського математика Едварда Каснера, і вперше описаний у книзі Каснера та Джеймса Ньюмена "Математика і уява" (Mathematics and the Imagination). Використання цього терміну Google відображає завдання організувати величезні обсяги інформації в Інтернеті.

Інтерфейс Google містить досить складну мову запитів, що дозволяє обмежити область пошуку окремими доменами, мовами, типами файлів тощо.

http://www.rambler.ru/

Rambler Media Group - інтернет-холдинг, що включає як сервіси пошукову систему, рейтинг-класифікатор ресурсів російського Інтернету, інформаційний портал.

Rambler створено у 1996 році.

Пошукова система Рамблер розуміє та розрізняє слова російської, англійської та української мов. За промовчанням пошук ведеться за всіма формами слова.



Сподобалась стаття? Поділіться їй