Алгоритм ранжирування. Алгоритм ранжирування Алгоритми ранжирування

Автор розповідає близько 30 цікавих (і повчальних) історій з галузі математики. В одній з історій йдеться про принципи роботи PageRank – алгоритму ранжування посилань, вперше використаного в Google. Тема актуальна та задоволена проста для розуміння. Тож слово Стівену Строгацю…

У ті далекі часи, коли Google ще не існувало, пошук у мережі був безнадійним заняттям. Сайти, запропоновані старими пошуковими машинами, часто не відповідали запиту, а ті, які містили потрібну інформацію, були або глибоко заховані у списку результатів, або були відсутні. Алгоритми на основі аналізу посилань вирішили проблему, проникнувши в суть парадоксу, подібного до коан дзен: в результаті пошуку в інтернеті повинні були відображатися найкращі сторінки. А що ж, робить сторінку кращою? Коли на неї посилаються інші не менш добрі сторінки.

Завантажити замітку у форматі або

Звучить подібно до міркувань про замкнене коло. Так і є. Саме тому все так складно. Вхопившись за цю ідею і перетворивши її на перевагу, алгоритм аналізу посилань дає рішення пошуку в мережі в стилі джиу-джитсу. Цей підхід побудований на ідеях, взятих із лінійної алгебри, вивчення векторів та матриць. Якщо ви хочете виявити закономірності у величезному накопиченні даних або виконати гігантські обчислення з мільйонами змінних, лінійна алгебра надасть при цьому всі необхідні інструменти. З її допомогою було збудовано фундамент для алгоритму PageRank, покладеного в основу Google. Вона також допомагає вченим класифікувати людські особи, провести аналіз голосування у Верховному суді, а також виграти приз Netflix (команда, що вручається, зуміла поліпшити більш ніж на 10% систему Netflix, на основі якої складаються рекомендації для перегляду кращих фільмів).

Щоб вивчити лінійну алгебру у дії, розглянемо, як працює алгоритм PageRank. А щоб виявити його сутність без зайвої метушні, представимо іграшкову павутину, що складається всього з трьох сторінок, пов'язаних між собою так:

Мал. 1. Невелика мережа із трьох сайтів

Стрілки вказують, що сторінка X містить посилання на сторінку Y, але Y не відповідає їй взаємністю. Навпаки, Y посилається Z. Тим часом X і Z посилаються друг на друга.

Які сторінки найважливіші в цьому маленькому павутинні? Ви можете подумати, що це неможливо визначити через брак інформації про вміст. Але такий спосіб мислення застарів. Занепокоєння щодо контенту вилилося у незручний спосіб ранжування сторінок. Комп'ютери мало розуміють у смисловому наповненні, а люди не справляються із тисячами нових сторінок, які щодня з'являються у мережі.

Підхід, придуманий Ларрі Пейджем та Сергієм Бріном, аспірантами університету та засновниками Google, полягав у тому, щоб дозволити сторінкам самим ранжуватися у визначеному порядку, голосуючи посиланнями. У наведеному вище прикладі сторінки X і Y посилаються на Z, завдяки чому Z стає єдиною сторінкою з двома вхідними посиланнями. Отже, вона і буде найпопулярнішою сторінкою в цьому середовищі. Однак якщо посилання надходять зі сторінок сумнівної якості, вони працюватимуть проти себе. Популярність сама собою нічого не означає. Головне – мати посилання з добрих сторінок.

І тут ми знову опиняємось у замкнутому колі. Сторінка вважається хорошою, якщо на неї посилаються хороші сторінки, але хто спочатку вирішує, які хороші? Це вирішує мережу. Ось як усе відбувається.

Алгоритм Google призначає для кожної сторінки дрібне число від 0 до 1. Це чисельне значення називається PageRank і вимірює «важливість» сторінки по відношенню до інших, вираховуючи відносну кількість часу, яку витратить гіпотетичний користувач на її відвідування. Хоча користувач може вибирати більш ніж одного вихідного посилання, він вибирає її випадково з рівною ймовірністю. При такому підході сторінки вважаються авторитетнішими, якщо вони частіше відвідуються.

А оскільки індекси PageRank визначаються як пропорції, їх сума по всій мережі повинна становити 1. Цей закон збереження передбачає інший, можливо, більший спосіб візуалізації PageRank. Представте його як рідку речовину, що тече по мережі, кількість якої зменшується на поганих сторінках і збільшується на хороших. За допомогою алгоритму ми намагаємося визначити, як ця рідина розподіляється через Інтернет протягом тривалого часу.

Відповідь отримаємо в результаті наступного процесу, що багаторазово повторюється. Алгоритм починається з якогось припущення, потім оновлює всі значення PageRank, розподіляючи рідину в рівних частинах за вихідними посиланнями, після цього вона проходить кілька кіл, поки не встановиться певний стан, при якому сторінки отримають частку, що їм належить.

Спочатку алгоритм задає рівні частки, що дозволяє кожній сторінці отримати однакову кількість PageRank. У нашому прикладі три сторінки, і кожна з них починає рух за алгоритмом з рахунком 1/3.

Мал. 2. Початкові значення PageRank

Потім оновлюється рахунок, відображаючи реальне значення кожної сторінки. Правило полягає в тому, що кожна сторінка бере свій PageRank з останнього кола і рівномірно розподіляє його на всі сторінки, на які посилається. Отже, оновлене значення сторінки X після проходження першого кола, як і раніше, дорівнює 1/3, оскільки саме стільки PageRank вона отримує від Z, єдиної сторінки, яка на неї посилається. При цьому рахунок сторінки Y зменшується до 1/6, оскільки вона отримує лише половину PageRank від X після попереднього кола. Друга половина переходить до сторінки Z, що робить її переможцем на даному етапі, оскільки вона додає собі ще 1/6 від сторінки X, а також 1/3 від Y і всього виходить 1/2. Таким чином, після першого кола ми маємо такі значення PageRank:

Мал. 3. Значення PageRank після одного оновлення

У наступних колах правило оновлення залишається незмінним. Якщо позначити через х, у, z поточний рахунок сторінок X, Y та Z, то в результаті оновлення отримаємо такий рахунок:

z' = ½ х + у,

де штрихи говорять, що відбулося оновлення. Подібні обчислення, що багаторазово повторюються, зручно виконувати в електронній таблиці (або вручну, якщо мережа маленька, як у нашому випадку).

Після десяти повторень виявимо, що від оновлення до оновлення цифри практично не змінюються. До цього моменту частка X складе 40,6% від усього PageRank, частка Y – 19,8%, а Z – 39,6%. Ці значення підозріло близькі до числа 40, 20 і 40%, що говорить про те, що алгоритм повинен до них сходитися. Так і є. Ці граничні значення алгоритму Google і визначає для мережі як PageRank.

Мал. 4. Граничні значення PageRank

Висновок для цієї маленької мережі такий: сторінки X і Z однаково важливі, незважаючи на те, що Z в два рази більше вхідних посилань. Це і зрозуміло: сторінка X дорівнює Z за значущістю, оскільки вона отримує від неї повне схвалення, проте натомість дає їй лише половину свого схвалення. Друга половина відправляється Y. Це також пояснює, чому Y дістається лише половина від часток X та Z.

Цікаво, що ці значення можна набути, не вдаючись до багаторазових ітерацій. Потрібно просто подумати над умовами, що визначають стаціонарний стан. Якщо після чергового оновлення нічого не змінюється, то x' = x, y' = y та z' = z. Тому, замінивши змінні зі штрихом у рівняннях оновлень на їх еквіваленти без штрихів, отримаємо систему рівнянь

при вирішенні якої x = 2y = z. Оскільки сума значень x, y та z повинна дорівнювати 1, звідси випливає, що x = 2/5, y = 1/5 та z = 2/5, що відповідає раніше знайденим значенням.

Складнощі починаються там, де в рівняннях є величезна кількість змінних, як це відбувається в реальній мережі. Тому одним із центральних завдань лінійної алгебри є розробка більш швидких алгоритмів для вирішення великих систем рівнянь. Навіть незначні удосконалення цих алгоритмів відчуваються практично у всіх сферах життя – від розкладу авіарейсів до стиснення зображення.

Однак найістотнішою перемогою лінійної алгебри, з погляду її ролі у повсякденному житті, безумовно, стало рішення парадоксу дзен-буддизму для ранжування сторінок. «Сторінка хороша тією мірою, якою хороші сторінки посилаються неї». Переведений математичні символи, цей критерій стає алгоритмом PageRank.

Пошуковик Google став тим, чим він є сьогодні після вирішення рівняння, яке і ми з вами щойно вирішили, але з мільярдами змінних - і, відповідно, з мільярдними прибутками.

Згідно Google термін PageRang походить від імені одного із засновників Google Ларрі Пейджа, а не від англійського слова page (сторінка).

Для простоти я представлю лише базову версію алгоритму PageRank. Для обробки мереж із деякими іншими структурними властивостями його необхідно змінити. Припустимо, у мережі є сторінки, які посилаються інші, але ті, своєю чергою, ними не посилаються. У процесі оновлення ці сторінки втратить свій PageRank. Вони віддають його іншим, і він не поповнюється. Таким чином, врешті-решт вони отримають значення PageRank, що дорівнює нулю, і з цієї точки зору стають невиразними.

З іншого боку, існують мережі, де деякі сторінки або групи сторінок відкриті для накопичення PageRank, але не роблять посилань на інші сторінки. Такі сторінки діють як накопичувачі PageRank.

Щоб уникнути подібних результатів, Брін та Пейдж змінили свій алгоритм наступним чином. Після кожного етапу в процесі оновлення даних усі поточні значення PageRank зменшуються на постійний коефіцієнт, так що їхня сума буде меншою за 1. Потім залишки PageRank рівномірно розподіляються між усіма вузлами в мережі, ніби «сипляться з неба». Таким чином, алгоритм завершується дією зрівняння, що розподіляє значення PageRank між «найбіднішими» вузлами.

Більш ретельно математика PageRank та інтерактивні дослідження розглядаються в роботі E. Aghapour, T. P. Chartier, A. N. Langville, і K. E. Pedings, Google PageRank: The mathematics of Google (

Крім графічного та теоретико-множинного часто використовують і алгебраїчне уявленняграфа як матриці.

Розглянемо орграф G, що містить nвершин та mребер. Матрицею суміжностіорграфа Gназивається матриця Aрозміру n n

Іноді матрицю суміжності називають матрицею відносин, або матрицею безпосередніх зв'язків.

Матрицею інцидентності(або матрицею інцидентів) орграфа Gназивається матриця Bрозміру n m, у якої

Для запровадження матриці суміжності необхідно пронумерувати вершини, а матриці інцидентності - і ребра графа.

Алгебраїчне подання дозволяє алгоритмізувати у зручній для програмування на ЕОМ формі процедуру визначення структурних кількісних параметрів системи.

Розглянемо тепер деякі методи вирішення практичних завдань, використовуючи введений нами математичний формалізм.

Ранжування елементів систем

Аналіз зв'язків у графі полягає, перш за все, у знаходженні та оцінці шляхів між його вершинами. Крім безпосереднього відшукання шляху в деякій системі комунікацій до цього завдання відноситься, наприклад, завдання вибору оптимальної стратегії та ін. найменшими витратами.

Пошуки шляхів за кресленням при складній структурі графа (на практиці доводиться аналізувати графи з числом вершин понад 100) утруднені та пов'язані з можливістю помилок. Розглянемо один з методів алгебри, зручний для використання на ЕОМ. Цей метод дозволяє, виходячи з матриці безпосередніх зв'язків , побудувати повну матрицю шляхів
, де - Число шляхів з вершини iдо вершини j(= 0), або обмежитися пошуком однієї з її елементів.

Числа або їх буквені вирази визначаються за допомогою визначників особливого роду - квазімінорів(беззнаковихвизначників). Має місце формула

Вираз
називають квазімінор елементаматриці . Знак
є символом квазімінору, а
вказує на матрицю з викресленими l-й рядком і k-м стовпцем, яка вписується в символ квазімінору подібно до матриці, що вписується в символ звичайного мінора.

Обчислення квазімінору зводиться до розкладання його на квазімінори меншого порядку за формулою

Процедура обчислення багато в чому подібна до процедури обчислення звичайних визначників, але для оволодіння цим методом потрібна деяка навичка.

приклад.

Нехай матриця безпосередніх зв'язків має вигляд

Необхідно знайти всі шляхи, що ведуть з вершини 1 до 5, і підрахувати їх число.

Для прикладу, що розглядається, отримуємо

Спочатку в матриці викреслюється стовпець 1, який відповідає номеру вершини, від якої починається шлях, і рядок 5, що відповідає номеру вершини, в якій шлях закінчується. Це відповідає видаленню з графа всіх ребер, що ведуть у вершину 1 і виходять з вершини 5. Положення та нумерацію інших рядків та стовпців зручніше залишити без зміни. Далі необхідно розкласти отриманий квазімінор по ненульовим елементам 1-го рядка

Розкладання для першого доданку ведеться за другим рядку, другого - за третім, третього - за четвертим, тобто. номер рядка, за яким ведеться розкладання, дорівнює номеру стовпця, у якому перебував останній член розкладання.

Якщо тепер покласти для ненульових елементів = 1 і зробити операції за правилами звичайної арифметики, то отримаємо -
.

Якщо ж у отриманому вираженні зробити дії за правилами булевої алгебри, то отримаємо значення повної матриці зв'язків, яка характеризує зв'язність графа. Значення елементів повної матриці зв'язків визначаються так:

= 1, якщо вершина i пов'язана з вершиною j хоча б одним шляхом,

=0 інакше.

Зазвичай вважають, що
.

Зв'язність – найважливіша характеристика структурної схеми системи. Структура тим краще, що повніше заповненість повної матриці зв'язків. Наявність великої кількості нулів говорить про серйозні вади у структурі системи.

Інша важлива характеристика структури – розподіл значущості елементів системи. Кількісна характеристика значущості ранг елемента- вперше явно було сформульовано під час аналізу структури відносин домінування (переваги, переважання) у групах індивідуумів (людей, тварин).

Використовуючи повну матрицю шляхів
, значення рангів елементів визначаються за формулою

Слід пам'ятати, що значимість елемента визначається самим значенням , а порівнянням рангів всіх елементів, тобто. ранг - Це відносний показник значущості.

Чим більший ранг даного елемента, тим більшим числом шляхів він пов'язаний з іншими елементами і тим більше елементів порушаться нормальні умови роботи при його відмові. Отже, при формуванні програми забезпечення надійності системи, що розглядається, необхідно приділити особливу увагу елементам з великим рангом.

Для систем зі структурою типу мереж наявність елементів із рангами, значно більшими, ніж в інших, зазвичай свідчить про функціональне навантаження цих елементів. Бажано перерозподілити зв'язки, передбачити обхідні шляхи, щоб зрівняти значущість елементів цієї системи.

Існують та інші методики визначення рангів. Вибір відповідної методики визначається специфікою завдання.

Слід зазначити, що є структури, ранжування елементів яких може втратити практичне значення. Це насамперед ієрархічні структури. Значимість елемента у яких визначається рівнем ієрархії.

Ми випустили нову книгу «Контент-маркетинг у соціальних мережах: Як засісти в голову передплатників та закохати їх у свій бренд».

Алгоритми ранжирування – методи оцінки якості сайтів

У ТОП-10 повинні потрапляти лише ті сайти, які максимально повно відповідають на запит користувача. Якісну видачу забезпечують спеціальні математичні формули, за якими визначається «корисність» того чи іншого сайту. Пошуковики не розголошують інформацію про свої алгоритми, вони надають вебмайстрам лише загальні рекомендації щодо покращення та оптимізації сайтів. Тим не менш, оптимізатори навчилися виявляти певні закономірності, на підставі яких розробляється стратегія

родовища.

Більше відео на нашому каналі - вивчайте інтернет-маркетинг із SEMANTICA

Які критерії враховує алгоритм ранжування

Пошуковики оцінюють сайти за багатьма параметрами. Серед найбільш значущих критеріїв слід зазначити:

унікальність та оптимізація текстів (наявність ключових фраз, нудота, водність);
вік домену;
кількість та якість вхідних посилань;
тип використовуваної CMS;
швидкість завантаження сторінок сайту;
наявність помилок у коді.

Розуміючи, як працює алгоритм пошукових систем, вебмайстер може впливати на видачу сайту. Для цього необхідно підігнати сторінки web-проекту під вимоги ПС. Зокрема, потрібно впровадити ключові фрази у метатеги title та description, а також безпосередньо в текст сторінки. Якщо відбувається просування на геозалежний запит, то, крім ключів, слід додати назву потрібного міста або регіону.

Це цікаво! Періодично відбувається апгрейд пошукової системи, що призводить до кардинальної зміни алгоритмів, що діють. Такі заходи спрямовані на боротьбу із пошуковим спамом. Нерідко зміна алгоритму Яндекса призводить до погіршення позицій сайтів, що просувалися «чорними» та «сірими» методами.

Пошукові санкції

Якщо вебмастер явно намагається маніпулювати алгоритмами Яндекса, пошукова система може застосовувати до нього різноманітні санкції. Можуть виникнути такі проблеми:

Зниження позицій у видачі
Погане індексування нових сторінок (або випадання з індексу старих документів)
Повний чи частковий БАН

Алгоритми Яндекса передбачають санкції за надмірну оптимізацію текстів, наприклад, розміщення на сторінках списків ключових фраз. Фільтр може бути накладений за "невидимий" текст, що зливається з фоном. Також під санкції потрапляють сайти-дорвеї та інтернет-майданчики, що копіюють чужий контент.

Новий алгоритм Яндекса – Мінусинськ

Цей алгоритм передбачає песимізацію web-проекту за використання SEO-посилань. Йдеться про сайти, що закуповують тисячі посилань за допомогою автоматизованих бірж типу Sape. З погляду Яндекса, посилання вважається «сеошним», якщо воно веде з неякісного сайту-донора і має комерційний анкор.

Підставою для застосування фільтра « » може стати різкий приріст маси посилань. Тому щоб убезпечити свій web-проект від можливості застосування подібної санкції, слід закуповувати посилання поступово та розбавляти анкорні лінки безанкорними гіперпосиланнями.

Це найпростіший спосіб оцінки роботи, оскільки передбачає розподіл всіх видів робіт на місцях, залежно від своїх цінності в організацію. Зміст якогось виду роботи порівнюється зі змістом робіт, прийнятих за вихідний пункт, у результаті займає відповідне місце. Часто таке зіставлення проводиться на підставі лише однієї посадової інструкції без проведення повного аналізу роботи. Потім, залежно від належності роботи до того чи іншого рангу чи градації, призначається оплата. Цей метод дуже простий і може бути корисний у невеликих фірмах з незначною різноманітністю видів робіт або з досить однорідною "родиною" їх, але може виявитися абсолютно непридатним у великих організаціях, з великою різноманітністю робіт різного змісту (деякі з них дуже складні). У цьому випадку угруповання видів робіт повинно проводитися на основі затвердженої схеми, особливо якщо наявність великої кількості індивідуальних градацій та ставок оплати не є прийнятною.

Метод ранжування щодо простий і недорогий у використанні, крім того, він може бути запроваджений досить швидко. З іншого боку, ранжування робіт може бути виконане на основі неповної інформації та без урахування певних стандартів. Часто люди, які займаються ранжуванням робіт, не мають спеціальних знань про роботи, які вони ранжують. Це означає, що ранжування може бути досить поверховим і призвести, швидше, до ранжування виконавців, а чи не самих видів робіт. З іншого боку, досить часто визначення рангових позицій різних видів робіт впливають переважаючі ставки оплати їм.

2. Метод класифікації

Цей метод широко використовується для оплати праці службовців установ, а також класифікації навичок співробітників в обробній промисловості. Його відмінність від методу ранжирування полягає в тому, що структура градацій та відповідна їм оплата встановлюються до ретельного дослідження різних видів робіт. Кількість градацій визначено, їх функції встановлені і зрозумілі виплати за кожною з них.

У цьому підході описи різних градацій складено в такий спосіб, що вони відбивають помітні розбіжності у рівні навичок, обов'язки і вимоги, що висуваються на роботу. Види робіт, для виконання яких від співробітників потрібно лише дотримання простих інструкцій при постійному контролі, відповідають найнижчій градації шкали. Кожна наступна щабель відбиває вищий рівень навичок, обов'язків тощо. та менший ступінь контролю. Робота не розбивається на складові, а так само, як і при методі ранжирування, розглядається в цілому. Рис. 3 наводиться приклад градацій та короткий опис конторських робіт.

Мал. 3. Градації конторських робіт: загальний опис робіт.

Шкала "D".Звичайна рутинна конторська робота.

Шкала "С".Робота, що вимагає спеціального навчання, знань та досвіду у певних сферах діяльності. При виконанні деяких видів робіт потрібна зовнішність вище за середні стандарти. Високий ступінь надійності та точності при роботі з деталями. Контроль за виконуваною роботою, крім загального керівництва, не передбачається.

Шкала "В".Робота, що вимагає серйозних спеціальних знань та досвіду у певній сфері діяльності. Для виконання деяких видів робіт потрібні дуже високі особисті якості. Високий ступінь надійності та точності при роботі з деталями. Виконана робота не потребує додаткової перевірки. Передбачається ініціативність та індивідуальна відповідальність при інтерпретації інструкцій щодо виконання тієї чи іншої роботи та прийняття правильного рішення. Можливе керівництво невеликою чи середньою групою персоналу.

Шкала "А".Робота, що вимагає дуже серйозних спеціальних знань та досвіду у певних галузях. Здатність організовувати та проводити деякі операції з власної ініціативи. Відповідальність за роботу та поведінку великої групи співробітників та вміння оцінити ефективність їх праці та здібності. Високий ступінь відповідальності передбачається вміння виконувати роль лідера і встановлювати контакти як усередині, так і поза організацією.

Класифікаційний метод також є відносно простим, недорогим та легко застосовним. Хоча отримані результати можуть бути цілком задовільними, сума винагороди, яка має бути виплачена за виконання тієї чи іншої роботи, може залежати від існуючих ставок. Більше того, письмовий опис кожного ступеня становить велику складність і ще більше ускладнюється у великих організаціях. У цих випадках дуже часто буває необхідно мати багато різних ступенів, але тоді це позбавить його основної переваги - простоти. Крім того, часто буває дуже складно помістити ту чи іншу роботу на будь-який ступінь, так як її характеристики можуть перетинатися з характеристиками іншого виду робіт, а рівень аналізу, що проводиться, не завжди буває достатньо докладним, щоб правильно класифікувати цей вид роботи.

Дещо складніший варіант такого підходу передбачає участь групи арбітрів, які представляють усі зацікавлені сторони. Арбітри вивчають 30 видів передбачуваних робіт та порівнюють їх між собою. Для загального ранжування парних порівнянь використовується комп'ютер, що надає певний відтінок науковості процесу і робить його результати більш прийнятними. Однак таке враження дуже оманливе.

Метод порівняння факторів

Цей метод передбачає ранжування різних видів робіт відповідно до певних факторів, внаслідок чого призначається їхня оплата. Перше завдання при застосуванні даного методу - вибрати та чітко описати фактори, які повинні використовуватися, зазвичай це навички, вимоги до розумового розвитку (рівень здобутої освіти та підготовки), вимоги до фізичного стану, відповідальність та умови праці. Залежно від потреб організації, цей список може бути змінений.

Вибираються певні ключові види робіт, вони розглядаються як роботи, які, як вважається, можуть представляти й інші різновиди робіт і ставок оплати, і складаються відповідні посадові інструкції. Відмінною рисою цього є використання існуючих ставок оплати ключових робіт визначення низки фіксованих точок на шкалі відносних ставок оплати, що виникають під час проведення оцінки виконання робіт. Вибрані види робіт повинні чітко відрізнятися один від одного та відповідним чином описані – можливо, з використанням аналізу роботи. Слід підібрати достатню кількість ключових видів робіт, щоб представити необхідну кількість реперних точок для порівняння всіх видів робіт: від найпростіших до найскладніших.

Наступним кроком для окремого співробітника або комітету є ранжування ключових робіт у порядку їхньої значущості виходячи з обраних факторів.

Схожою процедурою є й наступне призначення певних виплат за різні чинники за ключовими видами робіт. Ставки виконання кожного виду роботи розбиваються і виставляються пропорційно стосовно використовуваним чинникам. Наприклад, якщо роботу інструментальника можна умовно оцінити 20 одиницями оплати, то можна призначити: 9 – за навички та вміння, 5 – за вимогу до розумових здібностей, 2 – за фізичні вимоги, 3 – за відповідальність та 1 – за умови праці.

Після проведення такого ранжирування порівнюються результати ранжирування робіт за факторами та призначеною оплатою. Будь-які невідповідності у двох різних системах ранжирування можуть бути усунені шляхом коригування ставок або змісту робіт. Якщо це зробити неможливо, то ця робота не може використовуватися як ключова.

На заключному етапі всі види робіт, що залишилися, можуть бути розташовані на шкалі в залежності від їх співвідношення з ключовими видами робіт з точки зору їх змісту, кожен фактор розглядається окремо до тих пір, поки не будуть створені нові шкали ставок оплати всіх видів робіт на підприємстві.

Суть методу порівняння факторів полягає в тому, що ставки за ключові види робіт розглядаються як остаточні та правильні, інші види робіт ранжуються за кожним фактором і підганяються під основну шкалу. Цей метод нагадує метод ранжування, проте вимагає ранжування робіт з окремих чинників двічі замість ранжування всієї роботи загалом один раз.

Основна перевага методу порівняння чинників у тому, що беруться до уваги чинники, які, здається, визначають відносну цінність різних видів робіт. Він дозволяє скласти базову шкалу, виражену в грошових одиницях, а за нею можуть бути "виміряні" та неключові роботи. Це точніший і більш гнучкий метод порівняно з двома попередніми. З іншого боку, для застосування та використання цього методу потрібно більше часу, і його дуже складно пояснити співробітникам. Крім того, може виявлятись і певна несправедливість в оплаті через неадекватність існуючих ставок чи підходів, на основі яких менеджери чи представники профспілок розглядають порівняльну цінність різних робіт. Крім цього, незважаючи на очевидну науковість самого процесу визначення оплати, пропорційний розподіл оплати за роботу з різних факторів неминуче є довільним. З цих причин цей метод сьогодні не популярний.

Метод балового ранжирування

Метод визначення рейтингу спрямовано підвищення об'єктивності. У його основі лежить припущення, що є чинники, загальні всім видів робіт, хоча він, швидше, розподіляє бали за чинниками, ніж визначає цінність різних чинників у грошах.

(1) навички,

(2) зусилля,

(3) відповідальність,

(4) умови роботи.

Загалом вони можуть бути поділені на 10-15 підфакторів. Вимоги до цих підфакторів, надалі можуть бути підрозділені на кілька рівнів (зазвичай між 5 і 8). Рис. 3. показані фактори, рівні та бали, які використовувалися в одному реальному плані.

Як видно, кількість балів, приписаних кожному фактору, неоднакова. Це пов'язано із застосуванням методу зважування балового ранжирування. При прямому методі балового ранжирування розподіл балів за всіма чинниками однаково.

вибрати фактори, які є загальними для всіх видів робіт, що оцінюються;

визначити кількість рівнів, які мають бути різними для кожного фактора при порівнянні робіт;

встановити питому вагу кожного фактора;

визначити цінність кожного рівня чи кожного чинника у балах.

Далі готуються посадові інструкції кожного виду роботи, зазвичай з урахуванням її систематичного аналізу. Різні види робіт оцінюються на основі цих посадових інструкцій, а також за допомогою:

оцінки всіх факторів по одній роботі, потім всіх факторів по другій роботі тощо, або

оцінки всіх видів робіт за першим фактором, потім за другим і т.д.

Зазвичай застосовується другий метод, оскільки полегшує проведення порівняльного аналізу відносної цінності різних видів робіт. Кількість балів, отриманих кожним видом робіт з різних факторів, підсумовується, а потім загальна кількість набраних балів переводиться в грошові одиниці за допомогою методів, описаних нижче.

Фактори, використані в даному прикладі при складанні плану на основі методу балового ранжування, показують, як у цьому випадку відбувався розподіл загального балу за кожним фактором між різними підфакторами.
	Бали за рівнями	Загальна кількість можливих балів

Навички
1. Освіта
2. Досвід роботи
3. Ініціатива та винахідливість
Зусилля
4. Фізичні витрати
5. Розумові витрати
Відповідальність
6. Устаткування чи процес
7. Матеріали чи продукція
8. Безпека оточуючих
9. Робота інших
Умови роботи
10. Робочі умови
11. Можливі небезпеки

У наведеному вище прикладі фактори можуть бути використані для більшості робочих спеціальностей. У найпопулярнішій схемі, яка застосовується щодо менеджерів, так званому методі "Hay Guide Chart and Profile Method" (HGC), використовуються три досить загальні фактори (які роблять метод прийнятним для всіх видів робіт на різних рівнях організації):

Виконання робіт на основі "ноу-хау" -загальний набір навичок, необхідні виконання на середньому рівні, характеризується як шириною (кількість навичок), і глибиною (їх рівень)

Вирішення проблем -оригінальне, самостійне мислення, яке потрібне для проведення аналізу, оцінки, формування аргументів та висновків, вимірює інтенсивність розумового процесу...

Відповідальність -відповідальність за дії та за наслідки... вимірюється впливом роботи на кінцеві результати...

Головна перевага методу балового ранжирування у тому, що завдяки йому підраховуються лише бали, а чи не суми оплати праці. Тому на його використання не впливають існуючі ставки оплати на відміну від попередніх трьох методів. Метод також претендує на велику об'єктивність, оскільки зазвичай ґрунтується на даних про кожен вид робіт, отриманих за результатами їх аналізу, що дозволяє давати більш переконливі відповіді на всі питання працівників щодо достовірності оцінки. Проте загальновизнано, що це метод також містить безліч довільних і суб'єктивних елементів, особливо:

при виборі кількості та типів коректних факторів та рівнів, які повинні використовуватись при оцінці;

при розподілі питомої ваги або балів за факторами або їх різними рівнями.

За цими двома пунктами дуже важко приймати рішення. Практично неможливо уникнути суб'єктивності, оскільки немає об'єктивних критеріїв, і прийняті рішення можуть перебільшувати значущість одних видів робіт порівняно з іншими.

Для застосування даного методу необхідно мати хороші технічні навички. Будучи менш гнучким, ніж інші, він дозволяє легко врахувати зміни загальних економічних умов та інших чинників розробки структури оплати. Цей метод мають на увазі критики, коли стверджують, що оцінка роботи за своєю суттю - статичний метод, який ще слід пристосувати до динамічної ситуації. Однак оцінка виконуваної роботи може бути використана для того. Щоб зібрати відомості про зміни у змісті роботи та перевести ці зміни до вартісних одиниць.

Найбільш поширеним методом балового ранжирування є метод Hay (або Hay MSL – його оригінальна назва). Він включає такі чинники, як планування, організація, оцінка, розвиток та координація, які особливо добре співвідносяться з роботою менеджера.

Необхідно пам'ятати, що всі методи незалежно від їх складності і науковості, що здається, грунтуються спочатку на довільних рішеннях і дуже суб'єктивних оцінках і великою мірою залежать від існуючого співвідношення різних видів робіт. У багатьох випадках оцінка роботи – це найкраще з того, що ми можемо зробити, але її результати ніколи не слід розглядати як абсолютно правильні та незаперечні.

класифікація	ранжування	порівняння факторів	балове ранжування
некількісні		кількісні
шкала визначена	види робіт порівнюються один з одним		шкала визначена
робота розглядається в цілому		розглядаються фактори
дешевше та простіше		складний і дорогий
підходить для обмеженого кола робіт		підходить для широкого кола робіт

всього

Протягом тривалого часу алгоритми ранжирування Яндекс залишалися «секретом» для користувачів. Фахівці пошукової системи Яндекс воліли не інформувати користувачів мережі інтернет про зміни алгоритмів ранжирування.

Алгоритми ранжирування Яндекс

1 2007 рік

І лише у 2007 році співробітники компанії Яндекс стали інформувати своїх користувачів про введення нововведень у пошуковий алгоритм. Це трохи полегшивши просування сайтів для багатьох вебмайстрів.

Варто зазначити, що алгоритми ранжирування Яндекс постійно змінюються. Завдяки цим змінам додається новий і досконалий функціонал, який дуже полегшує роботу з цим пошуковою системою. Також завдяки зміні алгоритмів ранжирування усуваються баги, відбувається оновлення фільтрів та обмежувачів, підганяється точніша видача інформації, яка максимально відповідає початковому запиту.

2 трав 2008 рік

У травні 2008 року, фахівцями компанії Яндекс був випущений новий алгоритм, який має назву «Магадан».

Алгоритм Магадан

У даному алгоритмі збільшено вдвічі кількість факторів ранжирування, значно покращено класифікатор за місцезнаходженням користувача (геотаргетинг). Також в алгоритмі «Магадан» є такі інноваційні рішення як додавання класифікаторів для контенту та посилань. Значно збільшена швидкість пошукача з пошуку інформації за ключовими запитами, що вводяться (завдяки цьому алгоритму пошуковик здатний видавати інформацію навіть з текстами, які мають дореволюційну орфографію).

У липні того ж року вийшла нова версія алгоритму «Магадан», в якій були присутні додаткові фактори ранжирування, наприклад, визначення унікальності тексту та інформації, визначення приналежності контенту до порнографічного та інше.

3 вересня 2008 рік

Вже у вересні 2008 року компанія Яндекс випускає новий алгоритм, який зветься «Знахідка».

Завдяки появі даного алгоритму значно покращилася робота зі словниками в пошуковій системі Яндекс, значно зросла якість ранжування за запитами, у яких були присутні стоп – слова (спілки та прийменники). Також у даному алгоритмі було розроблено абсолютно новий підхід до машинального навчання (машина стала розрізняти різні запити, і почала змінювати для різних запитів чинники ранжирування, у розрахунковій формулі пошукової видачі).

4 квітня 2009 рік

Новий алгоритм під назвою «Арзамас» або «Анадир» було викладено у пошуковій системі Яндекс у квітні 2009 року.

Алгоритм Арзамас

Завдяки впровадженню цього алгоритму пошукова система Яндекс навчилася більш точно і значно краще розуміти російську мову, що дало можливість більш точно вирішувати неоднозначні слова у запитах. Також даний алгоритм дозволив враховувати пошуковою системою регіон, в якому знаходиться користувач. Завдяки чому користувачі стали отримувати більш точну та корисну інформацію з запитуваного питання, яка мала максимальне відношення до регіону, в якому знаходився користувач.

При цьому слід зазначити, що в різних регіонах видається інформація теж різна, незважаючи на той самий запит, що вводиться користувачем. Також у даному алгоритмі пошуку значно покращено формулу, яка дозволяє зручніше працювати з багатослівними запитами. Були введені жорсткіші фільтри для сторінок з попандер-банерами (Pop-Under банер з'являється на всіх сторінках сайту і не має відношення до тематики сайту), клікандер(Click-ander реклама, що з'являється на сторінці при першому кліку відвідувача) та бодіклік (Bodyclic - обслуговування тизерної реклами).

5 листопада 2009 рік

У листопаді 2009 року вийшов новий алгоритм, який має назву «Сніжинськ».

Алгоритм Сніжинськ

У цьому алгоритмі введено додаткові функції та параметри ранжирування, які дозволяють застосовувати кілька тисяч пошукових параметрів одного документа. Також в даному алгоритмі були присутні нові регіональні параметри, були впроваджені (фільтри сайтів, які мають намір намагатися впливати на пошукову видачу, простіше, анти гівне сайт), і значно покращився пошук оригіналів контенту в мережі інтернет. Також у даному алгоритмі була присутня самонавчається система MatrixNet.

6 грудня 2009 рік

У грудні 2009 року з'явився новий алгоритм під назвою "Конаково".

Цей алгоритм був лише покращеною версією алгоритму «Сніжинськ» і в ньому було покращено тільки локальне ранжування. У вересні 2010 року вийшов новий алгоритм "Обнінськ". У цьому алгоритмі було покращено ранжування за територіально незалежними запитами, було введено обмеження впливу штучних посилань на ранжування. Також завдяки цьому алгоритму значно покращилася процедура визначення авторського тексту, і було значно розширено словник транслітерації.

7 2010 рік

У грудні 2010 року вийшов новий алгоритм під назвою "Краснодар".

Для створення цього алгоритму було спеціально розроблено нову технологію, яка називається Спектр. Завдяки цьому алгоритму пошукова система Яндекс стала класифікувати запити та виділяти з них об'єкти, присвоюючи запитам певну категорію (товари, послуги та інше).

8 2014 рік

Черговий забійний постріл Яндекс - Алгоритми ранжирування Яндекс більше не враховуватимуть посилання при ранжируванні. Згідно з останніми заявами, на початку 2014 року буде запущено ранжування без посилань. З факторів ранжирування Яндекс приберуть усі фактори посилання. Це нововведення стосуватиметься лише комерційних запитів і спочатку буде випробувано на Москві та Московській області. Автори нововведень, творці АГС Яндекс.