Всичко за алгоритъма на Гугъл „RankBrain”

FAQ: RankBrain

Гугъл използва самообучаваща се система с изкуствен интелект, наречена “RankBrain”, за да предлага по-добри резултати при търсения. Чудите се как работи това и как се вписва в цялостния ранкиращ алгоритъм на Гугъл? Ето какво можем да ви кажем за RankBrain.

rankbrain

Какво е RankBrain?

RankBrain е името на самообучаващата се система с изкуствен интелект на Гугъл, която подпомага процеса на обработване на сърч заявките, както ни потвърдиха от централата на Гугъл.

Какво означава самообучаваща се система?

Самообучаващата се система представлява компютър, обучаващ сам себе си как се прави нещо, не е научен на това от човешка ръка и не следва някакво детайлно програмиране.

Какво е изкуствен интелект?

Истинския Изкуствен Интелект, или ИИ накратко, представлява компютър, който може да бъде умен като човешко същество, поне в смисъла на придобиване на знания като бива научен на това и като надгражда над това, което вече знае, осъществявайки нови връзки.

Истинския ИИ, разбира се, съществува само в романите за научна фантастика. На практика с ИИ се обозначават компютърни системи, които са създадени, за да учат и правят връзки.

Каква е разликата между изкуствения интелект и самообучаващата се система? Ако говорим за RankBrain, на нас ни се струва, че тези понятия са равнозначни. Можете да ги чуете като синоними или можете да чуете „самообучаваща се система” като описание на тип изкуствен интелект.

Значи RankBrain е новият начин, по който Гугъл ранкира резултатите от търсенето?

Не. RankBrain е част от цялостния търсещ “алгоритъм” на Гугъл; това е компютърна програма, която се използва, за да сортира милиарди страници, като намира и открива тези от тях, които отговарят най-много на заявките от търсенето.

Какво е името на търсещия алгоритъм на Гугъл?

Той се казва Hummingbird (букв. превод – Колибри), както сме споменавали и преди. В продължение на години общият алгоритъм нямаше официално име, но в средата на 2013 от Гугъл правят основен преглед на алгоритъма и му дава името Hummingbird.

Значи RankBrain е част от алгоритъма на Гугъл Humming?

hummingbird

Така смятаме ние. Hummingbird представлява цялостния алгоритъм за търсене, точно както една кола има има много съставни части. Например, самият двигател може да бъде съставен от различни части като маслен филтър, помпа за гориво, радиатор и т.н. По същия начин Hummingbird съдържа различни компоненти като RankBrain е един от най-новите.

В частност знаем, че RankBrain е част от общия Hummingbird алгоритъм,  защото е ясно, че RankBrain не може да се справи с всички търсения, както би се справил един цялостен алгоритъм.

Аз си мислех, че алгоритъма на Гугъл се казва “PageRank”

PageRank е част от цялостния Hummingbird алгоритъм и приписва по специален начин кредити на страници на базата на линковете от други страници, които сочат към първите.

PageRank е специален, защото това е първото име, което Гугъл дават на една част от ранкиращия си алгоритъм, много назад във времето, още от зараждането на търсачките през 1998.

Какво означават “сигналите”, които  Гугъл използва за ранкиране?

Сигналите са неща, които Гугъл използва, за да може да определи как да ранкира уеб страниците. Например, той прочита думите в една уеб страница, така че думите представляват сигнал. Ако някои думи са с удебелен шрифт, това може да бъде отбелязано като друг сигнал. Калкулациите, които са част от PageRank дават на дадена страница PageRank скоринг, който се използва като сигнал. Ако дадена страница бъде отбелязна като mobile-friendly (т.е. добре изглеждаща и работеща и през мобилни устройства), това е друг сигнал, който се регистрира.

Всички тези сигнали се обработват от различни компоненти вътре в алгоритъма на Hummingbird, за да се установи кои страници Гугъл показва като отговор на различни заявки за търсене.

Колко сигнала има?

Гугъл ползва повече от 200 важни ранкиращи сигнала, които на свой ред могат да имат до 10,000 вариации на подсигнали.

И RankBrain е третият най-важен сигнал?

Точно така. С изневиделица тази нова система се превърна в това, което Гугъл смята за третия най-важен сигнал за ранкиране на уеб сайтове.

Кои са първия и втория най-важни сигнали?

През март 2016 от Гугъл разкриха, че първите два фактора са съдържанието и линковете. Или линковете и съдържанието, защото не се съобщава кое е на първа позиция.

Какво точно прави RankBrain?

От имейлите с Гугъл считам, че RankBrain се използва като начин за интерпретиране на търсенията, който хората подават, за да намерят страници, които могат и да не съдържат точните въведени търсени думи.

 Гугъл вече нямаше ли начини да открива страници, които не се вписват в точните зададени заявки?

Да, в близкото минало Гугъл успешно намираше страници, които не съвпадат с точните думи за търсене. Но преди много години ако бяхте въвели нещо като “обувка,” Гугъл нямаше да може да намери страници, в които се съдържа думата „ обувки”, защото технически това са две различни думи. Но “семантичните гнезда” позволиха на Гугъл да бъде по-умен, да разбере, че всъщност” обувки” е вариация на „обувка”, също както “бягане” е вариация на “бягам.”

Гугъл също поумня по отношение на синонимите, така че ако търсите с ключова дума “маратонки,” търсачката може да помисли, че имате и също предвид “обувки за бягане.” Гугъл дори и захитря по отношение на някои концепции, като проумяха, че има страници за технологичната компания “Apple”, които са различни от  “apple” – плодът ябълка.

Ами The Knowledge Graph?

The Knowledge Graph стартира през 2012 и това беше начинa, по който Гугъл стана още по-умен относно връзките между думите. По-важното в случая е, че той научи как да търси “неща, а не стрингове,” както Гугъл сам описва.

Стринговете представляват търсене само на низове от букви, като например страници, които отговарят на спелуването на думата “Обама.” При търсенето на неща, обаче, Гугъл разбира, че когато някой търси “Обама,” той/тя вероятно има предвид американския президент Барак Обама, истински човек с връзки до други хора, места и неща.

obama_search

The Knowledge Graph представлява база данни от факти относно неща в света и взаимовръзките между тях.

Как RankBrain помага да се подобрят търсенията?

Методите, които вече Гугъл използва, за да прецизира търсенето си –  водят до някако действие на човешка ръка, която върши работа – дали създаване на семантични списъци или списъци със синоними, или пък база данни от връзки между неща. Е, разбира се, има и малко включена автоматизация. Но в голяма степен този процес зависи от човешката работа.

Проблемът е, че Гугъл обработва 3 милиарда търсения на ден. През  2007 от Гугъл посочиха, че 20-25% от всички търсения са били такива, които никога не са били виждани досега. През 2013 този процент пада на 15%, потвърдено от Гугъл. Но 15 % от 3 милиарда е пак огромен брой заявки, които никога не са били въвеждани от човек — 450 милиона на ден.

Сред тях има такива сложни, съставени от много думи, наречени също така “long-tail” заявки (заявки с дълга опашка). RankBrain е създаден, за да подпомогне по-доброто интерпретиране на тези търсения и ефективно да ги преведе, един вид зад сцената, и в крайна сметка да открие най-добрите страници.

Както от Гугъл отбелязаха, системата може да вижда модели между наглед несвързани сложни търсения, за да разбере как всъщност те са сходни едно с друго. Това научаване, от своя страна, й позволява по-добре да разбере бъдещите сложни търсения и дали те са свързани с определени теми. Най-важното от това, което Гугъл споменаха, че машината може да асоциира тези групи от търсения с резултати, които смята, че търсещите хора ще харесат най-много.

От Гугъл не са ни предоставили примери за групи търсения или пък детайли за това как RankBrain отгатва кои са най-добрите страници. Но последното може би се случва, понеже системата може да превежда двусмислено търсене в нещо по-специфично и така да изкара по-добрите отговори.

Кога стартира RankBrain?

От Гугъл знаем, че постепенно са пуснали RankBrain в началото на 2015, а функционира напълно в реално време и глобално от няколко месеца.

RankBrain винаги ли се учи?

Всичко, което RankBrain научава става офлайн. На RankBrain се подават партиди от стари търсения и така изкуственият интелект на системата се научава да прави предположения от тях.

Тези предположения се тестват и ако се одобрят, тогава последната версия на RankBrain започва да работи в реално време. После процесът на офлайн учене и тестване се повтаря.

 

Loading...