Все факторы ранжирования Яндекс

Таблицу скопировал отсюда: https://docs.google.com/spreadsheets/d/1hyZdad5-irEmdwTASl5HcKysOxtcvjY_-2_fgu9YmoQ/edit

НазваниеОписание
FI_PAGE_RANKPage rank. Фактор ремапится.
FI_TEXT_RELEVТекстовая релевантность (maxfreq – частота самого частого слова, которая имеет смысл длины документа).
FI_LINK_RELEVЛинковая релевантность. Фактор ремапится.
FI_PAGE_RANK_BONUSPriority bonus, приоритет 7 — текстовый приоритет. Фактор бинарный, имеет значение 0 для всех однословных запросов, и значение 1 практически для всех двух и более словных, кроме очень маленького количества ответов, для которых нет ни одной ссылки, прошедшей кворум, и текст тоже не прошел кворум.
FI_TEXT_RELEV_ALL_WORDSПриоритет strict для TR — текстовый приоритет — есть все слова запроса где-то в документе (при этом они проходят контекстные ограничения запроса, например, оба слова д.б. в одном предложении).
FI_TEXT_RELEV_PHRASEПриоритет phrase для TR — текстовый приоритет — есть все слова запроса подряд в документе.
FI_LINK_RELEV_ALL_WORDS(strict) есть все слова запроса в одном линке.
FI_LINK_RELEV_PHRASE(phrase) есть все слова запроса подряд в одном линке.
FI_TEXT_RELEV_TITLEНаличие точной фразы (текста запроса) в заголовке (если точнее, в первом предложении документа). Контекстные ограничения и стоп слова учитываются в точности как в TRp2, т.е. factor[8] minors factor[5]
FI_TEXT_RELEV_WHOLE_HR_MATCHEDВстретился участок, прошедший кворум, в котором все словопозиции обозначены как имеющие релевантность BEST_RELEV (заголовок или meta keywords).
FI_REMOVED_10NaN
FI_NEWSЭто новости (определяется по характерным ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-3 паттернам в url`е)) ).
FI_SHOPЭто магазин предложение (определяется по характерным ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-4 паттернам в url`е)) ). Не используется (deprecated)
FI_CATALOGЭто каталог (определяется по характерным ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassificacionnye?v=tkd#h45859-2 паттернам в url`е)) или по яндекс-каталогу).
FI_YA_BARПосещаемость из Бара — ((http://wiki.yandex-team.ru/AndrejjKostjagin/YaBarLog/HostStat Описание данных)). Фактор ремапится.
FI_LONGДлинный документ (чем длиннее документ, тем больше значение фактора).
FI_HIT_WEIGHTHitweigt — вариант текстовой релевантности, в которой веса всех хитов считаются равными (т.е. не учитывают надбавки за title и за близость слов). При этом соответствующие хиты должны пройти ограничения синтаксического колдунщика, т.е. можно считать, что фактор TRhitw равен 0 тогда и только тогда, когда SoftAndOk равен 0
FI_LONG_QUERYСумма idf слов запроса. Название не отражает суть: например, для запроса ‘Гадяч’ этот фактор будет больше, чем для запроса ‘Москва Питер Екатеринбург Самара’.
FI_PURE_TEXTДлинный текст без ссылок.
FI_ROOTЭто морда.
FI_REMOVED_20NaN
FI_REMOVED_21NaN
FI_GEOОзначает совпадение региона пользователя и сайта на уровне стран. Фактор бинарный: 1-совпадает, 0-нет. Основан на ((http://wiki.yandex-team.ru/ЯндексПоиск/КлассификацияСайтовИСтраниц/Географическая/ИспользованиеВПоиске геоклассификации сайтов))
FI_SUBQUERY_THEME_MATCHСовпадение тематических спектров запроса и документа. Тематика запроса — результат работы ((http://wiki.yandex-team.ru/EvgenijjKroxalev/subquery правила колдунщика SubquerySearch )) Тематика документа берется из яндекс-каталога
FI_SRСложносоставной static rank, собирается из статических компонентов по отдельной формуле((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/#oftnd1 *)).
FI_REFINESФактор про число refines. В языке запросов есть фича user refines (‘слово, перед которым стоит знак процентика’). По задумке это означает что-то вроде ‘хорошо бы, чтобы слово в документе было’. Единственное известное ((http://staff.yandex-team.ru/gulin Андрей Гулин)) ценное использование данной фичи — это запрос [%официальный %сайт НазваниеФирмы]. Пользователям данная фича неизвестна, т.к. не описана ни в какой документации. Планируется, что она исчезнет из языка запросов, но в колдунщике слова с приоритетом USER_REFINE останутся. Фактор говорит о том, сколько максимум USER_REFINE-слов одновременно встречалось в рамках единого попадания в кворум. Считается, что их от 0 до 3 (если >3, то считается, что 3). Это число мапится в полуинтервал [0,1)
FI_TR_BOOSTЧисло, на которое умножаются некоторые линковые факторы (именно, факторы номер 6, 7, 47, 66), если текстовая релевантность 0, и ссылок мало
FI_TRLR_LEMMAВ текстовой релевантности произошло совпадение леммы.
FI_TRAFGRAPH_OUT_ALL_SHARE_DRemapped mascot feature TrafgraphOutAll_share_d
FI_RELEV_SENTS_DSSMDssm модель, обучена на переформулировки, в документной части использует релевантные запросу предложения
FI_FRESH_NEWS_DETECTOR_PREDICTЗначение детектора новостей, рассчитываемого в бегемоте. Всегда 0 при значении детектора меньше порога.
FI_HIT_NUM_100Преобразованное количество слов запроса во всех линках url`а.
FI_HIT_NUM_GT_16У документа LR>20 количество вхождение слов запроса в линках > 16, фактор про LR.
FI_PCT_LINKSДля документов с высокой LR — нормированная линковая релевантность без учета близости, для документов с низкой LR 0
FI_HAS_LRUrl высокую LR.
FI_LINK_QUALITYКачество входящих ссылок (классификатор Лещинера) — сломан, см [405]
FI_ALICE_MUSIC_TRACK_TITLE_COSINE_MATCH_MAX_PREDICTIONЗначение фактора CosineMatchMaxPrediction для стрима AliceMusic
FI_NUM_LINKSЧисло входящих ссылок. Ремапится.
FI_POPULAR_QПопулярность запроса
FI_TR_UNMAPPEDTR деленный на куб количества слов в запросе и преобразованный стандартным remapTR.
FI_RUS_LANGЯзык документа — русский.
FI_ADD_TIMEВремя добавления страницы, больше — более старый документ; кладется корень из времени, отображенный на интервал [0,1] так, чтобы 3+ года давало 1.
FI_IS_MAIN_PAGEЕсли главная страница владельца (чаще всего домен второго уровня, например xxxx.ru), то фактор равен 1. Для бомжатников, хостингов, личных блогов и т.д. (например, лайфджорнал, народ.ру и пр.) — домены третьего уровня (типа xxxxx.narod.ru) так же будут иметь фактор равный 1.
FI_ADD_TIME_MPВремя добавления главной страницы владельца (хоста?), ремапится так же, как AddTime.
FI_ALICE_MUSIC_TRACK_TITLE_ANNOTATION_MAX_VALUE_WEIGHTEDЗначение фактора AnnotationMaxValueWeighted для стрима AliceMusic
FI_URL_CLICKS_PCTRНасколько часто кликают в данный URL по данному запросу — CTR домноженный на поправочный коэффициент
FI_TEXT_BM25Простой BM25 по тексту.
FI_LINK_BM25Простой BM25 по линкам, веса линков не учитываются.
FI_TLBM25Простой BM25 по тексту и линкам одновременно.
FI_TLP1Все слова запроса есть в тексте + линках.
FI_ADVНа сайте есть реклама.
FI_YANDEX_ADVНа сайте есть реклама Яндекса.
FI_NO_SPAMКлассификатор спама по фичам из антиспама признал сайт НЕ(!) спамом. Т.е. 0=спам, 1=хороший.
FI_TEXT_PAIRПростой BM25 по парам слов — берем все пары слов запроса и считаем число их вхождений в текст документа. В качества веса пары используем сумму весов слов. Комм Не работает, если в запросе есть стоп-слово
FI_LINK_PAIRТо же, что TxtPair, но для линков; веса линков не учитываются.
FI_TEXT_BREAKBM25 от количества предложений в документе, в которых встречается.
FI_TEXT_HEADBM25 по словам только в заголовке.
FI_TEXT_HI_RELEVBM25 по словам только с high rel-битиками (‘значимым’, с выделением (<b> итп)).
FI_REMOVED_58NaN
FI_WORD_COUNTMin(число слов запроса/10, 1.f)
FI_INV_WORD_COUNT1 / количество_слов_в_запросе.
FI_HAS_NO_TRУ документа нет TR.
FI_HAS_NO_LRУ документа нет LR.
FI_HAS_NO_QUERY_URL_SHOWSДля данного урла для данного запроса нет информации о кликабельности 1 — запроса или запроса-urla нет в базе кликов, 0 — запрос-url есть в базе кликов
FI_HAS_NO_QUERY_SHOWSДля данного запроса нет информации о кликабельности 1 — запроса нет в базе кликов, 0 — запрос есть в базе кликов.
FI_HOPSКоличество хопов урла в обходе (типа меньше — ближе к морде, тем меньше значение (0 — морда, 1 — с морды добраться нельзя, 0 < можно добраться с морды < 1). Нормальное значение для корня носта 0.0039).
FI_LOG_LRЛогарифм от LR, линейно отображенный в [0,1].
FI_TEXT_PAIR_EXналичие пар слов по точной форме
FI_TEXT_BREAK_EXколичество предложений, в которых встречается много слов по точной форме
FI_TEXT_HEAD_EXналичие слов в заголовке по точной форме
FI_TEXT_HI_RELEV_EXBM25 по точной форме
FI_TEXT_BM25_EXПростой BM25 по точной форме.
FI_TEXT_PAIR_SYNналичие пар слов c учетом синонимов (>=TxtPair)
FI_TEXT_BRAEK_SYNколичество предложений, в которых встречается много слов c учетом синонимов
FI_TEXT_HEAD_SYNналичие слов в заголовке c учетом синонимов
FI_TEXT_HI_RELEV_SYNBM25 c учетом синонимов
FI_TEXT_BM25_SYNПростой BM25 c учетом синонимов.
FI_QUERY_DOWNER_CLICKS_PCTRНасколько часто кликают в URLы данного domainId по данному запросу — CTR domainId домноженный на поправочный коэффициент
FI_HAS_NO_QUERY_DOWNER_SHOWSДля данного domainId для данного запроса нет информации о кликабельности 1 — запроса или запроса-владельца нет в базе кликов, 0 — запрос-владелец есть в базе кликов
FI_OWNER_CLICKS_PCTRКликабельность владельца независимо от запроса
FI_MEGAFONОтносительная частота слов запроса в ссылках (1 — слова запроса часто встречаются в ссылках, 0.3 — редко); если точнее, значение этого фактора пессимизируется при условии: TR=0 && LR=0 && (нет ни одной ссылки со всеми словами запроса) && (не прошёл кворум) && (в тексте встречается хотя бы одна пара слов запроса)
FI_HAS_ALL_WORDS_MERGEDВ ссылках есть все слова запроса
FI_HAS_ALL_WORDS_IN_LINKВ одной ссылке есть все слова запроса
FI_PHRASEЕсть ссылка, прошедшая кворум
FI_GOOD_RATIOКакая доля ссылок “хорошая”
FI_MANY_BADНасколько много “плохих” ссылок (плохой = dpr = 0)
FI_LR_MAX_DPRМаксимальный dpr ссылки
FI_LR_TF_IDFTfIdf обычный TF*IDF по ссылкам. Частота слова в ссылках умножается на обратную документную частоту и суммируется по всем словам, потом нормируется на длину документа.
FI_LR_RELEVЛинковая релевантность от Гулина
FI_LR_RELEV_200Линковая релевантность от Гулина
FI_LR_LOG_RELEVЛинковая релевантность от Гулина
FI_BF_EXACTЕсть точная форма всех слов запроса в тексте/линках
FI_BF_LEMMAЕсть лемма всех слов запроса в тексте/линках
FI_SOFT_AND_OKДокумент прошел softand по ограничениям синтаксического колдунщика. Только для документов, имеющих текстовую релевантность. Для однословных запросов всегда 1.
FI_NEW_LINK_QUALITYКлассификатор качества входящих ссылок 2 — сломан, см [407]
FI_UKRравен единице, если у сайта стоит украинский гео-атрибут(т.е 1 — украинский сайт)
FI_IS_BLOGСтраница с блогохостинга
FI_IS_LJСтраница с livejournal.com
FI_REMOVED_98NaN
FI_SPAM2Автоматичемкий классификатор спама им. Алексеева, вероятность того, что сайт спам (0 не спам, 1- спам)
FI_TEXT_FEATURESКачество текста. Считается по довольно сложной формуле
FI_TEXT_LIKEКачество текста (классификатор Алексеева)
FI_REMOVED_102NaN
FI_REMOVED_103NaN
FI_YABAR_CORE_OWNERЯдро аудитории владельцев по данным Яндекс.Браузинга
FI_YABAR_CORE_HOSTЯдро аудитории хостов по данным Яндекс.Браузинга
FI_HAS_YA_BAR_COREИмеет ли хост ядро
FI_SPAM_KARMAСпам карма имени антиспамеров — вероятность того, что хост – спам; основан на информации whois
FI_MUSIC_Qмузыкальность запроса. Результаты работы колдунщика Антона Коныгина.
FI_EXACT_MATCHESчисло ссылок, точно совпадающих с запросом
FI_DOC_LENДлина документа в предложениях
FI_URL_LENДлина URL’а, делённая на 5
FI_QUERY_NON_COMMERCIALITYКоммерческость запроса по словарю фраз от Директа: 0 — максимальная коммерческость, 1 — минимальная.
FI_HOST_SIZEРазмер хоста имени Расковалова в документах без учета дублей (каждый дубль учитывается в факторе самостоятельным документом)
FI_IS_HTMLТип документа — HTML
FI_LINK_SPEEDЧисло обратное дисперсии временам появления ссылок со словами запроса
FI_TH_LR_RELEVЛинковая релевантность с учетом тематичности
FI_TH_LR_RELEV_200Линковая релевантность с учетом тематичности
FI_TH_LR_LOG_RELEVЛинковая релевантность с учетом тематичности
FI_LERF_LR_RELEVЛинковая релевантность с учетом качества каждой ссылки
FI_LERF_LR_RELEV_200Линковая релевантность с учетом качества каждой ссылки
FI_LERF_LR_LOG_RELEVЛинковая релевантность с учетом качества каждой ссылки
FI_LERF_TH_LR_LOG_RELEVЛинковая релевантность с учетом качества каждой ссылки и тематичности каждой ссылки
FI_NON_COMM_LR_LOG_RELEVЛинковая релевантность с учетом некоммерческости каждой ссылки
FI_NON_COMM_TH_LR_LOG_RELEVЛинковая релевантность с учетом некоммерческости каждой ссылки и тематичности
FI_NON_COMM_LERF_LR_LOG_RELEVЛинковая релевантность с учетом некоммерческости каждой ссылки и качества каждой ссылки
FI_NON_COMM_LERF_TH_LR_LOG_RELEVЛинковая релевантность с учетом некоммерческости каждой ссылки, качества каждой ссылки и тематичности
FI_GEO_CITY_PROXIMОзначает совпадение региона, упомянутого в запросе и найденных сайтов на уровне областей. Фактор бинарный: 1-совпадает, 0-нет. Основан на ((http://wiki.yandex-team.ru/ЯндексПоиск/КлассификацияСайтовИСтраниц/Географическая/ИспользованиеВПоиске геоклассификации сайтов))
FI_LINKS_WITH_WORDS_PERCENTПроцент входящих ссылок со словами запроса
FI_LINKS_WITH_ALL_WORDS_PERCENTПроцент входящих ссылок со всеми словами запроса
FI_PORNO_QUERYЕсть ли в запросе слова из yweb/pornofilter/porno.query.
FI_IS_PORNOдокумент из порно-кишки
FI_IS_COMMдокумент из коммерческой-кишки. Не используется (deprecated)
FI_IS_FAKEфэйковый документ
FI_IS_SEOзаголовок страницы содержит коммерческую лексику. Не используется (deprecated)
FI_IS_WIKIстраница из ru.wikipedia.org
FI_IS_ESHOPкоммерческая страница (классификатор Савина)
FI_GEO_REGION_PROXIMNaN
FI_HAS_NO_ALL_WORDS_TR_SYNв документе нет всех слов запроса (с точностью до синонима)
FI_NUM_WORDS_TR_SYNпроцент слов запроса в документе (с точностью до синонима)
FI_HAS_ALL_WORDS_TR_SYNв документе есть все слова запроса (с точностью до синонима)
FI_NUM_WORDS_LRпроцент слов запроса в ссылках (с точностью до синонима)
FI_HAS_ALL_WORDS_LRв ссылках есть все слова запроса (с точностью до синонима)
FI_PAY_DETECTOR_PREDICTЗначение детектора коммерции, рассчитываемого в бегемоте.
FI_TEXT_INV_PAIRTR по парам слов запроса в обратном порядке
FI_LINK_INV_PAIRLR по парам слов запроса в обратном порядке
FI_TEXT_SKIP_PAIRTR по парам слов запроса через одно слово в текстах
FI_LINK_SKIP_PAIRLR по парам слов запроса через одно слово в текстах
FI_NUM_WORDS_TRFMпроцент всех слова запроса в тексте (с точностью до формы)
FI_HAS_ALL_WORDS_TRFMв документе есть все слова запроса (с точностью до формы)
FI_Q_DIVERSITYСтепень централизации точек, из которой задается запрос
FI_Q_BLOGСодержит ли запрос блоговую лексику
FI_GEO_LR_LOG_RELEVlog(LR, суженной на страну пользователя)
FI_LERF_GEO_LR_LOG_RELEVlog(LerfLR, суженной на страну пользователя)
FI_NON_COMMERCIAL_QUERYБинарная некоммерческость запроса: QueryNonCommerciality > 0.965.
FI_EXACT_MATCHES_MAPЧисло ссылок, совпадающих с текстом запроса (другой remap)
FI_LERF_NORM_LR_LOG_RELEVXLerfLRlogRelev (нормированное на сумму Lerf-весов всех ссылок, а не на сумму их исходных весов)
FI_NON_COMM_NORM_LR_LOG_RELEVXNonCommLRlogRelev (нормированное на сумму NonComm-весов всех ссылок, а не на сумму их исходных весов)
FI_NON_COMM_TH_NORM_LR_LOG_RELEVЛинковая релевантность с учетом некоммерческости каждой ссылки и тематичности
FI_NON_COMM_LERF_NORM_LR_LOG_RELEVXNonCommLerfNormLRlogRelev (нормированное на сумму NonCommLerf-весов всех ссылок, а не на сумму их исходных весов)
FI_NON_COMM_LERF_TH_NORM_LR_LOG_RELEVЛинковая релевантность с учетом некоммерческости каждой ссылки, качества каждой ссылки и тематичности
FI_NEVASCA1Не используется Дуплицированность контента. ‘Хорошесть’ хоста (от 0 до 1), посчитанная исходя из того, сколько и каких хостов заимствуют контент у данного.
FI_NEVASCA2Не используется Дуплицированность контента. ‘Плохость’ хоста (от 0 до 1) – пропорциональна числу вторичного контента на хосте.’Плохость’ хоста (от 0 до 1) – пропорциональна числу вторичного контента на хосте.
FI_LINK_AGEСредний возраст ссылок, внесших что-то в LR LinkAge=Min(log(средний возраст ссылки)/7, 1), за 1 принято 3 года
FI_TLENДлина текста страницы в словах TLen = Map(число слов, 1/400), где Map(x, y) = x*y / (1 + x*y)
FI_IS_UNREACHABLEСтраница недостижима по ссылкам с морды.
FI_LANG_LR_LOG_RELEVLR с учетом совпадения языка ссылки и запроса
FI_LERF_LANG_LR_LOG_RELEVLR с учетом совпадения языка ссылки и запроса и накрученности
FI_QUERY_URL_CLICKS_FRCотношение числа кликов по данному урлу ко всем кликам по запросу
FI_QUERY_DOWNER_CLICKS_FRCотношение числа кликов по данному domainId ко всем кликам по запросу
FI_QUERY_URL_CLICKS_PCTR_COPY[Bug: Копия фактора 45] Насколько часто кликают в данный URL по данному запросу — CTR домноженный на поправочный коэффициент
FI_DOPP_URL_SESSION_CLICKS_FRC_CITYКакую часть (в среднем по сессии) от кликнутых по данному запросу с дописанным к нему городом пользователя урлов составляет данный url. Считается по пользовательским сессиям.
FI_QUERY_URL_CLICKS_PCTR_REGНасколько часто кликают в данный URL по данному запросу — CTR домноженный на поправочный коэффициент, по мелким регионам из relev_regions.web.txt
FI_QUERY_DOWNER_CLICKS_PCTR_REGНасколько часто кликают в URLы данного domainId по данному запросу — CTR domainId домноженный на поправочный коэффициент, по мелким регионам из relev_regions.web.txt
FI_QUERY_URL_CLICKS_FRC_REGотношение числа кликов по данному урлу ко всем кликам по запросу, по мелким регионам из relev_regions.web.txt
FI_QUERY_DOWNER_CLICKS_FRC_REGотношение числа кликов по данному domainId ко всем кликам по запросу, по мелким регионам из relev_regions.web.txt
FI_QUERY_URL_CLICKS_COMBO_REGQuery URL Clicks Combo, по мелким регионам из relev_regions.web.txt
FI_QUERY_DOWNER_CLICKS_COMBO_REGQuery DOwner Clicks Combo, по мелким регионам из relev_regions.web.txt
FI_CATALOG_RELEVLR по каталожным описаниям
FI_YA_CATALOG_RELEVLR по отписанию в Яндекс.Каталоге
FI_EXACT_WORD_ORDER_LENДлина максимального совпадения форм в тексте и запросе
FI_EXACT_WORD_ORDER_WEIGHTВес максимального совпадения форм в тексте и запросе
FI_WORD_ORDER_LENДлина максимального совпадения по лемме в тексте и запросе
FI_WORD_ORDER_WEIGHTВес максимального совпадения по лемме в тексте и запросе
FI_LINK_MAX_AGEМаскимальный возраст значимого скопления ссылок, внесших что-то в LR
FI_TEXT_RELEV_ALL_WORDS_WITH_STOPSВарианты соответствующих факторов с учетом стоп слов
FI_LINK_RELEV_ALL_WORDS_WITH_STOPSВарианты соответствующих факторов с учетом стоп слов
FI_TLP1_ALLВарианты соответствующих факторов с учетом стоп слов
FI_BF_EXACT_ALLВарианты соответствующих факторов с учетом стоп слов
FI_BF_LEMMA_ALLВарианты соответствующих факторов с учетом стоп слов
FI_PASSAGE_LEGACY_TRTR лучшего пассажа — насколько качественный сниппет может получиться
FI_TEXT_BM25_ATTEN_SYNTR с дисконтом за номер предложения
FI_MAX_WORD_HOST_RANKХост ранк по максимально выраженному слову запроса (обычно это название сайта)
FI_MAX_WORD_HOST_CLICKSКликабельность domAttr по максимальномо выраженному слову. Например для всех запросов в которых есть слово википедия кликают на странцы википедии.
FI_DOM_PHRASE_RANKHostRank по отдельным словам
FI_DOM_PHRASE_CLICK_RANKКликабельность домена по словам
FI_IS_FORUMURL удовлетворяет регулярке FORUM_DETECTOR
FI_ALICE_MUSIC_TRACK_TITLE_ANNOTATION_MATCH_WEIGHTED_VALUEЗначение фактора AnnotationMatchWeightedValue для стрима AliceMusic
FI_IS_OBSOLETEВ URL есть древняя дата. Распознаются древние новости. Фактор 1 если в урле есть год <=2007.
FI_TR_WITH_STOPSВес максимального совпадения форм в тексте и запросе
FI_LR_WITH_STOPSВес максимального совпадения форм в тексте и запросе
FI_HAS_PAYMENTSНа странице есть про ‘оплату SMS’.
FI_IS_LINK_PESSIMISEDАнтиспамеры пессимизировали сайт — все динамические линковые факторы обнуляются. zerolnk.flt
FI_ESHOP_VALUEМагазинность страницы
FI_PORNO_VALUEПорнографичность страницы
FI_TRAFGRAPH_OUT_ALL_SHARE_MRemapped mascot feature TrafgraphOutAll_share_m
FI_TRAFGRAPH_OUT_ALL_SE_SHARE_DRemapped mascot feature TrafgraphOutAllSE_share_d
FI_TRAFGRAPH_OUT_ALL_SE_SHARE_MRemapped mascot feature TrafgraphOutAllSE_share_m
FI_NO_EXT_CLICKS_SHARERemapped mascot feature NoExtClicksShare
FI_COUNTERS_SEARCH_TRAFFIC1Поисковый трафик — переходы с поисковых систем на сайт (2-ая формула)
FI_COUNTERS_SEARCH_TRAFFIC2Поисковый трафик — переходы с поисковых систем на сайт (2-ая формула)
FI_DOM_PHRASE_YABARПереходы на сайт из поисковиков по отдельным словам, по данным бара
FI_ALICE_MUSIC_ARTIST_NAME_BCLM_MIX_PLAIN_KE5Значение фактора BclmMixPlainK000001 для стрима AliceMusic
FI_QUERY_URL_LCSНаибольшая общая подстрока урла и запроса, нормированная длиной урла
FI_ONLY_URLВсе совпадения только в URL’е, в тексте страницы совпадений нет
FI_GEO_RELEV_REGION_CITYNaN
FI_GEO_RELEV_REGION_REGIONNaN
FI_GEO_RELEV_REGION_COUNTRYТри уровня совпадения географии пользователя и страницы
FI_LR_GEO_RELEV_REGION_CITYNaN
FI_LR_GEO_RELEV_REGION_REGIONNaN
FI_LR_GEO_RELEV_REGION_COUNTRYТри уровня совпадения региона ссылок и запроса
FI_GEO_COUNTRY_PROXIMГеографическая близость
FI_IS_NAV_QUERYЯвляется ли запрос навигационным, по кликабельности ответов
FI_MAX_WORD_HOST_YABARНаиболее характерное слово запроса, соответствующее сайту, по данным бара
FI_FIRST_WORD_HOST_CLICKSКликабельность хоста по первому слову запроса. Достаточно часто первое (последнее) слово запроса — явное указание сайта, на котором следует искать информацию.
FI_ALICE_MUSIC_ARTIST_NAME_CMMATCH_TOP5_AVG_MATCHЗначение фактора CMMatchTop5AvgMatch для стрима AliceMusic
FI_QUERY_DOWNER_YABAR_VISITSNaN
FI_QUERY_DOWNER_YABAR_VISITORSNaN
FI_QUERY_DOWNER_YABAR_AVG_TIMEсреднее по пользователям активное непрерывное время нахождения пользователя (в сек) на страницах хоста после перехода по запросу из поисковой системы (фактор зависит от пары (запрос,domAttr)).
FI_QUERY_DOWNER_YABAR_AVG_TIME2среднее по пользователям активное непрерывное время нахождения пользователя (в сек) на страницах хоста после перехода по запросу из поисковой системы (фактор зависит от пары (запрос,domAttr)). По внутр счетчику Яндекс.Бара/Элементов/Браузера
FI_QUERY_DOWNER_YABAR_AVG_ACTIONSсреднее по пользователям число активных действий (клики, нажатия клавиш) при непрерывном нахождении пользователя на страницах хоста после перехода по запросу из поисковой системы (фактор зависит от пары (запрос,domAttr)). . По внутр счетчику Яндекс.Бара/Элементов/Браузера
FI_QUERY_URL_YABAR_VISITSNaN
FI_QUERY_URL_YABAR_VISITORSКол-во уникальных посетителей из поисковиков по конкретному запросу
FI_QUERY_URL_YABAR_AVG_TIMEсреднее по пользователям активное непрерывное время нахождения пользователя (в сек) на странице после перехода по запросу из поисковой системы (фактор зависит от пары (запрос,урл)).
FI_QUERY_URL_YABAR_AVG_TIME2среднее по пользователям активное непрерывное время нахождения пользователя (в сек) на странице после перехода по запросу из поисковой системы (фактор зависит от пары (запрос,урл)). По внутр счетчику Яндекс.Бара/Элементов/Браузера
FI_QUERY_URL_YABAR_AVG_ACTIONSсреднее по пользователям число активных действий (клики, нажатия клавиш) на странице после перехода по запросу из поисковой системы (фактор зависит от пары (запрос,урл))
FI_DSSM_BERT_DISTILL_SINSIG_MSE_BASE_REG_CHAINРазмечается пул из PRS логов при помощи Bert, обученного на sinsig. На этом пуле обучается dssm модель, с использованием BaseRegionChain
FI_DSSM_BERT_DISTILL_RELEVANCE_MSE_BASE_REG_CHAINРазмечается пул из PRS логов при помощи Bert, обученного на релевантность. На этом пуле обучается dssm модель, с использованием BaseRegionChain
FI_ALICE_MUSIC_ARTIST_NAME_PER_WORD_CM_MAX_MATCH_MINЗначение фактора PerWordCMMaxMatchMin для стрима AliceMusic
FI_ALICE_MUSIC_ARTIST_NAME_ATTENV1_BM15_K05Значение фактора AttenV1_Bm15_K05 для стрима AliceMusic
FI_ALICE_MUSIC_ALBUM_TITLE_ANNOTATION_MAX_VALUE_WEIGHTEDЗначение фактора AnnotationMaxValueWeighted для стрима AliceMusic
FI_IS_FOREIGN_QUERYЗапрос не на русском языке
FI_IS_FOREIGN_CLUSTERдокумент из зарубежного кластера
FI_PAGE_REGION_SIZE_INРазмер региона страницы
FI_PAGE_REGION_INV_SIZE_INФактор обратно пропорционален размеру региона страницы
FI_QUERY_REGION_SIZEРазмер региона запроса
FI_QUERY_REGION_INV_SIZEФактор обратно пропорционален размеру региона запроса
FI_GEO_GEOMETRY_PROXIMГеографическая близость пользователя и сайта
FI_RINGS_HOST_RANK_BADNESS_OLDХарактеризует раскрученность сайта линковыми кольцами. Значение — доля внешних ссылок, которые входят в линковые кольца и линкообменники.
FI_YABAR_HOST_VISITORSкол-во уникальных посетителей, ремапится экспоненциально
FI_YABAR_HOST_SEARCH_TRAFFICДоля трафика с поисковых систем
FI_YABAR_HOST_INTERNAL_TRAFFICдоля заходов на сайт не по ссылкам (набор руками или с закладок)
FI_YABAR_HOST_AVG_TIMEсреднее по пользователям активное непрерывное время нахождения пользователя (в сек) на страницах хоста
FI_YABAR_HOST_AVG_TIME2среднее по пользователям активное непрерывное время нахождения пользователя (в сек) на страницах хоста. По внутр счетчику Яндекс.Бара/Элементов/Браузера
FI_YABAR_HOST_AVG_ACTIONSсреднее по пользователям число активных действий (клики, нажатия клавиш) при непрерывном нахождении пользователя (в сек) на страницах хоста.
FI_YABAR_HOST_BROWSE_RANKреализация алгоритма описанного в статье ((http://wiki.yandex-team.ru//h.yandex.net/?http%3A%2F%2Fresearch.microsoft.com%2Fen-us%2Fpeople%2Ftyliu%2Ffp032-liu.pdf http://research.microsoft.com/en-us/people/tyliu/fp032-liu.pdf))
FI_YABAR_URL_VISITSПосещаемость урла по данным я-бара
FI_YABAR_URL_VISITORSКоличество уникальных посетителей урла
FI_YABAR_URL_AVG_TIMEсреднее по пользователям время нахождении пользователя на странице. Cчитается как разница между соседними переходами.
FI_OWNER_SATISFIED4_RATEЭто SEA фактор = s4_r/ (k_r+10) где s4_r — число кликов > 180 сек, k_r — общее число кликов. Считается с учётом переформулировок.
FI_OWNER_SATISFIED4_RATE_REGЭто SEA фактор = s4_r/ (k_r+10) где s4_r — число кликов > 180 сек, k_r — общее число кликов. Считается с учётом переформулировок. Локализованная версия
FI_URL_QUERY_VARIETYСтепень разнообразия запросов, по которым кликают данный урла
FI_IS_COMM_BY_KEYWORDSСтраница коммерческая по ключевым словам. Не используется (deprecated)
FI_DOC_TFIDF_SUMIdf по различным частям документа, сломаны, не используются
FI_TITLE_IDF_SUMIdf по различным частям документа, сломаны, не используются
FI_HEADING_IDF_SUMIdf по различным частям документа, сломаны, не используются
FI_NORMAL_TEXT_IDF_SUMIdf по различным частям документа, сломаны, не используются
FI_LR_VIDEO_RELEVЛинковый фактор про наличие видео на странице.
FI_AUX_TEXT_BM25BM25 по региону пользователя для локализуемых запросов, для нелокализуемых в КУБе — страна. Тексты отправляемых для регионов запросов можно посмотреть в relev_regions.txt в колдунщике
FI_AUX_LINK_BM25То же самое для линковой релевантности
FI_COMM_LINKS_SEO_HOSTSДоля входящих продажных ссылок. Реализован алгоритм распознавания коммерческих ссылок. Фактор ремапится на [0,1] если доля таких ссылок > 50%, иначе 0. ((http://wiki.yandex-team.ru/SvetlanaShorina/topseolinks выборка накрученных сайтов))
FI_COMM_LINKS_SEO_HOSTS_PORNO_QUERYПредыдущий фактор умноженный на PornoQuery
FI_COMM_LINKS_SEO_HOSTS_NON_COMMФактор CommLinksSEOHosts умноженный на NonCommercialQuery
FI_TOVAR_CATEGORY_QUERYВ запросе упоминается товарная категория. Не используется (deprecated)
FI_TOVAR_VENDOR_QUERYВ запросе упоминается вендор. Не используется (deprecated)
FI_Q_DIVERSITY2Географическая распределенность запроса
FI_NIGHT_QUERYЗапрос задают преимущественно ночью
FI_MORNING_QUERYЗапрос задают преимущественно утром
FI_DAY_QUERYЗапрос задают преимущественно днем
FI_EVENING_QUERYЗапрос задают преимущественно вечером
FI_HOUR_DIVERSITYСтепень выраженности задания запросов в разное время суток
FI_LCORХарактеризует частоту слов в ссылках. Фактор большой, если слово, сыгравшее в линковой релевантности, редкое для ссылок.
FI_SUBQUERY_THEME_MATCH_AСовпадение тематических спектров запроса и документа. Тематика запроса — результат работы ((http://wiki.yandex-team.ru/EvgenijjKroxalev/subquery правила колдунщика SubquerySearch )) Тематика документа определяется автоматическим классификатором
FI_TR_DOCQUORUMВес слов запроса, которые есть в тексте
FI_LR_DOCQUORUMВес слов запроса, которые есть в линках
FI_TRLR_DOCQUORUMВес слов запроса, которые есть в тексте и линках
FI_OWNER_SDIFF_CLICK_ENTROPYЭнтропия — распределение кликов
FI_OWNER_SDIFF_SHOW_ENTROPYЭнтропия — распределение показов
FI_OWNER_SDIFF_CSRATIO_ENTROPYЭнтропия — распределение отношения клики/показы
FI_PORNO_LR_LOG_RELEVДокумент порно по тексту ссылкок
FI_PORNO_NORM_LR_LOG_RELEVДокумент порно по тексту ссылкок, другая нормировка
FI_XPORNO_QUERYКлассификатор порно-запросов, другой словарь чем PornoQuery
FI_ALICE_MUSIC_ALBUM_TITLE_ATTENV1_BM15_K05Значение фактора AttenV1_Bm15_K05 для стрима AliceMusic
FI_GEO_COUNTRY_COUNTRY_PROXIMГеографическая близость страны сайта и страны запроса
FI_URL_DOMAIN_FRACTIONПокрытие домена трехбуквиями из запроса. (Челябинская лотерея — chelloto. Переводим запрос в транслит, находим трехбуквия которые покрываются (che, hel, lot, olo), смотрим какую долю от всех трехбуквиев покрыли )
FI_URL_PATH_AND_PARAMS_FRACTIONТо же, что и предыдущий фактор, но про весь урл кроме домена
FI_SPECIFICAL_QUERYЗапрос является локально-специфическим. Запрос часто переформулируют с явным заданием региона. ((https://ml.yandex-team.ru/archive/thread1433892/#message1433892 подробнее))
FI_JOKER_LENСчитаем текстовые фичи, считая что тайтл страницы приписан к каждому ее предложению, т.е. расстояние между словом из тайтла и любым другим словом 1 предложение. Len- максимальное отношение слов из запроса встретившихся в каком-то предложении текста (с приписанным тайтлом) в отношении к длине запроса. Пример [Хармс цирк Вертунов] для ((http://wiki.yandex-team.ru//h.yandex.net/?http%3A%2F%2Fwww.wikilivres.info%2Fwiki%2F%25D0%25A6%25D0%25B8%25D1%2580%25D0%25BA_%25D0%25A8%25D0%25B0%25D1%2580%25D0%25B4%25D0%25B0%25D0%25BC_%28%25D0%25A5%25D0%25B0%25D1%2580%25D0%25BC%25D1%2581%29 этого документа))
FI_JOKER_WEIGHTОтношение суммы idf встретившихся слов в предложении+тайтл ко всем словам.
FI_EXACT_JOKER_LENТо же самое что JokerLen, по точным формам
FI_EXACT_JOKER_WEIGHTТо же самое что JokerWeight, по точным формам
FI_MORE_120_SEC_VISITS_NOT_SEARCH_SHARERemapped mascot feature More120SecVisitsNotSearchShare
FI_LINK_BREAKАналоги соответствующих текстовых факторов для линков. BM25 от количества ссылок, в которых произошло совпадение.
FI_LINK_BM25_EXПростой BM25 по точной форме в текстах ссылок
FI_LINK_PAIR_SYNНаличие в ссылках пар слов c учетом синонимов
FI_LINK_BREAK_SYNКоличество ссылок, прошедших порог
FI_LINK_BM25_SYNПростой BM25 по ссылкам c учетом синонимов
FI_IS_VIDEO_QUERYЗапрос про видео
FI_OWNER_CLICKS_PCTR_REGКликабельность владельца независимо от запроса, отдельно по регионам
FI_OWNER_SDIFF_CLICK_ENTROPY_REGЭнтропия — распределение кликов. Регионализованный
FI_OWNER_SDIFF_SHOW_ENTROPY_REGЭнтропия — распределение показов. Регионализованный
FI_OWNER_SDIFF_CSRATIO_ENTROPY_REGЭнтропия — распределение отношения клики/показы. Регионализованный
FI_ADULTNESSequals 2 * NastyContent
FI_HOST_ADULTNESSequals 2 * NastyContent
FI_KC_HOST_ADULTNESSalways zero
FI_IS_COMДомен в зоне .com
FI_IS_UAДомен в зоне .ua
FI_IS_NOT_RUДомен не в зоне .ru
FI_LR_MARKET_RELEVLR по ссылкам из Яндекс.Маркета
FI_POETRYСтихотворность документа
FI_POETRY_QUADМаксимальная стихотворность четверостишья
FI_ENG_LANGЯзык документа — английский
FI_DOC_HAS_TWO_EXACT_QUERY_PARTSЗапрос полностью покрывается двумя точными группами, состоящими из exact match слов запроса подряд ((http://wiki.yandex-team.ru/poiskovajaplatforma/tr/CoverageByGroups Про покрытие группами))
FI_DOC_HAS_LEVENSHT1_QUERY_FRAGMENTCуществует группа, состоящая из exact match слов запроса, покрывающая запрос (возможно, с пропуском, добавлением или заменой слова)
FI_LARGEST_SY_INEXACT_GROUPДоля запроса, покрываемая самой длинной группой, состоящей из любых хитов (в т.ч. словоформ и синонимов). Возможно, с пропуском, добавлением или заменой слова
FI_TIME_PROFILES_MATCH_WDХарактеризует близости временных профилей запроса и документов по рабочим дням
FI_TIME_PROFILES_MATCH_WEХарактеризует близости временных профилей запроса и документов по выходным дням
FI_CYR_LANGЯзык документа кириллический
FI_REGIONAL_U_QUERYЗапросные факторы — результат работы ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/GeoRegionality классификатора геолокализованности запроса))U- геобесполезные — региональная выдача по запросу бессмысленна
FI_REGIONAL_R_QUERYR- георелевантные — региональные результаты в выдаче могли бы быть полезны, но не более того
FI_REGIONAL_V_QUERYV- геовитальные — региональная выдача имеет принципиальное значение
FI_URL_HAS_NO_DIGITSВ урле нет цифр
FI_ALICE_MUSIC_TRACK_ARTIST_NAMES_ALL_WCM_MAX_MATCHЗначение фактора AllWcmMaxMatch для стрима AliceMusic
FI_ALICE_MUSIC_TRACK_ALBUM_TITLE_COSINE_MATCH_MAX_PREDICTIONЗначение фактора CosineMatchMaxPrediction для стрима AliceMusic
FI_SYN_S1Показывают насколько текст является неестественным с точки зрения русского языка. Оценка того, насколько можно считать текст документа сгенерированным синонимайзером либо вообще автоматическим. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=1il#h58953-2 подробнее))
FI_SYN_FL_REMAP1Показывают насколько текст является неестественным с точки зрения русского языка. Оценка того, насколько можно считать текст документа сгенерированным синонимайзером либо вообще автоматическим. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=1il#h58953-2 подробнее))
FI_SYN_FL_REMAP2Показывают насколько текст является неестественным с точки зрения русского языка. Оценка того, насколько можно считать текст документа сгенерированным синонимайзером либо вообще автоматическим. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=1il#h58953-2 подробнее))
FI_OWNER_SESS_NORM_DURnd/k нормированное время до клика
FI_URL_SESS_NORM_DUR_RATEnd/i
FI_QUERY_DOWNER_SESS_NORM_DURnd/k
FI_QUERY_DOWNER_WEIGHT_CLICKw/k
FI_QUERY_DOWNER_ONLY_CLICK_RATEo/i
FI_QUERY_DOWNER_CLICK_SUMMARYподобранная формула
FI_QUERY_DOWNER_SATISFIED4_RATEr_s4b/(r_k + 10)
FI_SYNT_QUALITYИмеет ли запрос полный синтаксический разбор
FI_PAGE_DATEДата документа которая прописана на странице, ремапится квадратным корнем
FI_VISITS_P_VISITORSRemapped mascot feature VisitsPVisitors
FI_RINGS_HOST_RANK_BADNESS_2Дополнительные факторы про раскрученность сайта линковыми кольцами , ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=181r#h58953-4 подробнее))
FI_RINGS_HOST_RANK_BADNESS_3Дополнительные факторы про раскрученность сайта линковыми кольцами , ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=181r#h58953-4 подробнее))
FI_RINGS_HOST_RANK_BADNESS_4Дополнительные факторы про раскрученность сайта линковыми кольцами , ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=181r#h58953-4 подробнее))
FI_HAS_TEXT_POSУ документа есть текстовая релевантность
FI_QSEGMENTS_BM25BM25, где в качестве ‘слов’ выступают выделенные сегменты запроса
FI_QSEGMENTS_WEIGHTВес’ сегментов запроса в тексте
FI_SYN_BAD_WORD_PAIRSПоказатель неестественности текста с точки зрения русского языка. Число плохих пар слов в тексте, перенормированное в отрезок [0,1] по формуле z/(z+10)
FI_SYN_NUM_BAD_WORD_PAIRSДоля плохих пар среди всех найденных в таблице: z/(x+1), где z – число плохих пар в тексте, а x – число ((http://wiki.yandex-team.ru/EvgenijjGrechnikov/TestSynonimizers 2000-релевантных)) пар
FI_NUM_LATIN_LETTERSчисло латинских букв в тексте (не считая разметки), загнанное в [0,1] формулой n/(n+100)
FI_RINGS_HOST_RANK_BADNESS_1Дополнительные факторы про раскрученность сайта линковыми кольцами , ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=181r#h58953-4 подробнее))
FI_DOC_TFIDF_SUM_FIXEDПредыдущие факторы — исправленные
FI_TITLE_IDF_SUM_FIXEDПредыдущие факторы — исправленные
FI_HEADING_IDF_SUM_FIXEDПредыдущие факторы — исправленные
FI_NORMAL_TEXT_IDF_SUM_FIXEDПредыдущие факторы — исправленные
FI_QUERY_URL_CLICKS_COMBOфактор, хитрым образом скомбинированный из FRC и псевдо-CTR
FI_QUERY_DOWNER_CLICKS_COMBOфактор, хитрым образом скомбинированный из FRC и псевдо-CTR
FI_LR_AMORTIZED_BY_AGEЛинковая релевантность с пессимизацией за большой возраст линка
FI_WORDS_IN_TEXTЧисло слов в тексте (Слово — то, что выделил леммер), отображается в [0,1] по формуле x/(x+A)
FI_WORDS_IN_TITLEЧисло слов русского языка в заголовке
FI_MEAN_WORD_LENGTHСредняя длина слова
FI_PERCENT_WORDS_IN_LINKSПроцент числа слов внутри тега <a>..</a> от числа всех слов
FI_PERCENT_VISIBLE_CONTENTПроцент числа слов вне тегов (вне скобок <>) от числа всех слов
FI_PERCENT_FREQ_WORDSПроцент числа слов, являющихся 200 самыми частыми словами языка, от числа всех слов текста
FI_PERCENT_USED_FREQ_WORDSЧисло использованных в тексте 500 самых популярных слов языка, деленное на 500
FI_TRIGRAMS_PROBЛогарифм среднего геометрического вероятностей триграмм в тексте. (вероятность триграммы — число ее встречаний в тексте, деленное на число всех триграмм) , отображается в [0,1] по формуле -x(x+A)
FI_TRIGRAMS_COND_PROBЛогарифм среднего геометрического условных вероятностей триграмм. условная вероятность триграммы — ее вероятность, деленная на вероятность биграммы из первых двух слов
FI_DOPP_DOWNER_PCTRАналог фактора QueryDOwnerClicksPCTR, отличается от него тем, что запросы нормализуются по доппельгагерам (подробности такой нормализации — у ((http://staff.yandex-team.ru/finder Андрея Плахова)), код -ysite/yandex/doppelgangers)
FI_DOPP_DOWNER_PCTR_REGАналог фактора QueryDOwnerClicksPCTR, отличается от него тем, что запросы нормализуются по доппельгагерам (подробности такой нормализации — у ((http://staff.yandex-team.ru/finder Андрея Плахова)), код -ysite/yandex/doppelgangers). Локализованный до relev_regions.web.txt
FI_DOPP_URL_PCTRАналог фактора QueryUrlClicksPCTR, отличается от него тем, что запросы нормализуются по доппельгагерам (подробности такой нормализации — у ((http://staff.yandex-team.ru/finder Андрея Плахова)), код — ysite/yandex/doppelgangers)
FI_DOPP_URL_PCTR_REGАналог фактора QueryUrlClicksPCTR, отличается от него тем, что запросы нормализуются по доппельгагерам (подробности такой нормализации — у ((http://staff.yandex-team.ru/finder Андрея Плахова)), код — ysite/yandex/doppelgangers). Локализованный до relev_regions.web.txt
FI_URL_BM25BM25 по URL’у
FI_HAS_BIG_PICTUREНа странице есть большая картинка
FI_MATRIXNETКо всем факторам применяется MatrixNet — формула (TG_UNUSED — чтобы предотвратить вхождние в какие-либо формулы)
FI_DATER_AGEРазница между текущей датой и датой документа, определённой датировщиком, 1 — дата документа равна текущей, 0 — документу 10 лет или более, Если дата не определена, равен 0. Внимание!((1 — DaterAge)*60)^2 = возраст страницы в днях.
FI_HARD_PESSIMIZATIONжесткая пессимизация (aka PR=0), бинарный фактор, считается в антиспаме
FI_C_IN_DEGREE_1Хостовые факторы, определяют сайты, накрученные линками — вторая и третья входящие степени ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=181rh58953-4#cindegree12 подробнее))
FI_C_IN_DEGREE_2Хостовые факторы, определяют сайты, накрученные линками — вторая и третья входящие степени ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/antispam?v=181rh58953-4#cindegree12 подробнее))
FI_NUM_NON_RUSSIAN_LINKSЧисло входящих ссылок без русских букв. Ремапится.
FI_TEXT_MAX_FORMSМаксимальное число форм по всем словам запроса — max по всем словам запроса числа_форм_для_слова/64
FI_TEXT_WEIGHTED_FORMSВзвешенная по весам слов сумма числа форм — сумма по всем словам запроса числа_форм_для_слова/64*вес_слова; remap вида x/(1 + x).
FI_TEXT_FORMSНевзвешенная сумма числа форм — сумма по всем словам запроса числа_форм_для_слова/64/число_слов_запроса
FI_LINK_MAX_FORMSМаксимальное число форм по всем словам запроса
FI_LINK_WEIGHTED_FORMSВзвешенная по весам слов сумма числа форм
FI_LINK_FORMSНевзвешенная сумма числа форм
FI_TEXT_RELEV_WEIGHTED_1Аналоги одноименных факторов, вес слова = 1
FI_LINK_RELEV_WEIGHTED_1Аналоги одноименных факторов, вес слова = 1
FI_TEXT_BM25_FM_WEIGHTED_1Аналоги одноименных факторов, вес слова = 1
FI_TEXT_BM25_SYN_WEIGHTED_1Аналоги одноименных факторов, вес слова = 1
FI_LINK_BM25_WEIGHTED_1Аналоги одноименных факторов, вес слова = 1
FI_TLBM25_WEIGHTED_1Аналоги одноименных факторов, вес слова = 1
FI_QSEGMENTS_BREAKSСегменты запроса — это части запроса, которые сами по себе являются частотными запросами. Фактор показывает, насколько сегменты бьются в тексте. значение 0 — все слова встречаются только в рамках обозначенных сегментов, 1 — все вхождения разбивают сегменты
FI_ALICE_MUSIC_TRACK_LYRICS_CMMATCH_TOP5_AVG_MATCHЗначение фактора CMMatchTop5AvgMatch для стрима AliceMusic
FI_NUMERALS_PORTIONДоля разных частей речи в тексте. доля числительных (среди всех слов, у которых удалось распознать часть речи)
FI_PARTICLES_PORTIONдоля частиц
FI_ADJ_PRONOUNS_PORTIONдоля местоименных прилагательных
FI_ADV_PRONOUNS_PORTIONдоля местоименных существительных
FI_VERBS_PORTIONдоля глаголов
FI_FEM_MAS_NOUNS_PORTIONдоля слов, которые могут быть как существительными мужского рода, так и существительными женского рода, но не среднего рода, среди всех существительных (примеры: ‘колибри’ — пример неопределённого рода, который можно определять двумя способами, ‘Александра’ — омонимия).
FI_LINK_QUALITY_FIXEDКачество входящих ссылок (классификатор Лещинера) исправленный
FI_HAS_LINK_QUALITY_FIXEDСчитали LinkQuality для этой страницы или нет (не считали, если ссылок мало) исправленный
FI_NEW_LINK_QUALITY_FIXEDКлассификатор качества входящих ссылок 2 исправленный
FI_QUERY_ISORGВ запросе название организации (пример: Газпром, газпрома) ((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares Описание))
FI_ALICE_MUSIC_ARTIST_NAME_CM_MATCH_TOP5_AVG_MATCH_VALUEЗначение фактора CMMatchTop5AvgMatchValue для стрима AliceMusic
FI_LONGEST_TEXTРазмер самого большого текстового сегмента страницы (из фактора [18] PureText)
FI_SMART_UKRNaN
FI_SMART_BYNaN
FI_LR_WITHOUT_RAREлинковая релевантность без учета редких слов
FI_DIFFERENT_INTERNAL_LINKSКоличество различных внутренних ссылок на страницу
FI_HAS_DETERMINED_CITIESДля сайта определен город
FI_REGIONAL_U_QUERY_NEWЗапросные факторы — результат работы ((http://wiki.yandex-team.ru/PoiskovajaPlatforma/Lingvistika/ZaprosnyjeFactory/LocalizovannyjeZaprosy классификатора геолокализованности запроса)) — новая версия факторов [328]-[330]: U — геобесполезные — региональная выдача по запросу бессмысленна;
FI_REGIONAL_R_QUERY_NEWЗапросные факторы — результат работы ((http://wiki.yandex-team.ru/PoiskovajaPlatforma/Lingvistika/ZaprosnyjeFactory/LocalizovannyjeZaprosy классификатора геолокализованности запроса)) — новая версия факторов [328]-[330]: R — георелевантные — региональные результаты в выдаче могли бы быть полезны, но не более того;
FI_REGIONAL_V_QUERY_NEWЗапросные факторы — результат работы ((http://wiki.yandex-team.ru/PoiskovajaPlatforma/Lingvistika/ZaprosnyjeFactory/LocalizovannyjeZaprosy классификатора геолокализованности запроса)) — новая версия факторов [328]-[330]: V — геовитальные — региональная выдача имеет принципиальное значение.
FI_ALICE_MUSIC_ARTIST_NAME_PER_WORD_CM_MAX_PREDICTION_MINЗначение фактора PerWordCMMaxPredictionMin для стрима AliceMusic
FI_PAGE_RANK_UKRУкраинский Page rank
FI_QCLASS_DOWNLOAD#ERROR!
FI_QCLASS_BRANDNAMESРезультат классификатора запроса — в запросе есть слова из соответствующего словаря. бренд
FI_QCLASS_DISEASEмедицинсий словарь
FI_QCLASS_KAKвопрос
FI_QCLASS_MOSCOWзапрос специфический для Москвы
FI_QCLASS_OAOорганизация
FI_QCLASS_PORNOпорно
FI_QCLASS_TRAVELпутешествия
FI_VIDEO_RATINGПопулярность видео-ролика, приходит от видео
FI_PERIODIC_LINK_DATES_PERCENTПериодичность ссылок на сайт
FI_LINK_ALMOST_PERIODКоличество почти-периодических ссылок
FI_QDOWNER_STAT_POWERКоличество показов owner’а по запросу, нормировка x/(100 + x).
FI_QURL_STAT_POWERКоличество показов url’а по запросу, нормировка x/(100 + x).
FI_HAS_LIRU_CNTНаличие счетчика LiveInternet
FI_OWNER_REQS_POPULARITYПопулярность owner’а в запросах
FI_DSSM_YA_MUSIC_ASR_EARLY_BINDING_CEDSSM модель с ранним связыванием, обученная на реформулировках и дообученная на ASR гипотезы музыкальных запросов к Алисе
FI_DSSM_BERT_DISTILL_SINSIG_CE_COUNTRY_REG_CHAINМодель, обученная на пуле по PRS-логу на предсказание Bert, обученного на sinsig_ce с пороговым значениeм 0.5, с использованием цепочки регионов до страны
FI_DSSM_YA_MUSIC_EARLY_BINDING_CEDSSM модель с ранним связыванием, обученная на реформулировках и дообученная на музыкальные запросы к Алисе
FI_SECOND_INDEG_DISTR_XIОдиннадцать факторов основанных на статистических свойствах распределений входящих степеней вершин, ссылающихся на фиксированную вершину хостграфа.((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/hostdegree подробнее))
FI_PIRACY_DETECTOR_PREDICTЗначение детектора пиратскости, рассчитываемого в бегемоте.
FI_ALICE_MUSIC_URL_TYPE_IS_ALBUMТип канонизированного урла яндекс музыки — альбом
FI_FIRST_VALID_TS_10DAYSСчитается как (10-x) где x — возвраст документа в днях (непрерывно) относительно времени валидности документа в самоваре
FI_HOST_IN_QUERYХост документа распознан в запросе
FI_VITAL_HOST_IN_QUERYURL состоит только из хоста, который распознан в запросе
FI_YANDEX_NEWS_STORY_URLURL является сюжетом Яндекс новостей
FI_RC_SPYLOG_URL_RATIONAL_SIGMOID_D1T240URL feature computed from rapid clicks spy_log counters with decay of 1 day
FI_RC_SPYLOG_URL_RATIONAL_SIGMOID_D1T240_FROZENURL feature computed from rapid clicks spy_log counters with decay of 1 day
FI_RC_SPYLOG_URL_RATIONAL_SIGMOID_D0_5T30URL feature computed from rapid clicks spy_log counters with decay of 0.5 days
FI_RC_SPYLOG_URL_RATIONAL_SIGMOID_D0_5T30_FROZENURL feature computed from rapid clicks spy_log counters with decay of 0.5 day
FI_TIMESTAMPСчитаются как (80 — x) / 80, где x — возраст документа в часах. Факторы имеют смысл только для базы быстробота (последние 80 часов). Не используются в ранжировании. Используются в переранжировании.
FI_ADD_TIME_FULLСчитаются как (80 — x) / 80, где x — возраст документа в часах. Факторы имеют смысл только для базы быстробота (последние 80 часов). Не используются в ранжировании. Используются в переранжировании.
FI_SWBM25Хитрый BM25 в скользящем окне. Размер окна задается в предложениях. Используются «джокеры» для заголовков и начала документа. Учитывается морфологическая близость и структура текста. Вес окна затухает с удалением от начала документа.
FI_PLMФактор про то, наскоько хороший сниппет может получиться.
FI_TEXT_PAIR_W1Простой BM25 по парам слов — берем все пары слов запроса и считаем число их вхождений в текст документа. Вес =1. Комм Не работает, если в запросе есть стоп-слово
FI_AURA_DOC_LOG_SHAREDЛогарифм числа шинглов, на которых данный документ не уникален
FI_AURA_DOC_LOG_AUTHORЛогарифм числа шинглов, на которых данный владелец документа признан автором
FI_AURA_DOC_MEAN_SHARED_WEIGHTСредний вес не-уникальных шинглов данного документа
FI_MARKET_QUALITY_RATINGMascot feature MarketQualityRating
FI_MEDICAL2_HOST_QUALITYMedical host quality for new marks.
FI_MEDICAL2_HOST_QUALITY_FRESHMedical host quality for new marks for experiments.
FI_FIN_LAW_HOST_QUALITYFinance or law host quality for new marks.
FI_FIN_LAW_HOST_QUALITY_FRESHFinance or law host quality for new marks for experiments.
FI_SOS_HOST_QUALITYFinance or law host quality for new marks.
FI_SOS_HOST_QUALITY_FRESHFinance or law host quality for new marks for experiments.
FI_CS_DOCUMENTATION_HOSTFactor for host in list of documentation cs hosts for experiments
FI_REMOVED_466NaN
FI_REG_HOST_RANKCчитается так же, как и фактор HostRank, но не на всём owner-графе, а на его подграфе, состоящем из owner’ов данного региона. Принадлежность к региону определяется по TLD, либо по наличию в индексе страниц с данного owner’а, про которые geo или geoa классификатор говорит, что они из этого региона. Маппируется точно так же, как и фактор HostRank, в число от 0 до 1 с 256 градациями
FI_REG_IS_WIKIДокумент из языкового раздела википедии, соответствующего пользовательскому региону
FI_LANGUAGE_COMPLIANCEЯзык документа соответствует языку запроса
FI_COUNTRY_POPULAR_QПопулярность запроса внутри страны
FI_COUNTRY_Q_DIVERSITYСтепень централизации точек, из которой задается запрос (внутри страны)
FI_COUNTRY_Q_DIVERSITY2Географическая распределенность запроса внутри страны
FI_COUNTRY_HOURЧас, в который больше всего задают этот запрос
FI_COUNTRY_HOUR_DIVERSITYСтепень выраженности задания запросов в разное время суток (внутри страны)
FI_REMOVED_475NaN
FI_NATIONAL_DOMAINСтрана документа (домен) и страна пользователя совпадают ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/OpisanijaFaktorov#nationaldomain подробнее))
FI_IS_PORNO_ADVERTНа странице порно реклама
FI_RC_SPYLOG_URL_RATIONAL_SIGMOID_D3T120URL feature computed from rapid clicks spy_log counters with decay of 3 days
FI_COUNTRY_QUERY_REGIONALITYСтрановый классификатор локализуемости — насколько запрос подразумевает контекст страны
FI_NUM_SLASHESЧисло слешей в урле
FI_BM25F_DPR_OBSOLETEBM25 с разными параметрами для разных полей, включая входящий анкортекст. Веса текста входящих на страницу ссылок нормируются в зависимости от delta page rank ссылки
FI_WATCH_VIDEOНаличие встроенного видеоплеера на странице
FI_DOWNLOAD_VIDEOВидео для скачивания
FI_RC_SPYLOG_URL_RATIONAL_SIGMOID_D3T120_FROZENURL feature computed from rapid clicks spy_log counters with decay of 3 days
FI_RC_SPYLOG_URL_RATIONAL_SIGMOID_D14T300URL feature computed from rapid clicks spy_log counters with decay of 14 days
FI_SUBRELEVСлужебный фактор, который нужен был для поиска по сайту, и в будущем еще будет нужен.
FI_GSK_URL_MODELФактор вычисляется из текста урла с помощью классификатора последовательностей quality/seq/gsk
FI_URL_TRIGRAMSМодель с обучением каждой триграммы на ‘+’ и ‘-‘ урлах. Не зависит от запроса.
FI_RC_SPYLOG_URL_RATIONAL_SIGMOID_D14T300_FROZENURL feature computed from rapid clicks spy_log counters with decay of 14 days
FI_RC_SPYLOG_AGEAge of rapid clicks spy_log update, in seconds
FI_RC_SPYLOG_FRESHNESSFreshness of rapid clicks spy_log update
FI_YMW_FULLРазмер минимального куска текста, включающего все встречающиеся в документе слова запроса. Сейчас не используется. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/YMW подробнее))
FI_BCLMФактор имени Buettcher, Clarke и Lushman (модифицированный) ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/BCLm подробнее))
FI_QUERY_COMMERCIALITY_MXМера ‘коммерческости’ запроса. Является комплексно рассчитываемым фактором MatrixNet формулой по словарю закупок в директе + по логам пользовательских запросов + доп. интентные словари. Запросы с интентом купить фактор стремится в ->1 товарные запросы ->0.6 с интентом не купить, обзоры и тп -> 0 ((http://wiki.yandex-team.ru/AntonNeljubin/FaktorydljaNovogoKlassifikatorazaprosov факторы классификатора))((http://wiki.yandex-team.ru/JandeksPoisk/Antispam/AntiSEO/KlassifikatorKommercheskixZaprosov еще про него))
FI_FIELD_LMУниграммная языковая модель. Моделируется языковая по документу, сглаживается общеязыковой моделью. При построении модели по документу используется информацию о том, в каком поле документа встретилось слово запроса (Title, head или plain text)
FI_GEO_CITY_URL_REGION_CITYСовпадение географии, определённой из урла документа и города запроса (ip или lr)
FI_GEO_CITY_URL_REGION_REGIONСовпадение географии, определённой из урла документа и области запроса (ip или lr)
FI_GEO_CITY_URL_REGION_COUNTRYСовпадение географии, определённой из урла документа и страны запроса (ip или lr). Актуально для России и Украины.
FI_GEO_CITY_URL_GEO_CITY_CITYСовпадение географии, определённой из урла документа и города в запросе (правило GeoCity)
FI_PAY_APP_DETECTOR_PREDICTЗначение форкнутого детектора коммерции, рассчитываемого в бегемоте.
FI_TITLE_TRIGRAMS_QВычисляет покрытие запроса буквенными триграммами заголовка документа
FI_TITLE_TRIGRAMS_TВычисляет покрытие заголовка буквенными триграммами заголовка документа
FI_INLINKS_MODELВероятностная модель, построенная по текстам входящих ссылок
FI_QUERY_WORD_SEQUENCES_TRСчитает сумму вхождений следующего вида: последовательность слов запроса длиной больше двух, встретившихся в одном предложении; нормировано на длину документа.
FI_QUERY_WORD_SEQUENCES_LRСчитает сумму вхождений следующего вида: последовательность слов запроса длиной больше двух, встретившихся в одной ссылке; нормировано на кол-во ссылок.
FI_OWNER_NAV_QUOTAДоля кликов по навигационным запросам
FI_GEO_RELEV_ALIEN_CITYРезультат имеет геопривязку, не совпадающую с географией пользователя на уровне города ([415]==1 && [215]==0)
FI_GEO_V_QUERY_IN_USERS_CITYГеовитальность запроса для результатов из региона пользователя
FI_GEO_V_QUERY_IN_ALIEN_CITYГеовитальность запроса для результатов не из региона пользователя
FI_HOST_RELIABILITYдоля урлов, которые отвечают без ошибок
FI_DMOZ_THEME_MATCH_ALLСовпадение тематического спектра (по DMOZ) запроса и документа. Тема запроса определяется ((http://wiki.yandex-team.ru/JandeksPoisk/ZarubezhnyjjInternet/DMOZqueryClassifier1 правилом колдунщика DMOZTheme )) Тематика документа определяется автоматическим классификатором
FI_DMOZ_THEME_MATCH_BESTСовпадение тематического спектра (по DMOZ) запроса и документа. Тема запроса определяется лучшим результатом ((http://wiki.yandex-team.ru/JandeksPoisk/ZarubezhnyjjInternet/DMOZqueryClassifier1 правила колдунщика DMOZTheme )) Тематика документа определяется автоматическим классификатором
FI_MPSAОценивает минимальное расстояние между парами слов запроса с учетом удаленности пары от начала документа (Minimal Pair Size with Attenuation). Под парами понимаются все последовательные биграммы слов запроса. Таким образом, количество пар равно количеству слов в запросе, уменьшенному на 1. Соответственно, фактор имеет смысл для запросов, состоящих более чем из одного слова.((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/MPSA MPSA))
FI_BCLM2Отличается от BCLm тем, что веса всех слов считаются одинаковыми. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/BCLm2 BCLm2))
FI_ABSOLUTE_PLMТекстовая релевантность на основе языковой модели, учитывающая абсолютную позицию. Идем по тексту с окошком 20 слов, строим по каждому окошку языковую модель (то есть распределение вероятностей на словах русского языка) и вычисляем вероятность порождения запроса. За удаление от начала документа штрафуем модель.
FI_PAGE_REGION_COVERAGENaN
FI_PAGE_REGION_SIZEРазмер региона страницы
FI_PAGE_REGION_REL_COVERAGENaN
FI_RC_SPYLOG_FRESHNESS_AT_REQFreshness of rapid clicks spy_log update, calculated at the request time
FI_QUERY_ISGEOCпускает на базовые поиски под именем isgeo максимальный вес встреченного геообъекта в запросе. Под геообъектом понимается объект категории Geo, Geo1, GeoAddr, GeoAddr1, LandMark, LandMark1 (см. ((http://wiki.yandex-team.ru/AlekseySokirko/QueryObjects som-овскую разметку))).((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares Подробнее))
FI_QUERY_ISMUSICCпускает на базовые поиски под именем ismusic максимальный вес встреченного объекта категории Music или Music1 в запросе. (см. ((http://wiki.yandex-team.ru/AlekseySokirko/QueryObjects som-овскую разметку))).((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares Подробнее))
FI_BCLM_LITEМодификация фактора Bclm2, облегченная для использования в фастранке. Основное отличие состоит в том, что в BclmLite не используются абсолютные смещения слов относительно начала документа. Вместо этого фактор работает с обычными позициями вида <Номер_предложения, Позиция_в_предложении>. При этом близость между словами учитывается только внутри предложения.((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/BCLmLite BCLmLite))
FI_QUERY_NEARBYПри ответе на запрос важны результаты в непосредственной близости ([аптеки], [детская поликлиника])
FI_QUERY_CITYПри ответе на запрос важны результаты внутри города (основная масса локализуемых запросов)
FI_QUERY_ADMПри ответе на запрос важны результаты из области, региона пользователя ([аэропорт], [молокозавод])
FI_NUM_LINKS_FROM_MPЧисло входящих ссылок с морд
FI_YMW_FULL2Исправленный YmwFull. Отличается от предыдущей версии только поведением на 2хсловных запросах. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/YMW подробнее))
FI_FULL_QUORUMБинарный фактор, каждое слово запроса есть в тексте или в линках
FI_AUXC_TEXT_BM25uses ‘country aux tree’ (auxqc)
FI_AUXC_LINK_BM25uses ‘country aux tree’ (auxqc)
FI_SOFT_404Страница — ‘404’ (доля токенов ‘404’ по отношению к общему числу токенов на странице)
FI_RC_SPYLOG_URL_RATIONAL_SIGMOID_D1T240_AT_REQURL feature computed at the request time from rapid clicks spy_log counters with decay of 1 day
FI_DBM25BM25, в котором вес слова машинноподобран
FI_QUERY_WORD_COHESION_TRФактор оценивает как слова запроса группируются друг с другом в тексте документа без учета их порядка. ((http://wiki.yandex-team.ru/SergejjKrylov/QueryWordCohesionTR описание))
FI_OWNER_SESS_NORM_DUR_REGnd/k нормированное время до клика
FI_RC_SPYLOG_URL_RATIONAL_SIGMOID_D0_5T30_AT_REQURL feature computed at the request time from rapid clicks spy_log counters with decay of 0.5 days
FI_QUERY_DOWNER_SESS_NORM_DUR_REGnd/k
FI_QUERY_DOWNER_WEIGHT_CLICK_REGw/k
FI_QUERY_DOWNER_ONLY_CLICK_RATE_REGo/i
FI_QUERY_DOWNER_CLICK_SUMMARY_REGподобранная формула
FI_QUERY_DOWNER_SATISFIED4_RATE_REGr_s4b/(r_k + 10)
FI_SEGMENT_AUX_ALPHAS_IN_TEXTКоличество букв в сегменте Aux
FI_SEGMENT_AUX_SPACES_IN_TEXTКоличество пробелов в сегменте Aux
FI_SEGMENT_CONTENT_COMMAS_IN_TEXTКоличество запятых в сегменте Content
FI_CLASSIF_IS_SHOPСтраница — магазин. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/OpisanijaFaktorov#isshop описание)). Не используется (deprecated)
FI_LR_GEO_RELEV_REGION_NATDOMNaN
FI_AURA_DOC_LOG_ORIGINЛогарифм числа шинглов в документе, добавленных хозяином сайта как оригинальные тексты в ((http://wiki.yandex-team.ru/JandeksPoisk/Jekosistema/MarketingPR/Webmasters/plan/vtorcontect Плагин Оригинальности)). В формуле не участвует, нужен для переранжирования дублей
FI_AURA_DOC_MEAN_FLT_AUTHOR_SOURCEСреднее фильтрованное число источников авторства документа. В формуле не участвует, нужен для переранжирования дублей
FI_QUERY_REF_TRIGRAM_Q((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/OpisanijaFaktorov#queryreftrigrams описание))
FI_QUERY_REF_TRIGRAM_R((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/OpisanijaFaktorov#queryreftrigrams описание))
FI_IDF_VARIANCEДисперсия IDF слов запроса при условии наличия текстовых хитов в документе (смешанный запросно-текстовый фактор)
FI_URL_NGRAMS_MODELФактор ранжирования UrlNGramsModel в erf
FI_NATIONAL_LANGUAGEЯзык документа соответствует стране запроса
FI_OWNER_IS_COMMERCIALNaN
FI_GEO_COUNTRY_URL_REGION_COUNTRYNaN
FI_GEO_COUNTRY_URL_GEO_COUNTRYNaN
FI_NUM_LINKS_FROM_SEGMENT_CONTENTNaN
FI_LOCMПорядок слов в ссылках.
FI_URL_QUERY_VARIETY_REGСтепень разнообразия запросов, по которым кликают данный урла, cчитается по регионам
FI_URL_SESS_NORM_DUR_RATE_REGnd/i
FI_FILTRATION_SEGMENTSДоля сегментов запроса, присутствующая в тексте
FI_LANGUAGE_GOOD_FOR_TURKEYЯзык документа — один из допустимых для Турции (турецкий, английский, немецкий, французский, арабский, азербайджанский) либо документ имеет нулевую длину. На поисковой стадии вычисляется только для IsRealGeoLocal запросов.
FI_DBM25_2Вариация на тему ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/DBM25 DBM25)), см. ysite/yandex/relevance/dbm25.cpp
FI_GEO_DISPERSIONДисперсия регионов ссылок на документ
FI_QUERY_DOWNER_ENOUGH_CLICKEDКоличество кликов по владельцу и количество кликов по запросу больше 5
FI_BM25F_DPR_FIXEDBM25FdPR с нормировкой на среднюю длину документа, зависящую от языка документа. ((http://wiki.yandex-team.ru/BM25FRework Результаты тестирования.))
FI_LANG_POPULARITYПопулярность языка документа. Число от 0 до 1. ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/LanguagePopularity LanguagePopularity))
FI_QUERY_DOWNER_WS_FRC_AND_BM25F_DPR_FIXEDСумма факторов QueryDOwnerClicksFRC и BM25FdPRFixed с весами 0.358449 и 0.184922 соответственно. ‘565’ в названии фактора не надо воспринимать буквально, это легаси либо опечатка.
FI_QUERY_DOWNER_WS_MAX_WHR_AND_ONLY_CLICK_RATEСумма факторов 192 и 341 с весами 0.298942 и 0.454625 соответственно.
FI_RC_SPYLOG_URL_RATIONAL_SIGMOID_D3T120_AT_REQURL feature computed at the request time from rapid clicks spy_log counters with decay of 3 days
FI_RC_SPYLOG_URL_RATIONAL_SIGMOID_D14T300_AT_REQURL feature computed at the request time from rapid clicks spy_log counters with decay of 14 days
FI_TOCMФактор оценивает отличия позиций слов в заголовке от позий слов в запросе
FI_RELEV_GEO_LINKS_PERCENTNaN
FI_LANG_DISPERSIONДисперсия языков в xmap
FI_HAS_MISSPELLВ запросе есть опечатка
FI_DBM30_SMERCHВариация на тему ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/DBM25 DBM25)), см. ysite/yandex/relevance/dbm25.cpp
FI_IS_URL_FOR_CLICK_DEBOOSTПро урл известно что он показывается слишком часто с очень низкой релевантностью (по берту и/или по bm25)
FI_URL_LINK_PERCENTОтношение числа входящих ссылок, текст которых является URL, к числу всех входящих ссылок
FI_DSSM_BERT_DISTILL_L2Размечается пул из PRS логов при помощи Bert, обученного на sinsig. На этом пуле обучается dssm модель, с использованием BaseRegionChain
FI_NUM_NON_LETTERS_IN_URLКоличество ‘небукв’ в урле
FI_URL_LENGTH_2Длина URL’а с точностью до символа. Отключено в продакшн.
FI_IS_HUBХабовость страницы
FI_STATIC_TITLE_COMMСтепень комерческости заголовка страницы. Не используется (deprecated)
FI_STATIC_TITLE_BM25_EXBM25 заголовка страницы по её тексту
FI_STATIC_TITLE_LR_BM25BM25 заголовка страницы по текстам ссылок на неё
FI_SEO_IN_PAY_LINKSКоличество входящих сео-треш ссылок между хостами
FI_US_LONG_PERIOD_URL_MOBILE_DT180_AVGСтатический URL фактор по поисковым сессиям за 1600 дней рассчитанный по мобильным сессиям. Средний DwellTime, причем DwellTime из сессии обрезается, если больше 180 секунд
FI_US_LONG_PERIOD_URL_MOBILE_LONG_CLICK_PROBСтатический URL фактор по поисковым сессиям за 1600 дней рассчитанный по мобильным сессиям. Вероятность что клик по URL будет больше 120 секунд
FI_US_LONG_PERIOD_URL_MOBILE_LOSSES_PROBСтатический URL фактор по поисковым сессиям за 1600 дней рассчитанный по мобильным сессиям. Вероятность что на URL не кликнут, если кликнут хотя бы на один URL ниже.
FI_US_LONG_PERIOD_URL_MOBILE_DT3600_AVG_REGСтатический URL фактор по поисковым сессиям за 1600 дней рассчитанный по мобильным сессиям. Средний DwellTime, причем DwellTime из сессии обрезается, если больше 3600 секунд. Локализация до уровня стран.
FI_US_LONG_PERIOD_URL_MOBILE_DT180_AVG_REGСтатический URL фактор по поисковым сессиям за 1600 дней рассчитанный по мобильным сессиям. Средний DwellTime, причем DwellTime из сессии обрезается, если больше 180 секунд. Локализация до уровня стран.
FI_HP_DETECTOR_PREDICTЗначение детектора здоровья, рассчитываемого в бегемоте.
FI_IS_FEED_LISTINGOffersBase feature for ecoboost.
FI_IS_FEED_MAINOffersBase feature for ecoboost.
FI_IS_FEED_STRATOCASTEROffersBase feature for ecoboost.
FI_IS_FEED_ANYOffersBase feature for ecoboost.
FI_TITLE_IN_LINKS_TRIGRAMSДоля уникальных триграмм заголовка в триграммах ссылок
FI_LINKS_IN_TITLE_TRIGRAMSДоля уникальных триграмм ссылок в триграммах заголовка
FI_TRASH_ADVЗарекламленность страницы
FI_METRIKA_URL_VISITSАналогичный YabarUrlVisits
FI_URLGEO_ADMSURL документа соответствует региону(области) пользователя ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/geo/RegNavQueries /JandeksPoisk/KachestvoPoiska/geo/RegNavQueries))
FI_URLGEO_CITYURL документа соответствует городу пользователя
FI_REG_NAV_QUERYРегионально-навигационный запрос — в регионе пользователя есть один или несколько навигационных результатов по нему
FI_YABAR_URL_LCACЧисло сессий в которых урл являлся последним, отнесенное к числу сессий в которых урл появлялся
FI_SOWNER_MAX_SUM_SOURCE_RANKСумма максимальных значений SourceRank’ов для каждой входящей ссылки с учётом уникальности владельца.
FI_DBM35BM25 по текстам и линкам со спец. весами по уровню совпадения (форма, лемма, синоним)
FI_TRLR_QUORUM_FMВес слов запроса, которые есть в тексте в точной форме
FI_TRLR_QUORUM_LEMMAВес слов запроса, которые есть в тексте с точностью до леммы
FI_TRLR_QUORUM_SYNВес слов запроса, которые есть в тексте
FI_QUERY_ISHUMCпускает на базовые поиски под именем ishum максимальный вес встреченного объекта категории Hum или Hum1 в запросе. (см. ((http://wiki.yandex-team.ru/AlekseySokirko/QueryObjects som-овскую разметку))).((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares#ishum Подробнее))
FI_QUERY_ISTEXTCпускает на базовые поиски под именем istext максимальный вес встреченного объекта категории Text или Text1 в запросе. (см. ((http://wiki.yandex-team.ru/AlekseySokirko/QueryObjects som-овскую разметку))).((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares#istext Подробнее))
FI_QUERY_ISPICTURECпускает на базовые поиски под именем ispicture максимальный вес встреченного объекта категории Picture или Picture1 в запросе. (см. ((http://wiki.yandex-team.ru/AlekseySokirko/QueryObjects som-овскую разметку))).((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares#ispicture Подробнее))
FI_QUERY_MAXONEВозвращает под именем wmaxone максимальную степень нарицательности встреченных объектов в запросе. (см. ((http://wiki.yandex-team.ru/AlekseySokirko/QueryObjects som-овскую разметку))).((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares#maxone Подробнее))
FI_QUERY_MINONEВозвращает под именем wminone максимальную степень нарицательности встреченных объектов в запросе. (см. ((http://wiki.yandex-team.ru/AlekseySokirko/QueryObjects som-овскую разметку))).((http://wiki.yandex-team.ru/ArsenGadzhikurbanov/Wares#minone Подробнее))
FI_OQ_BM25_STRBm25 по запросному индексу для domAttr
FI_OQ_BM25_LEMBm25 по запросному индексу для domAttr
FI_OQ_BM25_SYNBm25 по запросному индексу для domAttr
FI_OQ_BCLM_WEIGHTEDBCLM по запросному индексу для domAttr
FI_OQ_BCLM_PLAINBCLM по запросному индексу для владельцев
FI_LINKS_ALIVEПозволяет оценить является ли документ ‘живым’ с точки зрения ссылок на него приходящих.
FI_SMALL_WINDOWМаксимальная сумма вес слов запроса в окне в 50 слов
FI_METRIKA_URL_VISITORSАналогичный YabarUrlVisitors
FI_METRIKA_URL_AVG_TIMEАналогичный YabarUrlAvgTime
FI_METRIKA_URL_CORE_AUDIENCEЯдро аудитории страниц на которых есть счетчик Метрики
FI_REGEX_MAX_CLICK_PERCENTДоля кликов по данному урлу среди всех кликов по похожим запросам
FI_REGEX_CTRcorrected CTR данного урла по всем похожим запросам
FI_DOM_PHRASE_CLICK_RANK_BIКликабельность домена по биграммам (без учёта тезаурусных расширений запросов)
FI_DOM_PHRASE_YABAR_BIПереходы на сайт из поисковиков по биграммам, по данным Бара (без учёта тезаурусных расширений запросов)
FI_LAST_WORD_HOST_CLICKSКликабельность хоста по последнему слову запроса (без учёта тезаурусных расширений запросов)
FI_HOST_HAS_FEED_URLSOffersBase feature for ecoboost.
FI_IS_FEED_OFFEROffersBase feature for ecoboost.
FI_HOST_ECOM_KERNEL_1Business kernel.
FI_HOST_ECOM_KERNEL_2Business kernel.
FI_HOST_ECOM_KERNEL_3Business kernel.
FI_RC_SEARCH_BASE_URL_RATIONAL_SIGMOID_D1TM600_AT_REQURL feature computed at the request time from rapid clicks search counters with decay of 1 day
FI_SYNSET_LOCMКопия фактора ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Locm LOCM)) для((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Synset синсетов)).
FI_SYNSET_LINK_BM25Копия фактора LinkBM25 для ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Synset синсетов)).
FI_RC_SEARCH_BASE_URL_CONTRAST_D30ODD0_9_X_D30T1_AT_REQURL feature computed at the request time from rapid clicks search counters with decay of 30 days
FI_REMOVED_639NaN
FI_DMOZ_QUERY_BEST_THEMEНаиболее вероятная тема запроса, определяемая ((http://wiki.yandex-team.ru/JandeksPoisk/ZarubezhnyjjInternet/DMOZqueryClassifier1 правилом колдунщика DMOZTheme)), учитываются только самые популярные темы (но здесь их больше чем в факторе DmozQueryThemes). Фактор содержит вероятность соотвествия запроса тематике, но для каждой темы берётся свой интервал на отрезке [0..1]
FI_DMOZ_QUERY_THEMESТема запроса, определяемая ((http://wiki.yandex-team.ru/JandeksPoisk/ZarubezhnyjjInternet/DMOZqueryClassifier1 правилом колдунщика DMOZTheme)), учитываются только несколько самых популярных тем.
FI_DIVERSITY_CATEG_NEED_PHOTO0 или 1 в зависимости от наличия в запросе явно выраженного интента need_photo из разнообразия
FI_DIVERSITY_CATEG_NEED_MAP0 или 1 в зависимости от наличия в запросе явно выраженного интента need_map из разнообразия
FI_LONG_QUERY_SYNФактор — аналог LongQuery (сумма idf слов запроса), но с ‘корректным’ учетом синонимов. Конкретно — выбирается минимум по idf (т.е. самое частое) из синонимов и слова.
FI_URL_HAS_SHORT_COUNTRY_NAME_TOKENУрл содержит токен, совпадающий с коротким названием страны пользователя. Фактор считается только на EU потоке.
FI_TURKEY_PAGE_RANKПерсонализированный турецкий PageRank
FI_EXPECTED_FOUNDОжидаемое количество найденного по запросу
FI_FOOTER_IN_LINKS_TRIGRAMSДоля уникальных триграмм фрагмента футера в триграммах ссылок
FI_LINKS_IN_FOOTER_TRIGRAMSДоля уникальных триграмм ссылок среди фрагмента триграмм футера
FI_ERRATUM_LOG_QUERY_PROBABILITYДвоичный логарифм вероятности запроса по языковой модели сервиса опечаток erratum
FI_URL_IS_MARKET_OFFERUrl является оффером в последней версии базы маркета.
FI_DBM40Вариация на тему ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/DBM25 DBM25)), см. ysite/yandex/relevance/dbm25.cpp
FI_REMOVED_653NaN
FI_BM25_0Вариация на тему BM25
FI_BM25_1Вариация на тему BM25
FI_BM25_0123Вариация на тему BM25
FI_QUERY_URL_CORRECTED_CTRИсправленные’ клики, посчитанные с помощью RequestAggregateLib
FI_QUERY_URL_CORRECTED_CTR_REGИсправленные’ клики, посчитанные с помощью RequestAggregateLib. Региональная версия
FI_YABAR_URL_VISITS_REGРегиональная Посещаемость урла по данным я-бара
FI_METRIKA_URL_HOST_VISIT_TIMEСреднее время пребывания юзера на хосте при внешнем (с другого не-поискового сайта) заходе с конкретного URL
FI_METRIKA_URL_HOST_VISIT_DEPTHСредняя ‘глубина’ (количество переходов в рамках хоста) пребывания юзера на хосте при внешнем (с другого не-поискового сайта) заходе с конкретного URL
FI_DBM_NUMBERSDBM отдельно по числам
FI_DBM_GEODBM отдельно по гео-объектам запроса
FI_DBM_SUBSTANTIVEDBM отдельно по существительным
FI_AVG_SESSION_LENСредняя длина логической сессии, в которой был запрос
FI_NHOP_TEXT_BCLM_WEIGHTEDBclm (weighted) по текстам из хопов.
FI_YABAR_URL_DOWNLOADSоценка вероятности скачки с документа
FI_BOCMОценивает соответствие позиций слов в предложениях документа позициям слов в запросе.
FI_HOST_USER_LEAKAGEКоэффициент оттока пользователей из поиска после визита на сайт
FI_FIO_MATCHВ документе присутствует ФИО из запроса.
FI_IS_INDEX_PAGEЭто index.(html/php/aspx?/…), без cgi параметров. Считается по всем дублям.
FI_IS_INDEX_PAGE_SOFTЭто index.(html/php/aspx?/…), возможно с cgi параметрами. Считается по всем дублям.
FI_IS_OWNERЯвляется ли хост сам себе владельцем, условно Host == Owner(Host).
FI_MIN_PATH_LENМинимальная длина PathAndQuery по всем полудублям.
FI_LERF_GEO_LR_LOG_RELEV_CNTРегионализированный (берутся только ссылки из страны запроса) вариант фактора XLerfGeoLRlogRelev
FI_NON_COMM_LERF_NORM_LR_LOG_RELEV_CNTРегионализированный (берутся только ссылки из страны запроса) вариант фактора XNonCommLerfNormLRlogRelev
FI_LOCM_CNTРегионализированный (берутся только ссылки из страны запроса) вариант фактора Locm
FI_LR_RELEV_CNTРегионализированный (берутся только ссылки из страны запроса) вариант фактора XLRrelev
FI_LERF_LR_RELEV_200_CNTРегионализированный (берутся только ссылки из страны запроса) вариант фактора XLerfLRrelev200
FI_NAV_LINEAR((http://wiki.yandex-team.ru/JandeksPoisk/Antispam/polunavigacionnyezaprosy#faktornavigacionnostiparyurl-zapros классификатор)) пар витальников [запрос-урл], урл витальный для запроса, если значение на нём >0.5
FI_RANK_COM_GOODNESSКлассификатор по оценкам коммерческих сайтов
FI_HAS_DOWNLOAD_LINK_ON_FILEНа документе есть прямая ссылка на файл
FI_HAS_DOWNLOAD_LINK_ON_FILE_HOSTINGНа документе есть ссылка на файлхостинг
FI_DIVERSITY_CATEG_DOWNLOAD0 или 1 — матчится ли запрос регулярке из тикета
FI_DIVERSITY_CATEG_REVIEW0 или 1 — матчится ли запрос регулярке из тикета
FI_DIVERSITY_CATEG_WATCH0 или 1 — матчится ли запрос регулярке из тикета
FI_TUR_QRПредсказание доли «хороших»(хотя бы с двумя разными городами и частотой>=10) упоминаний запроса с географией в Турции
FI_QUERY_TH3561Результат работы лексического классификатора запросов, предсказывающего вероятность клика по странице тематики 3561
FI_QUERY_TH3973Результат работы лексического классификатора запросов, предсказывающего вероятность клика по странице тематики 3973
FI_QUERY_IS_NAV_MXРанг ‘навигационности’ запроса
FI_QUERY_URL_YABAR_VISITS_REGрегиональная посещаемость из поисковиков по конкретному запросу
FI_CLICKED_WITH_ANOTHER_SE_CLICKSКлики по урлам показываемых в выдаче для запросов, по которым ушли искать в другие поисковики
FI_SHOWS_WITH_ANOTHER_SE_CLICKSПоказы урлов в выдаче для запросов, по которым ушли искать в другие поисковики
FI_COMMERCIAL_OWNER_RANK_REGКлассификатор коммерческости сайта
FI_HOST_IS_MARKET_OFFERВ последней версии базы маркета есть офферы с данного хоста.
FI_BCLM_MAXБлизость слов запроса к самому тяжелому слову.
FI_URL_PRON_REGEXP_MATCHУрл удовлетворяет regexp-выражению, заданному в проне
FI_HAS_USER_REVIEWSДокумент содержит пользовательский отзыв/комментарий
FI_REGEX_MAX_CLICK_PERCENT_REGДоля кликов по данному урлу среди всех кликов по похожим запросам, страновая версия, см. ((http://wiki.yandex-team.ru/Development/Poisk/arcadia/indexregex indexregex))
FI_REGEX_CTR_REGcorrected CTR данного урла по всем похожим запросам, страновая версия, см. ((http://wiki.yandex-team.ru/Development/Poisk/arcadia/indexregex indexregex))
FI_FOUNDСреднее количество найденного по запросу
FI_YABAR_WORD_DNGIУгол в пространстве Depth Nodes, посчитанный только по словам (Min по всем)
FI_DBM15_WARESNaN
FI_RANK_COM_GOODNESS_BARКлассификатор, аппроксимирующий качество коммерческих сайтов на основе данных о пользовательском поведении
FI_DOC_CREATE_MONTHВремя создания документа с точностью до месяца 1.0 — текущий месяц, 0 —- 10 лет назад и старше. Временно отключен
FI_DOC_UPDATE_MONTHВремя обновления документа с точностью до месяца 1.0 — текущий месяц, 0 —- 10 лет назад и старше. Временно отключен
FI_LR_SOURCERANKNaN
FI_LR_MAINPAGENaN
FI_DATER_STATS_YEAR_NORM_LIKELIHOODФункция правдоподобия распределения годов в документе. Временно отключен
FI_HOST_NUM_SOVETNIKNum of Sovetnik urls
FI_LCM_VARДисперсия количества слов запроса в ссылках.
FI_DATER_STATS_AVERAGE_SOURCE_SEGMENTСреднее арифметическое позиций дат в документе. Временно отключен
FI_DBM15_WARES2NaN
FI_CABMBM с затуханием по тексту каталожных ссылок.
FI_BEAST_NQUERY_URL_MEAN_POSСредняя позиция урла по нормализованному запросу
FI_BEAST_NQUERY_OWNER_MEAN_POSСредняя позиция domAttr по нормализованному запросу
FI_BEAST_URL_MEAN_POSСредняя позиция урла по всем запросам
FI_BEAST_HOST_MEAN_POSСредняя позиция хоста по всем запросам
FI_BEAST_URL_NUM_QUERIESКоличество запросов на урл
FI_BEAST_HOST_NUM_QUERIESКоличество запросов на хост
FI_YABAR_HOST_BROWSE_RANK_REGреализация алгоритма описанного в статье ((http://wiki.yandex-team.ru//h.yandex.net/?http%3A%2F%2Fresearch.microsoft.com%2Fen-us%2Fpeople%2Ftyliu%2Ffp032-liu.pdf http://research.microsoft.com/en-us/people/tyliu/fp032-liu.pdf)) по крупным регионам (ТРУБК)
FI_REMOVED_722NaN
FI_SEGMENT_WORD_PORTION_FROM_MAINCONTENTДоля слов документа из сегментов со score > 2.
FI_URL_DOMAIN_SIMILARITY_FIXEDNaN
FI_TOTAL_DUPSNaN
FI_RANK_BOOST_GOODNESSРанг качества сайта, используемый для бустов московской коммерческой формулы
FI_QUERY_DOWNER_CLICKS_FRC_REG_GEONaN
FI_QUERY_URL_CLICKS_FRC_REG_GEONaN
FI_LANGUAGE_DISTRIBUTIONNaN
FI_URL_SHOWS_WITH_NEXT_PAGE_CLICKS_P1NaN
FI_URL_SHOWS_WITH_NEXT_PAGE_CLICKS_P10Фактор используется в SelectionRank. TG_UNUSED: не должен входить в формулы во избежание обратной связи
FI_URL_CLICKS_PCTR_YEARNaN
FI_URL_CLICKS_PCTR_YEARPNaN
FI_SMALL_WINDOW_ATTENUATIONNaN
FI_RC_SEARCH_BASE_URL_RATIONAL_SIGMOID_D3T120_AT_REQURL feature computed at the request time from rapid clicks search counters with decay of 3 days
FI_OWNER_CTR_WITH_NEXT_PAGE_CLICKS_P10NaN
FI_COMM_RUSВес документа по однословному словарю коммерческой лексики
FI_WIKI_LINK_COUNTNaN
FI_URL_IN_LINKS_TRIGRAMS_STATICNaN
FI_LINKS_IN_URL_TRIGRAMS_STATICNaN
FI_UKR_IS_QUERY_LANGПоказывает, что запрос на украинском языке
FI_QUERIES_AVG_CM2Average query commerciality
FI_QI_QUERY_COUNTКоличество запросов в группе частотных запросов похожих на заданный
FI_QI_URL_FREQ_WEIGHTED_FRCFRC группы частотных запросов похожих на заданный, с усреднением через сумму кликов и показов
FI_QI_URL_FREQ_WEIGHTED_FRC_REGFRC группы частотных запросов похожих на заданный, с усреднением через сумму кликов и показов, по региональной статистике
FI_RC_SEARCH_BASE_URL_RATIONAL_SIGMOID_D1TM600_FROZENURL feature computed from rapid clicks search frozen counters with decay of 1 day
FI_WORD_HOST_WIKI_SUMОтносительная популярность пары word-host, где word — слово из title статьи в Википедии, а host — хост, на который ссылаются в данной статье.
FI_REG_WORD_HOST_CLICKS_SUMОтносительная кликабельность тройки countryId-word-host по данным поисков в Яндексе.
FI_REG_WORD_HOST_YABAR_SUMОтносительная кликабельность тройки countryId-word-host по данным с популярных поисковиков по логам Бара и SimilarGroup.
FI_REGEX_MAX_CLICK_PERCENT_YABAR_REGДоля кликов по данному урлу среди всех кликов по похожим запросам, посчитанная по popular search engine
FI_YABAR_HOST_SURFTR_DEPTH_NODES_LEAFLNДлина лепестка Depth Nodes, посчитанная для хостов
FI_YABAR_HOST_SURFTR_NODES_TIME_GRDISPДисперсия угла в пространстве Nodes Time, посчитанная для хостов
FI_YABAR_HOST_SURFTR_NODES_TIME_LEADFLN900.9-квантиль длины лепестка в пространстве Nodes Time, посчитанная для хостов
FI_WORD_HOST_DOWNLOAD_PROBABILITYСредняя по словам запроса вероятность скачать файл с хоста после клика.
FI_NASTY_CONTENTФактор гадкости контента.
FI_URL_SYNNORM_PCTRCTR по кликовым данным, запрос нормализованы по синсетам
FI_URL_SYNNORM_PCTR_REGРегиональный CTR по кликовым данным, запрос нормализованы по синсетам
FI_URL_QUERY_TRIGRAMS_STATICStatic trigrams intercection of url and queries by which users visited the url.
FI_ADV_ASPAMNaN
FI_HAS_PORNO_QUERYРезультат работы adult правила колдунщика.
FI_QU_BM15_WEIGHTEDВзвешенный BM15 для запроса по индексу документ — список запросов по которым на него переходили.
FI_WS_IS_INDEX_PAGE_AND_BOCMNaN
FI_WS_IS_INDEX_PAGE_AND_QUERY_IS_NAV_MXNaN
FI_BROWSER_HOST_DOWNLOAD_PROBABILITYВероятность скачки с хоста после клика (по логам Бара).
FI_NHOP_CHAINS_COUNT_FRCКоличество цепочек по запросу / (количество цепочек, в которых участвовал урл + количество цепочек по запросу).
FI_NHOP_IS_FINALКоличество цепочек, в которых урл был последним, нормированное на общее количество цепочек, в которых был данный урл.
FI_VISITS_FROM_WIKIКоличество переходов на урл с Википедии
FI_RC_SEARCH_BASE_URL_CONTRAST_D30ODD0_9_X_D30T1_FROZENURL feature computed from rapid clicks search frozen counters with decay of 30 days
FI_REG_BROWSER_USER_HUBПоказатель страницы как хаба (на какое число страниц пользователи Бара переходят с неё).
FI_AUX_TITLE_BM25Считается TextBM25 в тайтле по тексту названия региона пользователя — аналогично фактору 268.
FI_BCLMFBCLM for Annotation index, doc text and links.
FI_NO_PRODUCTS_PROBABILITYDssm предсказание вероятности по url + title, что на странице нет товаров.
FI_PSE_FRC_BROWSERFRC популярной поисковой системы по логам браузера
FI_LOG_CTR_MEANWeighted mean of log(query_clicks)/log(query_shows) for given host. Weights are proportional to log(query_shows) + 0.2.
FI_QUERY_URL_NHOP_TOTAL_FRCКоличество переходов по запросу на урл, встречающийся в цепочек хопов, нормированное на общее чесло переходов по запросу.
FI_QUERY_URL_NHOP_IS_FINALВероятность урла быть последним по запросу в цепочке хопов.
FI_ONE_PRODUCT_PROBABILITYDssm предсказание вероятности по url + title, что на странице один товар.
FI_MANY_PRODUCTS_PROBABILITYDssm предсказание вероятности по url + title, что на странице много товаров.
FI_RC_SEARCH_BASE_URL_RATIONAL_SIGMOID_D3T120_FROZENURL feature computed from rapid clicks search frozen counters with decay of 3 days
FI_GEO_CITY_URL_HAS_CITYДля урла определена геопривязка уровня города по правилам BUKI-1125
FI_GEO_CITY_URL_HAS_COUNTRYДля урла определена геопривязка уровня страны по правилам BUKI-1125
FI_GEO_RELEV_REGION_CITY_GEOAФактор GeoRelevRegionCity по аттрибуту geoa
FI_GEO_RELEV_REGION_REGION_GEOAФактор GeoRelevRegionRegion по аттрибуту geoa
FI_GEO_GEOMETRY_PROXIM_GEOAФактор GeoGeometryProxim по аттрибуту geoa
FI_GEO_RELEV_ALIEN_CITY_GEOAФактор GeoRelevAlienCity по аттрибуту geoa
FI_GEO_V_QUERY_IN_USERS_CITY_GEOAФактор GeoVQueryInUserCity по аттрибуту geoa
FI_GEO_V_QUERY_IN_ALIEN_CITY_GEOAФактор GeoVQueryInAlienCity по аттрибуту geoa
FI_PAGE_REGION_SIZE_GEOФактор PageRegionSize по атрибуту geo
FI_PAGE_REGION_COVERAGE_GEOФактор PageRegionCoverage по атрибуту geo
FI_PAGE_REGION_COVERAGE_ADRESAФактор PageRegionCoverage по атрибуту adresa
FI_GEO_RELEV_REGION_CITY_ADRESAФактор GeoRelevRegionCity по атрибуту adresa
FI_DOPP_URL_SESSION_CLICKS_FRCКакую часть (в среднем по сессии) от кликнутых по данному query урлов составляет данный url. Считается по пользовательским сессиям.
FI_OWNER_IS_ACTUAL_SHOPОвнер является магазином
FI_OWNER_IS_SERVICEОвнер является сервисом
FI_NHOP_TEXT_BCLM_PLANEBclm (plane) по текстам из хопов.
FI_SAME_QUERY_FRC_BROWSERFRC по переходам с запросов, которые были заданы пользователем несколько раз
FI_QUERY_URL_ISBM_CTRСредний вес показов на первой странице; клик весит 1, не-клик — согласно таблице SBM_GAMMAS
FI_QUERY_URL_ISBM_CTR_REGСредний вес показов на первой странице; клик весит 1, не-клик — согласно таблице SBM_GAMMAS. Региональная версия
FI_REGEX_BEAST_POSITION_REGполусумма оценки позиции урла с медианной позицией по всем похожим запросам по бистам
FI_RC_SPYLOG_HOST_RATIONAL_SIGMOID_D3T0_AT_REQHost feature computed at the request time from rapid clicks spy_log counters with decay of 3 days
FI_RC_SPYLOG_HOST_RATIONAL_SIGMOID_D3T0DTM3600_AT_REQHost feature computed at the request time from rapid clicks spy_log counters with decay of 3 days
FI_RC_SPYLOG_HOST_RATIONAL_SIGMOID_D14T0_AT_REQHost feature computed at the request time from rapid clicks spy_log counters with decay of 14 days
FI_RC_SPYLOG_HOST_RATIONAL_SIGMOID_D14DTM3600_AT_REQHost feature computed at the request time from rapid clicks spy_log counters with decay of 14 days
FI_RC_SPYLOG_HOST_RATIONAL_SIGMOIDED_CTRD3DT0TM3600_AT_REQHost feature computed at the request time from rapid clicks spy_log counters with decay of 3 days
FI_RC_SPYLOG_HOST_RATIONAL_SIGMOIDED_CTRD14DT0TM3600_AT_REQHost feature computed at the request time from rapid clicks spy_log counters with decay of 14 days
FI_RC_SPYLOG_HOST_RATIONAL_SIGMOID_D3T0_FROZENHost feature computed from rapid clicks spy_log counters with decay of 3 days
FI_RC_SPYLOG_HOST_RATIONAL_SIGMOID_D3T0DTM3600_FROZENHost feature computed from rapid clicks spy_log counters with decay of 3 days
FI_RC_SPYLOG_HOST_RATIONAL_SIGMOID_D14T0_FROZENHost feature computed from rapid clicks spy_log counters with decay of 14 days
FI_RC_SPYLOG_HOST_RATIONAL_SIGMOID_D14DTM3600_FROZENHost feature computed from rapid clicks spy_log counters with decay of 14 days
FI_RC_SPYLOG_HOST_RATIONAL_SIGMOIDED_CTRD3DT0TM3600_FROZENHost feature computed from rapid clicks spy_log counters with decay of 3 days
FI_RC_SPYLOG_HOST_RATIONAL_SIGMOIDED_CTRD14DT0TM3600_FROZENHost feature computed from rapid clicks spy_log counters with decay of 14 days
FI_COMMERCIAL_DSSM_ODD_LIKEFinetuned reformulations DSSM to commercial clicked bargain odd-like target from visit log
FI_DISTRIBUTOR_HOSTSIs legal video distributor
FI_ONE_PRODUCT_PROBABILITY_AVGAverage value of feature OneProductProbability
FI_MANY_PRODUCTS_PROBABILITY_AVGAverage value of feature ManyProductsProbability
FI_PAY_DETECTOR_PREDICT_AVGAverage value of feature PayDetectorPredict
FI_OWNER_IS_PARTNERОвнер является партнером
FI_SHOP_IN_SHOP_URLДокумент является ShopInShop
FI_QUERY_CONVERSION_DETECTOR_PREDICTЗначение конверсионности запроса, рассчитываемого в бегемоте.
FI_FIO_FROM_ORIGINAL_REQUEST_BODY_CHAIN0_WCMФактор по ФИО из оригинального запроса Считается по содержимому документа. Алгоритм: Chain0Wcm
FI_PRODUCT_OFFER_ANY_AVAILABLEХотя бы у одного оффера из распаршенной схемы есть статус о доступности.
FI_PRODUCT_OFFER_NO_PRODUCTSВ распаршенной схеме нет ни одного оффера.
FI_BAD_YTIER_URLДля урла из ytier известно что у него контент низкого качества
FI_NORM_YTIER_URLДля урла из ytier известно что у него контент приемлимого качества
FI_GOOD_YTIER_URLДля урла из ytier известно что у него контент хорошего качества
FI_BEST_YTIER_URLДля урла из ytier известно что у него контент отличного качества
FI_HOST_IS_ECOM_PURCHASEНа хосте есть покупка по ECOMу.
FI_HOST_IS_VISIT_LOGS_PURCHASEНа хосте есть покупка по VISIT LOGу.
FI_YANDEX_MARKET_PRODUCT_URLURL является продуктом на Маркете.
FI_YANDEX_MARKET_PRODUCT_INCLUDE_OFFERID_URLURL является продуктом на Маркете и имеет offerid.
FI_SHOP_IN_SHOP_CPA_URLURL является ShopInShopCPA.
FI_PRODUCT_OFFER_NOT_AVAILABLEХотя бы у одного оффера из распаршенной схемы есть статус о недоступности.
FI_OWNER_IS_ECOM_PURCHASEНа owner’е есть покупка по ECOMу.
FI_OWNER_IS_VISIT_LOGS_PURCHASEНа owner’е есть покупка по VISIT LOGу.
FI_NAV_PARASITESDssm предсказание вероятности по url + title, что документ нахлебник.
FI_OFFER_AVAILABILITY_IS_SET_UPВ оффере из нового парсера выставлено поле PartnerOfferContent available.
FI_OFFER_AVAILABILITYВ оффере из нового парсера поле PartnerOfferContent available == true.
FI_URL_CLICKS_MAX_GEO_CITY_FRC_WEIGHTNormalized corrected clicks count by query with user’s city(gc=) mentioned
FI_URL_CLICKS_MAX_GEO_CITY_FRC_RATIONormalized corrected clicks maximum ratio by query with user’s city(gc=) mentioned
FI_URL_CLICKS_MAX_ALIEN_GEO_CITY_FRC_RATIONormalized corrected clicks maximum ratio by query with not user’s city(gc=) mentioned
FI_FAST_MXNaN
FI_PURCHASE_TOTAL_PREDICTЗначение PurchaseTotalPredict, рассчитываемого в бегемоте.
FI_SERP_SUMMARY_SURPLUS_PREDICTЗначение SerpSummarySurplusPredict, рассчитываемого в бегемоте.
FI_YABAR_URL_REVISITSВозвращаемость пользователя на url
FI_REQUEST_WITH_120_D3_CLICK_PART_PREDICTЗначение RequestWith120D3ClickPartPredict, рассчитываемого в бегемоте.
FI_QUERY_NAV_PARASITES_DETECTOR_PREDICTЗначение запросного детектора нахлебников, рассчитываемого в бегемоте.
FI_BROWSER_HOST_CNT_DWELL_TIME_LOGЛогарифм среднего времени нахождения пользователя на хосте с локализацией по стране; считается по данным логов Yabar
FI_BROWSER_HOST_DWELL_TIME_REGION_FRCОтношение dwell time на хосте в данном регионе к dwell time на хосте по всем регионам
FI_BROWSER_URL_DWELL_TIME_REGION_FRCОтношение dwell time на странице в данном регионе к dwell time на странице по всем регионам
FI_BROWSER_BOOKMARKS_URLThe more users add to bookmarks a url, the more factor value it has
FI_SOS_DSSMПредсказание sos.dssm модели по url + title.
FI_MED_DSSMПредсказание med.dssm модели по url + title.
FI_FIN_LAW_DSSMПредсказание fin_law.dssm модели по url + title.
FI_WIKI_INFOBOXНа данный урл есть ссылка из Infobox-ов в Википедии.
FI_CRUELTY_DSSMПредсказание cruelty.dssm модели по url + title.
FI_HALF_ECOM_PREDICTЗначение HalfEcomPredict, рассчитываемого в бегемоте.
FI_PREFIX_SUFFIX_MAX_CLICK_PERCENT_REGФактор, аналогичный RegexMaxClickPercentReg, но расчитанный по preffix-suffix генерализации.
FI_PREFIX_SUFFIX_MAX_CLICK_PERCENT_YABAR_REGФактор, аналогичный RegexMaxClickPercentYabarReg, но расчитанный по preffix-suffix генерализации.
FI_DSSM_NAVIGATION_L2Запросно-документная модель навигационности.
FI_YABAR_HOST_SURFTR_NODES_HANGS_GRADIENTСредний угод наклона в плоскости вершины-зависания
FI_QUERY_URL_CORRECTED_CTR_XFACTORЗапросно-урловый фактор. Значение — результат коллаборативной фильтрации данных для фактора QueryUrlCorrectedCtr
FI_FULL_MATRIX_NETЗначение MatrixNet медленной модели ранжирования.
FI_FAST_MATRIX_NETЗначение MatrixNet быстрой модели ранжирования.
FI_FILTER_MATRIX_NETЗначение MatrixNet фильтрующей модели.
FI_SMALL_WINDOW_ATTENUATION_QNaN
FI_QUERY_DOC_TITLE_RANGES_MATCHING_SCOREФактор по тексту запроса и заголовку (title) документа, оценка соответствия числовых диапазонов при словах-маркерах
FI_FULL_POLYNOMЗначение Polynom медленной модели ранжирования.
FI_FAST_POLYNOMЗначение Polynom быстрой модели ранжирования.
FI_FILTER_POLYNOMЗначение Polynom фильтрующей модели ранжирования.
FI_IS_TRANSLATED_DOCUMENTПризнак, что документ был получен машинным переводом
FI_MED_DSSM_WITH_TRASHПредсказание med_with_trash.dssm (мед. документная модель с доливкой треша в лерн) модели по url + title.
FI_FIN_LAW_DSSM_WITH_TRASHПредсказание fin_law_with_trash.dssm (фин-юр. документная модель с доливкой треша в лерн) модели по url + title.
FI_FIO_FROM_ORIGINAL_REQUEST_BODY_MIN_WINDOW_SIZEФактор по ФИО из оригинального запроса Считается по содержимому документа. Минимальный размер окна, в которой входят все слова запроса. Нормировано на число слов в запросе.
FI_FIO_FROM_ORIGINAL_REQUEST_TEXT_COSINE_MATCH_MAX_PREDICTIONФактор по ФИО из оригинального запроса Текст документа. Алгоритм CosineMatchMaxPrediction.
FI_ALL_FIO_FROM_ORIGINAL_REQUEST_ALL_MAX_F_BODY_CHAIN0_WCMФактор по всем ФИО из оригинального запроса Агрегация по всем расширениям. Тип аггрегации по расширениям: наибольшее значение фактора; Считается по содержимому документа. Алгоритм: Chain0Wcm
FI_ALL_FIO_FROM_ORIGINAL_REQUEST_ALL_MAX_F_BODY_MIN_WINDOW_SIZEФактор по всем ФИО из оригинального запроса Агрегация по всем расширениям. Тип аггрегации по расширениям: наибольшее значение фактора; Считается по содержимому документа. Минимальный размер окна, в которой входят все слова запроса. Нормировано на число слов в запросе.
FI_SP_AVG_CLICK_FRC_SYN_REGДоля урла в общем числе кликнутых за сессию урлов по запросу (synnorm).
FI_SP_AVG_TOTAL_FRC_SYN_REGСредняя доля кликов по данному урлу по данному запросу среди всех кликов по данному запросу (synnorm) в течение дня.
FI_SP_AVG_TOTAL_FRC_REGСредняя доля кликов по данному урлу по данному запросу среди всех кликов по данному запросу (qnorm) в течение дня.
FI_QI_QUERY_URL_CORRECTED_CTR_XFACTORQI version of factor 861. MaxValue over the set of popular similar queries.
FI_QI_QUERY_URL_ISBM_CTR_REGQI version of factor 798. MaxValue over the set of popular similar queries.
FI_ALL_FIO_FROM_ORIGINAL_REQUEST_ALL_MAX_F_TEXT_COSINE_MATCH_MAX_PREDICTIONФактор по всем ФИО из оригинального запроса Агрегация по всем расширениям. Тип аггрегации по расширениям: наибольшее значение фактора; Текст документа. Алгоритм CosineMatchMaxPrediction.
FI_DSSM_PAGE_QUALITYDssm, предсказывающая оценку page quality для документа
FI_HAS_TURBO_ECOMNaN
FI_MEMORANDUM_URL_TYPENaN
FI_SP_AVG_TOTAL_FRC_XFACTOR_REGЗапросно-урловый фактор. Значение — результат коллаборативной фильтрации данных для фактора SamplePeriodDayFrc
FI_FAST_FILTER_MATRIX_NETЗначение MatrixNet быстрой фильтрующей модели.
FI_FAST_FILTER_POLYNOMЗначение Polynom быстрой фильтрующей модели ранжирования.
FI_QI_SP_AVG_TOTAL_FRC_REGQI version of factor 879.
FI_META_MATRIX_NETЗначение MatrixNet на мете.
FI_META_POLYNOMЗначение Polynom на мете.
FI_SHORT_VIDEOДокумент — это короткое видео (тикток, reels, shorts).
FI_TELEGRAM_CHANNEL_WEBДокумент — телеграмм-канал в веб-формате.
FI_TELEGRAM_POSTДокумент — пост в телеграмме.
FI_CORRECTED_CTR_ANNOTATION_MATCH_PREDICTIONCorrectedCtrReg фактор в аннотационном индексе, фактор AnnotationMatchPrediction
FI_CORRECTED_CTR_QUERY_MATCH_PREDICTIONCorrectedCtrReg фактор в аннотационном индексе, фактор QueryMatchPrediction
FI_CORRECTED_CTR_VALUE_WCM_AVGCorrectedCtrReg фактор в аннотационном индексе, фактор ValueWcmAvg
FI_CORRECTED_CTR_BM15_V4_K5CorrectedCtrReg фактор в аннотационном индексе, фактор Bm15V4K5
FI_IS_NOT_CGIФактор о наличии символа ‘?’ в урле. Равен нулю, если урл имеет cgi-параметры (точнее: все дубли имеют символ ‘?’ в урле).
FI_ALICE_CLICK_DSSMDSSMное предсказание клика по данным, специфичным для Алисы
FI_TEL_FULL_ATTRIBUTE_TEXT_BOCM15_K001Фактор по телефонным аттрибутам tel_full из оригинального запроса Текст документа. Алгоритм агрегации весов слов Bocm15. Коэффициент нормализации 0.01.
FI_REMOVED_902NaN
FI_SAMPLE_PERIOD_DAY_FRC_QUERY_MATCH_PREDICTIONSamplePeriodDayFrc фактор в аннотационном индексе, фактор QueryMatchPrediction
FI_SAMPLE_PERIOD_DAY_FRC_ANNOTATION_MATCH_PREDICTIONSamplePeriodDayFrc фактор в аннотационном индексе, фактор AnnotationMatchPrediction
FI_ONE_CLICK_QUERY_MATCH_PREDICTIONOneClick фактор в аннотационном индексе, фактор QueryMatchPrediction
FI_ONE_CLICK_ANNOTATION_MATCH_PREDICTIONOneClick фактор в аннотационном индексе, фактор AnnotationMatchPrediction
FI_ONE_CLICK_BM15_AK4OneClick фактор в аннотационном индексе, фактор Bm15AK4
FI_ONE_CLICK_BOCM_WEIGHTED_W1K3OneClick фактор в аннотационном индексе, фактор BocmWeightedW1K3
FI_LONG_CLICK_QUERY_MATCH_PREDICTIONLongClick фактор в аннотационном индексе, фактор QueryMatchPrediction
FI_LONG_CLICK_ANNOTATION_MATCH_PREDICTIONLongClick фактор в аннотационном индексе, фактор AnnotationMatchPrediction
FI_LONG_CLICK_BM15_AK4LongClick фактор в аннотационном индексе, фактор Bm15AK4
FI_LONG_CLICK_BOCM_WEIGHTED_W1K3LongClick фактор в аннотационном индексе, фактор BocmWeightedW1K3
FI_SPLIT_DWELL_TIME_QUERY_MATCH_PREDICTIONSplitDwellTime фактор в аннотационном индексе, фактор QueryMatchPrediction
FI_SPLIT_DWELL_TIME_ANNOTATION_MATCH_PREDICTIONSplitDwellTime фактор в аннотационном индексе, фактор AnnotationMatchPrediction
FI_BQPR_QUERY_MATCH_PREDICTIONBQPR фактор в аннотационном индексе, фактор QueryMatchPrediction
FI_BQPR_ANNOTATION_MATCH_PREDICTIONBQPR фактор в аннотационном индексе, фактор AnnotationMatchPrediction
FI_YABAR_VISITS_QUERY_MATCH_PREDICTIONYabarVisits фактор в аннотационном индексе, фактор QueryMatchPrediction
FI_YABAR_VISITS_ANNOTATION_MATCH_PREDICTIONYabarVisits фактор в аннотационном индексе, фактор AnnotationMatchPrediction
FI_YABAR_TIME_QUERY_MATCH_PREDICTIONYabarTime фактор в аннотационном индексе, фактор QueryMatchPrediction
FI_YABAR_TIME_ANNOTATION_MATCH_PREDICTIONYabarTime фактор в аннотационном индексе, фактор AnnotationMatchPrediction
FI_SIMPLE_CLICK_QUERY_MATCH_PREDICTIONSimpleClick фактор в аннотационном индексе, фактор QueryMatchPrediction
FI_SIMPLE_CLICK_ANNOTATION_MATCH_PREDICTIONSimpleClick фактор в аннотационном индексе, фактор AnnotationMatchPrediction
FI_LONG_CLICK_BOCM_PLAINLongClick фактор в аннотационном индексе, фактор BocmPlain
FI_RANDOM_LOG_DBM35_XFACTOR_FULL_MATCH_PREDICTIONРезультат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор FullMatchPrediction
FI_RANDOM_LOG_DBM35_XFACTOR_ANNOTATION_MATCH_PREDICTIONРезультат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор AnnotationMatchPrediction
FI_ONE_CLICK_SYNONYM_MATCH_PREDICTIONOneClick фактор в аннотационном индексе, фактор SynonymMatchPrediction
FI_ONE_CLICK_FULL_MATCH_PREDICTIONOneClick фактор в аннотационном индексе, фактор FullMatchPrediction
FI_ONE_CLICK_VALUE_WCM_AVGOneClick фактор в аннотационном индексе, фактор ValueWcmAvg
FI_ONE_CLICK_BOCM_WEIGHTED_MAX_K1OneClick фактор в аннотационном индексе, фактор BocmWeightedMaxK1
FI_ONE_CLICK_BM15_STRICT_K2OneClick фактор в аннотационном индексе, фактор Bm15StrictK2
FI_ONE_CLICK_BM15_MAX_K3OneClick фактор в аннотационном индексе, фактор Bm15MaxK3
FI_ONE_CLICK_BCLM_PLAIN_W1K3OneClick фактор в аннотационном индексе, фактор BclmPlainW1K3
FI_ONE_CLICK_VALUE_WCM_MAXOneClick фактор в аннотационном индексе, фактор ValueWcmMax
FI_ONE_CLICK_VALUE_WCM_PREDICTIONOneClick фактор в аннотационном индексе, фактор ValueWcmPrediction
FI_ONE_CLICK_BCLM_WEIGHTED_K3OneClick фактор в аннотационном индексе, фактор BclmWeightedK3
FI_BQPR_BOCM_WEIGHTED_W1_K3BQPR фактор в аннотационном индексе, фактор BocmWeightedW1K3
FI_BQPR_BM15_STRICT_K2BQPR фактор в аннотационном индексе, фактор Bm15StrictK2
FI_SPLIT_DWELL_BOCM_WEIGHTED_MAX_K1SplitDwellTime фактор в аннотационном индексе, фактор BocmWeightedMaxK1
FI_SPLIT_DWELL_TIME_FULL_MATCH_PREDICTIONSplitDwellTime фактор в аннотационном индексе, фактор FullMatchPrediction
FI_SPLIT_DWELL_TIME_VALUE_WCM_AVGSplitDwellTime фактор в аннотационном индексе, фактор ValueWcmAvg
FI_CORRECTED_CTR_BM15_STRICT_K2CorrectedCtrReg фактор в аннотационном индексе, фактор Bm15StrictK2
FI_FRACTION_OF_QUERIES_WITH_GEO_PREDICTIONПредсказание доли запросов с географией по мешку слов, построенному для запроса
FI_URL_IS_EXACTЗапрос является урлом с точностью до простановки точек и пробельных символов — используется правило колдунщика isurl
FI_RANDOM_LOG_DBM35_XFACTOR_VALUE_WCM_MAXРезультат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор ValueWcmMax
FI_RANDOM_LOG_DBM35_XFACTOR_VALUE_WCM_AVGРезультат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор ValueWcmAvg
FI_RANDOM_LOG_DBM35_XFACTOR_BM15_STRICK_K2Результат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор Bm15StrictK2
FI_RANDOM_LOG_DBM35_XFACTOR_BCLM_PLAIN_W1_k3Результат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор BclmPlainW1K3
FI_RANDOM_LOG_DBM35_XFACTOR_BCLM_WEIGHTED_K3Результат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор BclmWeightedK3
FI_RANDOM_LOG_DBM35_XFACTOR_BOCM_WEIGHTED_K3Результат коллаборативной фильтрации для фактора FI_DBM35 из random log в аннотационном индексе, фактор BocmWeightedW1K3
FI_CORRECTED_CTR_XFACTOR_ANNOTATION_MATCH_PREDICTIONCorrectedCtrXfactor в аннотационном индексе, фактор AnnotationMatchPrediction
FI_CORRECTED_CTR_XFACTOR_QUERY_MATCH_PREDICTIONCorrectedCtrXfactor в аннотационном индексе, фактор QueryMatchPrediction
FI_CORRECTED_CTR_XFACTOR_VALUE_WCM_MAXCorrectedCtrXfactor в аннотационном индексе, фактор ValueWcmMax
FI_CORRECTED_CTR_XFACTOR_VALUE_WCM_AVGCorrectedCtrXfactor в аннотационном индексе, фактор ValueWcmAvg
FI_CORRECTED_CTR_XFACTOR_BOCM_WEIGHTED_W1K3CorrectedCtrXfactor в аннотационном индексе, фактор BocmWeightedW1K3
FI_CORRECTED_CTR_XFACTOR_BCLM_PLAIN_K3CorrectedCtrXfactor в аннотационном индексе, фактор BclmPlainK3
FI_CORRECTED_CTR_XFACTOR_BCLM_MIX_PLAIN_W1K1CorrectedCtrXfactor в аннотационном индексе, фактор BclmMixPlainW1K1
FI_ALICE_TIMESPENT_SUFFIX_SUMПредсказание суммарного таймспента до конца сессии при условии реализации этой пары запрос-документ
FI_ALICE_TIMESPENTПредсказание вклада этой пары запрос-документ в таймспент
FI_SAMPLE_PERIOD_DAY_FRC_VALUE_WCM_AVGSamplePeriodDayFrc фактор в аннотационном индексе, фактор ValueWcmAvg
FI_SAMPLE_PERIOD_DAY_FRC_BM15_MAX_K3SamplePeriodDayFrc фактор в аннотационном индексе, фактор Bm15MaxK3
FI_SAMPLE_PERIOD_DAY_FRC_BOCM_WEIGHTED_K3SamplePeriodDayFrc фактор в аннотационном индексе, фактор BocmWeightedK3
FI_SAMPLE_PERIOD_DAY_FRC_BOCM_DOUBLE_K5SamplePeriodDayFrc фактор в аннотационном индексе, фактор BocmDoubleK5
FI_SPLIT_DWELL_TIME_BM15_MAX_K3SplitDwellTime фактор в аннотационном индексе, фактор Bm15MaxK3
FI_SIMPLE_CLICK_BCLM_WEIGHTED_K3SimpleClick фактор в аннотационном индексе, фактор BclmWeightedK3
FI_ALICE_MAX_PERCENT_PLAYEDПредсказание процента длины трека, который будет проигран при условии реализации этой пары запрос-трек
FI_WEIGHTED_UNMATCH_URL_PREDICTED_USER_REGIONВероятность того, что предсказанный моделью yweb/robot/urlgeo_ml регион — корректен, при условии, что предсказан город
FI_PSE_FRC_BROWSER_ANNOTATION_MATCH_PREDICTIONPopularSEFRCBrowser фактор в аннотационном индексе, фактор AnnotationMatchPrediction
FI_PSE_FRC_BROWSER_SYNONYM_MATCH_PREDICTIONPopularSEFRCBrowser фактор в аннотационном индексе, фактор SynonymMatchPrediction
FI_PSE_FRC_BROWSER_VALUE_WCM_PREDICTIONPopularSEFRCBrowser фактор в аннотационном индексе, фактор ValueWcmPrediction
FI_PSE_FRC_BROWSER_BCLM_WEIGHTED_V2K3PopularSEFRCBrowser фактор в аннотационном индексе, фактор BclmWeightedV2K3
FI_PSE_FRC_BROWSER_BCLM_MIX_PLAIN_W1K1PopularSEFRCBrowser фактор в аннотационном индексе, фактор BclmMixPlainW1K1
XLR_ANNOTATION_MATCH_PREDICTIONСчитается по линковому индексу. Max(sum(idf)) по всем линкам которые являются подмножествами query / sum(idf) для query
FI_ONE_CLICK_ANNOTATION_MATCH_PREDICTION_WEIGHTEDOneClick фактор в аннотационном индексе, фактор AnnotationMatchPredictionWeighted
FI_LONG_CLICK_ANNOTATION_MATCH_PREDICTION_WEIGHTEDLongClick фактор в аннотационном индексе, фактор AnnotationMatchPredictionWeighted
FI_YABAR_TIME_ANNOTATION_MATCH_PREDICTION_WEIGHTEDYabarTime фактор в аннотационном индексе, фактор AnnotationMatchPredictionWeighted
FI_PAGE_HAS_MAPS_APIРавен единице, если страница подключает js-api какого либо поставщика гео-данных
FI_LONG_CLICK_SP_ANNOTATION_MATCH_PREDICTIONLongClickSamplePeriod фактор в аннотационном индексе, фактор AnnotationMatchPrediction
FI_LONG_CLICK_SP_QUERY_MATCH_PREDICTIONLongClickSamplePeriod фактор в аннотационном индексе, фактор QueryMatchPrediction
FI_LONG_CLICK_SP_VALUE_WCM_AVGLongClickSamplePeriod фактор в аннотационном индексе, фактор ValueWcmAvg
FI_LONG_CLICK_SP_VALUE_WCM_PREDICTIONLongClickSamplePeriod фактор в аннотационном индексе, фактор ValueWcmPrediction
FI_LONG_CLICK_SP_BCLM_PLAIN_W1K3LongClickSamplePeriod фактор в аннотационном индексе, фактор BclmPlainW1K3
FI_LONG_CLICK_SP_BCLM_WEIGHTED_K3LongClickSamplePeriod фактор в аннотационном индексе, фактор BclmWeightedK3
FI_LONG_CLICK_SP_BOCM_WEIGHTED_W1K3LongClickSamplePeriod фактор в аннотационном индексе, фактор BocmWeightedW1K3
FI_LONG_CLICK_SP_BCLM_PLAIN_K5LongClickSamplePeriod фактор в аннотационном индексе, фактор BclmPlainK5
FI_LONG_CLICK_SP_BCLM_WEIGHTED_V2K3LongClickSamplePeriod фактор в аннотационном индексе, фактор BclmWeightedV2K3
FI_LONG_CLICK_SP_BOCM_DOUBLE_K5LongClickSamplePeriod фактор в аннотационном индексе, фактор BocmDoubleK5
FI_LONG_CLICK_SP_BM15_STRICT_K2LongClickSamplePeriod фактор в аннотационном индексе, фактор Bm15StrictK2
FI_URL_CLICKS_MAX_GEO_REGION_FRC_RATIONormalized corrected clicks maximum ratio by query with user’s city(gc=) mentioned equal by region
FI_URL_CLICKS_MAX_GEO_REGIONONLY_FRC_RATIONormalized corrected clicks maximum ratio by query with user’s city(gc=) mentioned equal to user’s region
FI_BQPR_SAMPLE_WCM_COVERAGE_MAXBQPR на семплированном периоде. Аннотационный индекс. Фактор WcmCoverageMax
FI_BQPR_SAMPLE_FULL_MATCH_PREDICTIONBQPR на семплированном периоде. Аннотационный индекс. Фактор FullMatchPrediction
FI_BQPR_SAMPLE_ANNOTATION_MATCH_PREDICTION_WEIGHTEDBQPR на семплированном периоде. Аннотационный индекс. Фактор AnnotationMatchPredictionWeighted
FI_BQPR_SAMPLE_VALUE_PCM_AVGBQPR на семплированном периоде. Аннотационный индекс. Фактор ValuePcmAvg
FI_BQPR_SAMPLE_VALUE_WCM_AVGBQPR на семплированном периоде. Аннотационный индекс. Фактор ValueWcmAvg
FI_BQPR_SAMPLE_BM15_V4_K5BQPR на семплированном периоде. Аннотационный индекс. Фактор Bm15V4K8
FI_BQPR_SAMPLE_BOCM_WEIGHTED_V4_K8BQPR на семплированном периоде. Аннотационный индекс. Фактор BocmWeightedV4K8
FI_BQPR_SAMPLE_WCM_MAXBQPR на семплированном периоде. Аннотационный индекс. Фактор SampleWcmMax
FI_BQPR_SAMPLE_SYNONYM_MATCH_PREDICTIONBQPR на семплированном периоде. Аннотационный индекс. Фактор SynonymMatchPrediction
FI_BQPR_SAMPLE_ANNOTATION_MATCH_PREDICTIONBQPR на семплированном периоде. Аннотационный индекс. Фактор AnnotationMatchPrediction
FI_BQPR_SAMPLE_SUFFIX_MATCH_COUNTBQPR на семплированном периоде. Аннотационный индекс. Фактор SuffixMatchCount
FI_BQPR_SAMPLE_WCM_COVERAGE_PREDICTIONBQPR на семплированном периоде. Аннотационный индекс. Фактор WcmCoveragePrediction
FI_DOUBLE_FRC_FULL_MATCH_PREDICTIONDoubleFrc в аннотационном индексе, фактор FullMatchPrediction
FI_DOUBLE_FRC_SYNONYM_MATCH_PREDICTIONDoubleFrc в аннотационном индексе, фактор SynonymMatchPrediction
FI_DOUBLE_FRC_ANNOTATION_MATCH_PREDICTIONDoubleFrc в аннотационном индексе, фактор AnnotationMatchPrediction
FI_DOUBLE_FRC_ANNOTATION_MATCH_PREDICTION_WEIGHTEDDoubleFrc в аннотационном индексе, фактор AnnotationMatchPredictionWeighted
FI_DOUBLE_FRC_QUERY_MATCH_PREDICTIONDoubleFrc в аннотационном индексе, фактор QueryMatchPrediction
FI_DOUBLE_FRC_VALUE_WCM_AVGDoubleFrc в аннотационном индексе, фактор ValueWcmAvg
FI_DOUBLE_FRC_BOCM_WEIGHTED_MAX_K1DoubleFrc в аннотационном индексе, фактор BocmWeightedMaxK1
FI_DOUBLE_FRC_BM15_V4_K5DoubleFrc в аннотационном индексе, фактор Bm15V4K5
FI_DOUBLE_FRC_BOCM_WEIGHTED_V4_K5DoubleFrc в аннотационном индексе, фактор BocmWeightedV4K5
FI_DOUBLE_FRC_BOCM_DOUBLE_K1DoubleFrc в аннотационном индексе, фактор BocmDoubleK1
REMOVED_1012NaN
REMOVED_1013NaN
REMOVED_1014NaN
REMOVED_1015NaN
REMOVED_1016NaN
REMOVED_1017NaN
REMOVED_1018NaN
REMOVED_1019NaN
REMOVED_1020NaN
REMOVED_1021NaN
REMOVED_1022NaN
REMOVED_1023NaN
FI_XF_DT_SHOW_ALL_MIN_WФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: минимальный вес расширения.
FI_XF_DT_SHOW_ALL_MAX_F_FIELD_SET2_BM15FLOG_K0_001Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: Bm15 по группе стримов 2. Максимальное значение фактора по расширениям.
FI_XF_DT_SHOW_ALL_MAX_F_FIELD_SET3_BCLM_WEIGHTED_FLOG_W0_K0_001Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: BclmWeightedFLogW0 по группе стримов 3. Максимальное значение фактора по расширениям.
FI_XF_DT_SHOW_ALL_MAX_F_FIELD_SET_UT_BM15FLOG_W0_K0_0001Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: Bm15FLogW0 по урлу и тайтлу. Максимальное значение фактора по расширениям.
FI_XF_DT_SHOW_ALL_MAX_F_TEXT_COSINE_MATCH_MAX_PREDICTIONФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: CosineMaxMatchPrediction по тексту и тайтлу. Максимальное значение фактора по расширениям.
FI_XF_DT_SHOW_ALL_MAX_F_URL_BM15_K0_1Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: Bm15 по урлу. Максимальное значение фактора по расширениям.
FI_XF_DT_SHOW_ALL_MAX_WF_LONG_CLICK_SP_FULL_MATCH_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: FullMatchValue по стриму LongClickSP. Максимальное взвешенное значение фактора по расширениям.
FI_XF_DT_SHOW_ALL_MAX_WF_ONE_CLICK_FULL_MATCH_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: FullMatchValue по стриму OneClick. Максимальное взвешенное значение фактора по расширениям.
FI_XF_DT_SHOW_ALL_SUM_W2F_SUM_W_FIELD_SET1_BM15FLOG_K0_001Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: Bm15FLog по группе стримов 1. Среднее взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по расширениям.
FI_XF_DT_SHOW_ALL_SUM_W2F_SUM_W_FIELD_SET_UT_BM15FLOG_W0_K0_0001Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: Bm15FLogW0 по урлу и тайтлу. Среднее взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по расширениям.
FI_XF_DT_SHOW_ALL_SUM_WF_SUM_W_BODY_MIN_WINDOW_SIZEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: MinWindowSize по тексту. Среднее взвешенное значений фактора по расширениям.
FI_XF_DT_SHOW_BAG_OF_WORDS_FIELD_SET_BAG_OF_WORDS_ORIGINAL_REQUEST_FRACTION_EXACTФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: мешочный OriginalRequestFractionExact по группе стримов для мешочных факторов (текст, тайтл, аннотационные стримы).
FI_XF_DT_SHOW_BAG_OF_WORDS_LONG_CLICK_SP_COSINE_MATCH_MAX_PREDICTIONФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: мешочный CosineMaxMatchPrediction по стриму LongClickSP.
FI_XF_DT_SHOW_BAG_OF_WORDS_LONG_CLICK_SP_COSINE_MATCH_WEIGHTED_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: мешочный CosineMatchWeightedValue по стриму LongClickSP.
FI_XF_DT_SHOW_BAG_OF_WORDS_SIMPLE_CLICK_ANNOTATION_MATCH_AVG_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: мешочный AnnotationMatchAvgValue по стриму SimpleClick.
FI_XF_DT_SHOW_BAG_OF_WORDS_TITLE_COSINE_MAX_MATCHФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: мешочный CosineMaxMatcg по тайтлу.
FI_XF_DT_SHOW_TOP_MIN_WF_FIELD_SET3_BCLM_WEIGHTED_FLOG_W0_K0_001Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: BclmWeightedFLogW0 по группе стримов 3. Минимальное взвешенное значение фактора по топу расширений.
FI_XF_DT_SHOW_TOP_MIN_WF_LONG_CLICK_SP_ANNOTATION_MATCH_WEIGHTED_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: AnnotationMatchWeightedValue по стриму LongClickSP. Минимальное взвешенное значение фактора по топу расширений.
FI_XF_DT_SHOW_TOP_MIN_WF_MAX_W_LONG_CLICK_SP_ANNOTATION_MATCH_WEIGHTED_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: AnnotationMatchWeightedValue по стриму LongClickSP. Минимальное взвешенное значение фактора по топу расширений нормированное на максимальный вес по топу расширений.
FI_XF_DT_SHOW_TOP_SUM_W2F_SUM_W_BODY_CHAIN0WCMФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: Chain0WCM по тексту. Среднее взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по топу расширений.
FI_XF_DT_SHOW_TOP_SUM_W2F_SUM_W_LONG_CLICK_SP_FULL_MATCH_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: FullMatchValue по стриму LongClickSP. Среднее взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по топу расширений.
FI_XF_DT_SHOW_TOP_SUM_W2F_SUM_W_ONE_CLICK_FULL_MATCH_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: FullMatchValue по стриму OneClick. Среднее взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по топу расширений.
FI_XF_DT_SHOW_TOP_SUM_WF_SUM_W_FIELD_SET3_BCLM_WEIGHTED_FLOG_W0_K0_001Фактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: BclmWeightedFLogW0 по группе стримов 3. Среднее взвешенное значений фактора по топу расширений.
FI_ONE_CLICK_FRC_XF_SP_FULL_MATCH_PREDICTIONOneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор FullMatchPrediction
FI_ONE_CLICK_FRC_XF_SP_ANNOTATION_MATCH_PREDICTION_WEIGHTEDOneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор AnnotationMatchPredictionWeighted
FI_ONE_CLICK_FRC_XF_SP_VALUE_WCM_AVGOneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор ValueWcmAvg
FI_ONE_CLICK_FRC_XF_SP_WCM_MAXOneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор WcmMax
FI_ONE_CLICK_FRC_XF_SP_WCM_COVERAGE_PREDICTIONOneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор WcmCoveragePrediction
FI_ONE_CLICK_FRC_XF_SP_WCM_COVERAGE_MAXOneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор WcmCoverageMax
FI_ONE_CLICK_FRC_XF_SP_PCM_MAXOneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор PcmMax
FI_ONE_CLICK_FRC_XF_SP_PREFIX_MATCH_COUNTOneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор PrefixMatchCount
FI_ONE_CLICK_FRC_XF_SP_SUFFIX_MATCH_COUNTOneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор SuffixMatchCount
FI_ONE_CLICK_FRC_XF_SP_BM15_V0_W1K1OneClickFrc, посчитанный по сэмплированному периоду и коллаборативно расширенный, фактор Bm15V0W1K1
FI_IS_LOCAL_PROBABILITYЗначение классификатора локализуемости для запроса
FI_IS_RELEV_LOCALE_RUrelev_locale == ru
FI_IS_RELEV_LOCALE_UArelev_locale == ua
FI_IS_RELEV_LOCALE_BYrelev_locale == by
FI_IS_RELEV_LOCALE_KZrelev_locale == kz
FI_IS_RELEV_LOCALE_TRrelev_locale == tr
FI_IS_RELEV_LOCALE_WORLDrelev_locale == world
FI_QCLASS_PORNO_VWPorn query classification result from Wizard (iad_vw flag, based on Vowpal Wabbit)
FI_FULL_URL_FRACTIONПокрытие URL триграммами из запроса. Аналог UrlDomainFraction,UrlPathAndParamsFraction факторов.
FI_QUERY_DWELL_TIME_FULL_MATCH_PREDICTIONQueryDwellTime, фактор FullMatchPrediction
FI_QUERY_DWELL_TIME_SYNONYM_MATCH_PREDICTIONQueryDwellTime, фактор SynonymMatchPrediction
FI_QUERY_DWELL_TIME_ANNOTATION_MATCH_PREDICTIONQueryDwellTime, фактор AnnotationMatchPrediction
FI_QUERY_DWELL_TIME_ANNOTATION_MATCH_PREDICTION_WEIGHTEDQueryDwellTime, фактор AnnotationMatchPredictionWeighted
FI_QUERY_DWELL_TIME_QUERY_MATCH_PREDICTIONQueryDwellTime, фактор QueryMatchPrediction
FI_QUERY_DWELL_TIME_VALUE_WCM_AVGQueryDwellTime, фактор ValueWcmAvg
FI_QUERY_DWELL_TIME_BCLM_PLAIN_W1K3QueryDwellTime, фактор BclmPlainW1K3
FI_QUERY_DWELL_TIME_BM15_COVERAGE_V4_K3QueryDwellTime, фактор Bm15CoverageV4K3
FI_QUERY_DWELL_TIME_BCLM_PLAIN_K4QueryDwellTime, фактор BclmPlainK4
FI_QUERY_DWELL_TIME_BOCM_WEIGHTED_V4_K5QueryDwellTime, фактор BocmWeightedV4K5
FI_MORE_90_SEC_VISITS_SHAREДоля посещений, для которых время нахождения в течение дня на хосте больше 90 сек
FI_MORE_160_SEC_VISITS_SHAREДоля посещений, для которых время нахождения в течение дня на хосте больше 160 сек
FI_RANK_HACKED_NOVA_PHPРанк взломанных сайтов
FI_RANK_AGS4Ранк ags4
FI_MAX_QS_DOC_CLASS_QS_RANK_PTH_QUERY_SPAMМаксимальный QsRank на владельце
FI_AVG_QS_RANK_ON_NOT_SUBDOMAIN_DOCSСредний QsRank на основном домене
FI_VISITORS_RETURN_MONTH_SHAREДоля возвратившихся в течение месяца пользователей
FI_VISITORS_RETURN_MONTH_NUMBERКоличество возвратившихся в течение месяца пользователей
FI_RANK_XIT_DOORРанк дорвеев
FI_AVG_TITLE_CAPITAL_LETTERS_RATIOДоля заглавных букв в Title
FI_FROM_SEARCH_SHARE_NORMALIZEDДоля входящего трафика с поисковых систем среди всего входящего трафика
FI_GREEN_TRAFFIC_SHARE_NORMALIZEDДоля прямых заходов среди всего входящего трафика
FI_AVG_QS_F_WND_500_TOKENСредний QsRank в скользящем окне
FI_MIN_OWNER_QS_RANKМинимальный QsRank
FI_AVG_NUMHOPSСредний Hops
FI_URL_BM15_K01Bm15K01 factor over hits from Url
FI_TITLE_BM15_K01Bm15K01 factor over hits from Title
FI_TITLE_BOCM15_K001Bocm15K001 factor over hits from Title
FI_TEXT_BM11_NORM16384Bm11Norm16384 factor over hits from Text
FI_TEXT_BOCM11_NORM256Bocm11Norm256 factor over hits from Text
FI_TEXT_COSINE_MATCH_MAX_PREDICTIONCosineMatchMaxPrediction factor over hits from Text
FI_FIELD_SET1_BM15_FLOG_K0001Bm15FLogK0001 factor over hits from FieldSet1 stream
FI_FIELD_SET2_BM15_FLOG_K0001Bm15FLogK0001 factor over hits from FieldSet2 stream
FI_FIELD_SET3_BCLM_WEIGHTED_FLOG_W0_K0001BclmWeightedFLogW0K0001 factor over hits from FieldSet3 stream
FI_FIELD_SET_UT_BM15_FLOG_W0_K00001Bm15FLogW0K00001 factor over hits from FieldSetUT stream
FI_BODY_CHAIN0_WCMChain0Wcm factor over hits from Body
FI_BODY_PAIR_MIN_PROXIMITYPairMinProximity factor over hits from Body
FI_BODY_MIN_WINDOW_SIZEMinWindowSize factor over hits from Body
FI_POPULAR_SE_FRC_BROWSER_COSINE_MATCH_MAX_PREDICTIONCosineMatchMaxPrediction factor over hits from PopularSeFrcBrowser stream
FI_DOUBLE_FRC_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from DoubleFrc stream
FI_DOUBLE_FRC_ANNOTATION_MAX_VALUE_WEIGHTEDAnnotationMaxValueWeighted factor over hits from DoubleFrc stream
FI_DOUBLE_FRC_ANNOTATION_MAX_VALUEAnnotationMaxValue factor over hits from DoubleFrc stream
FI_DOUBLE_FRC_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from DoubleFrc stream
FI_DOUBLE_FRC_ALL_WCM_WEIGHTED_VALUEAllWcmWeightedValue factor over hits from DoubleFrc stream
FI_DOUBLE_FRC_ALL_WCM_MATCH95_AVG_VALUEAllWcmMatch95AvgValue factor over hits from DoubleFrc stream
FI_DOUBLE_FRC_ALL_WCM_WEIGHTED_PREDICTIONAllWcmWeightedPrediction factor over hits from DoubleFrc stream
FI_DOUBLE_FRC_ALL_WCM_MATCH80_AVG_VALUEAllWcmMatch80AvgValue factor over hits from DoubleFrc stream
FI_DOUBLE_FRC_FULL_MATCH_VALUEFullMatchValue factor over hits from DoubleFrc stream
FI_DOUBLE_FRC_FULL_MATCH_ANY_VALUEFullMatchAnyValue factor over hits from DoubleFrc stream
FI_DOUBLE_FRC_EXACT_QUERY_MATCH_AVG_VALUEExactQueryMatchAvgValue factor over hits from DoubleFrc stream
FI_ONE_CLICK_FRC_XF_SP_BCLM_MIX_PLAIN_KE5BclmMixPlainKE5 factor over hits from OneClickFrcXfSp stream
FI_ONE_CLICK_FRC_XF_SP_BM15_STRICT_ANNOTATION_K01Bm15StrictAnnotationK01 factor over hits from OneClickFrcXfSp stream
FI_ONE_CLICK_FRC_XF_SP_ALL_WCM_WEIGHTED_VALUEAllWcmWeightedValue factor over hits from OneClickFrcXfSp stream
FI_ONE_CLICK_FRC_XF_SP_ALL_WCM_WEIGHTED_PREDICTIONAllWcmWeightedPrediction factor over hits from OneClickFrcXfSp stream
FI_ONE_CLICK_FRC_XF_SP_ALL_WCM_MATCH80_AVG_VALUEAllWcmMatch80AvgValue factor over hits from OneClickFrcXfSp stream
FI_ONE_CLICK_FRC_XF_SP_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from OneClickFrcXfSp stream
FI_ONE_CLICK_FRC_XF_SP_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from OneClickFrcXfSp stream
FI_ONE_CLICK_FRC_XF_SP_BCLM_PLANE_PROXIMITY1_BM15_W0_SIZE1_K0001BclmPlaneProximity1Bm15W0Size1K0001 factor over hits from OneClickFrcXfSp stream
FI_ONE_CLICK_FRC_XF_SP_BCLM_WEIGHTED_PROXIMITY1_BM15_SIZE1_K001BclmWeightedProximity1Bm15Size1K001 factor over hits from OneClickFrcXfSp stream
FI_BQPRSAMPLE_BCLM_MIX_PLAIN_KE5BclmMixPlainKE5 factor over hits from BQPRSample stream
FI_BQPRSAMPLE_ALL_WCM_WEIGHTED_VALUEAllWcmWeightedValue factor over hits from BQPRSample stream
FI_BQPRSAMPLE_ALL_WCM_WEIGHTED_PREDICTIONAllWcmWeightedPrediction factor over hits from BQPRSample stream
FI_BQPRSAMPLE_ALL_WCM_MAX_PREDICTIONAllWcmMaxPrediction factor over hits from BQPRSample stream
FI_BQPRSAMPLE_ALL_WCM_MATCH80_AVG_VALUEAllWcmMatch80AvgValue factor over hits from BQPRSample stream
FI_BQPRSAMPLE_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from BQPRSample stream
FI_BQPRSAMPLE_COSINE_MATCH_MAX_PREDICTIONCosineMatchMaxPrediction factor over hits from BQPRSample stream
FI_BQPRSAMPLE_ANNOTATION_MAX_VALUE_WEIGHTEDAnnotationMaxValueWeighted factor over hits from BQPRSample stream
FI_BQPRSAMPLE_ANNOTATION_MAX_VALUEAnnotationMaxValue factor over hits from BQPRSample stream
FI_BQPRSAMPLE_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from BQPRSample stream
FI_BQPRSAMPLE_BOCM15_K001Bocm15K001 factor over hits from BQPRSample stream
FI_BQPRSAMPLE_BCLM_PLANE_PROXIMITY1_BM15_W0_SIZE1_K0001BclmPlaneProximity1Bm15W0Size1K0001 factor over hits from BQPRSample stream
FI_BQPRSAMPLE_BCLM_WEIGHTED_PROXIMITY1_BM15_SIZE1_K001BclmWeightedProximity1Bm15Size1K001 factor over hits from BQPRSample stream
FI_LONG_CLICK_SP_BCLM_PLANE_PROXIMITY1_BM15_W0_SIZE1_K0001BclmPlaneProximity1Bm15W0Size1K0001 factor over hits from LongClickSP stream
FI_LONG_CLICK_SP_BM15_MAX_ANNOTATION_K001Bm15MaxAnnotationK001 factor over hits from LongClickSP stream
FI_LONG_CLICK_SP_FULL_MATCH_VALUEFullMatchValue factor over hits from LongClickSP stream
FI_LONG_CLICK_SP_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from LongClickSP stream
FI_LONG_CLICK_SP_COSINE_MATCH_MAX_PREDICTIONCosineMatchMaxPrediction factor over hits from LongClickSP stream
FI_LONG_CLICK_SP_ANNOTATION_MAX_VALUEAnnotationMaxValue factor over hits from LongClickSP stream
FI_LONG_CLICK_SP_ANNOTATION_MAX_VALUE_WEIGHTEDAnnotationMaxValueWeighted factor over hits from LongClickSP stream
FI_LONG_CLICK_SP_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from LongClickSP stream
FI_LONG_CLICK_SP_ALL_WCM_MATCH95_AVG_VALUEAllWcmMatch95AvgValue factor over hits from LongClickSP stream
FI_LONG_CLICK_SP_ALL_WCM_WEIGHTED_VALUEAllWcmWeightedValue factor over hits from LongClickSP stream
FI_LONG_CLICK_SP_ALL_WCM_MAX_MATCHAllWcmMaxMatch factor over hits from LongClickSP stream
FI_LONG_CLICK_SP_ALL_WCM_WEIGHTED_PREDICTIONAllWcmWeightedPrediction factor over hits from LongClickSP stream
FI_LONG_CLICK_SP_BOCM15_K001Bocm15K001 factor over hits from LongClickSP stream
FI_LONG_CLICK_SP_QUERY_PREFIX_MATCH_ORIGINAL_WORD_VALUEQueryPrefixMatchOriginalWordValue factor over hits from LongClickSP stream
FI_SAMPLE_PERIOD_DAY_FRC_BCLM_PLANE_PROXIMITY1_BM15_W0_SIZE1_K0001BclmPlaneProximity1Bm15W0Size1K0001 factor over hits from SamplePeriodDayFrc stream
FI_SAMPLE_PERIOD_DAY_FRC_ATTEN_V1_BM15_K05AttenV1Bm15K05 factor over hits from SamplePeriodDayFrc stream
FI_SAMPLE_PERIOD_DAY_FRC_FULL_MATCH_VALUEFullMatchValue factor over hits from SamplePeriodDayFrc stream
FI_SAMPLE_PERIOD_DAY_FRC_FULL_MATCH_ANY_VALUEFullMatchAnyValue factor over hits from SamplePeriodDayFrc stream
FI_SAMPLE_PERIOD_DAY_FRC_ALL_WCM_WEIGHTED_VALUEAllWcmWeightedValue factor over hits from SamplePeriodDayFrc stream
FI_SAMPLE_PERIOD_DAY_FRC_ALL_WCM_WEIGHTED_PREDICTIONAllWcmWeightedPrediction factor over hits from SamplePeriodDayFrc stream
FI_SAMPLE_PERIOD_DAY_FRC_ALL_WCM_MATCH95_AVG_VALUEAllWcmMatch95AvgValue factor over hits from SamplePeriodDayFrc stream
FI_SAMPLE_PERIOD_DAY_FRC_ALL_WCM_MATCH80_AVG_VALUEAllWcmMatch80AvgValue factor over hits from SamplePeriodDayFrc stream
FI_SAMPLE_PERIOD_DAY_FRC_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from SamplePeriodDayFrc stream
FI_SAMPLE_PERIOD_DAY_FRC_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from SamplePeriodDayFrc stream
FI_SAMPLE_PERIOD_DAY_FRC_ANNOTATION_MAX_VALUEAnnotationMaxValue factor over hits from SamplePeriodDayFrc stream
FI_SAMPLE_PERIOD_DAY_FRC_ANNOTATION_MAX_VALUE_WEIGHTEDAnnotationMaxValueWeighted factor over hits from SamplePeriodDayFrc stream
FI_SAMPLE_PERIOD_DAY_FRC_BOCM15_K001Bocm15K001 factor over hits from SamplePeriodDayFrc stream
FI_CORRECTED_CTR_XFACTOR_ALL_WCM_WEIGHTED_VALUEAllWcmWeightedValue factor over hits from CorrectedCtrXFactor stream
FI_CORRECTED_CTR_XFACTOR_ALL_WCM_MAX_PREDICTIONAllWcmMaxPrediction factor over hits from CorrectedCtrXFactor stream
FI_CORRECTED_CTR_XFACTOR_ALL_WCM_WEIGHTED_PREDICTIONAllWcmWeightedPrediction factor over hits from CorrectedCtrXFactor stream
FI_CORRECTED_CTR_XFACTOR_ALL_WCM_MATCH80_AVG_VALUEAllWcmMatch80AvgValue factor over hits from CorrectedCtrXFactor stream
FI_CORRECTED_CTR_XFACTOR_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from CorrectedCtrXFactor stream
FI_CORRECTED_CTR_XFACTOR_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from CorrectedCtrXFactor stream
FI_CORRECTED_CTR_XFACTOR_BCLM_PLANE_PROXIMITY1_BM15_W0_SIZE1_K001BclmPlaneProximity1Bm15W0Size1K001 factor over hits from CorrectedCtrXFactor stream
FI_CORRECTED_CTR_XFACTOR_BCLM_WEIGHTED_PROXIMITY1_BM15_SIZE1_K001BclmWeightedProximity1Bm15Size1K001 factor over hits from CorrectedCtrXFactor stream
FI_LONG_CLICK_ALL_WCM_MAX_PREDICTIONAllWcmMaxPrediction factor over hits from LongClick stream
FI_LONG_CLICK_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from LongClick stream
FI_LONG_CLICK_ANNOTATION_MAX_VALUE_WEIGHTEDAnnotationMaxValueWeighted factor over hits from LongClick stream
FI_LONG_CLICK_FULL_MATCH_VALUEFullMatchValue factor over hits from LongClick stream
FI_LONG_CLICK_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from LongClick stream
FI_SIMPLE_CLICK_ALL_WCM_WEIGHTED_VALUEAllWcmWeightedValue factor over hits from SimpleClick stream
FI_SIMPLE_CLICK_ALL_WCM_WEIGHTED_PREDICTIONAllWcmWeightedPrediction factor over hits from SimpleClick stream
FI_SIMPLE_CLICK_ALL_WCM_MAX_PREDICTIONAllWcmMaxPrediction factor over hits from SimpleClick stream
FI_SIMPLE_CLICK_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from SimpleClick stream
FI_SIMPLE_CLICK_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from SimpleClick stream
FI_BROWSER_PAGE_RANK_ANNOTATION_MAX_VALUE_WEIGHTEDAnnotationMaxValueWeighted factor over hits from BrowserPageRank stream
FI_BROWSER_PAGE_RANK_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from BrowserPageRank stream
FI_BROWSER_PAGE_RANK_ANNOTATION_MAX_VALUEAnnotationMaxValue factor over hits from BrowserPageRank stream
FI_BROWSER_PAGE_RANK_BOCM15_K001Bocm15K001 factor over hits from BrowserPageRank stream
FI_ONE_CLICK_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from OneClick stream
FI_ONE_CLICK_FULL_MATCH_VALUEFullMatchValue factor over hits from OneClick stream
FI_ONE_CLICK_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from OneClick stream
FI_SPLIT_DWELL_TIME_ALL_WCM_WEIGHTED_PREDICTIONAllWcmWeightedPrediction factor over hits from SplitDwellTime stream
FI_SPLIT_DWELL_TIME_BM15_MAX_ANNOTATION_K001Bm15MaxAnnotationK001 factor over hits from SplitDwellTime stream
FI_QUERY_DWELL_TIME_BCLM_WEIGHTED_PROXIMITY1_BM15_SIZE1_K0001BclmWeightedProximity1Bm15Size1K0001 factor over hits from QueryDwellTime stream
FI_QUERY_DWELL_TIME_ATTEN_V1_BM15_K001AttenV1Bm15K001 factor over hits from QueryDwellTime stream
FI_QUERY_DWELL_TIME_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from QueryDwellTime stream
FI_QUERY_DWELL_TIME_ANNOTATION_MAX_VALUE_WEIGHTEDAnnotationMaxValueWeighted factor over hits from QueryDwellTime stream
FI_QUERY_DWELL_TIME_ANNOTATION_MAX_VALUEAnnotationMaxValue factor over hits from QueryDwellTime stream
FI_QUERY_DWELL_TIME_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from QueryDwellTime stream
FI_QUERY_DWELL_TIME_ALL_WCM_WEIGHTED_VALUEAllWcmWeightedValue factor over hits from QueryDwellTime stream
FI_QUERY_DWELL_TIME_ALL_WCM_MATCH80_AVG_VALUEAllWcmMatch80AvgValue factor over hits from QueryDwellTime stream
FI_RANDOM_LOG_DBM35_BCLM_PLANE_PROXIMITY1_BM15_W0_SIZE1_K0001BclmPlaneProximity1Bm15W0Size1K0001 factor over hits from RandomLogDBM35 stream
FI_RANDOM_LOG_DBM35_BM15_STRICT_ANNOTATION_K001Bm15StrictAnnotationK001 factor over hits from RandomLogDBM35 stream
FI_RANDOM_LOG_DBM35_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from RandomLogDBM35 stream
FI_RANDOM_LOG_DBM35_ANNOTATION_MAX_VALUE_WEIGHTEDAnnotationMaxValueWeighted factor over hits from RandomLogDBM35 stream
FI_RANDOM_LOG_DBM35_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from RandomLogDBM35 stream
FI_RANDOM_LOG_DBM35_ALL_WCM_WEIGHTED_VALUEAllWcmWeightedValue factor over hits from RandomLogDBM35 stream
FI_RANDOM_LOG_DBM35_FULL_MATCH_VALUEFullMatchValue factor over hits from RandomLogDBM35 stream
FI_RANDOM_LOG_DBM35_EXACT_QUERY_MATCH_AVG_VALUEExactQueryMatchAvgValue factor over hits from RandomLogDBM35 stream
FI_IS_RELEV_LOCALE_IDrelev_locale == id
FI_IS_MOBILE_BEAUTYБинарный фактор про мобильную адаптивность документа. Берётся из erf
FI_FOREIGN_DOMAINВ тех случаях когда FI_NATIONAL_DOMAIN равен 0, а herf.NationalDomainId заполнен ставим 1
FI_XF_DT_SHOW_ALL_MAX_WF_QUERY_DWELL_TIME_MIX_MATCH_WEIGHTED_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: MixMatchWeightedValue по стриму QueryDwellTime. Максимальное взвешенное значение фактора по расширениям.
FI_XF_DT_SHOW_ALL_SUM_WF_SUM_W_QUERY_DWELL_TIME_MIX_MATCH_WEIGHTED_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: MixMatchWeightedValue по стриму QueryDwellTime. Среднее взвешенное значение фактора по расширениям.
FI_XF_DT_SHOW_TOP_MIN_WF_QUERY_DWELL_TIME_MIX_MATCH_WEIGHTED_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: MixMatchWeightedValue по стриму QueryDwellTime. Минимальное взвешенное значение фактора по топу расширений.
FI_XF_DT_SHOW_TOP_MIN_WF_QUERY_DWELL_TIME_ANNOTATION_MATCH_WEIGHTED_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: AnnotationMatchWeightedValue по стриму QueryDwellTime. Минимальное взвешенное значение фактора по топу расширений.
FI_XF_DT_SHOW_ALL_MAX_WF_QUERY_DWELL_TIME_ANNOTATION_MATCH_WEIGHTED_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: AnnotationMatchWeightedValue по стриму QueryDwellTime. Максимальное взвешенное значение фактора по расширениям.
FI_XF_DT_SHOW_TOP_SUM_WF_SUM_W_QUERY_DWELL_TIME_ALL_WCM_MATCH95_AVG_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: AllWcmMatch95AvgValue по стриму QueryDwellTime. Среднее взвешенное значение фактора по топу расширений.
FI_XF_DT_SHOW_ALL_MAX_WF_BQPRSAMPLE_MIX_MATCH_WEIGHTED_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: MixMatchWeightedValue по стриму BQPRSample. Максимальное взвешенное значение фактора по расширениям.
FI_XF_DT_SHOW_ALL_MAX_WF_DOUBLE_FRC_MIX_MATCH_WEIGHTED_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: MixMatchWeightedValue по стриму DoubleFrc. Максимальное взвешенное значение фактора по расширениям.
FI_DSSM_LONG_MIDDLE_SHORT_VS_HARD_CLICKSDSSM model trained on clicks.
FI_DSSM_LONG_VS_SHORT_MIDDLE_HARD_NO_CLICKSDSSM model trained on clicks.
FI_DSSM_MIDDLE_VS_SHORT_LONG_HARD_NO_CLICKSDSSM model trained on clicks.
FI_DSSM_SHORT_VS_MIDDLE_LONG_HARD_NO_CLICKSDSSM model trained on clicks.
FI_DSSM_NO_VS_SHORT_MIDDLE_LONG_HARD_CLICKSDSSM model trained on clicks.
FI_DSSM_LONG_VS_SHORT_MIDDLE_HARD_CLICKSDSSM model trained on clicks.
FI_DSSM_MIDDLE_LONG_VS_SHORT_HARD_CLICKSDSSM model trained on clicks.
FI_DSSM_SHORT_MIDDLE_LONG_VS_HARD_NO_CLICKSDSSM model trained on clicks.
FI_MEDICAL2_URL_QUALITYНейронная модель качества контента для медицинской тематики
FI_IS_DESKTOP_REQUESTrequest came from yandsearch (rearr.is_desktop == 1)
FI_IS_MOBILE_REQUESTrequest came from touchsearch (rearr.is_mobile == 1)
FI_IS_TABLET_REQUESTrequest came from padsearch (rearr.is_tablet == 1)
FI_REQUEST_IS_FROM_ANDROIDrequest came from device with Android OS (rearr.dd_osfamily == Android)
FI_REQUEST_IS_FROM_IOSrequest came from device with iOS (rearr.dd_osfamily == iOS)
FI_REQUEST_IS_FROM_WINDOWSrequest came from device with Windows OS (rearr.dd_osfamily == Windows)
FI_REQUEST_IS_FROM_OTHER_PLATFORMrequest does not come from devices with Android, iOS or Windows OS (rearr.dd_osfamily != [Android, iOS, Windows])
FI_IS_EMBED_VIDEO_BROKENБитое встроенное видео на странице.
FI_CORRECTED_CTR_LONG_PERIOD_FULL_MATCH_VALUEFullMatchValue factor over hits from CorrectedCtrLongPeriod stream
FI_CORRECTED_CTR_LONG_PERIOD_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from CorrectedCtrLongPeriod stream
FI_CORRECTED_CTR_LONG_PERIOD_ANNOTATION_MAX_VALUE_WEIGHTEDAnnotationMaxValueWeighted factor over hits from CorrectedCtrLongPeriod stream
FI_CORRECTED_CTR_LONG_PERIOD_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from CorrectedCtrLongPeriod stream
FI_CORRECTED_CTR_LONG_PERIOD_ALL_WCM_MATCH95_AVG_VALUEAllWcmMatch95AvgValue factor over hits from CorrectedCtrLongPeriod stream
FI_CORRECTED_CTR_LONG_PERIOD_ALL_WCM_MATCH80_AVG_VALUEAllWcmMatch80AvgValue factor over hits from CorrectedCtrLongPeriod stream
FI_CORRECTED_CTR_LONG_PERIOD_ALL_WCM_WEIGHTED_VALUEAllWcmWeightedValue factor over hits from CorrectedCtrLongPeriod stream
FI_CORRECTED_CTR_LONG_PERIOD_ALL_WCM_WEIGHTED_PREDICTIONAllWcmWeightedPrediction factor over hits from CorrectedCtrLongPeriod stream
FI_MEDICAL2_URL_QUALITY_FRESHНейронная модель качества контента для медицинской тематики (для экспов)
FI_NHOP_SUM_DWELL_TIME_BCLM_MIX_PLAIN_KE5BclmMixPlainKE5 factor over hits from NHopSumDwellTime stream
FI_NHOP_SUM_DWELL_TIME_ALL_WCM_MATCH80_AVG_VALUEMatch80AvgValue factor over hits from NHopSumDwellTime stream
FI_FIN_LAW_URL_QUALITYНейронная модель качества контента для финансовой и юридической тематик
FI_NHOP_SUM_DWELL_TIME_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from NHopSumDwellTime stream
FI_FIN_LAW_URL_QUALITY_FRESHНейронная модель качества контента для финансовой и юридической тематик (для экспов)
FI_FIRST_CLICK_DT_XF_BCLM_MIX_PLAIN_KE5BclmMixPlainKE5 factor over hits from FirstClickDtXf stream
FI_FIRST_CLICK_DT_XF_FULL_MATCH_VALUEFullMatchValue factor over hits from FirstClickDtXf stream
FI_FIRST_CLICK_DT_XF_ANNOTATION_MAX_VALUE_WEIGHTEDAnnotationMaxValueWeighted factor over hits from FirstClickDtXf stream
FI_FIRST_CLICK_DT_XF_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from FirstClickDtXf stream
FI_FIRST_CLICK_DT_XF_BCLM_PLANE_PROXIMITY1_BM15_W0_SIZE1_K0001BclmPlaneProximity1Bm15W0Size1K001 factor over hits from FirstClickDtXf stream
FI_REQUEST_WITH_REGION_NAME_TEXT_BM11_NORM16384Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Bm11 по тексту и тайтлу документа
FI_REQUEST_WITH_REGION_NAME_TEXT_COSINE_MATCH_MAX_PREDICTIONФактор лингвистического бустинга. Тип расширений: RequestWithRegionName. CosineMatchMaxPrediction по тексту и тайтлу документа
FI_REQUEST_WITH_REGION_NAME_LONG_CLICK_ANNOTATION_MATCH_WEIGHTED_VALUEФактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: AnnotationMatchWeightedValue по стриму LongClick.
FI_REQUEST_WITH_REGION_NAME_ONE_CLICK_FULL_MATCH_VALUEФактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: FullMatchValue по стриму OneClick.
FI_REQUEST_WITH_REGION_NAME_ONE_CLICK_ANNOTATION_MATCH_WEIGHTED_VALUEФактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: AnnotationMatchValue по стриму OneClick.
FI_REQUEST_WITH_REGION_NAME_LONG_CLICK_SP_ANNOTATION_MATCH_WEIGHTED_VALUEФактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: AnnotationMatchWeightedValue по стриму LongClickSP.
FI_REQUEST_WITH_REGION_NAME_LONG_CLICK_SP_FULL_MATCH_VALUEФактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: FullMatchValue по стриму LongClickSP.
FI_REQUEST_WITH_REGION_NAME_BQPR_SAMPLE_ANNOTATION_MAX_VALUE_WEIGHTEDФактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: AnnotationMaxValueWeighted по стриму BQPRSample.
FI_REQUEST_WITH_REGION_NAME_FIELD_SET1_BM15FLOG_K0_001Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: Bm15 по группе стримов 1.
FI_REQUEST_WITH_REGION_NAME_FIELD_SET2_BM15FLOG_K0_001Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: Bm15 по группе стримов 2.
FI_REQUEST_WITH_REGION_NAME_FIELD_SET3_BCLM_WEIGHTED_FLOG_W0_K0_001Фактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: BclmWeightedFLogW0 по группе стримов 3.
FI_REQUEST_WITH_REGION_NAME_BODY_CHAIN0WCMФактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор Chain0Wcm по тексту документа
FI_QUERY_DOC_RANDOMRandom float in [0,1] by user request and document
FI_SOS_URL_QUALITYНейронная модель качества контента для sos тематики
FI_SUM_FLASH_AREAотношение суммарной площади всех Flash-блоков к площади экрана
FI_SOS_URL_QUALITY_FRESHНейронная модель качества контента для sos тематики (для экспов)
FI_URL_HOST_FRACTIONCopy of old version No.294 factor. Added for use on L3 stage only. Покрытие домена трехбуквиями из запроса. (Челябинская лотерея — chelloto. Переводим запрос в транслит, находим трехбуквия которые покрываются (che, hel, lot, olo), смотрим какую долю от всех трехбуквиев покрыли)
FI_URL_HITS_COVERAGEFast version of FI_URL_DOMAIN_FRACTION
FI_ALICE_TIMESPENT_SUMПредсказание таймспента сессии при условии реализации данной пары запрос-документ
FI_DSSM_DOG_L3Запросно-документная dssm, предсказывающая собачность документа
FI_TIKTOK_TAGДокумент — это подборка из тиктока /tag
FI_TIKTOK_DISCOVERYДокумент — это подборка из тиктока /discovery
FI_TIKTOK_MUSICДокумент — это подборка из тиктока /music
FI_DSSM_SINSIG_L2Запросно-документная модель синсига.
FI_URL_COSINE_MATCH_MAX_PREDICTIONФактор по оригинальному запросу. Считается по токенезированному урлу. Алгоритм CosineMatchMaxPrediction.
FI_URL_ATTENV1_BM15_K05Фактор по оригинальному запросу. Считается по токенезированному урлу. Вес хита умножается на 1/ (1 + позиция слова в предложении) Алгоритм агрегации весов слов: Bm15. Коэффициент нормализации 0.5.
FI_TITLE_BCLM_MIX_PLAIN_KE5Фактор по оригинальному запросу. Считается по заголовку документа. Алгоритм агрегации весов слов — BclmMixPlain: линейная смесь аннотационного Bclm веса и взвешенного Positionless веса слова, затем пословные счётчики агрегируются через bm15. Коэффициент нормализации 10^(-5).
FI_TITLE_CM_MATCH_TOP5_AVG_MATCH_VALUEФактор по оригинальному запросу. Считается по заголовку документа. Алгоритм CMMatchTop5AvgMatchValue.
FI_TITLE_WORD_COVERAGE_FORMФактор по оригинальному запросу. Считается по заголовку документа. Степень покрытия слов запроса с точностью до формы (без синонимов).
FI_TITLE_ATTENV1_BM15_K05Фактор по оригинальному запросу. Считается по заголовку документа. Вес хита умножается на 1/ (1 + позиция слова в предложении) Алгоритм агрегации весов слов: Bm15. Коэффициент нормализации 0.5.
FI_BODY_BCLM_MIX_PLAIN_KE5Фактор по оригинальному запросу. Считается по содержимому документа. Алгоритм агрегации весов слов — BclmMixPlain: линейная смесь аннотационного Bclm веса и взвешенного Positionless веса слова, затем пословные счётчики агрегируются через bm15. Коэффициент нормализации 10^(-5).
FI_BODY_COSINE_MATCH_MAX_PREDICTIONФактор по оригинальному запросу. Считается по содержимому документа. Алгоритм CosineMatchMaxPrediction.
FI_BODY_ALL_WCM_WEIGHTED_PREDICTIONФактор по оригинальному запросу. Считается по содержимому документа. Алгоритм AllWcmWeightedPrediction.
FI_BODY_BOCM15_K001Фактор по оригинальному запросу. Считается по содержимому документа. Алгоритм агрегации весов слов Bocm15. Коэффициент нормализации 0.01.
FI_BODY_QUERY_PART_MATCH_SUM_VALUE_ANYФактор по оригинальному запросу. Считается по содержимому документа. Алгоритм: QueryPartMatchSumValueAny.
FI_BODY_WORD_COVERAGE_FORMФактор по оригинальному запросу. Считается по содержимому документа. Степень покрытия слов запроса с точностью до формы (без синонимов).
FI_BODY_WORD_COVERAGE_EXACTФактор по оригинальному запросу. Считается по содержимому документа. Степень покрытия слов запроса в точной форме.
FI_BODY_BM15_MAX_ANNOTATION_K001Фактор по оригинальному запросу. Считается по содержимому документа. Алгоритм аггрегации весов: Bm15MaxAnnotation Коэффициент нормализации 0.01.
FI_HAS_CLOAKINGNaN
FI_DSSM_FULL_SPLIT_BERTNaN
FI_SOCIAL_URL_IS_VERIFIEDUrl является каналом/постом из верифицированного аккаунта социальной сети
FI_DSSM_MIMICRATION_URLDssm, предсказывающая является ли сайт мимикришником
FI_REMOVED_1297NaN
FI_REMOVED_1298NaN
FI_META_POLY_GEN_8_ALL_WCM_MAX_MATCHMetaPolyGen8
FI_QUERY_DWELL_TIME_CM_MATCH80_AVG_VALUECMMatch80AvgValue factor over hits from QueryDwellTime stream
FI_DOUBLE_FRC_CM_MATCH_TOP5_AVG_MATCHCMMatchTop5AvgMatch factor over hits from DoubleFrc stream
FI_ONE_CLICK_FRC_XF_SP_PER_WORD_CM_MAX_MATCH_MINPerWordCMMaxMatchMin factor over hits from OneClickFrcXfSp stream
FI_FIRST_CLICK_DT_XF_PER_WORD_CM_MAX_MATCH_MINPerWordCMMaxMatchMin factor over hits from FirstClickDtXf stream
FI_XF_DT_SHOW_ALL_MAX_WF_LONG_CLICK_SP_PER_WORD_CM_MAX_MATCH_MINФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: PerWordCMMaxMatchMin по стриму LongClickSP. Максимальное взвешенное значение фактора по расширениям.
FI_XF_DT_SHOW_ALL_MAX_WF_ONE_CLICK_PER_WORD_CM_MAX_MATCH_MINФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: PerWordCMMaxMatchMin по стриму OneClick. Максимальное взвешенное значение фактора по расширениям.
FI_XF_DT_SHOW_TOP_MIN_WF_FIRST_CLICK_DT_XF_PER_WORD_CM_MAX_MATCH_MINФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: PerWordCMMaxMatchMin по стриму FirstClickDtXf. Минимальное взвешенное значение фактора по топу расширений.
FI_REMOVED_1307NaN
FI_REMOVED_1308NaN
FI_DISTANCE_TO_ANKARAРасстояние от города, откуда был задан запрос, до Анкары
FI_DISTANCE_TO_MAGADANРасстояние от города, откуда был задан запрос, до Магадана
FI_LATITUDEГеографическая широта города, откуда был задан запрос
FI_LONGITUDEГеографическая долгота города, откуда был задан запрос
FI_LONG_CLICK_MOBILE_FULL_MATCH_VALUEFullMatchValue factor over hits from LongClick stream (Mobile sessions filtered)
FI_LONG_CLICK_MOBILE_COSINE_MATCH_MAX_PREDICTIONCosineMatchMaxPrediction factor over hits from LongClick stream (Mobile sessions filtered)
FI_LONG_CLICK_MOBILE_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from LongClick stream (Mobile sessions filtered)
FI_LONG_CLICK_MOBILE_ALL_WCM_MATCH95_AVG_VALUEAllWcmMatch95AvgValue factor over hits from LongClick stream (Mobile sessions filtered)
FI_LONG_CLICK_MOBILE_ALL_WCM_WEIGHTED_VALUEAllWcmWeightedValue factor over hits from LongClick stream (Mobile sessions filtered)
FI_LONG_CLICK_MOBILE_ALL_WCM_WEIGHTED_PREDICTIONAllWcmWeightedPrediction factor over hits from LongClick stream (Mobile sessions filtered)
FI_LONG_CLICK_MOBILE_CM_MATCH_TOP5_AVG_VALUECMMatchTop5AvgValue factor over hits from LongClick stream (Mobile sessions filtered)
FI_LONG_CLICK_MOBILE_BM15_MAX_ANNOTATION_K001Bm15MaxAnnotationK001 factor over hits from LongClick stream (Mobile sessions filtered)
FI_XF_DT_SHOW_ALL_MAX_WF_LINKS_ALL_PER_WORD_CM_MAX_MATCH_MINФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: PerWordCMMaxMatchMin по входящим ссылкам. Максимальное взвешенное значение фактора по расширениям.
FI_REMOVED_1322NaN
FI_REMOVED_1323NaN
FI_US_LONG_PERIOD_URL_CTRСтатический URL фактор по поисковым сессиям за 1600 дней. Обычный Ctr.
FI_US_LONG_PERIOD_URL_DT3600_AVGСтатический URL фактор по поисковым сессиям за 1600 дней. Средний DwellTime, причем DwellTime из сессии обрезается, если больше 3600 секунд
FI_REMOVED_1326NaN
FI_US_LONG_PERIOD_URL_DT180_AVGСтатический URL фактор по поисковым сессиям за 1600 дней. Средний DwellTime, причем DwellTime из сессии обрезается, если больше 180 секунд
FI_US_LONG_PERIOD_URL_LONG_CLICK_PROBСтатический URL фактор по поисковым сессиям за 1600 дней. Вероятность что клик по URL будет больше 120 секунд
FI_US_LONG_PERIOD_URL_SHOWSСтатический URL фактор по поисковым сессиям за 1600 дней. Логарифм числа показов.
FI_REMOVED_1330NaN
FI_US_LONG_PERIOD_URL_WINS_PROBСтатический URL фактор по поисковым сессиям за 1600 дней. Вероятность что на URL кликнут, если не кликнут хотя бы на один URL выше.
FI_US_LONG_PERIOD_URL_LOSSES_PROBСтатический URL фактор по поисковым сессиям за 1600 дней. Вероятность что на URL не кликнут, если кликнут хотя бы на один URL ниже.
FI_US_LONG_PERIOD_URL_CTR_REGСтатический URL фактор по поисковым сессиям за 1600 дней. Обычный Ctr. Локализация до уровня стран.
FI_US_LONG_PERIOD_URL_URL_DT3600_AVG_REGСтатический URL фактор по поисковым сессиям за 1600 дней. Средний DwellTime, причем DwellTime из сессии обрезается, если больше 3600 секунд. Локализация до уровня стран.
FI_US_LONG_PERIOD_URL_LONG_CLICK_PROB_REGСтатический URL фактор по поисковым сессиям за 1600 дней. Вероятность что клик по URL будет больше 120 секунд. Локализация до уровня стран.
FI_US_LONG_PERIOD_URL_POSITION_AVG_REGСтатический URL фактор по поисковым сессиям за 1600 дней. Средняя позиция URL по всем запросам. Локализация до уровня стран.
FI_US_LONG_PERIOD_URL_SHOWS_REGСтатический URL фактор по поисковым сессиям за 1600 дней. Логарифм числа показов. Локализация до уровня стран.
FI_DSSM_LOG_DWELL_TIME_BIGRAMSDSSM model trained on clicks. Takes bigrams into account.
FI_FIRST_LAST_CLICK_MOBILE_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from FirstLastClick stream (Mobile sessions filtered)
FI_FIRST_LAST_CLICK_MOBILE_COSINE_MATCH_MAX_PREDICTIONCosineMatchMaxPrediction factor over hits from FirstLastClick stream (Mobile sessions filtered)
FI_FIRST_LAST_CLICK_MOBILE_FULL_MATCH_VALUEFullMatchValue factor over hits from FirstLastClick stream (Mobile sessions filtered)
FI_FIRST_LAST_CLICK_MOBILE_ALL_WCM_MATCH95_AVG_VALUEAllWcmMatch95AvgValue factor over hits from FirstLastClick stream (Mobile sessions filtered)
FI_FIRST_LAST_CLICK_MOBILE_CM_MATCH_TOP5_AVG_VALUECMMatchTop5AvgValue factor over hits from FirstLastClick stream (Mobile sessions filtered)
FI_FIRST_LAST_CLICK_MOBILE_ALL_WCM_WEIGHTED_VALUEAllWcmWeightedValue factor over hits from FirstLastClick stream (Mobile sessions filtered)
FI_IS_QVOICEБыл ли запрос задан голосом
FI_AVG_DT_WEIGHTED_BY_RANK_MOBILE_ALL_WCM_WEIGHTED_VALUEAllWcmWeightedValue factor over hits from AvgDTWeightedByRankMobile stream (Mobile sessions filtered)
FI_AVG_DT_WEIGHTED_BY_RANK_MOBILE_ALL_WCM_MATCH95_AVG_VALUEAllWcmMatch95AvgValue factor over hits from AvgDTWeightedByRankMobile stream (Mobile sessions filtered)
FI_AVG_DT_WEIGHTED_BY_RANK_MOBILE_CM_MATCH_TOP5_AVG_VALUECMMatchTop5AvgValue factor over hits from AvgDTWeightedByRankMobile stream (Mobile sessions filtered)
FI_AVG_DT_WEIGHTED_BY_RANK_MOBILE_ANNOTATION_MATCH_WEIGHTED_VALUEAnnotationMatchWeightedValue factor over hits from AvgDTWeightedByRankMobile stream (Mobile sessions filtered)
FI_AVG_DT_WEIGHTED_BY_RANK_MOBILE_FULL_MATCH_VALUEFullMatchValue factor over hits from AvgDTWeightedByRankMobile stream (Mobile sessions filtered)
FI_AVG_DT_WEIGHTED_BY_RANK_MOBILE_MIX_MATCH_WEIGHTED_VALUEMixMatchWeightedValue factor over hits from AvgDTWeightedByRankMobile stream (Mobile sessions filtered)
FI_XF_DT_SHOW_TOP_SUM_W2F_SUM_W_FIELD_SET5_AVG_PER_TRIGRAM_MAX_VALUE_ANYФактор лингвистического бустинга. Тип расширений: XfDtShow. Фактор: AvgPerTrigramMaxValueAny по группе стримов 5. Среднее взвешенное значений фактора по топу расширений.
FI_CORRECTED_CTR_LONG_PERIOD_AVG_PER_TRIGRAM_AVG_VALUE_ANYAvgPerTrigramAvgValueAny фактор по CorrectedCtrLongPeriod стриму
FI_DSSM_LOG_DT_BIGRAMS_L2DSSM model trained on clicks. Takes bigrams into account. Embeddings for documents are computed offline.
FI_RANK_ARTROZРанк качества текстов на хосте. Чем выше — тем больше вероятность того, что хост полон статей — рерайта, плохого копирайта, заказанного на биржах контента. Жжёт сильнее как позапросная агрегация.
FI_DSSM_LOG_DWELL_TIME_BIGRAMS_QUERY_DERIVATIVE_MINМинимум от градиентов по словам по биграммной LogDwelltime модели.
FI_DSSM_LOG_DWELL_TIME_BIGRAMS_QUERY_DERIVATIVE_MAXМаксимум от градиентов по словам по биграммной LogDwelltime модели.
FI_DSSM_LOG_DWELL_TIME_BIGRAMS_QUERY_DERIVATIVE_MOMENT_2_CENTRALВторой центральный момент (дисперсия) от градиентов по словам по биграммной LogDwelltime модели.
FI_DSSM_LOG_DWELL_TIME_BIGRAMS_QUERY_DERIVATIVE_MOMENT_3_CENTRALТретий центральный момент от градиентов по словам по биграммной LogDwelltime модели.
FI_DSSM_VK_POPULARITYВероятность того, что хост vk.com является популярным для данного запроса согласно соответствующей dssm-модели.
FI_DSSM_ONLINER_POPULARITYВероятность того, что хост onliner.by является популярным для данного запроса согласно соответствующей dssm-модели.
FI_REMOVED_1362NaN
FI_REMOVED_1363NaN
FI_DSSM_RAMBLER_POPULARITYВероятность того, что хост rambler.ru является популярным для данного запроса согласно соответствующей dssm-модели.
FI_DSSM_EXPERTCEN_POPULARITYВероятность того, что хост expertcen.ru является популярным для данного запроса согласно соответствующей dssm-модели.
FI_DSSM_SUNHOME_POPULARITYВероятность того, что хост sunhome.ru является популярным для данного запроса согласно соответствующей dssm-модели.
FI_UB_LONG_PERIOD_URL_VISITS_SN_PROBСтатический URL фактор по браузерным логам за максимальный период. Процент трафика с социальных сетей во всем трафике с других хостов и поиска.
FI_UB_LONG_PERIOD_URL_DIRECT_H_CHILDREN_90_CNT_FROM_EXT_HOSTСтатический URL фактор по браузерным логам за максимальный период. Среднее число прямых потомков с хоста на которых провели больше 90 секунд. Потомок прямой, только если с нашей страницы на потомок есть ссылка и по ней перешли.
FI_UB_LONG_PERIOD_URL_DEPTH_FROM_EXT_HOSTСтатический URL фактор по браузерным логам за максимальный период. Средняя максимальная глубина дерева с корнем в текущем URL, когда URL посещают с других хостов.
FI_UB_LONG_PERIOD_URL_BROWSE_FRCСтатический URL фактор по браузерным логам за максимальный период. Число раз когда на страницу перешли с серпа деленое на общее число страниц на которые перешли с серпа. Чем ближе к 1, тем чаще страницу открывали единственной в сессии.
FI_UB_LONG_PERIOD_URL_AVG_SEARCH_DURATION_600Статический URL фактор по браузерным логам за максимальный период. Средняя длина поисковых сессий, когда на страницу переходили с серпа
FI_UB_LONG_PERIOD_URL_SEARCH_PERCENT_ENDСтатический URL фактор по браузерным логам за максимальный период. Формулу расчета фактора смотрим на wiki.
FI_UB_LONG_PERIOD_URL_SEARCH_PERCENT_MIDDLE_30Статический URL фактор по браузерным логам за максимальный период. Формулу расчета фактора смотрим на wiki.
FI_UB_LONG_PERIOD_URL_VISIT_120_PROBСтатический URL фактор по браузерным логам за максимальный период. Вероятность что пользователь проведет на странице > 120 секунд.
FI_UB_LONG_PERIOD_URL_LEAVES_CNTСтатический URL фактор по браузерным логам за максимальный период. Число листьев в поддереве URLа. В данном случае листья это страницы с которых не было переходов.
FI_UB_LONG_PERIOD_URL_DT_URL_H_CHILDREN_CUT_600Статический URL фактор по браузерным логам за максимальный период. Среднее время проведенное на странице и во всех потомках страницы(URLы на которые перешли) из хоста. Обрезаем, если суммарный Dt больше 10 минут
FI_UB_LONG_PERIOD_URL_MIN_TIME_WHEN_PAGE_SHOWСтатический URL фактор по браузерным логам за максимальный период. Минимальное unix time когда страница появилась в логах первый раз.
FI_UB_LONG_PERIOD_URL_DELTA_AVG_MIN_TIME_WHEN_PAGE_SHOWСтатический URL фактор по браузерным логам за максимальный период. Разность между средним и минимальным unix time когда страница появилась в логах.
FI_UB_LONG_PERIOD_URL_LATITUDEСтатический URL фактор по браузерным логам за максимальный период. Cредняя широта откуда просматривали страницу.
FI_UB_LONG_PERIOD_URL_LONGITUDEСтатический URL фактор по браузерным логам за максимальный период. Cредняя долгота откуда просматривали страницу.
FI_UB_LONG_PERIOD_URL_DOWNLOADS_PROBСтатический URL фактор по браузерным логам за максимальный период. Вероятность скачки со страницы
FI_UB_LONG_PERIOD_URL_DOWNLOADS_IMAGE_PROBСтатический URL фактор по браузерным логам за максимальный период. Вероятность скачки изображения со страницы
FI_UB_LONG_PERIOD_URL_DOWNLOADS_TORRENT_PROBСтатический URL фактор по браузерным логам за максимальный период. Вероятность скачки торрент файла со страницы
FI_UB_LONG_PERIOD_URL_SEARCH_PERCENT_END_REGСтатический URL фактор по браузерным логам за максимальный период. Формулу расчета фактора смотрим на wiki. Локализация до уровня стран.
FI_UB_LONG_PERIOD_URL_LEAVES_CNT_REGСтатический URL фактор по браузерным логам за максимальный период. Число листьев в поддереве URLа. В данном случае листья это страницы с которых не было переходов. Локализация до уровня стран.
FI_UB_LONG_PERIOD_URL_DT_URL_H_CHILDREN_CUT_600_REGСтатический URL фактор по браузерным логам за максимальный период. Среднее время проведенное на странице и во всех потомках страницы(URLы на которые перешли) из хоста. Обрезаем, если суммарный Dt больше 10 минут. Локализация до уровня стран.
FI_MISSPELL_LM_NGR_YANDEX_DIRECT_ORIGINALCумма скоров слов запроса по языковой модели 3grams-yandex-direct.
FI_MISSPELL_LM_RTL_NGR_WEB_MT_ORIGINALCумма скоров слов запроса по языковой модели web-mt.
FI_UB_LONG_PERIOD_RANKСтатический URL фактор по браузерным логам за максимальный период. Ранк, на основе только UBLP счетчиков, который позволяет находить многие SBR потери
FI_QFUF_TOP_SUM_WF_SUM_W_FIELD_SET3_BCLM_WEIGHTED_FLOG_W0_K0_001NaN
FI_QUERY_TO_TEXT_ALL_SUM_WF_SUM_W_BODY_MIN_WINDOW_SIZENaN
FI_QUERY_TO_TEXT_ALL_AVG_WNaN
FI_QFUF_ALL_SUM_WF_SUM_W_QUERY_DWELL_TIME_MIX_MATCH_WEIGHTED_VALUENaN
FI_QUERY_TO_TEXT_TOP_MIN_WF_BODY_MIN_WINDOW_SIZENaN
FI_QFUF_ALL_MAX_F_FIELD_SET_UT_BM15_FLOG_W0_K0_0001NaN
FI_QFUF_ALL_SUM_WF_SUM_W_FIELD_SET3_BCLM_WEIGHTED_FLOG_W0_K0_001NaN
FI_QFUF_ALL_AVG_WNaN
FI_QUERY_TO_TEXT_ALL_SUM_F_COUNT_BODY_PAIR_MIN_PROXIMITYNaN
FI_QFUF_ALL_TOTAL_WNaN
FI_QUERY_TO_TEXT_ALL_SUM_F_COUNT_TEXT_BOCM11_NORM256NaN
FI_QFUF_ALL_MAX_F_TEXT_COSINE_MATCH_MAX_PREDICTIONNaN
FI_QFUF_TOP_SUM_W2F_SUM_W_FIELD_SET1_BM15FLOG_K0_001NaN
FI_QFUF_ALL_MAX_F_TEXT_BOCM11_NORM256NaN
FI_QFUF_TOP_SUM_WF_SUM_W_FIELD_SET_UT_BM15FLOGW0_K0_0001NaN
FI_DSSM_ONE_CLICK_PROBABILITYDSSM model trained on clicks, target=OneClicks/Clicks. Takes bigrams into account.
FI_DSSM_QUERY_DWELL_TIMEDSSM model trained on clicks, target=QueryDwellTime stream value. Takes bigrams into account.
FI_ALL_MATCHED_WORD_WEIGHTS_SUMNaN
FI_STRING_MATCHED_WORD_WEIGHTS_SUMNaN
FI_ALL_MATCHED_WORD_WEIGHTS_SUM_TEXTNaN
FI_ALL_MATCHED_WORD_WEIGHTS_SUM_LINKNaN
FI_STRING_MATCHED_WORD_WEIGHTS_SUM_LINKNaN
FI_ALL_MATCHED_WORD_FILTRATION_MODEL_WEIGHTS_SUMNaN
FI_STRING_MATCHED_WORD_FILTRATION_MODEL_WEIGHTS_SUMNaN
FI_LEMMA_MATCHED_WORD_FILTRATION_MODEL_WEIGHTS_SUMNaN
FI_ALL_MATCHED_WORD_FILTRATION_MODEL_WEIGHTS_SUM_LINKNaN
FI_STRING_MATCHED_WORD_FILTRATION_MODEL_WEIGHTS_SUM_LINKNaN
FI_QFUF_ALL_MAX_F_LINKANN_INDICATOR_ANNOTATION_MAX_VALUE_WEIGHTEDФактор лингвистического бустинга. Тип расширений: Qfuf. Аггрегация по всем расширениям. Наибольшее значение фактора. По стриму из линкового индекса LinkAnnIndicator. Алгоритм AnnotationMaxValueWeighted — максимальный вес (по MainWeights весам слов) покрытия аннотациями, взвешено на вес аннотации
FI_QFUF_ALL_MAX_WF_LINKANN_INDICATOR_FULL_MATCH_VALUEФактор лингвистического бустинга. Тип расширений: Qfuf. Аггрегация по всем расширениям. Наибольшее значение фактора. По стриму из линкового индекса LinkAnnIndicator. Алгоритм AnnotationMaxValueWeighted — максимальный вес (по MainWeights весам слов) покрытия аннотациями, взвешено на вес аннотации
FI_XF_DT_SHOW_ALL_MAX_WF_MAX_W_LINKANN_INDICATOR_PER_WORD_CM_MAX_MATCH_MINФактор лингвистического бустинга. Тип расширений: XfDtShow. Аггрегация по всем расширениям. Наибольшее взвешенное значение фактора. Нормировано на максимальный вес расширения. По стриму из линкового индекса LinkAnnIndicator. Алгоритм PerWordCMMaxMatchMin: минимальный по словам вес CMMaxMatch.
FI_XF_DT_SHOW_KNN_ALL_MAX_WF_META_POLY_GEN8_BCLM_MIX_PLAIN_KE5Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn (ближайшие по dssm-модели, обучаемой предсказывать XfDtShow расширения). Агрегация по всем расширениям. Наибольшее взвешенное значение фактора. Смесь множества стримов, вес высчитывается по фиксированному полиному от весов компонент на данной аннотации. Алгоритм агрегации весов слов — BclmMixPlain: линейная смесь аннотационного Bclm веса и взвешенного Positionless веса слова, затем пословные счётчики агрегируются через bm15. Коэффициент нормализации 10^(-5).
FI_XF_DT_SHOW_KNN_ALL_MAX_WF_MAX_W_CTR_LONG_PERIOD_WORD_COVERAGE_FORMФактор лингвистического бустинга. Тип расширений: XfDtShowKnn (ближайшие по dssm-модели, обучаемой предсказывать XfDtShow расширения). Агрегация по всем расширениям. Наибольшее взвешенное значение фактора. Нормировано на максимальный вес расширения. Стрим: CorrectedCtrLongPeriod. Степень покрытия слов запросас точностью до формы (без синонимов).
FI_QFUF_ALL_MAX_WF_MAX_W_VPCG_CORRECTED_CLICKS_SLP_EXACT_QUERY_MATCH_AVG_VALUEФактор лингвистического бустинга. Тип расширений: Qfuf. Агрегация по всем расширениям. Наибольшее взвешенное значение фактора. Нормировано на максимальный вес расширения. Результат vpcg для долгого длинного периода, данные: CorrectedClicks. Средний вес аннтаций среди тех, в которых запрос оказался точной подстрокой.
FI_XF_DT_SHOW_KNN_ALL_MAX_WF_MAX_W_CTR_LONG_PERIOD_BCLM_PLANE_PROXIMITY1_BM15_W0_SIZE1_K0001Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn (ближайшие по dssm-модели, обучаемой предсказывать XfDtShow расширения). Агрегация по всем расширениям. Наибольшее взвешенное значение фактора. Нормировано на максимальный вес расширения. Стрим: CorrectedCtrLongPeriod. Алгоритм BclmPlaneProximity1Bm15W0Size1: использует bclm с безвесовым взвеживанием если слов запроса несколько, если слово одно, то используется взвешенная по типу совпадения сумма хитов. Коэффициент нормализации 0.001.
FI_XF_DT_SHOW_KNN_ALL_AVG_WФактор лингвистического бустинга. Тип расширений: XfDtShowKnn (ближайшие по dssm-модели, обучаемой предсказывать XfDtShow расширения). Агрегация по всем расширениям. Средний вес расширений.
FI_DSSM_LANGUAGE_CLASSIFIER_RUS_L2Документная dssm модель language classifier rus.
FI_DSSM_LANGUAGE_CLASSIFIER_ENG_L2Документная dssm модель language classifier eng.
FI_DSSM_LANGUAGE_CLASSIFIER_OTH_L2Документная dssm модель language classifier other.
FI_REMOVED_1428NaN
FI_REMOVED_1429NaN
FI_ALICE_ARAMUSICNaN
FI_ALICE_MUSIC_RELEVANCE_DSSMПредсказание DSSM модели для определения нерелевантных ответов Алисы
FI_RANDOM_LOG_QUERY_AVG_NEWSСреднее значение News по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_ADD_TIMEСреднее значение AddTime по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_TEXT_HI_RELEV_SYNСреднее значение TxtHiRelSy по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_TEXT_LIKEСреднее значение TextLike по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_HAS_NO_ALL_WORDS_TR_SYNСреднее значение HasNoAllWordsTRSy по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_IS_FORUMСреднее значение IsForum по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_HAS_PAYMENTSСреднее значение HasPayments по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_YABAR_HOST_AVG_TIME2Среднее значение YabarHostAvgTime2 по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_YABAR_URL_VISITORSСреднее значение YabarUrlVisitors по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_QUERY_DOWNER_ONLY_CLICK_RATEСреднее значение QueryDOwnerOnlyClickRate по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_DATER_AGEСреднее значение DaterAge по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_LONGEST_TEXTСреднее значение LongestText по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_DIFFERENT_INTERNAL_LINKSСреднее значение DifferentInternalLinks по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_QUERY_DOWNER_ONLY_CLICK_RATE_REGСреднее значение QueryDOwnerOnlyClickRate_Reg по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_IS_HUBСреднее значение IsHub по запросу за год. Рассчитывается в оффлайне.
FI_REMOVED_1447NaN
FI_RANDOM_LOG_QUERY_AVG_BM25_0Среднее значение BM25_0 по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_BOCMСреднее значение Bocm по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_IS_INDEX_PAGEСреднее значение IsIndexPage по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_QUERIES_AVG_CM2Среднее значение QueriesAvgCM2 по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_BROWSER_HOST_DOWNLOAD_PROBABILITYСреднее значение BrowserHostDownloadProbability по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_REG_BROWSER_USER_HUBСреднее значение RegBrowserUserHub по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_AUX_TITLE_BM25Среднее значение AuxTitleBM25 по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_QUERY_URL_CORRECTED_CTR_XFACTORСреднее значение QueryUrlCorrectedCtrXfactor по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_QUERY_TO_DOC_ALL_SUM_F_COUNT_TEXT_BM11_NORM16384Среднее значение QueryToDocAllSumFCountTextBm11Norm16384 по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_AVG_XF_DT_SHOW_ALL_SUM_WF_SUM_W_BODY_MIN_WINDOW_SIZEСреднее значение XfDtShowAllSumWFSumWBodyMinWindowSize по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_CLICKS_WEIGHTED_AVG_IS_MAIN_PAGEСредневзвешанное кликами значение IsMainPage по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_CLICKS_WEIGHTED_AVG_YABAR_URL_AVG_TIMEСредневзвешанное кликами значение YabarUrlAvgTime по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_CLICKS_WEIGHTED_AVG_DIFFERENT_INTERNAL_LINKSСредневзвешанное кликами значение DifferentInternalLinks по запросу за год. Рассчитывается в оффлайне.
FI_RANDOM_LOG_QUERY_DWELLTIME_WEIGHTED_AVG_URL_DOMAIN_FRACTIONСредневзвешанное dwelltime-ами значение UrlDomainFraction по запросу за год. Рассчитывается в оффлайне.
FI_BM25F_DPR_FIXED_NO_LINKSBM25FdPR с нормировкой на среднюю длину документа, зависящую от языка документа. Используются только хиты текстов.
FI_DOMAIN_HAS_METRIKADoes owner have metrika or not
FI_HAS_SIDEBLOCKУ документа есть турбо-страница для mobile платформы.
FI_HISTORICAL_ANNOTATION_COUNTDocument annotations count in the whole history of the Search (DSSM AnnReg models helper)
FI_HISTORICAL_ANN_WORD_COUNTDocument annotation words count in the whole history of the Search (DSSM AnnReg models helper)
FI_HISTORICAL_ANN_REG_COUNTDocument annotation regions count in the whole history of the Search (DSSM AnnReg models helper)
FI_REMOVED_1468NaN
FI_REMOVED_1469NaN
FI_NO_APPROX_SMALL_WINDOW_ATTENUATIONNaN
FI_NO_APPROX_SMALL_WINDOW_ATTENUATION_QNaN
FI_DSSM_MAIN_CONTENT_KEYWORDSQuery-MainContentKeywords similarity, target: logDwellTime
FI_YELLOWNESS_MAXMaximum value of domain yellowness (based on Toloka)
FI_YELLOWNESS_MEANMean value of domain yellowness (based on Toloka)
FI_YELLOWNESS_MEDIANMedian of domain yellowness (based on Toloka)
FI_YELLOWNESS_MINMinimum value of domain yellowness (based on Toloka)
FI_DSSM_BOOSTING_XF_WEIGHT_QUERY_SELF_SIMILARITYDssm Boosting query self similarity for XfWeight model.
FI_DSSM_BOOSTING_XF_WEIGHT_KMEANS_5_AVG_TOP_02_SCOREDssm Boosting AvgTop02Score aggregation for XfWeight model over 5-means centroids.
FI_DSSM_BOOSTING_XF_WEIGHT_KMEANS_5_AVG_TOP_04_SCOREDssm Boosting AvgTop04Score aggregation for XfWeight model over 5-means centroids.
FI_DSSM_BOOSTING_XF_WEIGHT_KMEANS_5_AVG_TOP_02_SCORE_AVG_CLUSTER_TOP_3_WEIGHTEDDssm Boosting AvgTop02ScoreAvgClusterTop3Weighted aggregation for XfWeight model over 5-means centroids.
FI_DSSM_BOOSTING_XF_WEIGHT_KMEANS_5_AVG_TOP_02_SCORE_QEDssm Boosting AvgTop02Score aggregation for XfWeight model over 5-means centroids (query as expansion).
FI_DSSM_BOOSTING_XF_WEIGHT_KMEANS_5_AVG_TOP_02_SCORE_AVG_CLUSTER_TOP_3_WEIGHTED_QEDssm Boosting AvgTop02ScoreAvgClusterTop3Weighted aggregation for XfWeight model over 5-means centroids (query as expansion).
FI_DSSM_BOOSTING_XF_ONE_QUERY_SELF_SIMILARITYDssm Boosting query self similarity for XfOne model.
FI_DSSM_BOOSTING_XF_ONE_KMEANS_1_SCOREDssm Boosting Score aggregation for XfOne model over 1-means centroids.
FI_DSSM_BOOSTING_XF_ONE_KMEANS_1_SCALED_SUM_WEIGHTDssm Boosting ScaledSumWeight aggregation for XfOne model over 1-means centroids.
FI_DSSM_BOOSTING_XF_ONE_KMEANS_1_SCORE_QEDssm Boosting Score aggregation for XfOne model over 1-means centroids (query as expansion).
FI_DSSM_BOOSTING_XF_ONE_KMEANS_1_SCORE_AVG_NEAREST_1_WEIGHTED_QEDssm Boosting ScoreAvgNearest1Weighted aggregation for XfOne model over 1-means centroids (query as expansion).
FI_DSSM_BOOSTING_XF_ONE_KMEANS_1_SCORE_AVG_NEAREST_5_WEIGHTED_QEDssm Boosting ScoreAvgNearest5Weighted aggregation for XfOne model over 1-means centroids (query as expansion).
FI_DSSM_BOOSTING_XF_ONE_SE_KMEANS_1_SCOREDssm Boosting Score aggregation for XfOneSe model over 1-means centroids.
FI_DSSM_BOOSTING_XF_ONE_SE_KMEANS_1_SCORE_SCALED_SUM_WEIGHTEDDssm Boosting ScoreScaledSumWeighted aggregation for XfOneSe model over 1-means centroids.
FI_DSSM_BOOSTING_XF_ONE_SE_KMEANS_1_SCORE_AVG_NEAREST_5_WEIGHTEDDssm Boosting ScoreAvgNearest5Weighted aggregation for XfOneSe model over 1-means centroids.
FI_DSSM_BOOSTING_CTR_QUERY_SELF_SIMILARITYDssm Boosting query self similarity for Ctr model.
FI_DSSM_BOOSTING_CTR_KMEANS_1_SCOREDssm Boosting Score aggregation for Ctr model over 1-means centroids.
FI_DSSM_BOOSTING_CTR_KMEANS_1_SCORE_QEDssm Boosting Score aggregation for Ctr model over 1-means centroids (query as expansion).
FI_DSSM_BOOSTING_CTR_KMEANS_1_SCORE_SCALED_SUM_WEIGHTED_QEDssm Boosting ScoreScaledSumWeighted aggregation for Ctr model over 1-means centroids (query as expansion).
FI_DSSM_BOOSTING_CTR_KMEANS_1_SCORE_AVG_NEAREST_1_WEIGHTED_QEDssm Boosting ScoreAvgNearest1Weighted aggregation for Ctr model over 1-means centroids (query as expansion).
FI_YELLOWNESS_DISPERSIONYellowness distribution dispersion of domain (based on Toloka)
FI_VPCG_CORRECTED_CLICKS_SLP_PER_WORD_CM_MAX_PREDICTION_MINРезультат vpcg для долгого длинного периода, данные: CorrectedClicks. Фактор FullMatchPrediction
FI_VPCG_CORRECTED_CLICKS_SLP_ALL_WCM_MATCH95_AVG_VALUEРезультат vpcg для долгого длинного периода, данные: CorrectedClicks. Фактор AllWcmMatch95AvgValue
FI_VPCG_CORRECTED_CLICKS_SLP_CM_MATCH_TOP5_AVG_VALUEРезультат vpcg для долгого длинного периода, данные: CorrectedClicks. Фактор CMMatchTop5AvgValue
FI_VPCG_CORRECTED_CLICKS_SLP_ANNOTATION_MAX_VALUE_WEIGHTEDРезультат vpcg для долгого длинного периода, данные: CorrectedClicks. Фактор AnnotationMaxValueWeighted
FI_VPCG_CORRECTED_CLICKS_SLP_MIX_MATCH_WEIGHTED_VALUEРезультат vpcg для долгого длинного периода, данные: CorrectedClicks. Фактор MixMatchWeightedValue
FI_VPCG_CORRECTED_CLICKS_SLP_CM_MATCH_TOP5_AVG_PREDICTIONРезультат vpcg для долгого длинного периода, данные: CorrectedClicks. Фактор CMMatchTop5AvgPrediction
FI_DSSM_CTR_NO_MINERDSSM model trained on CTRs without miner.
FI_DSSM_PAGE_QUALITY_RTHUBПредсказание dssm (url + title), обученной на сигнал page_quality и внедренной в RTHub, первый слот.
FI_DSSM_PAGE_QUALITY_RTHUB_SLOT2Предсказание dssm (url + title), обученной на сигнал page_quality и внедренной в RTHub, второй слот.
FI_DSSM_QUERY_EMBEDDING_CTR_NO_MINER_PCA_0Главные компоненты запросного эмбединга от модели DssmCtrNoMiner
FI_DSSM_QUERY_EMBEDDING_CTR_NO_MINER_PCA_1Главные компоненты запросного эмбединга от модели DssmCtrNoMiner
FI_DSSM_QUERY_EMBEDDING_CTR_NO_MINER_PCA_2Главные компоненты запросного эмбединга от модели DssmCtrNoMiner
FI_DSSM_QUERY_EMBEDDING_CTR_NO_MINER_PCA_3Главные компоненты запросного эмбединга от модели DssmCtrNoMiner
FI_DSSM_QUERY_EMBEDDING_CTR_NO_MINER_PCA_4Главные компоненты запросного эмбединга от модели DssmCtrNoMiner
FI_DSSM_QUERY_EMBEDDING_CTR_NO_MINER_PCA_5Главные компоненты запросного эмбединга от модели DssmCtrNoMiner
FI_DSSM_QUERY_URL_TITLE_REG_CHAIN_CLICKS_ODDDSSM model trained on click odd pool
FI_DSSM_QUERY_URL_TITLE_REG_CHAIN_CLICKS_PERSDSSM model trained on click personalization pool
FI_DSSM_QUERY_URL_TITLE_REG_CHAIN_CLICKS_TR_FULLDSSM model trained on click triangle pool
FI_REQUEST_WITH_REGION_NAME_LINKANN_FLOAT_MULTIPLICITY_CMMATCH_TOP5_AVG_MATCH_VALUEФактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: CMMatchTop5AvgMatchValue по стриму FloatMultiplicity индекса LinkAnn
FI_REMOVED_1517NaN
FI_LINKANN_FLOAT_MULTIPLICITY_PER_WORD_AMMAX_VALUE_MINФактор лингвистического бустинга. Фактор: PerWordAMMaxValueMin по стриму FloatMultiplicity индекса LinkAnn
FI_LINKANN_FLOAT_MULTIPLICITY_ATTENV1_BM15_K001Фактор лингвистического бустинга. Фактор: AttenV1Bm15K001 по стриму FloatMultiplicity индекса LinkAnn
FI_LINKANN_LINK_EXTERNAL_BOCM11_NORM256Фактор лингвистического бустинга. Фактор: Bocm11Norm256 по стриму IsExternal индекса LinkAnn
FI_REMOVED_1521NaN
FI_REQUEST_WITH_REGION_NAME_LINKANN_FLOAT_MULTIPLICITY_ANNOTATION_MAX_VALUEФактор лингвистического бустинга. Тип расширений: RequestWithRegionName. Фактор: AnnotationMaxValue по стриму FloatMultiplicity индекса LinkAnn
FI_DSSM_LOG_DT_BIGRAMS_AM_HARD_QUERIES_NO_CLICKSDSSM model trained on clicks without miner (with no-clicks and AM-hard negatives). Takes bigrams into account.
FI_RANDOMLOGHOST_HAS_PAYMENTS_AVGAVG aggregation of HasPayments web factor using random log
FI_RANDOMLOGHOST_IS_VIDEO_QUERY_AVGAVG aggregation of VideoQuery web factor using random log
FI_RANDOMLOGHOST_SYNT_QUALITY_AVGAVG aggregation of SyntQuality web factor using random log
FI_RANDOMLOGHOST_REGIONAL_V_QUERY_NEW_PERCENTALE_90PERCENTALE_90 aggregation of GeoRegionalityVNew web factor using random log
FI_RANDOMLOGHOST_QCLASS_DOWNLOAD_AVGAVG aggregation of QClassDownload web factor using random log
FI_RANDOMLOGHOST_QUERY_ISMUSIC_AVGAVG aggregation of IsMusic web factor using random log
FI_RANDOMLOGHOST_QUERY_TH3561_PERCENTALE_25PERCENTALE_25 aggregation of QueryThEncyclopedic web factor using random log
FI_RANDOMLOGHOST_COMMERCIAL_OWNER_RANK_REG_AVGAVG aggregation of CommercialOwnerRank_Reg web factor using random log
FI_RANDOMLOGHOST_YABAR_WORD_DNGI_PERCENTALE_25PERCENTALE_25 aggregation of YabarWordDepthNodesGradientMin web factor using random log
FI_RANDOMLOGHOST_PSE_FRC_BROWSER_AVGAVG aggregation of PopularSEFRCBrowser web factor using random log
FI_RANDOMLOGHOST_URL_CLICKS_MAX_GEO_REGION_FRC_RATIO_AVGAVG aggregation of URLClicksMaxGeoRegionFRCRatio web factor using random log
FI_RANDOMLOGHOST_UB_LONG_PERIOD_URL_DIRECT_H_CHILDREN_90_CNT_FROM_EXT_HOST_PERCENTALE_90PERCENTALE_90 aggregation of UBLongPeriodDirectHChildren90CntFromExtHost web factor using random log
FI_RANDOMLOGHOST_UB_LONG_PERIOD_URL_DT_URL_H_CHILDREN_CUT_600_REG_PERCENTALE_90PERCENTALE_90 aggregation of UBLongPeriodDtUrlHChildrenCut600Reg web factor using random log
FI_RANDOMLOGHOST_QUERY_ISPICTURE_AVGAVG aggregation of IsPicture web factor using random log
FI_RANDOMLOGHOST_ERRATUM_LOG_QUERY_PROBABILITY_AVGAVG aggregation of ErratumLogQueryProbability web factor using random log
FI_REMOVED_1539NaN
FI_REMOVED_1540NaN
FI_REMOVED_1541NaN
FI_DSSM_QUERY_COUNTRY_TO_URL_ESTIMATED_DISTANCEПредсказанная по запросу и стране, с помощью dssm-модели длина клика из данной страны.
FI_DSSM_RANDOM_LOG_QUERY_AVG_NEWSПредсказанное с помощью нейронной сети среднее значение News по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_ADD_TIMEПредсказанное с помощью нейронной сети среднее значение AddTime по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_TEXT_HI_RELEV_SYNПредсказанное с помощью нейронной сети среднее значение TxtHiRelSy по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_TEXT_LIKEПредсказанное с помощью нейронной сети среднее значение TextLike по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_HAS_NO_ALL_WORDS_TR_SYNПредсказанное с помощью нейронной сети среднее значение HasNoAllWordsTRSy по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_IS_FORUMПредсказанное с помощью нейронной сети среднее значение IsForum по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_HAS_PAYMENTSПредсказанное с помощью нейронной сети среднее значение HasPayments по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_YABAR_HOST_AVG_TIME2Предсказанное с помощью нейронной сети среднее значение YabarHostAvgTime2 по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_YABAR_URL_VISITORSПредсказанное с помощью нейронной сети среднее значение YabarUrlVisitors по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_QUERY_DOWNER_ONLY_CLICK_RATEПредсказанное с помощью нейронной сети среднее значение QueryDOwnerOnlyClickRate по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_DATER_AGEПредсказанное с помощью нейронной сети среднее значение DaterAge по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_LONGEST_TEXTПредсказанное с помощью нейронной сети среднее значение LongestText по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_DIFFERENT_INTERNAL_LINKSПредсказанное с помощью нейронной сети среднее значение DifferentInternalLinks по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_QUERY_DOWNER_ONLY_CLICK_RATE_REGПредсказанное с помощью нейронной сети среднее значение QueryDOwnerOnlyClickRate_Reg по запросу за год.
FI_REMOVED_1557NaN
FI_REMOVED_1558NaN
FI_ALICE_MUSIC_URL_TYPE_IS_TRACKТип канонизированного урла яндекс музыки — трек
FI_DSSM_RANDOM_LOG_QUERY_AVG_BOCMПредсказанное с помощью нейронной сети среднее значение Bocm по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_IS_INDEX_PAGEПредсказанное с помощью нейронной сети среднее значение IsIndexPage по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_QUERIES_AVG_CM2Предсказанное с помощью нейронной сети среднее значение QueriesAvgCM2 по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_BROWSER_HOST_DOWNLOAD_PROBABILITYПредсказанное с помощью нейронной сети среднее значение BrowserHostDownloadProbability по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_REG_BROWSER_USER_HUBПредсказанное с помощью нейронной сети среднее значение RegBrowserUserHub по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_AUX_TITLE_BM25Предсказанное с помощью нейронной сети среднее значение AuxTitleBM25 по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_QUERY_URL_CORRECTED_CTR_XFACTORПредсказанное с помощью нейронной сети среднее значение QueryUrlCorrectedCtrXfactor по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_QUERY_TO_DOC_ALL_SUM_F_COUNT_TEXT_BM11_NORM16384Предсказанное с помощью нейронной сети среднее значение QueryToDocAllSumFCountTextBm11Norm16384 по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_AVG_XF_DT_SHOW_ALL_SUM_WF_SUM_W_BODY_MIN_WINDOW_SIZEПредсказанное с помощью нейронной сети среднее значение XfDtShowAllSumWFSumWBodyMinWindowSize по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_CLICKS_WEIGHTED_AVG_IS_MAIN_PAGEПредсказанное с помощью нейронной сети средневзвешанное кликами значение IsMainPage по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_CLICKS_WEIGHTED_AVG_YABAR_URL_AVG_TIMEПредсказанное с помощью нейронной сети средневзвешанное кликами значение YabarUrlAvgTime по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_CLICKS_WEIGHTED_AVG_DIFFERENT_INTERNAL_LINKSПредсказанное с помощью нейронной сети средневзвешанное кликами значение DifferentInternalLinks по запросу за год.
FI_DSSM_RANDOM_LOG_QUERY_DWELLTIME_WEIGHTED_AVG_URL_DOMAIN_FRACTIONПредсказанное с помощью нейронной сети средневзвешанное dwelltime-ами значение UrlDomainFraction по запросу за год.
XF_DT_SHOW_KNN_ALL_MAX_WF_FIELD_SET3_BCLM_WEIGHTED_F_LOG_W0_K0_001Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: BclmWeightedFLogW0 по группе стримов 3. Максимальное взвешенное значение фактора.
XF_DT_SHOW_KNN_ALL_MAX_WF_FIELD_SET2_BM15_F_LOG_K0_001Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: Bm15FLog по группе стримов 2. Максимальное взвешенное значение фактора.
XF_DT_SHOW_KNN_BAG_OF_WORDS_FIELD_SET_BAG_OF_WORDS_ORIGINAL_REQUEST_FRACTIONФактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: мешочный OriginalRequestFraction по стриму FieldSetBagOfWords.
XF_DT_SHOW_KNN_ALL_MAX_WF_SUM_W_QUERY_DWELL_TIME_MIX_MATCH_WEIGHTED_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: MixMatchWeightedValue по стриму QueryDwellTime. Максимальное взвешенное значение фактора нормированное на суммарный вес.
XF_DT_SHOW_KNN_ALL_SUM_W2_F_SUM_W_TITLE_BM15_K0_1Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: Bm15 по стриму Title. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) нормированное на суммарный вес.
XF_DT_SHOW_KNN_TOP_MIN_F_FIELD_SET3_BCLM_WEIGHTED_F_LOG_W0_K0_001Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: BclmWeightedFLogW0 по группе стримов 3. Минимальное значение фактора по топу расширений.
XF_DT_SHOW_KNN_ALL_SUM_W2_F_SUM_W_FIELD_SET3_BCLM_WEIGHTED_F_LOG_W0_K0_001Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: BclmWeightedFLogW0 по группе стримов 3. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) нормированное на суммарный вес.
XF_DT_SHOW_KNN_ALL_MAX_WF_FIELD_SET1_BM15_F_LOG_K0_001Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: Bm15FLog по группе стримов 1. Максимальное взвешенное значение фактора.
XF_DT_SHOW_KNN_ALL_SUM_WF_SUM_W_FIELD_SET1_BM15_F_LOG_K0_001Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: Bm15FLog по группе стримов 1. Суммарное взвешенное значение фактора нормированное на суммарный вес.
XF_DT_SHOW_KNN_BAG_OF_WORDS_LONG_CLICK_SP_ANNOTATION_MATCH_AVG_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: мешочный AnnotationMatchAvgValue по стриму LongClickSP.
XF_DT_SHOW_KNN_TOP_SUM_W2_F_SUM_W_FIELD_SET1_BM15_F_LOG_K0_001Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: Bm15FLog по группе стримов 1. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по топу расширений нормированное на суммарный вес по топу расширений.
XF_DT_SHOW_KNN_TOP_MIN_WF_MAX_W_FIELD_SET1_BM15_F_LOG_K0_001Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: Bm15FLog по группе стримов 1. Минимальное взвешенное значение фактора по топу расширений нормированное на максимальный вес по топу расширений.
XF_DT_SHOW_KNN_ALL_MAX_WF_SUM_W_BODY_PAIR_MIN_PROXIMITYФактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: PairMinProximity по стриму Body. Максимальное взвешенное значение фактора нормированное на суммарный вес.
XF_DT_SHOW_KNN_ALL_SUM_W2_F_SUM_W_FIELD_SET1_BM15_F_LOG_K0_001Фактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: Bm15FLog по группе стримов 1. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) нормированное на суммарный вес.
XF_DT_SHOW_KNN_BAG_OF_WORDS_SIMPLE_CLICK_ANNOTATION_MATCH_AVG_VALUEФактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: мешочный AnnotationMatchAvgValue по стриму SimpleClick.
XF_DT_SHOW_KNN_BAG_OF_WORDS_TITLE_COSINE_MAX_MATCHФактор лингвистического бустинга. Тип расширений: XfDtShowKnn. Фактор: мешочный CosineMaxMatch по стриму Title.
FI_REGIONALITY5_LOCALIZATION_PROBABILITYПредсказание вероятности того, что запрос локализуем в соответствии с правилом Regionality5.
FI_REMOVED_1590NaN
FI_REMOVED_1591NaN
FI_REMOVED_1592NaN
FI_REMOVED_1593NaN
FI_DOCUMENT_HAS_FIO_FROM_ORIGINAL_REQUESTDocument has Fio from original request
FI_PAGE_QUALITY_EXPERIMENT_1Фактор для экспериментов Page Quality 1
FI_DSSM_LOG_DT_BIGRAMS_AM_HARD_QUERIES_NO_CLICKS_MIXEDDSSM model trained on clicks without miner (with no-clicks and am_hard negatives 50/50 and then on am_hard negatives only). Takes bigrams into account.
FI_DSSM_BOOSTING_XF_ONE_SE_AM_SS_HARD_KMEANS_1_SCOREDssm Boosting Score aggregation for XfOneSeAmSsHard model over 1-means centroids.
FI_DSSM_BOOSTING_XF_ONE_SE_AM_SS_HARD_KMEANS_1_SCORE_AVG_CLUSTER_TOP_3_WEIGHTEDDssm Boosting ScoreAvgClusterTop3Weighted aggregation for XfOneSeAmSsHard model over 1-means centroids.
FI_PAGE_QUALITY_EXPERIMENT_2Фактор для экспериментов Page Quality 2
FI_YELLOWNESS_IMG_MAXAverage by url maximum yellowness of teaser image
FI_YELLOWNESS_IMG_AVGAverage by url average yellowness of teaser image
FI_YELLOW_IMG_SHARERatio of yellow images in teasers on host
FI_YELLOW_IMG_COUNTAverage yellow images count on host
FI_TEASERS_COUNTAverage teasers count on host
FI_TEASERS_AREAAverage teasers area on host
FI_YELLOWNESS_TXT_MINAverage by url minimum yellowness of teaser text
FI_YELLOWNESS_TXT_AVGAverage by url average yellowness of teaser text
FI_HAS_ADV_CLICKABLE_BGBackground is clickable advertisement
FI_ADV_NETS_AREAAverage ratio of adverts on screen
FI_ADV_NETS_AREA_FIRST_PAGERatio of adverts on screen on main page
FI_ADV_NETS_COUNTAverage count of adverts on screen
FI_ADV_TRAFF_OUT_SHARE_DESKTOPRatio of outgoing advertisement traffic to all traffic (desktop)
FI_RTB_TRAFF_OUT_SHARE_DESKTOPRatio of outgoing real-time bidding traffic to all traffic (desktop)
FI_NEWS_AGENCY_RATINGRating of news agency from agencies.json (Yandex.News resource)
FI_QUERY_TO_TEXT_BY_XF_DT_SHOW_KNN_ALL_SUM_W2_F_SUM_W_TEXT_BOCM11_NORM256Фактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Фактор: Norm256 по стриму Bocm11. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}).
FI_QUERY_TO_TEXT_BY_XF_DT_SHOW_KNN_TOP_SUM_W2_F_SUM_W_BODY_MIN_WINDOW_SIZEФактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Фактор: MinWindowSize по стриму Body. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по топу расширений нормированное на суммарный вес по топу расширений.
FI_QUERY_TO_TEXT_BY_XF_DT_SHOW_KNN_ALL_SUM_W2_F_SUM_W_BODY_MIN_WINDOW_SIZEФактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Фактор: MinWindowSize по стриму Body. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) нормированное на суммарный вес.
FI_QUERY_TO_TEXT_BY_XF_DT_SHOW_KNN_TOP_SUM_W2_F_SUM_W_TEXT_BOCM11_NORM256Фактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Фактор: Norm256 по стриму Bocm11. Суммарное взвешенное значений фактора умноженных на вес (\\frac{\\Sum W_i * (W_i * F_i)}{\\Sum W_i}) по топу расширений.
FI_QUERY_TO_TEXT_BY_XF_DT_SHOW_KNN_ALL_MIN_WФактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Минимальный вес расширения.
FI_QUERY_TO_TEXT_BY_XF_DT_SHOW_KNN_ALL_AVG_WФактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Среднее арифметическое весов расширений.
FI_QUERY_TO_TEXT_BY_XF_DT_SHOW_KNN_ALL_TOTAL_WФактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Суммарный вес расширений.
FI_QUERY_TO_TEXT_BY_XF_DT_SHOW_KNN_BAG_OF_WORDS_FIELD_SET_BAG_OF_WORDS_ORIGINAL_REQUEST_FRACTIONФактор лингвистического бустинга. Тип расширений: QueryToTextByXfDtShowKnn. Фактор: мешочный OriginalRequestFraction по стриму FieldSetBagOfWords.
FI_PAGE_QUALITY_EXPERIMENT_3Фактор для экспериментов Page Quality 3
DssmBoostingXfOneSeAmSsHardQueryMutationAddFixedYearWordRenormedDistanceХарактеризует запрос по степени изменения от добавления фиксированного слова (номер некоторого года), используется dssm модель DssmBoostingXfOneSeAmSsHard
DssmBoostingXfOneSeAmSsHardQueryMutationAddOnlineWordRenormedDistanceХарактеризует запрос по степени изменения от добавления фиксированного слова (‘онлайн’ для кирилицы), используется dssm модель DssmBoostingXfOneSeAmSsHard
DssmBoostingXfOneSeAmSsHardQueryMutationDelSiteWordRenormedDistanceХарактеризует запрос по степени изменения от удаления фиксированного слова (‘сайт’ для кирилицы), используется dssm модель DssmBoostingXfOneSeAmSsHard
FI_DOC_SOURCE_FRESHДокумент из шардов со свежим
FI_RANDOM_LOG_WORD_MAX_HAS_NO_TRДля каждого слова в оффлайне вычисляется среднее значение HasNoTr по запросам за 3 месяца. Далее по всем словам запроса берётся максимум этой величины.
FI_RANDOM_LOG_WORD_MAX_IS_LJДля каждого слова в оффлайне вычисляется среднее значение IsLJ по запросам за 3 месяца. Далее по всем словам запроса берётся максимум этой величины.
FI_REMOVED_1630NaN
FI_RANDOM_LOG_WORD_MIN_BCLM_LITEДля каждого слова в оффлайне вычисляется среднее значение BclmLite по запросам за 3 месяца. Далее по всем словам запроса берётся минимум этой величины.
FI_RANDOM_LOG_WORD_SKIP_STOP_WORDS_MAX_DBM40Для каждого слова в оффлайне вычисляется среднее значение DBM40 по запросам за 3 месяца. Далее по всем не стоп словам запроса берётся максимум этой величины.
FI_RANDOM_LOG_WORD_SKIP_STOP_WORDS_MAX_IS_DESKTOP_REQUESTДля каждого слова в оффлайне вычисляется среднее значение IsDesktopRequest по запросам за 3 месяца. Далее по всем не стоп словам запроса берётся максимум этой величины.
FI_RANDOM_LOG_WORD_MAX_RLQ_AVG_HAS_NO_ALL_WORDS_TR_SYNДля каждого слова в оффлайне вычисляется среднее значение RLQAvgHasNoAllWordsTrSyn по запросам за 3 месяца. Далее по всем словам запроса берётся максимум этой величины.
FI_RANDOM_LOG_WORD_MAX_DSSM_AGGREGATED_ANN_REGДля каждого слова в оффлайне вычисляется среднее значение DssmAggregatedAnnReg по запросам за 3 месяца. Далее по всем словам запроса берётся максимум этой величины.
FI_RANDOM_LOG_WORD_MAX_META_NUM_URLS_PER_HOST_FIXEDДля каждого слова в оффлайне вычисляется среднее значение MetaNumUrlsPerHostFixed по запросам за 3 месяца. Далее по всем словам запроса берётся максимум этой величины.
FI_RANDOM_LOG_WORD_SKIP_STOP_WORDS_MAX_SD_IS_NAV_MX_QUERY_MAXДля каждого слова в оффлайне вычисляется среднее значение MaxSDIsNavMxQueryMax по запросам за 3 месяца. Далее по всем не стоп словам запроса берётся максимум этой величины.
FI_RANDOMLOGHOST_VISITS_FROM_WIKI_AVGAVG aggregation of VisitsFromWiki web factor using random log
FI_PAGE_QUALITY_EXPERIMENT_4Фактор для экспериментов Page Quality 4
FI_RANDOMLOGHOST_NAV_LINEAR_PERCENTALE_25PERCENTALE_25 aggregation of NavLinear web factor using random log
FI_RANDOMLOGHOST_FOUND_PERCENTALE_90PERCENTALE_90 aggregation of Found web factor using random log
FI_RANDOMLOGHOST_SUBQUERY_THEME_MATCH_AVGAVG aggregation of SubqueryThMatch web factor using random log
FI_PAGE_QUALITY_EXPERIMENT_5Фактор для экспериментов Page Quality 5
FI_RANDOMLOGHOST_SEGMENT_WORD_PORTION_FROM_MAINCONTENT_AVGAVG aggregation of SegmentWordPortionFromMainContent web factor using random log
FI_RANDOMLOGHOST_XF_DT_SHOW_ALL_MAX_F_FIELD_SET2_BM15FLOG_K0_001_AVGAVG aggregation of XfDtShowAllMaxFFieldSet2Bm15FLogK0001 web factor using random log
FI_RANDOMLOGHOST_QUERY_REGION_SIZE_AVGAVG aggregation of QueryRegionSize web factor using random log
FI_DOC_FROM_WEB_TIER1Документ пришёл из WebTier1
FI_RANDOMLOGHOST_IS_RELEV_LOCALE_UA_AVGAVG aggregation of IsRelevLocaleUA web factor using random log
FI_RANDOMLOGHOST_QFUF_ALL_SUM_WF_SUM_W_FIELD_SET3_BCLM_WEIGHTED_FLOG_W0_K0_001_PERCENTALE_90PERCENTALE_90 aggregation of QfufAllSumWFSumWFieldSet3BclmWeightedFLogW0K0001 web factor using random log
FI_RANDOMLOGHOST_DSSM_BOOSTING_CTR_QUERY_SELF_SIMILARITY_PERCENTALE_90PERCENTALE_90 aggregation of DssmBoostingCtrQuerySelfSimilarity web factor using random log
FI_RANDOMLOGHOST_QUERY_TO_DOC_ALL_SUM_F_COUNT_TEXT_BOCM11_NORM256_AVGAVG aggregation of QueryToDocAllSumFCountTextBocm11Norm256 web factor using random log. NOTE: QueryToDocAllSumFCountTextBocm11Norm256 has been removed.
FI_RANDOMLOGHOST_QUERY_IS_NAV_MX_PERCENTALE_90PERCENTALE_90 aggregation of IsNavMxQuery web factor using random log
FI_DOC_FROM_PLATINUM0Документ пришёл из Platinum0
FI_RANDOMLOGHOST_DBM15_WARES2_AVGAVG aggregation of DBM15Wares2 web factor using random log
FI_RANDOMLOGHOST_URL_NGRAMS_MODEL_PERCENTALE_90PERCENTALE_90 aggregation of UrlNGramsModel web factor using random log
FI_UNEXPECTED_TRASH_URL_QUALITYНейронная документная модель для поиска неожиданной жести
FI_MEDICAL_HOST_QUALITY_FRESHMedical host quality fresh.
FI_RANDOMLOGHOST_DSSM_BOOSTING_CTR_KMEANS_1_SCORE_SCALED_SUM_WEIGHTED_QE_PERCENTALE_25PERCENTALE_25 aggregation of DssmBoostingCtrKMeans1ScoreScaledSumWeightedQE web factor using random log
FI_RANDOMLOGHOST_LONG_CLICK_MOBILE_ALL_WCM_WEIGHTED_VALUE_PERCENTALE_90PERCENTALE_90 aggregation of LongClickMobileAllWcmWeightedValue web factor using random log
FI_RANDOMLOGHOST_DSSM_VK_POPULARITY_PERCENTALE_25PERCENTALE_25 aggregation of DssmVkPopularity web factor using random log
FI_RANDOMLOGHOST_UB_LONG_PERIOD_URL_VISITS_SN_PROB_AVGAVG aggregation of UBLongPeriodVisitsSNProb web factor using random log
FI_RANDOMLOGHOST_COUNTRY_QUERY_REGIONALITY_PERCENTALE_90PERCENTALE_90 aggregation of CountryQueryRegionality web factor using random log
FI_RANDOMLOGHOST_HIT_WEIGHT_PERCENTALE_90PERCENTALE_90 aggregation of TRhitw web factor using random log
FI_RANDOMLOGHOST_UB_LONG_PERIOD_URL_AVG_SEARCH_DURATION_600_PERCENTALE_90PERCENTALE_90 aggregation of UBLongPeriodAvgSearchDuration600 web factor using random log
FI_RANDOMLOGHOST_REQUEST_IS_FROM_IOS_AVGAVG aggregation of RequestIsFromIOS web factor using random log
FI_RANDOMLOGHOST_DSSM_QUERY_EMBEDDING_CTR_NO_MINER_PCA_4_PERCENTALE_90PERCENTALE_90 aggregation of DssmQueryEmbeddingCtrNoMinerPca4 web factor using random log
FI_RANDOMLOGHOST_XF_DT_SHOW_ALL_MAX_F_FIELD_SET_UT_BM15FLOG_W0_K0_0001_AVGAVG aggregation of XfDtShowAllMaxFFieldSetUTBm15FLogW0 web factor using random log
FI_RANDOMLOGHOST_URL_TRIGRAMS_PERCENTALE_25PERCENTALE_25 aggregation of UrlTrigrams web factor using random log
FI_RANDOMLOGHOST_DSSM_QUERY_EMBEDDING_CTR_NO_MINER_PCA_1_PERCENTALE_90PERCENTALE_90 aggregation of DssmQueryEmbeddingCtrNoMinerPca1 web factor using random log
FI_RANDOMLOGHOST_IS_RELEV_LOCALE_KZ_AVGAVG aggregation of IsRelevLocaleKZ web factor using random log
FI_RANDOMLOGHOST_TEXT_FEATURES_PERCENTALE_90PERCENTALE_90 aggregation of TextFeatures web factor using random log
FI_HAS_JS_FROM_MARKETGID_COM1 if host include js from marketgid.com
FI_HAS_JS_FROM_RFITY_COM1 if host include js from rfity.com
FI_DSSM_GOOGLE_SPECIFICITYDSSM prediction of google specificity for query
FI_OWNER_WEBSITE_ATTENTIONSite owner pays attention to site details (at least once in quarter)
FI_REMOVED_1676NaN
FI_CHAT_SCOREChat info. positive / events or zero
FI_HOST_PLAYER_VIEW_DEPTHHost player info. Relation between view time and video duration
FI_HAS_JS_FROM_GOOGLE_ANALYTICS_COM1 if host include js from google-analytics.com
FI_HAS_JS_FROM_GOOGLEAPIS_COM1 if host include js from googleapis.com
FI_HAS_JS_FROM_FACEBOOK_NET1 if host include js from facebook.net
FI_HAS_JS_FROM_MC_YANDEX_RU1 if host include js from mc.yandex.ru
FI_KNN_RANDOM_LOG_QUERY_AVG_ADD_TIMEСреднее значение RandomLogQueryAvgAddTime ближайших по knn запросов.
FI_KNN_RANDOM_LOG_QUERY_AVG_TEXT_HI_RELEV_SYNСреднее значение RandomLogQueryAvgTxtHiRelSy ближайших по knn запросов.
FI_KNN_RANDOM_LOG_QUERY_AVG_TEXT_LIKEСреднее значение RandomLogQueryAvgTextLike ближайших по knn запросов.
FI_KNN_RANDOM_LOG_QUERY_AVG_IS_FORUMСреднее значение RandomLogQueryAvgIsForum ближайших по knn запросов.
FI_KNN_RANDOM_LOG_QUERY_AVG_HAS_PAYMENTSСреднее значение RandomLogQueryAvgHasPayments ближайших по knn запросов.
FI_KNN_RANDOM_LOG_QUERY_AVG_DIFFERENT_INTERNAL_LINKSСреднее значение RandomLogQueryAvgDifferentInternalLinks ближайших по knn запросов.
FI_KNN_RANDOM_LOG_QUERY_AVG_IS_TARGET_BUSSINESS_CARDСреднее значение RandomLogQueryAvgIsTargetBussinessCard ближайших по knn запросов.
FI_KNN_RANDOM_LOG_QUERY_AVG_QUERY_TO_DOC_ALL_SUM_F_COUNT_TEXT_BM11_NORM16384Среднее значение RandomLogQueryAvgQueryToDocAllSumFCountTextBm11Norm16384 ближайших по knn запросов.
FI_KNN_RANDOM_LOG_QUERY_AVG_XF_DT_SHOW_ALL_SUM_WF_SUM_W_BODY_MIN_WINDOW_SIZEСреднее значение RandomLogQueryAvgXfDtShowAllSumWFSumWBodyMinWindowSize ближайших по knn запросов.
FI_HOST_SPEED_FROM_SPYLOGHost speed estimation
FI_HOST_OFFICIALIs site official
FI_REMOVED_1694NaN
FI_HOST_CY_100_LOGQuality link from good sites estimation
FI_HOST_NEVASCA2_SHARE_WEIGHTWeight sum of each non-unique nevasca shingle
FI_HOST_NEVASCA2_FRESH_WEEKNevasca shingle quantity in last week
FI_HOST_TRAFGRAPH_IN_GT_SHARE_DGreentraffic share (aka direct visits). Desktop
FI_HOST_TRAFGRAPH_IN_GT_SHARE_MGreentraffic share (aka direct visits). Mobile
FI_HOST_GREEN_TRAFFIC_DESKTOP_LOGGreentraffic absolute (desktop)
FI_HOST_RETURN_RATE_MONTHVisits averaged by user
FI_HOST_BIZ_KERNEL0
FI_HOST_BIZ_KERNEL_QUANTILE0
FI_HAS_VIDEO1 if video on page
FI_WEB_VIDEO_PCTR_NEW_ALL_WCM_MAX_MATCHStream PCtrNew from yandex video
FI_WEB_VIDEO_PCTR_NEW_CM_MATCH_TOP5_AVG_MATCHStream PCtrNew from yandex video
FI_WEB_VIDEO_PCTR_NEW_ANNOTATION_MAX_VALUE_WEIGHTEDStream PCtrNew from yandex video
FI_WEB_VIDEO_PCTR_NEW_CM_MATCH_TOP5_AVG_PREDICTIONStream PCtrNew from yandex video
FI_WEB_VIDEO_PCTR_NEW_FULL_MATCH_VALUEStream PCtrNew from yandex video
FI_WEB_VIDEO_PCTR_NEW_PER_WORD_CM_MAX_MATCH_MINStream PCtrNew from yandex video
FI_HAS_TURBOУ документа есть турбо-страница. Зависит от платформы
FI_MEDICAL_HOST_QUALITY_METRICMedical host quality for metric.
FI_REQUEST_WITHOUT_VERBS_TITLE_BM15_K01Исходный запрос с удалением глаголов. Считается по заголовку документа. Алгоритм агрегации весов слов: Bm15. Коэффициент нормализации 0.1.
FI_REQUEST_WITHOUT_VERBS_FIELD_SET_UT_BM15FLOG_W0_K00001Исходный запрос с удалением глаголов. Считается по компазиционном стриму, состоящего из токенезированного урла и заголовка документа. Алгоритм агрегации весов слов: Bm15FLogW0. Коэффициент нормализации 0.0001.
FI_REQUEST_WITHOUT_VERBS_BODY_MIN_WINDOW_SIZEИсходный запрос с удалением глаголов. Считается по содержимому документа. Минимальный размер окна, в которой входят все слова запроса. Нормировано на число слов в запросе.
FI_REQUEST_WITHOUT_VERBS_URL_BM15_K01Исходный запрос с удалением глаголов. Считается по токенезированному урлу. Алгоритм агрегации весов слов: Bm15. Коэффициент нормализации 0.1.
FI_RANDOMLOGHOST_LONG_RMSERMSE aggregation of Long web factor using random log
FI_RANDOMLOGHOST_QUERY_ISORG_RMSERMSE aggregation of IsOrg web factor using random log
FI_RANDOMLOGHOST_GSK_URL_MODEL_RMSERMSE aggregation of GskUrlModel web factor using random log
FI_RANDOMLOGHOST_DATER_STATS_AVERAGE_SOURCE_SEGMENT_RMSERMSE aggregation of DaterStatsAverageSourceSegment web factor using random log
FI_RANDOMLOGHOST_VISITS_FROM_WIKI_RMSERMSE aggregation of VisitsFromWiki web factor using random log
FI_RANDOMLOGHOST_XF_DT_SHOW_BAG_OF_WORDS_TITLE_COSINE_MAX_MATCH_RMSERMSE aggregation of XfDtShowBagOfWordsTitleCosineMaxMatch web factor using random log
FI_RANDOMLOGHOST_UB_LONG_PERIOD_URL_DOWNLOADS_PROB_RMSERMSE aggregation of UBLongPeriodDownloadsProb web factor using random log
FI_RANDOMLOGHOST_META_AVG_IS_NOT_CGI_RMSERMSE aggregation of MetaAvgIsNotCgi meta factor using random log
FI_RANDOMLOGHOST_META_RMS_SYN_BAD_WORD_PAIRS_RMSERMSE aggregation of MetaRmsSynPercentBadWordPairs meta factor using random log
FI_RANDOMLOGHOST_META_POS_TRIGRAMS_PROB_RMSERMSE aggregation of MetaPosTrigramsProb meta factor using random log
FI_RANDOMLOGHOST_BOCM_PERCENTALE_90PERCENTALE_90 aggregation of Bocm web factor using random log
FI_RANDOMLOGHOST_SEGMENT_WORD_PORTION_FROM_MAINCONTENT_PERCENTALE_90PERCENTALE_90 aggregation of SegmentWordPortionFromMainContent web factor using random log
FI_RANDOMLOGHOST_IS_MOBILE_BEAUTY_PERCENTALE_90PERCENTALE_90 aggregation of IsMobileBeauty web factor using random log
FI_RANDOMLOGHOST_US_LONG_PERIOD_URL_WINS_PROB_PERCENTALE_90PERCENTALE_90 aggregation of USLongPeriodUrlWinsProb web factor using random log
FI_RANDOMLOGHOST_DSSM_BOOSTING_XF_WEIGHT_KMEANS_5_AVG_TOP_02_SCORE_QE_PERCENTALE_90PERCENTALE_90 aggregation of DssmBoostingXfWeightKMeans5AvgTop02ScoreQE web factor using random log
FI_RANDOMLOGHOST_DSSM_BOOSTING_CTR_KMEANS_1_SCORE_PERCENTALE_90PERCENTALE_90 aggregation of DssmBoostingCtrKMeans1Score web factor using random log
FI_RANDOMLOGHOST_SD_IS_NAV_MX_QUERY_MAX_PERCENTALE_90PERCENTALE_90 aggregation of SDIsNavMxQueryMax meta factor using random log
FI_RANDOMLOGHOST_META_WEB_764_1076_PRODUCT_INV_AVG_PERCENTALE_90PERCENTALE_90 aggregation of MetaWeb764Web1076ProductInvAvg meta factor using random log
FI_RANDOMLOGHOST_META_WEB_1099_1219_PRODUCT_INV_POS_PERCENTALE_90PERCENTALE_90 aggregation of MetaWeb1099Web1219ProductInvPos meta factor using random log
FI_RANDOMLOGHOST_META_MAX_DSSM_MIDDLE_VS_SHORT_LONG_HARD_NO_CLICKS_PERCENTALE_90PERCENTALE_90 aggregation of MetaMaxDssmMiddleVsShortLongHardNoClicks meta factor using random log
FI_RANDOMLOGHOST_NUM_LINKS_FROM_MP_MAXMAX aggregation of NumLinksFromMP web factor using random log
FI_RANDOMLOGHOST_NAV_LINEAR_MAXMAX aggregation of NavLinear web factor using random log
FI_RANDOMLOGHOST_DATER_STATS_AVERAGE_SOURCE_SEGMENT_MAXMAX aggregation of DaterStatsAverageSourceSegment web factor using random log
FI_RANDOMLOGHOST_WS_IS_INDEX_PAGE_AND_QUERY_IS_NAV_MX_MAXMAX aggregation of WeightedSumIsIndexPageIsNavMxQuery web factor using random log
FI_RANDOMLOGHOST_QUERY_TO_DOC_ALL_SUM_F_COUNT_TEXT_BOCM11_NORM256_MAXMAX aggregation of QueryToDocAllSumFCountTextBocm11Norm256 web factor using random log. NOTE: QueryToDocAllSumFCountTextBocm11Norm256 has been removed.
FI_RANDOMLOGHOST_DSSM_LOG_DWELL_TIME_BIGRAMS_QUERY_DERIVATIVE_MAX_MAXMAX aggregation of DssmBigramsQueryDerivativeMax web factor using random log
FI_RANDOMLOGHOST_DSSM_QUERY_COUNTRY_TO_URL_ESTIMATED_DISTANCE_MAXMAX aggregation of DssmQueryCountryToUrlEstimatedDistance web factor using random log
FI_RANDOMLOGHOST_META_WEB_764_1076_PRODUCT_INV_AVG_MAXMAX aggregation of MetaWeb764Web1076ProductInvAvg meta factor using random log
FI_RANDOMLOGHOST_TEXT_FEATURES_LOGAVGLOGAVG aggregation of TextFeatures web factor using random log
FI_RANDOMLOGHOST_DOC_LEN_LOGAVGLOGAVG aggregation of DocLen web factor using random log
FI_RANDOMLOGHOST_IS_HTML_LOGAVGLOGAVG aggregation of IsHTML web factor using random log
FI_RANDOMLOGHOST_DOC_HAS_LEVENSHT1_QUERY_FRAGMENT_LOGAVGLOGAVG aggregation of HasLevensht1QueryFragment web factor using random log
FI_RANDOMLOGHOST_HEADING_IDF_SUM_FIXED_LOGAVGLOGAVG aggregation of HeadingIdfSumFixed web factor using random log
FI_RANDOMLOGHOST_ADV_PRONOUNS_PORTION_LOGAVGLOGAVG aggregation of AdvPronounsPortion web factor using random log
FI_RANDOMLOGHOST_LONGEST_TEXT_LOGAVGLOGAVG aggregation of LongestText web factor using random log
FI_RANDOMLOGHOST_COUNTRY_HOUR_LOGAVGLOGAVG aggregation of CountryHour web factor using random log
FI_RANDOMLOGHOST_METRIKA_URL_AVG_TIME_LOGAVGLOGAVG aggregation of MetrikaUrlAvgTime web factor using random log
FI_RANDOMLOGHOST_WIKI_LINK_COUNT_LOGAVGLOGAVG aggregation of WikiLinkCount web factor using random log
FI_RANDOMLOGHOST_BROWSER_URL_DWELL_TIME_REGION_FRC_LOGAVGLOGAVG aggregation of BrowserUrlDwellTimeRegionFrc web factor using random log
FI_RANDOMLOGHOST_WIKI_INFOBOX_LOGAVGLOGAVG aggregation of WikiInfobox web factor using random log
FI_RANDOMLOGHOST_QUERY_DOC_TITLE_RANGES_MATCHING_SCORE_LOGAVGLOGAVG aggregation of QueryDocTitleRangesMatchingScore web factor using random log
FI_RANDOMLOGHOST_IS_MOBILE_BEAUTY_LOGAVGLOGAVG aggregation of IsMobileBeauty web factor using random log
FI_RANDOMLOGHOST_QUERY_TO_TEXT_ALL_SUM_WF_SUM_W_BODY_MIN_WINDOW_SIZE_LOGAVGLOGAVG aggregation of QueryToTextAllSumWFSumWBodyMinWindowSize web factor using random log
FI_RANDOMLOGHOST_DSSM_RANDOM_LOG_QUERY_AVG_DIFFERENT_INTERNAL_LINKS_LOGAVGLOGAVG aggregation of DssmRandomLogQueryAvgDifferentInternalLinks web factor using random log
FI_RANDOMLOGHOST_META_URL_DIRECT_CHILDREN_CNT_LOGAVGLOGAVG aggregation of MetaUrlDirectChildrenCnt meta factor using random log
FI_RANDOMLOGHOST_META_WEB_1241_1299_PRODUCT_INV_POS_LOGAVGLOGAVG aggregation of MetaWeb1241Web1299ProductInvPos meta factor using random log
FI_RANDOMLOGHOST_META_EPS_HASH_SHARE_NATIONAL_LANGUAGE_LOGAVGLOGAVG aggregation of MetaEpsHashShareNationalLanguage meta factor using random log
FI_IS_HTTPSДокумент имеет протокол https
FI_QUERY_URL_EDIT_DIST_NORMALIZED_BY_MAX_LENРасстояние Левенштейна между запросом и урлом вида youtubecom/watch нормированное по максимуму из длины запроса и урла
FI_QUERY_URL_LCS_NORMALIZED_BY_QUERYДлина наибольшей общей подстроки между урлом и запросом нормированная на длину запроса
FI_TOLOKA_BASED_PORN_QUERY_CLASSIFICATION_SIGMOIDНормированное сигмоидой значение текстового запросного классификатора порно по оценкам из Толоки
FI_TOLOKA_BASED_PORN_QUERY_CLASSIFICATION_BINARYБинаризованное значение текстового запросного классификатора порно по оценкам из Толоки
FI_WEB_CLASSIFICATION_BASED_PORN_QUERY_CLASSIFICATIONПриведенное к [0,1] значение текстового запросного классификатора порно по оценкам классификатора веба и доп. словарям
FI_WEB_CLASSIFICATION_BASED_PORN_QUERY_CLASSIFICATION_BINARYБинаризированное с использованием фикслистов значение текстового запросного классификатора порно по оценкам классификатора веба и доп. словарям
FI_DIRTY_LANGUAGE_IN_QUERYНаличие нецензурной лексики в запросе. 0 — отсутствует, 0.5 — нежёсткий, 1 — жёсткий
FI_PORN_MARKERS_IN_QUERYНаличие порно-маркеров в запросе (0 — есть, 1/3 — нет, 1 — запрос ‘серый’)
FI_DSSM_PANTHER_TERMSNaN
FI_ADULTNESS_PRODДокументный классификатор порнушности, фичи по тексту документа
FI_ADULTNESS_URLДокументный классификатор порнушности, фичи по урлу документа
FI_NASTY_IMAGE_VALUEДокументный классификатор порнушности, фичи по картинкам документа (информация берется из индекса Картинок)
FI_NASTY_VIDEOДокументный классификатор порнушности, фичи по видеороликам документа (информация берется из индекса Видео)
FI_NASTY_HOSTХостовый классификатор порнушности, фичи про порнушность запросов, по которым показывался и кликался хост
FI_OFFICIAL_IN_QUERYНаличие в лемматизированном запросе слова официальный
FI_WIKI_IN_QUERYНаличие в лемматизированном запросе слова википедия
FI_NOT_IN_QUERYНаличие в лемматизированном запросе слова не и похожих по смыслу
FI_PRICE_IN_QUERYНаличие в лемматизированном запросе слов купить, цена и похожих по смыслу
FI_DWELL_TIME_SUM_FRACTION_PERCENTALE25_AGGRФактор возвращаемости на хост. Percentale агрегация с коэффициентом 0.25f фичи DwellTimeSumFraction
FI_DOC_FROM_QUICK_MEDДокумент пришёл из QuickMed
FI_AVERAGE_RETURN_TIME_PERCENTALE99_AGGRФактор возвращаемости на хост. Percentale агрегация с коэффициентом 0.99f фичи AverageReturnTime
FI_AVERAGE_RETURN_TIME_PERCENTALE97_AGGRФактор возвращаемости на хост. Percentale агрегация с коэффициентом 0.97f фичи AverageReturnTime
FI_AVERAGE_RETURN_TIME_GREATER_FRACTION99_AGGRФактор возвращаемости на хост. GreaterFraction агрегация с коэффициентом 0.99f фичи AverageReturnTime
FI_AVERAGE_LOG_RETURN_TIME_PERCENTALE99_AGGRФактор возвращаемости на хост. Percentale агрегация с коэффициентом 0.99f фичи AverageLogReturnTime
FI_AVERAGE_LOG_RETURN_TIME_GREATER_FRACTION90_AGGRФактор возвращаемости на хост. GreaterFraction агрегация с коэффициентом 0.9f фичи AverageLogReturnTime
FI_FIRST_CLICK_DWELL_TIME_LESS_FRACTION5_AGGRФактор возвращаемости на хост. LessFraction агрегация с коэффициентом 0.05f фичи FirstClickDwellTime
FI_AVERAGE_VISITS_PER_3_HOURS_WEIGHTED_AVERAGE_AGGRФактор возвращаемости на хост. WeightedAverage агрегация фичи AverageVisitsPer3Hours
FI_MEDICAL_HOST_QUALITYMedical host quality.
FI_HAS_TURBO_APPУ документа есть турбо-страница для desktop платформы. Апдейты поверх базы доставляются через saas.
FI_AVERAGE_DWELL_TIME_PER_HOUR_WEIGHTED_AVERAGE_AGGRФактор возвращаемости на хост. WeightedAverage агрегация фичи AverageDwellTimePerHour
FI_AVERAGE_DWELL_TIME_PER_3_HOURS_LESS_FRACTION10_AGGRФактор возвращаемости на хост. LessFraction агрегация с коэффициентом 0.1f фичи AverageDwellTimePer3Hours
FI_AVERAGE_DWELL_TIME_PER_WEEK_MAX_AGGRФактор возвращаемости на хост. Max агрегация фичи AverageDwellTimePerWeek
FI_QUERY_DOPP_MEDIAN_DWELLTIMEМедианный двеллтайм запроса за всю историю. Двеллтайм обрезается до 6000. Запрос нормализуется по доппельгангерам
FI_QUERY_DOPP_MULTIPLE_CLICKS_SHOWSЧисло показов запроса с более чем одним кликом за всю историю. Запрос нормализуется по доппельгангерам
FI_QUERY_DOPP_MULTIPLE_CLICKS_PROBABILITYДоля показов запроса с более чем одним кликом от всех показов за всю историю. Запрос нормализуется по доппельгангерам
FI_RANDOMLOGOWNER_RANDOM_LOG_WORD_MAX_META_NUM_URLS_PER_HOST_FIXED_PERCENTALE_90Owner aggregation of RandomLogWordMaxMetaNumUrlsPerHostFixed web factor using random log, aggregation type is PERCENTALE_90
FI_RANDOMLOGOWNER_META_WEB_1099_1219_PRODUCT_INV_POS_LOGAVGOwner aggregation of MetaWeb1099Web1219ProductInvPos meta factor using random log, aggregation type is LOGAVG
FI_RANDOMLOGOWNER_DSSM_DWELLTIME_REG_CHAIN_TRAINED_EMBEDDING_PERCENTALE_90Owner aggregation of DssmDwelltimeRegChainTrainedEmbedding meta factor using random log, aggregation type is PERCENTALE_90
FI_RANDOMLOGOWNER_DSSM_RANDOM_LOG_QUERY_AVG_HAS_PAYMENTS_LOGAVGOwner aggregation of DssmRandomLogQueryAvgHasPayments web factor using random log, aggregation type is LOGAVG
FI_RANDOMLOGOWNER_UB_LONG_PERIOD_URL_BROWSE_FRC_PERCENTALE_90Owner aggregation of UBLongPeriodBrowseFrc web factor using random log, aggregation type is PERCENTALE_90
FI_RANDOMLOGOWNER_META_URL_CHILDREN_CNT_LOGAVGOwner aggregation of MetaUrlChildrenCnt meta factor using random log, aggregation type is LOGAVG
FI_RANDOMLOGOWNER_META_RMS_DIFFERENT_INTERNAL_LINKS_PERCENTALE_25Owner aggregation of MetaRmsDifferentInternalLinks meta factor using random log, aggregation type is PERCENTALE_25
FI_RANDOMLOGOWNER_RANDOM_LOG_WORD_MAX_HAS_NO_TR_PERCENTALE_90Owner aggregation of RandomLogWordMaxHasNoTr web factor using random log, aggregation type is PERCENTALE_90
FI_RANDOMLOGOWNER_META_RESID_US_LONG_PERIOD_URL_WINS_PROB_RMSEOwner aggregation of MetaResidUSLongPeriodUrlWinsProb meta factor using random log, aggregation type is RMSE
FI_RANDOMLOGOWNER_PORNO_QUERY_LOGAVGOwner aggregation of PornoQuery web factor using random log, aggregation type is LOGAVG
FI_RANDOMLOGOWNER_NATIONAL_LANGUAGE_LOGAVGOwner aggregation of NationalLanguage web factor using random log, aggregation type is LOGAVG
FI_RANDOMLOGOWNER_PERCENT_VISIBLE_CONTENT_PERCENTALE_90Owner aggregation of PercentVisibleContent web factor using random log, aggregation type is PERCENTALE_90
FI_RANDOMLOGOWNER_META_WEB_1241_1299_PRODUCT_INV_POS_PERCENTALE_25Owner aggregation of MetaWeb1241Web1299ProductInvPos meta factor using random log, aggregation type is PERCENTALE_25
FI_RANDOMLOGOWNER_LINKANN_FLOAT_MULTIPLICITY_ATTENV1_BM15_K001_LOGAVGOwner aggregation of LinkAnnFloatMultiplicityAttenV1Bm15K001 web factor using random log, aggregation type is LOGAVG
FI_RANDOMLOGOWNER_UB_LONG_PERIOD_URL_LEAVES_CNT_RMSEOwner aggregation of UBLongPeriodLeavesCnt web factor using random log, aggregation type is RMSE
FI_RANDOMLOGOWNER_NUM_LINKS_FROM_MP_LOGAVGOwner aggregation of NumLinksFromMP web factor using random log, aggregation type is LOGAVG
FI_RANDOMLOGOWNER_DSSM_RANDOM_LOG_QUERY_AVG_DIFFERENT_INTERNAL_LINKS_PERCENTALE_25Owner aggregation of DssmRandomLogQueryAvgDifferentInternalLinks web factor using random log, aggregation type is PERCENTALE_25
FI_RANDOMLOGOWNER_QUERY_ISORG_RMSEOwner aggregation of IsOrg web factor using random log, aggregation type is RMSE
FI_RANDOMLOGOWNER_QSEGMENTS_BM25_MAXOwner aggregation of QSegmentsBM25 web factor using random log, aggregation type is MAX
FI_RANDOMLOGOWNER_SEGMENT_AUX_ALPHAS_IN_TEXT_RMSEOwner aggregation of SegmentAuxAlphasInText web factor using random log, aggregation type is RMSE
FI_RANDOMLOGOWNER_RANDOM_LOG_QUERY_DWELLTIME_WEIGHTED_AVG_URL_DOMAIN_FRACTION_LOGAVGOwner aggregation of RandomLogQueryDwelltimeWeightedAvgUrlDomainFraction web factor using random log, aggregation type is LOGAVG
FI_RANDOMLOGOWNER_RANDOM_LOG_WORD_SKIP_STOP_WORDS_MAX_IS_DESKTOP_REQUEST_LOGAVGOwner aggregation of RandomLogWordSkipStopWordsMaxIsDesktopRequest web factor using random log, aggregation type is LOGAVG
FI_RANDOMLOGOWNER_VISITS_FROM_WIKI_RMSEOwner aggregation of VisitsFromWiki web factor using random log, aggregation type is RMSE
FI_RANDOMLOGOWNER_QUERY_ISTEXT_RMSEOwner aggregation of IsText web factor using random log, aggregation type is RMSE
FI_RANDOMLOGOWNER_DBM_SUBSTANTIVE_MAXOwner aggregation of DBMSubstantive web factor using random log, aggregation type is MAX
FI_RANDOMLOGOWNER_DATER_STATS_AVERAGE_SOURCE_SEGMENT_RMSEOwner aggregation of DaterStatsAverageSourceSegment web factor using random log, aggregation type is RMSE
FI_RANDOMLOGOWNER_IS_MOBILE_BEAUTY_LOGAVGOwner aggregation of IsMobileBeauty web factor using random log, aggregation type is LOGAVG
FI_RANDOMLOGOWNER_LONG_CLICK_SP_MIX_MATCH_WEIGHTED_VALUE_PERCENTALE_90Owner aggregation of LongClickSPMixMatchWeightedValue web factor using random log, aggregation type is PERCENTALE_90
FI_RANDOMLOGOWNER_FEM_MAS_NOUNS_PORTION_LOGAVGOwner aggregation of FemAndMasNounsPortion web factor using random log, aggregation type is LOGAVG
FI_RANDOMLOGOWNER_TRIGRAMS_PROB_PERCENTALE_90Owner aggregation of TrigramsProb web factor using random log, aggregation type is PERCENTALE_90
FI_RANDOMLOGOWNER_DATER_STATS_YEAR_NORM_LIKELIHOOD_PERCENTALE_25Owner aggregation of DaterStatsYearNormLikelihood web factor using random log, aggregation type is PERCENTALE_25
FI_RANDOMLOGOWNER_URL_PATH_AND_PARAMS_FRACTION_MAXOwner aggregation of UrlPathAndParamsFraction web factor using random log, aggregation type is MAX
FI_QUERY_TO_TEXT_ALL_AVGСреднее значение для запросного фактора по данным лингвобустинга QueryToText, вычисляется в бегемотном правиле LingBoostQueryFeatures
FI_QUERY_TO_TEXT_KNN_ALL_AVGСреднее значение для запросного фактора по данным лингвобустинга QueryToTextByXfDtShowKnn, вычисляется в бегемотном правиле LingBoostQueryFeatures
FI_XFDT_SHOW_ALL_TOTAL_Wsum / (sum + 10) для запросного фактора по данным лингвобустинга XfDtShow, вычисляется в бегемотном правиле LingBoostQueryFeatures
FI_XFDT_SHOW_QUANTILE_01Квантиль 0.1 для запросного фактора по данным лингвобустинга XfDtShow, вычисляется в бегемотном правиле LingBoostQueryFeatures
FI_XFDT_SHOW_KNN_QUANTILE_01Квантиль 0.1 для запросного фактора по данным лингвобустинга XfDtShowKnn, вычисляется в бегемотном правиле LingBoostQueryFeatures
FI_XFDT_SHOW_KNN_QUANTILE_09Квантиль 0.9 для запросного фактора по данным лингвобустинга XfDtShowKnn, вычисляется в бегемотном правиле LingBoostQueryFeatures
FI_QFUF_ALL_TOTAL_WEIGHTsum / (sum + 10) для запросного фактора по данным лингвобустинга Qfuf, вычисляется в бегемотном правиле LingBoostQueryFeatures
FI_QFUF_ALL_AVGСреднее значение для запросного фактора по данным лингвобустинга Qfuf, вычисляется в бегемотном правиле LingBoostQueryFeatures
FI_IS_TASIXCайт расположен в сети Tas-IX (актуально для Узбекистана)
FI_DSSM_BOOSTING_SERP_SIMILARITY_HARD_KMEANS_1_SCOREDssm Boosting Score for SerpSimilarityHard model over 1-means centroids.
FI_PAGE_QUALITY_HOSTPage quality aggregated by host (avg).
FI_IS_RELEV_LOCALE_UZrelev_locale == uz
FI_QUERY_DOPP_TIME_FROM_PREVIOUS_PERCENTILE_2525% квантиль времени с предыдущего запроса перед текущим. Запрос нормализуется по доппельгангерам
FI_NEURO_TEXT_MODEL_LONG_CLICK_PREDICTOR_BY_WORD_AND_BIGRAM_COUNTERS_WITH_SS_HARDSРезультат применения нейронной модели, обученной отличать длинные клики от остальных событий, входом модели являтся пословные и биграмные счётчики, рассчитываемые по текстовым стримам (Title, Body, Url).
FI_IS_MOBILE_BEAUTY_HOSTадаптирован ли этот хост под мобильные устройства
FI_QFUF_FILTERED_BY_XF_ONE_SE_ALL_MAX_F_FIELD_SET2_BM15FLOG_K0001Фактор лингвистического бустинга. Тип расширений: QfufFilteredByXfOneSe (qfuf, фильтрованные по dssm-модели XfOneSe). Агрегация по всем расширениям. Наибольшее значение фактора. Взвешенное объединение стримов Url, Title, Body, CorrectedCtr, LongClick, OneClick, BrowserPageRank, SplitDwellTime, SamplePeriodDayFrc, SimpleClick, YabarVisits, YabarTime. Алгоритм агрегации весов слов: Bm15FLog (Bm15 агрегация логарифмов встречаемости слов). Коэффициент нормализации 0.001.
FI_QFUF_FILTERED_BY_XF_ONE_SE_ALL_MAX_F_FIELD_SET3_BCLM_WEIGHTED_FLOG_W0_K0001Фактор лингвистического бустинга. Тип расширений: QfufFilteredByXfOneSe (qfuf, фильтрованные по dssm-модели XfOneSe). Агрегация по всем расширениям. Наибольшее значение фактора. Взвешенное объединение стримов Title, Body, LongClick, LongClickSP, OneClick. Алгоритм агрегации весов слов: BclmWeightedFLogW0. Коэффициент нормализации 0.001.
FI_QFUF_FILTERED_BY_XF_ONE_SE_ALL_MAX_F_FIELD_SET_UT_BM15FLOG_W0_K00001Фактор лингвистического бустинга. Тип расширений: QfufFilteredByXfOneSe (qfuf, фильтрованные по dssm-модели XfOneSe). Агрегация по всем расширениям. Наибольшее значение фактора. Считается по компазиционном стриму, состоящего из токенезированного урла и заголовка документа. Алгоритм агрегации весов слов: Bm15FLogW0. Коэффициент нормализации 0.0001.
FI_QFUF_FILTERED_BY_XF_ONE_SE_ALL_MAX_F_TITLE_BM15_K01Фактор лингвистического бустинга. Тип расширений: QfufFilteredByXfOneSe (qfuf, фильтрованные по dssm-модели XfOneSe). Агрегация по всем расширениям. Наибольшее значение фактора. Считается по заголовку документа. Алгоритм агрегации весов слов: Bm15. Коэффициент нормализации 0.1.
FI_QFUF_FILTERED_BY_XF_ONE_SE_TOP_SUM_WF_SUM_W_FIELD_SET2_BM15FLOG_K0001Фактор лингвистического бустинга. Тип расширений: QfufFilteredByXfOneSe (qfuf, фильтрованные по dssm-модели XfOneSe). Агрегация по топ-10 (по значению фактора) расширениям. Взвешенная сумма весов факторов. Нормированно на суммарный вес расширений. Взвешенное объединение стримов Url, Title, Body, CorrectedCtr, LongClick, OneClick, BrowserPageRank, SplitDwellTime, SamplePeriodDayFrc, SimpleClick, YabarVisits, YabarTime. Алгоритм агрегации весов слов: Bm15FLog (Bm15 агрегация логарифмов встречаемости слов). Коэффициент нормализации 0.001.
FI_QFUF_FILTERED_BY_XF_ONE_SE_TOP_SUM_WF_SUM_W_BODY_MIN_WINDOW_SIZEФактор лингвистического бустинга. Тип расширений: QfufFilteredByXfOneSe (qfuf, фильтрованные по dssm-модели XfOneSe). Агрегация по топ-10 (по значению фактора) расширениям. Взвешенная сумма весов факторов. Нормированно на суммарный вес расширений. Считается по содержимому документа. Минимальный размер окна, в которой входят все слова запроса. Нормировано на число слов в запросе.
FI_ORIGINAL_REQUEST_WORDS_FILTERED_BY_DSSM_SS_HARD_FIELD_SET1_BM15FLOG_K0001Фактор по фильтрованному оригинальному запросу: вычисляется dssm-расстояние от запроса без слов до исходного запроса, после чего происходит отсечение по порогу. Взвешенное объединение стримов Url,Title,Body,Links,CorrectedCtr,LongClick,OneClick,BrowserPageRank,SplitDwellTime,SamplePeriodDayFrc,SimpleClick,YabarVisits,YabarTime. Алгоритм агрегации весов слов: Bm15FLog (Bm15 агрегация логарифмов встречаемости слов). Коэффициент нормализации 0.001.
FI_ORIGINAL_REQUEST_WORDS_FILTERED_BY_DSSM_SS_HARD_FIELD_SET_UT_BM15FLOG_W0_K00001Фактор по фильтрованному оригинальному запросу: вычисляется dssm-расстояние от запроса без слов до исходного запроса, после чего происходит отсечение по порогу. Считается по компазиционном стриму, состоящего из токенезированного урла и заголовка документа. Алгоритм агрегации весов слов: Bm15FLogW0. Коэффициент нормализации 0.0001.
FI_DSSM_CTR_ENG_SS_HARDDSSM model trained on cross language CTRs using serp similarity hard miner.
FI_REMOVED_1856NaN
FI_FRACTION_OF_PRESENTED_IN_TITLE_WORDS_WITH_WEIGHTS_BY_DSSM_SS_HARD_MODELДля всех слов слов запроса вычисляется вес методом query-mutation (расстояние между запросами при налиичии и отсуствии слова). Берётся сумма весов слов найденных в тайтле, делённое на сумму весов всех слов.
FI_MAX_WEIGHT_OF_ABSENT_IN_TITLE_WORDS_WITH_WEIGHTS_BY_DSSM_SS_HARD_MODELДля всех слов слов запроса вычисляется вес методом query-mutation (расстояние между запросами при налиичии и отсуствии слова). Берётся максимум веса среди слов, отсутсвующих в тайтле документа.
FI_NEURO_TEXT_MODEL_LONG_CLICK_PREDICTOR_BY_WORD_AND_BIGRAM_COUNTERS_WITHOUT_TITLE_WITH_SS_HARDSРезультат применения нейронной модели, обученной отличать длинные клики от остальных событий, входом модели являтся пословные и биграмные счётчики, рассчитываемые по текстовым стримам (Body, Url).
FI_REMOVED_1860NaN
FI_DATER_ADDTIME_80HOURSСчитается как (80-x) где x — возвраст документа в часах (непрерывно). Использует данные датировщика RobotAddTime
FI_DATER_ADDTIME_10DAYSСчитается как (10-x) где x — возвраст документа в днях (непрерывно). Использует данные датировщика RobotAddTime
FI_DATER_AGE_10DAYSРазница между текущей датой и датой документа, определённой датировщиком RobotAddTime, 1 — дата равна текущей, 0 — документу 10 дней и больше, или дата не определена
FI_XF_ONE_SE_KNN_ALL_MAX_WF_MAX_W_FIELD_SET1_BM15FLOG_K0001Фактор лингвистического бустинга. Тип расширений: XfOneSeKnn (ближайшие по dssm-модели, обучаемой предсказывать XfDtShow расширения). Агрегация по всем расширениям. Наибольшее взвешенное значение фактора. Нормировано на максимальный вес расширения. Взвешенное объединение стримов Url,Title,Body,Links,CorrectedCtr,LongClick,OneClick,BrowserPageRank,SplitDwellTime,SamplePeriodDayFrc,SimpleClick,YabarVisits,YabarTime. Алгоритм агрегации весов слов: Bm15FLog (Bm15 агрегация логарифмов встречаемости слов). Коэффициент нормализации 0.001.
FI_XF_ONE_SE_KNN_ALL_MAX_WF_MAX_W_ONE_CLICK_FULL_MATCH_VALUEФактор лингвистического бустинга. Тип расширений: XfOneSeKnn (ближайшие по dssm-модели, обучаемой предсказывать XfDtShow расширения). Агрегация по всем расширениям. Наибольшее взвешенное значение фактора. Нормировано на максимальный вес расширения. TODO Алгоритм: максимальный вес полностью совпавшей с запросом аннотации. Считается по стриму OneClick.
FI_QUERY_TO_TEXT_BY_XF_ONE_SE_KNN_TOP_SUM_WF_SUM_W_BODY_MIN_WINDOW_SIZEФактор лингвистического бустинга. Тип расширений: QueryToTextByXfOneSeKnn (QueryToText расширения XfOneSeKnn расширений). Агрегация по топ-10 (по значению фактора) расширениям. Взвешенная сумма весов факторов. Нормированно на суммарный вес расширений. Считается по содержимому документа. Минимальный размер окна, в которой входят все слова запроса. Нормировано на число слов в запросе.
FI_QUERY_TO_TEXT_BY_XF_ONE_SE_KNN_ALL_SUM_WF_SUM_W_FIELD_SET3_BCLM_WEIGHTED_FLOG_W0_K0001Фактор лингвистического бустинга. Тип расширений: QueryToTextByXfOneSeKnn (QueryToText расширения XfOneSeKnn расширений). Агрегация по всем расширениям. Взвешенная сумма весов факторов. Нормированно на суммарный вес расширений. Взвешенное объединение стримов Title, Body, LongClick, LongClickSP, OneClick. Алгоритм агрегации весов слов: BclmWeightedFLogW0. Коэффициент нормализации 0.001.
FI_IS_INTERNATIONAL_DOMAINДомен в международной зоне
FI_IS_MEMORANDUM_QUERYЗапрос был распознан как имеющий интент к объектам авторского права, защищаемых анти-пиратским меморандумом.
FI_HOST_VIDEO_STEVENSONхост содержит пиратские видео защищаемых анти-пиратским меморандумом.
FI_HOST_VIDEO_DISTRIBUTORхост содержит видео защищаемых анти-пиратским меморандумом.
FI_FRESH_HOST_AVG_30DAYS_SURPLUSСредний профицит свежести хоста за 30 дней
FI_FRESH_HOST_30DAYS_POSITIVE_SURPLUS_RATEДоля документов с положительным профицитом свежести с хоста за 30 дней
FI_HOST_STEVENSON_BINARYСтивенсон
FI_HOST_STEVENSON_URLS_PER_CLICKSСтивенсон
FI_HOST_STEVENSON_URLS_PER_SHOWSСтивенсон
FI_HOST_STEVENSON_URLS_PER_SHOWS10Стивенсон
FI_HOST_STEVENSON_WEIGHTСтивенсон
FI_VIDEO_INTENDANCE_PREDICTПеренормированный предикт ethos классификатора по разметке на уместность видео.
FI_PIRACY_PREDICTПеренормированный предикт ethos классификатора, обученного на синтетической выборке ‘запрос характерный для пиратского сайта’ vs ‘запрос характерен для сайта далёкого от этого’
FI_FREE_SLOT_1881в данном слоте ни когда не было не нулевой фичи
FI_STEVENSON_DSSM_PREDICTORРегрессия по dssm эмбедам на разделение меморандумных и нет запросов
FI_MEMORANDUM_PREDICTПеренормированный предикт ethos классификатора, обученного различать меморандумные запросы от рандома
FI_PIRACY_PREDICT_DSSMРегрессия по dssm эмбедам на разделение пирато специфичных и нет запросов
FI_REFORMULATIONS_LONGEST_CLICK_LOG_DTDSSM модель, которая предсказывает логарифм самого длинного клика на серпе. В качестве негативных примеров выбираем урлы из прошлых запросов этого же пользователя, причем максимальное время между запросами не более 7 минут (суперхарды по переформулировкам)
FI_DOC_FROM_QUICKДокумент пришёл из Quick но не из QuickRt
FI_DOC_FROM_QUICK_RTДокумент пришёл из QuickRt
FI_DOC_FROM_CALLISTOДокумент пришёл из Callisto
FI_LEGAL_PLAYERSFeature LegalPlayers from VideoIndex
FI_SOCIAL_NETWORKS_PLAYERSFeature SocialNetworksPlayers from VideoIndex
FI_STEVENSON_PLAYERSFeature StevensonPlayers from VideoIndex
FI_REFORMULATIONS_LONGEST_CLICK_LOG_DT_EARLY_BINDING_DSSMDSSM модель с ранним связыванием, обученная на переформулировках, которая предсказывает логарифм самого длинного клика на серпе.
FI_HAS_NEWS_AGENCY_RATINGRating of news agency from agencies.json > 0 (Yandex.News resource)
FI_WEEKDAY_QUERY_PROBABILITYWeekday query probability
FI_HOST_BIZ_KERNEL_PERCENTILEПоказатель качества сайта с точки зрения факторов про пользовательское поведение, агрегированных до владельцев.
FI_HIT_CONTEXTS_DSSMNeural network value for contexts of query hits in document text. Predicts relevance-all-8-years. Uses formula ussr-dump-20190719 prs-20190720 all-8-years [t > 0.25] CrossEntropy 20k 0.25 -S 0.8 -Z 1 predictions for learning.
FI_ANTISPAM_BANBans of Antispam from erf
FI_DSSM_REFORMULATIONS_WITH_EXTENSIONSDSSM модель, обученная на пуле переформулировок, которая в запросной части помимо самого запроса получает 4 расширения XfDt с самым большим весом
FI_RANDOM_LOG_HOST_TOP_CLICKED_URLS_IS_MOBILE_REQUEST_LOGAVGАгрегированная по ближайшим на хосте урлам LogAvg-статистика фактора IsMobileRequest
FI_RANDOM_LOG_HOST_TOP_CLICKED_URLS_NANOBTANIUM_QUERY_WORD_TITLE_5N_DIST2MAXX_MAX_IS_MOBILE_REQUEST_LOGAVGАгрегированная по ближайшим на хосте урлам LogAvg-статистика фактора NanobtaniumQueryWordTitle5nDist2maxXMax
FI_ANTISPAM_BAN_GSMBans on gsm of Antispam from erf
FI_ANTISPAM_BAN_FRESHBans on fresh of Antispam from erf
FI_RANDOM_LOG_QUERY_AVG_IS_BLOGСреднее значение IsBlog по запросу за год. Рассчитывается в оффлайне.
FI_HAS_TURBO_MOBILEУ документа есть турбо-страница для mobile платформы. Апдейты поверх базы доставляются через saas.
FI_HAS_TURBO_DESKTOPУ документа есть турбо-страница для desktop платформы. Апдейты поверх базы доставляются через saas.
FI_DSSM_FORMULA_8YEARS_CE25_PREDICTIONМодель, обученная на предсказание оценки формулой ussr-dump-20190719 prs-20190720 all-8-years [t > 0.25] CrossEntropy 20k 0.25 -S 0.8 -Z 1.
FI_REMOVED_1907NaN
FI_RANDOM_COMMERCIALСлучайный’ фактор для коммерческих сайтов.
FI_UNEXPECTED_TRASH_URL_QUALITY_FRESHНейронная документная модель для поиска неожиданной жести (для экспов)
FI_REQUEST_MULTITOKENS_ALL_MAX_F_URL_BCLM_MIX_PLAIN_KE5Features calculated on url with request multitokens expansion
FI_REQUEST_MULTITOKENS_ALL_SUM_W2_F_SUM_W_URL_EXACT_QUERY_MATCH_AVG_VALUEFeatures calculated on url with request multitokens expansion
FI_DSSM_FORMULA_8YEARS_CE25_PREDICTION_RATINGSМодель, обученная на предсказание оценки формулой ussr-dump-20190719 prs-20190720 all-8-years [t > 0.25] CrossEntropy 20k 0.25 -S 0.8 -Z 1 и дообученная на оценки релевантности.
FI_QUERIES_RATIO_MORDA_2Доля запросов, по которым показывалась морда владельца, среди всех запросов, по которым показывался владелец за последнюю неделю.
SERP_CLICKS_BY_HOP_PART_0_30Доля посещений с серпа документов, находящихся на уровне 0 хопов. За 30 дней.
QUERIES_AVG_TOPСредняя позиция владельца по запросам за последнюю неделю.
TRAFGRAPH_MOBILE_DESKTOP_SE_SHAREОтношение мобильных к десктопам по трафу с поисковиков.
TRAFGRAPH_MOBILE_DESKTOP_OUT_ALL_SHAREОтношение мобильных к десктопам по всему исходящему трафу.
AVG_IS_ORGСреднее значениие запросного фактора isorg по запросам с данным владельцем за последнюю неделю.
AVG_QS_F_PUNCT_BLANKS_RATУсредненное отношение пунктуации ко всем разделителям в документах владельца.
FI_FRESH_DETECTOR_PREDICTЗначение детектора свежести, рассчитываемого в бегемоте. Всегда 0 при значении детектора меньше порога.
FI_HOST_VIDEO_DISTRIBUTOR_PRODхост содержит видео защищаемых анти-пиратским меморандумом.
FI_HOST_MEMORANDUM_WEIGHTСтивенсон

Было ли это полезно?

0 / 0

Добавить комментарий 0

Ваш электронный адрес не будет опубликован. Обязательные поля помечены *