Наверное, в слабом знакомстве с принципами работы поисковиков.
Цифра, которую гугл приводит в верхней стоке, абсолютно бессмысленна и наикакого отношения к реальному числу хитов не имеет. Чтоб узнать настоящее число, надо пролистать до последней страницы,на ней будет написана точная цифра.
Еще можно сравнивать две таких "потолочных" оценки между собой, хотя тоже не желательно, но никак нельзя сравнивать одну такую оценку с точной цифрой (6).
Я мог бы емко и по существу ответить по поводу слабости, но, помня о ваших заслугах в развитии мировой науки и российской демократии, а также наших предыдущих разговорах за последний десяток лет, ограничусь вздохом. Я это время лучше на общение с полковником Тейлором потрачу.
Интересное замечание, буду теперь его учитывать. Меня всегда смущало большое число повторов в результатах, выдаваемых гуглом, которые, конечно, должны искажать картину.
Знаете, все гораздо хуже. Дело не в повторах. Если вы сделаете сами тот поиск, который мы так несколько неудачно обсуждали вуше, вы увидите, что наверху первой старницы цифра в 18 миллионов, а внизу количество страниц результатов - 6. Как вы понимаете, никакими повторами из 46 хитов 18 млн не сделать. Дело в том, что гугл по умолчанию количество старниц не считает, это было бы колоссальной растратой ресурсов. Он находит первые несколько страниц, а остальные начинает искать только, если вы эти страницы перелистываете. Если вы начнете перелистывать, вы обратите внимание, что в адресной строке появился дополнительный параметр - &start=<число>. Например, &start=90 означает, что вы запрашивает хиты начиная с 90-го. Его можно поменять руками, максимально до 990. Если ваш запрос РЕАЛЬНО находит более 1000 страниц, увы, их посчитать невозможно. Но это встречается крайне редко. Вообще среди пользователей гугла, даже самых продвинутых (а мой собеседник выше, между прочим, совершенно гениальный гуглер, один из лучших каких я вообще встречал) широко распространены два заблуждения: (1) "Oценка" гугла имеет какое-то отношение к действитлеьности. Реально эта цифра беретеся проктически с потолка, экстраполируется на основании первых нескольких страниц. Она всегда в сотни, а то и в тысячи раз больше числа страниц, которые гугле реально находит по данному запросу. (2) Все страницы, индексированные гуглом, будут показаны по запросу, если сапрашиваемый термин в них реально встречается. На самом деле гугле показывает лишь определенную часть страниц, которые в нем индексированы. Как он их отбирает - загадка, на котоую ответ никто не знает. Например, если задать в качестве поиска livejournal без кавычек, гугл показывает только 23 сайта, и больше якобы в природе нет (такая же чушь, как 200 млн, которые он обешает на первой странице). Если же задать то же слово в кавычках, то откуда-то появляется уже 81 сайт, хотя формально оба запроса идентичны. Eсли же запросить "livejournal" -putin (тот же запрос, но не показывать страницы, где есть слово putin), то количество хитов *увеличивается* до 94!
В общем, можно с большой оглядкой сравнивать два числа, полученных одним способом, либо перелистыванием страниц (предпочтительно) либо по "оценке" на первой старнице, но ни в коем случае нельзя сравнивать цифры, "добытые" разными способами.
Спасибо за подробное разъяснение. Я осмыслила и попробовала. Блин. Действительно не получается никаких тысяч с миллионами( Не понимаю, зачем тогда вообще нужна такая экстраполяция. Остальное тоже очень и очень странно и ни разу интуитивно не понятно.
Но всё-таки - можно ли сказать, что сравнивать два числа, полученных одним способом, имеет смысл при оценке встречаемости слова/выражения, как мы тут постоянно делаем (здесь 100 000, а здесь 10 000, о, значит, первый вариант лучше, т.е. понятно, что реально цифры другие, но возможно ли хотя бы узнать, какое выражение чаще встречается), или это всё равно гадание на кофейной гуще? А то пример с жж совсем меня настораживает.
(1) только качественные выводы. Если одно выражение встречаетс1 10 раз, а другое 300, то второе более употребительное. Если одно встре-чается 230 раз, а друго 280, никаких выводов. (2) Лучше считать реальные страницы пролистыванием, чем смотреть на эту экстраполяцию.
no subject
Date: 2013-10-16 01:39 am (UTC)no subject
Date: 2013-10-16 01:44 am (UTC)no subject
Date: 2013-10-16 02:33 am (UTC)cant get along with - About 697,000,000 results
no subject
Date: 2013-10-16 02:36 am (UTC)no subject
Date: 2013-10-16 02:35 am (UTC)no subject
Date: 2013-10-16 02:41 am (UTC)no subject
Date: 2013-10-16 07:59 pm (UTC)no subject
Date: 2013-10-17 12:26 am (UTC)no subject
Date: 2013-10-16 03:38 am (UTC)Google:
"those i can't get along with" - 6 results
"people i can't get along with" - About 16,300,000 results
no subject
Date: 2013-10-16 04:26 am (UTC)no subject
Date: 2013-10-16 04:31 am (UTC)no subject
Date: 2013-10-17 12:29 am (UTC)Цифра, которую гугл приводит в верхней стоке, абсолютно бессмысленна и наикакого отношения к реальному числу хитов не имеет. Чтоб узнать настоящее число, надо пролистать до последней страницы,на ней будет написана точная цифра.
Еще можно сравнивать две таких "потолочных" оценки между собой, хотя тоже не желательно, но никак нельзя сравнивать одну такую оценку с точной цифрой (6).
no subject
Date: 2013-10-17 02:44 am (UTC)no subject
Date: 2013-10-18 03:10 pm (UTC)Меня всегда смущало большое число повторов в результатах, выдаваемых гуглом, которые, конечно, должны искажать картину.
no subject
Date: 2013-10-19 01:16 am (UTC)Как вы понимаете, никакими повторами из 46 хитов 18 млн не сделать. Дело в том, что гугл по умолчанию количество старниц не считает, это было бы колоссальной растратой ресурсов. Он находит первые несколько страниц, а остальные начинает искать только, если вы эти страницы перелистываете. Если вы начнете перелистывать, вы обратите внимание, что в адресной строке появился дополнительный параметр - &start=<число>. Например, &start=90 означает, что вы запрашивает хиты начиная с 90-го. Его можно поменять руками, максимально до 990. Если ваш запрос РЕАЛЬНО находит более 1000 страниц, увы, их посчитать невозможно. Но это встречается крайне редко. Вообще среди пользователей гугла, даже самых продвинутых (а мой собеседник выше, между прочим, совершенно гениальный гуглер, один из лучших каких я вообще встречал) широко распространены два заблуждения:
(1) "Oценка" гугла имеет какое-то отношение к действитлеьности. Реально эта цифра беретеся проктически с потолка, экстраполируется на основании первых нескольких страниц. Она всегда в сотни, а то и в тысячи раз больше числа страниц, которые гугле реально находит по данному запросу.
(2) Все страницы, индексированные гуглом, будут показаны по запросу, если сапрашиваемый термин в них реально встречается. На самом деле гугле показывает лишь определенную часть страниц, которые в нем индексированы. Как он их отбирает - загадка, на котоую ответ никто не знает. Например, если задать в качестве поиска livejournal без кавычек, гугл показывает только 23 сайта, и больше якобы в природе нет (такая же чушь, как 200 млн, которые он обешает на первой странице). Если же задать то же слово в кавычках, то откуда-то появляется уже 81 сайт, хотя формально оба запроса идентичны. Eсли же запросить "livejournal" -putin (тот же запрос, но не показывать страницы, где есть слово putin), то количество хитов *увеличивается* до 94!
В общем, можно с большой оглядкой сравнивать два числа, полученных одним способом, либо перелистыванием страниц (предпочтительно) либо по "оценке" на первой старнице, но ни в коем случае нельзя сравнивать цифры, "добытые" разными способами.
no subject
Date: 2013-10-22 07:05 am (UTC)Остальное тоже очень и очень странно и ни разу интуитивно не понятно.
Но всё-таки - можно ли сказать, что сравнивать два числа, полученных одним способом, имеет смысл при оценке встречаемости слова/выражения, как мы тут постоянно делаем (здесь 100 000, а здесь 10 000, о, значит, первый вариант лучше, т.е. понятно, что реально цифры другие, но возможно ли хотя бы узнать, какое выражение чаще встречается), или это всё равно гадание на кофейной гуще? А то пример с жж совсем меня настораживает.
no subject
Date: 2013-10-22 07:36 pm (UTC)(1) только качественные выводы. Если одно выражение встречаетс1 10 раз, а другое 300, то второе более употребительное. Если одно встре-чается 230 раз, а друго 280, никаких выводов.
(2) Лучше считать реальные страницы пролистыванием, чем смотреть на эту экстраполяцию.
no subject
Date: 2013-10-22 07:45 pm (UTC)no subject
Date: 2013-10-16 04:35 am (UTC)"people i can't get along with" - About 81 results
"those i can't get along with" - 1 result
no subject
Date: 2013-10-16 04:48 am (UTC)no subject
Date: 2013-10-16 05:40 am (UTC)no subject
Date: 2013-10-16 05:44 am (UTC)no subject
Date: 2013-10-16 12:33 pm (UTC)Those WHO тогда уж
no subject
Date: 2013-10-16 03:44 pm (UTC)no subject
Date: 2013-10-17 12:30 am (UTC)no subject
Date: 2013-10-16 04:32 pm (UTC)no subject
Date: 2013-10-17 12:32 am (UTC)No results found for "people I cannot live in peace with".
...obviously...