|
|
|
|
|
|
О нас, о форумчанах Sostava |
|
Гость<< < |
Цитата, автор voland:
Цитата, автор Юрий Рязанов:
……
И совершенно другой сложности задача рассчитать "частотное распределение" посещений, можно сегментировать аудиторию до безумства -
|
Зачем?
надо просто написать булеву алгебру событий
(1) этот (к) приходит по этой причине (к)
(2) другой (j) приходит по другой причине (j)
............................
|
Булева, для меня слишком витиевато…
…. Тем более статистика у Вас есть вся - по составу, так я понял? …
|
Тут внизу есть счетчик «mail.ru» - вот только это и есть, всем доступный, аналогичный на GFK
Одновременно и ТАКЖЕ точно можно просчитать ветки ГФК, когда там была ругань.
(добавляете еще причину - "участвовать в ругани" ). Найдете Р(для ругани).
Сможете прогнозировать. |
Да бог с ним с GFK. Был я «там» (ник ЮР), над новичками конечно прикалываются, не угодных «мочат», что есть то есть. На сколько я могу судить, там очень спаянная тусовка: для поиска «истины» -это плохо, когда друзья товарищи проблема объективности в оценке суждений (личностный фактор), а их табакерки , семинары и т.д.- так хорошо конечно.
Да и бог с ней с «правдой» которой нет, главное что бы комфортно и в удовольствие общалось. Они нашли свой уникальный формат… брэнд же - не всеяден.
|
|
<
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
26.06.2006 18:02 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
26.06.2006 18:14 | |
|
|
|
Постов: 2114 Дата регистрации: 01.09.2005 |
Добрый вечер коллеги.
Я согласен с Юрой задача о "Аудитории сайта" и медиапланировании с использованием статистики страниц сайтов и форумов, куда интереснее наших маркетинговых дрязг: форум ГФК форум Состава. Это не паханое поле!
Вот лично мне сейчас понадобилось решать такую задачу. Столкнулся с тем, что по рейтингам и статистике посещений одна картина, одни сайты-лидеры в данной категории по хостам. по рейтингу по запросам по ключевым фразам в поисковых машинах, совсем другая картина. Ни один из лидеров по статистике хостов за месяц в первые 60 сайтов выдачи поисковой системы не попадает, чего не пиши. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
26.06.2006 18:49 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
Цитата, автор butaev:
....Я решал получил, что если от 20 до 26 раз, то Х(предельное)- Аудиторию, можно вычислить достаточно точно.
Это не совсем биномиальное распеределение, но получившиеся значения очень близки с Юриными.
|
Эдуард, во как тебя все это разобрало (гм. я сам такой). Подсчитал. Да еще точно! :)
Есть типовая общепризнанная практика оценки всяческой exp-асимптотики (вспомните, как определяется время полураспада и т.д.). Надо ее где то резать, по умолчанию, все дружно взявшись за руки договорились, что эта величина должна быть ограничена экспонентой:
Gпр/[Gпр-G(m)]=e и тогда уже не для предельной, а для ХАРАКТЕРНОЙ аудитории ресурса (она ближе к реалиям) можно записать:
G(mо)= Gпр[1-exp(-1)]= Gпр*63%
А характерное время (период) ее накопления: mo=-1/ln(1-R/Gпр),
Тогда статистика такая:
Ресурсы ____время mo__X(mo)______Xпр
RBK_________mo=7сут___ 1169423___1850000
GFK_________mo=26сут__ 2845______4500
Pmarketing__mo=32сут__ 3413______5400
Mediaplan___mo=39сут__ 1391______2200
Sostav______mo=97сут__ 79015_____125000
Конфа МИ____mo=100сут_ 5689______9000
Получается, что наша конфа «МИ»: с периодом mo=100 сут, насыщается до 5600 посетителей и все с начала...
Эдуард, тебя как я понял, очень интересует обновление «новых» посетителей в сут! Это легко оценить:
Всегда хорошо выполняется условие R/Gпр=Хост(1сут)/Хпр<<1
Тогда логарифмом можно пожертвовать ln(1-R/Gпр)~-R/Gпр и записать
mo~1/(R/Gпр) – по логике, раз в Л.Ч. стоит время mo (период), то П.Ч R/Gпр=q – есть не что иное, как % прироста за ед. времени .
Очень простая оценка обновления в сутки:
У «МИ» 1/mo=1/100=1% в сут.
У GFK 1/mo=1/26=4% в сут.
У РБК 1/mo=1/7=14% в сут.
и т.д.
Чего еще может быть проще.
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
26.06.2006 19:48 | |
|
|
|
Постов: 2449 Дата регистрации: 02.03.2006 |
Цитата, автор Гость:
Цитата, автор voland:
Цитата, автор Юрий Рязанов:
……
И совершенно другой сложности задача рассчитать "частотное распределение" посещений, можно сегментировать аудиторию до безумства -
|
Зачем?
надо просто написать булеву алгебру событий
(1) этот (к) приходит по этой причине (к)
(2) другой (j) приходит по другой причине (j)
............................
|
Булева, для меня слишком витиевато…
…. Тем более статистика у Вас есть вся - по составу, так я понял? …
|
Тут внизу есть счетчик «mail.ru» - вот только это и есть, всем доступный, аналогичный на GFK
Одновременно и ТАКЖЕ точно можно просчитать ветки ГФК, когда там была ругань.
(добавляете еще причину - "участвовать в ругани" ). Найдете Р(для ругани).
Сможете прогнозировать. |
Да бог с ним с GFK. Был я «там» (ник ЮР), над новичками конечно прикалываются, не угодных «мочат», что есть то есть. На сколько я могу судить, там очень спаянная тусовка: для поиска «истины» -это плохо, когда друзья товарищи проблема объективности в оценке суждений (личностный фактор), а их табакерки , семинары и т.д.- так хорошо конечно.
Да и бог с ней с «правдой» которой нет, главное что бы комфортно и в удовольствие общалось. Они нашли свой уникальный формат… брэнд же - не всеяден.
|
Булева алгебра - Это в данном случае всё пространство всех гипотез -
в данном случае - почему приходят на сайт.
Да, им на ГФК комфортно, но они гробят неугодных, это некрасиво. |
|
-------- Woland, чурка нерусская :) |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
26.06.2006 22:35 | |
|
|
|
Постов: 2449 Дата регистрации: 02.03.2006 |
Цитата, автор butaev:
Добрый вечер коллеги.
Я согласен с Юрой задача о "Аудитории сайта" и медиапланировании с использованием статистики страниц сайтов и форумов, куда интереснее наших маркетинговых дрязг: форум ГФК форум Состава. Это не паханое поле!
Вот лично мне сейчас понадобилось решать такую задачу. Столкнулся с тем, что по рейтингам и статистике посещений одна картина, одни сайты-лидеры в данной категории по хостам. по рейтингу по запросам по ключевым фразам в поисковых машинах, совсем другая картина. Ни один из лидеров по статистике хостов за месяц в первые 60 сайтов выдачи поисковой системы не попадает, чего не пиши. |
Промоушен грамотный однако!!!!!!!!!!!!!
Знают, как втиснуться. |
|
-------- Woland, чурка нерусская :) |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
26.06.2006 22:36 | |
|
|
|
Постов: 2449 Дата регистрации: 02.03.2006 |
Цитата, автор butaev:
для: voland©
Надо вычислить (при разных допущениях) во сколько раз будет больше накопленная сумма IP-адресов за 30 дней, чем мы обнаружили за 1 день. |
Это зависит от причин
если интересная тема,
если надо кого-то защищать (наоборот - ругать)
и т.п.
Посмотрите, на динамику данной сетки.
|
|
-------- Woland, чурка нерусская :) |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
26.06.2006 22:39 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
для: voland©
А вы могли бы на примере это ветки, продемонстрировать возможности булевой алгебры и рассчитать статистику посещений? Очень интересно в живую увидеть, как она эта алгебра работает.
Я со своей стороны подумаю, как это подсчитать без алгебры. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
27.06.2006 00:29 | |
|
|
|
Постов: 2758 Дата регистрации: 31.08.2005 |
Цитата, автор butaev:
Добрый вечер коллеги.
Я согласен с Юрой задача о "Аудитории сайта" и медиапланировании с использованием статистики страниц сайтов и форумов, куда интереснее наших маркетинговых дрязг: форум ГФК форум Состава. Это не паханое поле!
Вот лично мне сейчас понадобилось решать такую задачу. Столкнулся с тем, что по рейтингам и статистике посещений одна картина, одни сайты-лидеры в данной категории по хостам. по рейтингу по запросам по ключевым фразам в поисковых машинах, совсем другая картина. Ни один из лидеров по статистике хостов за месяц в первые 60 сайтов выдачи поисковой системы не попадает, чего не пиши. |
Эдуард, посмотрите индекс цитирования: у СОСТАВА 4500, форум Состава - 275, Джи-Фи-К - 140 и т.д. Каждая такая ссылка в отчете посещений не видна напрочь, а в результате - люди приходят. Да и с поисковиков значительная часть приходит за счет прямых запросов на название сайтов,а не на содержательные запросы.
Вообще эта тема, запросы с поисковиков и откуда берутся люди на сайтах, сродни поискам там, где светло (топ рейтинга по источникам пришедших на сайт), а все гораздо более "размыто" и из-за этого сложно поймать какую-ту систематичность. |
|
-------- http://www.dnp.ru |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
27.06.2006 07:54 | |
|
|
|
Постов: 2114 Дата регистрации: 01.09.2005 |
Добрый день Михаил где посмотреть индекс?
Подскажи, чтобы не копаться.
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
27.06.2006 08:35 | |
|
|
|
Постов: 2114 Дата регистрации: 01.09.2005 |
Добрый вечер Юрий.
Ты обо мне более высокого мнения, чем я такого стою.
Я умею танцевать только от печки. До меня с трудом дошло, что количество уникальных IP-адресов (хостов) в первый день наблюдения статистики сайта - Х(1) отнесенное к Х(предельное) называемой АУДИТОРИЕЙ САЙТА ИЗМЕРЕННОЙ В ОРИГИНАЛЬНЫХ IP-адресах (хостах), т. е. величина Х(1)/Х(предельное) не что иное как вероятность попадания в статистику сайта некоторого количества IP-адресов в первый день нашего месячного наблюдения. Это просто по определению из теории вероятности. [1 - Х(1)/Х(предельное)] соответственно вероятность не попадания уникальных IP-адресов из тех что имеются в нашей аудитории в статистику сайта в наш первый день наблюдения.
Теперь нам придется делать 1 допущение, которые плохо соответствуют тому, что происходит в жизни, но для не очень точного решения задачи, чтобы в принципе понять к чему может привести такой расчет примем его.
1. Допущение: во все дни месяца, недели, года количество людей из аудитории "приходящих" на сайт приблизительно одно и тоже и не важно были ли они там вчера (третьего, четвертого дня) или нет.
Тогда вероятность того, что за 30 дней не попадут в статистику сайта некие IP-адреса (хосты) из нашей Аудитории [1 - Х(1)/Х(предельное)]^30. Это тоже из теории вероятности. Вероятность непопадания в 1 день умножается на вероятность непопадания во 2 день и так далее до 30 дня. А мы их приняли равными из-за допущения 1.
Из-за этого и 30 степень.
{1- [1 - Х(1)/Х(предельное)]^30} соответственно вероятность попадания за 30 дней хостов из нашей Аудитории в статистику посещения сайта за 30 дней. Тоже просто определение из теории вероятности. Х(предельное)*{1- [1 - Х(1)/Х(предельное)]^30} количество оригинальных хостов за месяц. И мы его значение смотрим на mail.ru всегда и бесплатно, как и Х(1).
Получаю твою формулу Х(30)=Х(предельное)*{1- [1 - Х(1)/Х(предельное)]^30} при этом я не пользовался ни чем, чтобы выходило за пределы первых 2 лекций по теории вероятности в "арбузолитейном" ВУЗе города Х.
Та самая лекция, где рассказывают про вероятность выпадения орла, если уже раз орел при подбрасывании выпал.
Теперь полезную для этой задачи, и удобную формулу для расчетов. Вывел при обсуждении этой задачи мой друг Андрей Иванович Лумпов (помнишь нашу с ним статью по теории полезности).
Х(предельное)=Х(1)*(435/DR - 12.435 + 0.1569*R-0.00178*R^2)
где R=X(30)/X(1), а DR=(30-R).
Обрати внимание на вклад линейного и квадратичного члена при R в диапазоне значений 20 – 25 (в нашем примере с нашим "Обшим форумом Состава"17000/640=26,56), он небольшой им можно пренебречь. И получится очень простая формула для практиков.
Твой ход!
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
27.06.2006 08:46 | |
|
|
|
Постов: 64 Дата регистрации: 07.03.2006 |
Например здесь есть статистика по ИЦ.
http://yaca.yandex.ru/yca/cat/Science/Sciences/Humanities/Economics/Marketing/
Но на сегодня, в том же Яндекс данный критерий (ИЦ) не так сильно влияет на результаты поиска. Заголовки страниц (тайтлы), сами тексты, описания страниц, акценты в самом тексте (выделение жирным, заголовки и т.д.). А вообще, наука поисковой оптимизации далеко не простая :) |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
27.06.2006 08:54 | |
|
|
|
Постов: 2449 Дата регистрации: 02.03.2006 |
Цитата, автор Юрий Рязанов:
для: voland©
А вы могли бы на примере это ветки, продемонстрировать возможности булевой алгебры и рассчитать статистику посещений? Очень интересно в живую увидеть, как она эта алгебра работает.
Я со своей стороны подумаю, как это подсчитать без алгебры. |
Господи, помилуй!
Юрий, да Вы сами так и считаете!
Иначе цифр ВООБЩЕ нет, есть только подобие.
Давайте зададим алгебру, Вы - дадите цифры.
Вот - пусть алгебра событий будет=
1) Приход на Состав-МИ "дежурный" (обычный) - некое среднее число событий в месяц из основного числа посетителей
2) Приход туда же новых пользователей - еще некое число,
3) Приход НА ИНТЕРЕСНУЮ ТЕМУ - из имеющихся пользователей - еще m3,
4) Приход "для защиты" (или для ругани) m4,
5) Приход "клубный" - а потому что народ собрался (потусоваться) m5
Еще есть другие неучтенные события? |
|
-------- Woland, чурка нерусская :) |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
27.06.2006 10:25 | |
|
|
|
Постов: 2457 Дата регистрации: 02.07.2004 |
Цитата, автор Юрий Рязанов:
Я со своей стороны подумаю, как это подсчитать без алгебры. |
Юра, а как без пространства событий вообще что-то считать? Нормировать сумму вероятностей на единицу нужно или как? |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
27.06.2006 12:23 | |
|
|
|
Постов: 2457 Дата регистрации: 02.07.2004 |
Цитата, автор Михаил Дымшиц:
Вообще эта тема, запросы с поисковиков и откуда берутся люди на сайтах, сродни поискам там, где светло. |
Именно. Считать что надо не умеем, поэтому считаем то, что умеем считать. Рядовое явление у статистиков. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
27.06.2006 12:26 | |
|
|
|
Михаил Дымшиц<< < |
Эдуард,
у меня стоит Яндекс-Бар, там есть этот показатель (индекс цитирования). Где его еще можно посмотреть, я не знаю. |
|
<
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
27.06.2006 15:59 | |
|
|
|
Постов: 2449 Дата регистрации: 02.03.2006 |
Цитата, автор Винопивец:
Цитата, автор Михаил Дымшиц:
Вообще эта тема, запросы с поисковиков и откуда берутся люди на сайтах, сродни поискам там, где светло. |
Именно. Считать что надо не умеем, поэтому считаем то, что умеем считать. Рядовое явление у статистиков. |
Поправка - у "статистиков".
Все-таки не надо всю заслуженную и трудную профессию мордой в грязь. |
|
-------- Woland, чурка нерусская :) |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
27.06.2006 17:50 | |
|
|
|
Постов: 2449 Дата регистрации: 02.03.2006 |
Цитата, автор Винопивец:
Цитата, автор Юрий Рязанов:
Я со своей стороны подумаю, как это подсчитать без алгебры. |
Юра, а как без пространства событий вообще что-то считать? Нормировать сумму вероятностей на единицу нужно или как? |
Недавно читал один "учебник", прости Господи, по "теории статистики" (не меньше!!!!!).
Если начтоящая статистика есть математический анализ пространства с мерой,
то вэтом учебнике учат только "вербальному анализу немерянных дыр",
если не сказать хуже - вербабьему.
И кого учат, заметьте? Тех, кто НИЧЕГО еще не знает и всему ВЕРИТ! Руки бы поотрывал. |
|
-------- Woland, чурка нерусская :) |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
27.06.2006 17:54 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
[quote]Цитата, автор butaev:
Цитата, автор butaev:
……До меня с трудом дошло, что количество уникальных IP-адресов (хостов) в первый день наблюдения статистики сайта - Х(1) отнесенное к Х(предельное) называемой АУДИТОРИЕЙ САЙТА ИЗМЕРЕННОЙ В ОРИГИНАЛЬНЫХ IP-адресах (хостах), т. е. величина Х(1)/Х(предельное) не что иное как вероятность попадания в статистику сайта некоторого количества IP-адресов в первый день нашего месячного наблюдения. Это просто по определению из теории вероятности…..
…………………….
Тоже просто определение из теории вероятности. Х(предельное)*{1- [1 - Х(1)/Х(предельное)]^30} количество оригинальных хостов за месяц. И мы его значение смотрим на mail.ru всегда и бесплатно, как и Х(1).
Получаю твою формулу Х(30)=Х(предельное)*{1- [1 - Х(1)/Х(предельное)]^30} при этом я не пользовался ни чем, чтобы выходило за пределы первых 2 лекций по теории вероятности в "арбузолитейном" ВУЗе города Х.
|
я не скажу, что это ПОДВИГ, но что героическое в этом есть… (с)
Эдуард, тусуясь на соседней ветки по медиапланированию, - я как черт ладана боюсь приводить какие либо пусть и даже простейшие мат .доказательства. Уровень мат. грамотности катастрофический.
Так я поступил и здесь. Помнишь, я просто написал «есть две точки Х(1) и Х(30)»- и надо подобрать 3-ю к которой бы кривая стремилась асимптотически. – вот этим я и хотел ограничится, а ты понимаешь начал копать и копать… прости я не понял тебя, что ты хотел именно этого объяснения приведенной формулы. Ты меня запутал, когда употребил «биномиальный» - как из этого закона получить формулу (и я тебе честно отрапортовал). Сказал бы, просто: «А на пальцах это как?» - ну я бы и выложил тебе сразу все что ты выше написал. А почему я не понял, что ты хотел от меня –см. следующий пост!!!
Теперь полезную для этой задачи, и удобную формулу для расчетов. Вывел при обсуждении этой задачи мой друг Андрей Иванович Лумпов (помнишь нашу с ним статью по теории полезности).
Х(предельное)=Х(1)*(435/DR - 12.435 + 0.1569*R-0.00178*R^2)
где R=X(30)/X(1), а DR=(30-R).
Обрати внимание на вклад линейного и квадратичного члена при R в диапазоне значений 20 – 25 (в нашем примере с нашим "Обшим форумом Состава"17000/640=26,56), он небольшой им можно пренебречь. И получится очень простая формула для практиков.
|
Эдуард, мои аплодисменты Андрею! Очень хорошее приближение, для решения трансцендентного уравнения (беру на вооружение). В софте это у меня это решается в лоб (с заданной точностью, ну он же железный).
|
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
27.06.2006 18:10 | |
|
|
|
Постов: 2128 Дата регистрации: 07.04.2005 |
Цитата, автор butaev:
…………
Твой ход!
|
мля.. мля..А что скажет купечество (с)
А если не побояться …(с) проникнуть еще глэбже, и подсчитать частотное распределение g(f) - вот именно его то «подумалось мне тогда» ты и хочешь подсчитать.
По биномиальному закону 1 ресурс –еще куда не шло. А вот 2 ресурса и более, все суши весла.
Зная распределение g(f) – означает, что мы знаем о ВСЕ
Внизу на рис. я изобразил расчет когда РО мы вешаем на «МИ» и на «GFK»
И если бы админы обоих ресурсов ОТКРЫЛИ статистику в Mail.ru , то легко можно было проверить мой расчет. Там в статистику по ID-счетчика можно смотреть ПЕРЕСЕЧЕНИЕ аудиторий. У меня за мес. получилось, что 1100 чел. посещают оба ресурса. Примерно каждый второй из МИ посеется на GFK, и примерно каждый 3-ий GFK гуляет по МИ.
Твой ход!
|
|
| Sostav20.jpg |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
27.06.2006 18:11 | |
|
|
|
| Только зарегистрированные пользователи могут оставлять сообщения в этом форуме |
|
|
|
|
|
© "ООО Состав.ру" 1998-2024
тел/факс: +7 495 225 1331 адрес: 109004, Москва, Пестовский пер., д. 16, стр. 2
При использовании материалов портала ссылка на Sostav.ru обязательна! Администрация Sostav.ru просит Вас сообщать о всех замеченных технических неполадках на E-mail
|
|
|