Тема про ОШИБКИ измерения и НЕ МОНОТОННОСТИ признака

Слово и фраза:

Искать:

Сортировать по:

Форумы на Sostav.ru / Маркетинговые исследования / Тема про ОШИБКИ измерения и НЕ МОНОТОННОСТИ признака

Мысли вслух...Возможно есть и ошибки...

< 1 2 3 4 5 6 7 8 >

Profile

Юрий Рязанов^©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор butaev:

для: Юрий Рязанов©
Берем ежедневное издание, для него берем любимую формулу
G(m)=Gпр[1-(1-R/Gпр)^m]. По условию задачи Gпр1=Gпр2……

Эдуард, мыслишь в правильном направлении… ;)

Только по условию равны и рейтинги: R1=R2 – где R1 – это средний рейтинг за период (дисперсия>0), а R2=const(дисперсия=0)

Для R2 – эта формула вполне годится для описания Охвата G2(m) . А вот для «прыгающего» рейтинга R1 – приведенная запись уже не годится. Более общая запись мной здесь была приведена (привожу еще раз см. фото). И надо проявить чуток изобретательности.

И в конечном итоге надо найти отношение G1(m)/ G2(m) и сравнить с 1. И как вы уже догадались G1(m)/ G2(m) >1 для m>1 (и равенство только в асимптотике)

Эта задача - просто замечательная. С удивительным не тривиальным выводом:

Чем больше разброс значений рейтинга СМИ от своего среднего значения за период, тем быстрее растет его Охват

Демон Бутаева: в практическом плане указывает нам на бессмысленность точных измерений единичных: номеров изданий, эфирных событий, щитов и т.д. Более чем достаточно просто измерять среднее за «характерный» период.

Формулы.gif

Комментарий понравился?

02.03.2008 02:40

Profile

Винопивец^©

Постов: 2457
Дата регистрации: 02.07.2004

для: Юрий Рязанов© Меня в твоем выводже аот что смущает. Первое. Если ты предполагаеш (согласен) что стабильный рейтинг делают разные люди, то будь готов предположить, что большие отклонения делают одни и те же люди (читающие/глядящие с устойчивой периодичностью, отличной от твоего периода усреднения). Второе. Естественный период усреднения - периодичность выхода. Что получится, если усреднять сырые сырые данные по периоду, кратному естественному? По фрауции естественного периода? Окажется ли картинка устойчивой? Лично я что-то сомневаюсь.
для: IgorRudy© 30-40 параметров? Для модели, не ограниченной физическими законами? Хе. Допустим, что у каждого параметра может быть только два значения. Возможных комбинаций > 2^N, 30 < N < 40, т.е. от миллиарда до триллиона. Ни у кого никогда не будет достаточного количества исходных данных, чтобы проверить такую модель, так что выводы таких модельеров годятся разве для продажи полным идиотам.

Комментарий понравился?

02.03.2008 12:02

Profile

butaev^©

Постов: 2114
Дата регистрации: 01.09.2005

для: Юрий Рязанов©
Добрый день.
"Чем больше разброс значений рейтинга СМИ от своего среднего значения за период, тем быстрее растет его Охват.
Это точно. В первую минуту, когда я задумался над этой задачей я попробовал, что-то из данного положения "выудить" для решения. Даже аналогия пришла в голову, что размещаться в нем как играть в азартные игры. Риск большой, т. к. AIR для такого издания мы знаем очень неточно (концепция использования такого показателя как AIR базируется на Законе больших чисел, а он для этого издания в рамках полугодия плохо применим; вспоминаешь Мишино "AIR-некий индекс"), но и выигрыш может быть большой.
А дальше я ушел за рамки ОТС и стал строить гипотезы о том как "читается/не читается реклама в том и в другом издании.
Я уже писал в других дискуссиях, что раз цель медиапланирования сделать прогноз, то для изданий с небольшими рейтингами надо много чего изучать прежде, чем их использовать. При таком изучении разных аспектов такого издания я использую модель некого негласного договора (симбиоза интересов редакции и разных групп читателей). Контент анализ нескольких (чем больше тем лучше) номеров - это минимум, что надо сначала сделать.
2. А вот про «характерный период» в применении к разным печатным СМИ «треба» поговорить отдельно.

Комментарий понравился?

02.03.2008 15:21

Profile

Юрий Рязанов^©

Постов: 2128
Дата регистрации: 07.04.2005

Вот наиболее простой вариант решения задачи.

Два Охвата.gif

Комментарий понравился?

02.03.2008 17:27

Profile

IR^©

Маркетолог - международник
Постов: 5658
Дата регистрации: 27.01.2007

Цитата, автор Винопивец:для: IgorRudy© 30-40 параметров? Для модели, не ограниченной физическими законами? Хе. Допустим, что у каждого параметра может быть только два значения. Возможных комбинаций > 2^N, 30 < N < 40, т.е. от миллиарда до триллиона.

Олег, а где вы видели хотя бы одну бизнес модель с менее чем 10 параметрами?
PS Кстати, на D0 (эксперимент в ФермиЛабе) - почти все модели с более чем 30-40 параметрами, и ничего, либо н-сетями, либо монте-карло с аннилингом всё считают.

--------
marketer marketiri lupus est ...

Комментарий понравился?

02.03.2008 20:41

Profile

butaev^©

Постов: 2114
Дата регистрации: 01.09.2005

для: Юрий Рязанов©
Вывод формул понятен. Результат тоже.

Комментарий понравился?

02.03.2008 23:29

Profile

Юрий Рязанов^©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор Винопивец:
для: Юрий Рязанов© Меня в твоем выводже аот что смущает. Первое. Если ты предполагаеш (согласен) что стабильный рейтинг делают разные люди, то будь готов предположить, что большие отклонения делают одни и те же люди (читающие/глядящие с устойчивой периодичностью, отличной от твоего периода усреднения). Второе. Естественный период усреднения - периодичность выхода. Что получится, если усреднять сырые сырые данные по периоду, кратному естественному? По фрауции естественного периода? Окажется ли картинка устойчивой? Лично я что-то сомневаюсь.

Олег, как ты уже понял (см. мой вариант док-ва) я не делаю никаких предположений относительно причин стабильности рейтинга.

Вывод построен на известности функции распределения вероятностей g(m) – суть биномиальный закон.

g(m;n)=Gпр*C(n,m)*R^m*(1-R)^(n-m) (1) - биномиальное распределение где

R – рейтинг одного номера
Gпр – предельный охват всех номеров издания (или просто нормировочный коэффициент из эксперимента )
n – число номеров
m – число выход рекламы
C(n,m) – биномиальные коэффициенты

Полная вероятность или Охват получаются, если провести суммирование выражения (1) по всем номерам n (не интегрирование поскольку это дискретный закон):

G(m)= Сумм[g(m)]=Gпр[1-(1-R/Gпр)^m] (2)

При суммировании учтено, что по биномиальной теореме: Сумм{C(n;m)*A^m*B^(n-m)}=(A+B)^m и надо учесть что суммирование ведется от 0, а в (2) от 1, поэтому надо вычесть из суммы «0» член.

Далее я просто обобщил точную формулу для Охвата (2) на случай когда рейтинг может принимать любые значения, а именно заменил в (2) член (1-R/Gпр)^m на произведение П(1-Ri/Gпр) где рейтинг может быть уже любым.

Примечание: я почти уверен, что вывод «флуктуации рейтинга увеличивают охват» будет справедлив и при любом другом законе распределения вероятностей (он инвариантен).

Безусловно, надо отдавать себе отчет, что все величины в (2) имеют вероятностную природу (средние случайных величин). И в этом смысле твои опасения вполне обоснованы.
Вопрос о периоде усреднения сырах данных конечно заслуживает особого внимания, и он с мой т.з. не очень сложен. И здесь нужно ориентироваться на характерное время стационарного потребления медиа.
К примеру у "Гэллапа" : Исследование проводится непрерывно в течение года (за исключением новогодних, майских праздников, а также месяца августа). Данные предоставляются 4 раза в год за предыдущие 5-6 месяцев («скользящий график»)
Все это интуитивно понятно и не требует особых обоснований и ОЧень глубоких исследований, все периоды стационарности наглядно видны из скользящего трекинга медиапотребления.

Комментарий понравился?

03.03.2008 12:56

Profile

Гость^©

Незваный гость лучше ...
Постов: 262
Дата регистрации: 06.09.2006

Цитата, автор Юрий Рязанов:
К примеру у Гэллапа: Исследование проводится непрерывно в течение года (за исключением новогодних, майских праздников, а также месяца августа). Данные предоставляются 4 раза в год за предыдущие 5-6 месяцев («скользящий график»)

У какого такого "Гэллапа"? Вы о проекте NRS TNS Gallup Media?
Перед тем, как заявлять, стоит справки навести. ;)
Это, в отличие от трехэтажных формул, проверить на раз.
Ну, не обновили они эту информацию на сайте, но это же не повод дезинформировать читателей. :)

NRS_07.pdf

--------
Ты пришел, Рабби?!

Комментарий понравился?

03.03.2008 13:16

Profile

Юрий Рязанов^©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор butaev:

для: Юрий Рязанов©
Добрый день.
"Чем больше разброс значений рейтинга СМИ от своего среднего значения за период, тем быстрее растет его Охват.
Это точно. В первую минуту, когда я задумался над этой задачей я попробовал, что-то из данного положения "выудить" для решения. Даже аналогия пришла в голову, что размещаться в нем как играть в азартные игры. Риск большой, т. к. AIR для такого издания мы знаем очень неточно (концепция использования такого показателя как AIR базируется на Законе больших чисел, а он для этого издания в рамках полугодия плохо применим; вспоминаешь Мишино "AIR-некий индекс"), но и выигрыш может быть большой.
……

Эдуард! Вот вот "про азарт" ОЧень верно подметил

. Можно сказать и так:

Конечно, стратегия с большой дисперсией рискованнее!!! Но что лучше для нашего кошелька – Риск или безопасная игра?

Комментарий понравился?

03.03.2008 13:23

Profile

Винопивец^©

Постов: 2457
Дата регистрации: 02.07.2004

для: butaev© Эдуард, так и есть. В самых общих предположениях: чем выше волатильность, тем больше возможный выигрыш. Дальше, конечно, вопрос ограничения рисков. На бирже его можно ограничить абсолютно (закрытием позиции при определенных потерях). Но в рекламировании так не сделаешь, и игра этим симметризуетсся.
для: IgorRudy© Физическая модель (в т.ч. производство с логистикой и пр.) может иметь много параметров, потому что кроме данных измерений есть еще физические законы. Но статистическая модель в области человеческой деятельности (поведения) даже с 10-ю параметрами сомнительна, а 30 - это всегда шарлатанство.

Комментарий понравился?

05.03.2008 18:17

Profile

Винопивец^©

Постов: 2457
Дата регистрации: 02.07.2004

для: Юрий Рязанов© Юра, да я помню, что такое биномиальное распределение, правда помню. Я про другое, про предположения в основе - и ты меня, судя по всему, понял.

Комментарий понравился?

05.03.2008 18:19

Profile

IR^©

Маркетолог - международник
Постов: 5658
Дата регистрации: 27.01.2007

Цитата, автор Винопивец:Но статистическая модель в области человеческой деятельности (поведения) даже с 10-ю параметрами сомнительна, а 30 - это всегда шарлатанство.

Почему? Не понимаю.
Ведь в реальной жизни миллионы параметров, и ничего - не ломается.

--------
marketer marketiri lupus est ...

Комментарий понравился?

05.03.2008 19:53

Profile

Михаил Дымшиц^©

Постов: 2758
Дата регистрации: 31.08.2005

Цитата, автор IgorRudy:

Почему? Не понимаю.
Ведь в реальной жизни миллионы параметров, и ничего - не ломается.

В реальной жизни очень мало параметров, которые влияют на СТАТИСТИЧЕСКИЕ КОНКРЕТНЫЕ ПОВЕДЕНЧЕСКИЕ ПРОЯВЛЕНИЯ: цена, расстояние, сила раздражителя, вес груза... Все когнитивные, эмоциональные и прочие реально наблюдаемые реакции или предлагаемые теми или иными исследователями конструкты НИ В КОЕМ СЛУЧАЕ НЕ ЯВЛЯЮТСЯ измеримыми в поведении групп людей параметрами.
Игорь, это типичная путаница между РАЗНООБРАЗИЕМ объяснений людьми своего поведения и СУЩЕСТВЕННЫМИ параметрами, влияющими на это поведение. Природа ошибки в том, что люди при интроспекции предпочитают ситуации межличностного общения, где последствия каждого коммуникативного события действительно зависят от миллиона нюансов, а социальная статистика (в том числе маркетинг) занимается анализом поведения ситуаций со слабым вовлечением (покупки) или являющимся результатом множества индивидуальных решений, каждое из которых не зависит от других (например, рождаемость как статистический показатель).

--------
http://www.dnp.ru

Комментарий понравился?

05.03.2008 20:16

Profile

IR^©

Маркетолог - международник
Постов: 5658
Дата регистрации: 27.01.2007

для: Михаил Дымшиц©
Михаил, мне кажется так же зависит от данных. Когда я делаю анализ по пациентам (потребителям медицинских услуг), то по каждому пациенту в данных записываются более 100 параметров - от комбинаций диагнозов, лекарств, до поведения при покупке лекарств, варианты страховок и частоты посещения госпиталей разных типов. Каждый из этих параметров не описывает поведение пациента (например, один даже самый весомый параметр не может предсказать сколько пациент потратит на лекарства в данном году), но в совокупности все параметры предсказывают поведение пациента с точностью до 90%.
Похожий анализ я использовал и для врачей - там число параметров, которые приводили к 90%-ой точности было меньше, но все равно более 30.

--------
marketer marketiri lupus est ...

Комментарий понравился?

05.03.2008 21:07

Profile

butaev^©

Постов: 2114
Дата регистрации: 01.09.2005

Добрый вечер уважаемые коллеги.
для: Винопивец© и для: Юрий Рязанов©
Добрый вечер.
Мне бы с валидностью измерений разобраться, не до "волатильности". :)

Комментарий понравился?

05.03.2008 21:27

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор butaev:

Добрый вечер уважаемые коллеги.
для: Винопивец© и для: Юрий Рязанов©
Добрый вечер.
Мне бы с валидностью измерений разобраться, не до "волатильности". :)

На мой взгляд термин «волатильность» наиболее удачный, в понимании задачи Демон Бутаева – поскольку речь идет НЕ о дисперсии ошибки номера(читай валидности рейтинга), а о дисперсии медиапотребления от номера к номеру.

Комментарий понравился?

05.03.2008 21:49

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор IgorRudy:

.... но все равно более 30.

Игорь, а сколько из этих 30 - независимых параметров? ;) Если -ВСЕ, то какова ошибка? (они ошибки от независимых, имеют свойство складываться) :(

Комментарий понравился?

05.03.2008 21:57

Постов: 2758
Дата регистрации: 31.08.2005

Цитата, автор IgorRudy:
от комбинаций диагнозов, лекарств, до поведения при покупке лекарств, варианты страховок и частоты посещения госпиталей разных типов.

Игорь, это все взаимозависимые признаки с высокой устойчивостью во времени для хронических заболеваний: правильно подобранное лечение дает стабилизацию состояния, значимое отклонение дает понятный набор последующих событий (госпитализаций и т.д.), изменение страховых программ и т.д.. Это не прогнозирование, это репликация данных предыдущих периодов на последующие.

Добавите маркеры комплайнса, будете почти 100% разделять стабильных и нестабильных на последующие периоды и динамику тяжести заболевания. Но вы это можете делать только для пожизненных заболеваний и только на связанные с ними затраты, затраты на острые состояния на следующие 12 месяцев вы не сможете прогнозировать у конкретного человека ни с какой точностью (хотя вероятность травм за 5-ти летний период прогнозируется, но это прогноз на факт травмы, но даже не её тяжесть, тем более, ни когда именно за эти пять лет)...

--------
http://www.dnp.ru

Комментарий понравился?

05.03.2008 23:01

Profile

IR^©

Маркетолог - международник
Постов: 5658
Дата регистрации: 27.01.2007

Цитата, автор Юрий Рязанов:Если -ВСЕ, то какова ошибка? (они ошибки от независимых, имеют свойство складываться) :(

Конечно независимые. В любом случае ошибка при прогнозе от 30 параметров меньше ошибки от прогноза с 5-ю параметрами.

--------
marketer marketiri lupus est ...

Комментарий понравился?

05.03.2008 23:13

Постов: 2114
Дата регистрации: 01.09.2005

для: Юрий Рязанов©
Дело даже не в демоне. Если просто понять, что при нестабильном медиапотреблении доверительный интервал AIR при вероятностях 95% на 5%, в самом идеальном случае (нет ни каких ошибок кроме случайных) - это удвоенное стандартное отклонение. То для AIR порядка 2% и N в привязке именно к одному номеру (не за весь период), то и так все становится понятным. См. всем известную таблицу в приложении.
Надо только представлять, что на практике достоверность еще хуже и какого порядка реально N и рейтинг.
В дополнение не безынтересно прочесть главу "Функции выборочного метода" (стр. 193 и далее) в монографии В. Э. Шлепентоха "Проблемы качества социологической информации: достоверность, репрезентативность, прогностический потенциал", Москва, "Центр социологического прогнозирования", 2006 год. Там как раз пример про чтение журнала.

СТАТИСТИЧЕСКИЕ ОТКЛОНЕНИЯ 2 сигма.doc

Комментарий понравился?

05.03.2008 23:15

< 1 2 3 4 5 6 7 8 >

В настоящий момент эту тему просматривают: участников - 0, гостей - 3.

Только зарегистрированные пользователи могут оставлять сообщения в этом форуме

Форумы на Sostav.ru / Маркетинговые исследования / Тема про ОШИБКИ измерения и НЕ МОНОТОННОСТИ признака

© "ООО Состав.ру" 1998-2026

тел/факс: +7 495 225 1331 адрес: 109004, Москва, Пестовский пер., д. 16, стр. 2

При использовании материалов портала ссылка на Sostav.ru обязательна!
Администрация Sostav.ru просит Вас сообщать о всех замеченных технических неполадках на E-mail