Слово и фраза: Искать: Сортировать по:
Форумы на Sostav.ru / Маркетинговые исследования / Тема про ОШИБКИ измерения и НЕ МОНОТОННОСТИ признака
Мысли вслух...Возможно есть и ошибки...
< 1 2 3 4 5 6 7 8 >

Profile
Равшан©

Постов: 3376
Дата регистрации: 26.04.2005
для: Михаил Дымшиц©
И сколько получилось? :)

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 21.02.2008 11:15
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор butaev:

для: Юрий Рязанов©
Доброе утро.
Я пока не понял вот этой фразы в твоем посте: "Я же возьму и перемешаю их. Кто мне это запретит?".
В моей постановке задачи я черные шары как бы приклеил к дну урны.


Эдуард, своим условием, ты запретил мне организовывать случайную выборку!!!

P.S. Даже по ТВ показывают людям как перемешиваются шары в лотереи.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 21.02.2008 12:57
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор IgorRudy:

для: Юрий Рязанов©
Юра, а если чесло чёрных шаров равно нулю?



Игорь поясни подробнее. Равно 0 где? В выборке(n) или в ГС (N)

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 21.02.2008 13:00
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор Михаил Дымшиц:


Цитата, автор Юрий Рязанов:

Дело в том, что в реальности мы имеем дело с целыми значениями!!!



Вот-вот... Я вообще бы ушел в отчетах от процентов, а указывал бы все в натуральных дробях, но выясилось, что понимание записи за пределами 1/2...1/5 вообще в обществе отсутствует.



Миша, можно и в процентах, только эти проценты должны быть вычислены по целочисленным значениям доверительного интервала +-t(ab/n)^0.5. И тогда придется каждый раз заново вычислять интеграл Лапласа чтобы указать доверительную вероятность. А это не шуточное дело не смотря на обилие таблиц интеграла... Так что пусть все остается по старому....

P.S. Еше в самом начале когда я игрался с производными от целочисленного бинома, я отметил что математики этого не любят по определению производной. И в общем случае дробные величины na - суть наиболее вероятное число ответов ДА, надо всегда трактовать как целое число ближайшее к na. Ну и понятно что для малых признаков из-за оцеления дов. интервала возникает гиганская неопределенность дов. вероятности(неопределеность в смысле отличия от принятой индустрией 95% и только это).

И последнее:
любой график ошибки (колокол) нарисованный сплошной линией не корректен. Правильно, когда он изображен "частоколом" -отдельными точками по целым значениям оси Х.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 21.02.2008 13:21
цитата
Profile
Винопивец©

Постов: 2457
Дата регистрации: 02.07.2004
для: Юрий Рязанов© Насчет имен-то я шутил, а насчет того, что Пуассон принципиально отличается от Бернулли и никоим образом не является его частным случаем - не шутил.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей Сайт пользователя 21.02.2008 23:53
цитата
Profile
Винопивец©

Постов: 2457
Дата регистрации: 02.07.2004

Цитата, автор Юрий Рязанов:
Дело в том, что в реальности мы имеем дело с целыми значениями!!!
.....
Правильно, когда он изображен "частоколом" -отдельными точками по целым значениям оси Х.[/b]

Если идти в этих рассуждениях до конца, то все, что мы видим в экономических и социологических наблюдениях - вообше не функции, а точки. Мы знаем, какие они в момент измерения (в твоем случае - целые по оси абсцисс), а в между измерениями Вообще Ничего Нет. Поэтому все дифференцирования и интегрирования - это приближения неизвестной точности. Какова цена товара между сделками? - Правильно, никакая.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей Сайт пользователя 21.02.2008 23:59
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор Винопивец:

для: Юрий Рязанов© Насчет имен-то я шутил, а насчет того, что Пуассон принципиально отличается от Бернулли и никоим образом не является его частным случаем - не шутил.


Подозреваю, что замена "частный" на "предельный" тебя тоже не удовлетворит... Давай Олег колись чего ты там замыслил?

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 22.02.2008 00:55
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор Винопивец:
Если идти в этих рассуждениях до конца, то все, что мы видим в экономических и социологических наблюдениях - вообше не функции, а точки. Мы знаем, какие они в момент измерения (в твоем случае - целые по оси абсцисс), а в между измерениями Вообще Ничего Нет. Поэтому все дифференцирования и интегрирования - это приближения неизвестной точности. Какова цена товара между сделками? - Правильно, никакая.


При большом числе измерений (n) расcтояния между возможными соседними значениями случайной величины становятся малыми по сравнению с интервалом всех значений. И в этом смысле случайную величину можно рассматривать как непрерывную. Дифференцирование –в конечных разностях, а интегрирование- простое суммирование.
На твою парадигму "Какова цена товара между сделками? - Правильно, никакая" - отвечаю. Если совершается очень много сделок то при удачной(оптимально выбранной) дискретизации процесса - цена товара между сделками будет равна среднему в доверительном интервале.

Олег я рассматриваю случай не подпадающий под твои парадигмы. Твоими словами: ключевое - точно известна функция распределения вероятностей. Ни прибавить ни убавить... ;)

P.S. Олег, ты всегда держишь в напряжении. Не даешь расслабится. :( Пиши… Твои посты - как танки (япон. стих) .

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 22.02.2008 01:34
цитата
Profile
IR©
Маркетолог - международник
Постов: 5658
Дата регистрации: 27.01.2007

Цитата, автор Юрий Рязанов:


Цитата, автор IgorRudy:

для: Юрий Рязанов©
Юра, а если чесло чёрных шаров равно нулю?



Игорь поясни подробнее. Равно 0 где? В выборке(n) или в ГС (N)


Юра, в твоих обозначениях, число m=0.
--------
marketer marketiri lupus est ...

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 22.02.2008 03:50
цитата
Profile
Михаил Дымшиц©

Постов: 2758
Дата регистрации: 31.08.2005

Цитата, автор Юрий Рязанов:


Цитата, автор Винопивец:
Если идти в этих рассуждениях до конца, то все, что мы видим в экономических и социологических наблюдениях - вообше не функции, а точки. Мы знаем, какие они в момент измерения (в твоем случае - целые по оси абсцисс), а в между измерениями Вообще Ничего Нет. Поэтому все дифференцирования и интегрирования - это приближения неизвестной точности. Какова цена товара между сделками? - Правильно, никакая.



При большом числе измерений (n) расcтояния между возможными соседними значениями случайной величины становятся малыми по сравнению с интервалом всех значений. И в этом смысле случайную величину можно рассматривать как непрерывную.



Оба правы, но в воспитательных целях правильнее отображать точками, а линии апроксимации делать бледными-бледными... Чтобы не забывали, что "среднее" получается из облака значений

Стандартно понимаемый "маркетинговый подход", основанный на анализе и получении статистических данных, на практике приводит к игнорированию проведения конкретной сделки, так как ориентируясь на средние значения нескольких параметров забывают, что параметры конкретной сделки чаще всего не соответствуют ни одному такому "среднему" параметру. На бакалейном рынке это применимо, а при переносе в сферу услуг и b2b получается полная гадость.

Всякие ментальные засады, формируемые визуализацией разных важных вещей при обучении, потом очень жестко сказываются на эффективности деятельности. Например, мне совсем непонятно, как эффективно демонстрировать длительность времени, практически у всех, выходящих из системы образования, например, этап "бурного роста" воспринимается как происходящий пракически в один бизнес-год из нулевой точки, хотя в жизни ни то, ни другое не встречается.
--------
http://www.dnp.ru

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей Сайт пользователя 22.02.2008 08:35
цитата
Profile
Винопивец©

Постов: 2457
Дата регистрации: 02.07.2004
для: Михаил Дымшиц© Так я о чем и говорю. Если очень большая плотность точек (как об этом говорит Юра и твой пример с бакалеей vs. b2b) - в аппроксимациях какая-то толика физического смысла сохраняется. Если же точек мало или они разрежены выборочностью данных без четкого понимания, что наблюдалось в генеральной совокупности - вовсе труба.
для: Юрий Рязанов© Юра, Пуассон - непрерывное распределение, полученное предельным переходом из дискретного. При этом часть свойств осталась похожими, а некоторые стали совсем непохожими. Настолько, что либимое физиками "положим бесконечно малое эпсилон равным двум" не катит.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей Сайт пользователя 22.02.2008 12:33
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005
для: IgorRudy©

Цитата, автор Юрий Рязанов:

В условиях, когда выборка ограничена (это всегда так) распределение ответов респондентов у нас подчиняется биномиальному распределению:

W= n!/[m!k!]*a^m*b^k (1)

n – общее число респондентов (объем выборки)
m – число ответов ДА (находятся в интервале признака)
k=n-m – число ответов НЕТ (вне измеряемого интервала признака)



Вероятность не обнаружить признак есть условие m=0 и соответственно из бинома см. выражение (1) получаем:

W(0) = b^n или W(0) = (1-a)^n

Для n=100 и a=1% вероятность не обнаружить признак W(0)=36.6% и т.д. считается для любых [n,a]

Игорь, ты от меня ждал другой ответ?

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 22.02.2008 14:03
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005
Эдуард, ты меня спрашивал, как соотносятся данные ТФ-опроса с данными интернет счетчика? См. графики.

Этот пример показывает нам, что малые рейтинги ~1% при достаточно большой выборке (в данном примере каждая точка на ТФ-графике ~1000 интервью) могут быть достаточно информативны.
attachment
ТФ опрос и инет счетчик 1.gif

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 26.02.2008 18:05
цитата
Profile
butaev©

Постов: 2114
Дата регистрации: 01.09.2005
для: Юрий Рязанов©
Добрый вечер.
Спасибо.
Вполене прилично. А не можешь дать свою версию. Почему в средем значения, приведенные на "зеленом графике" в два раза превосходят значения за те же периоды "на синем графике"?

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 26.02.2008 21:01
цитата
Profile
Михаил Дымшиц©

Постов: 2758
Дата регистрации: 31.08.2005
для: Гость Инерционность памяти на редкие, но эмоционально яркие события. При увеличении выборки различие будет падать, так как будет накапливаться менее эмоционально вовлеченная аудитория.
Вообще при опросах активная аудитория носителей завышает свою активность, а редко бывающие - скрывают. Из-за этого при исследовании жураналов "по обложкам" аудитория номера ниже (люди уверенны, что читали все номера, но это не так), а накопленная за период - больше, чем по ответам "сколько номеров вы прочитали за... "
--------
http://www.dnp.ru

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей Сайт пользователя 26.02.2008 21:05
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005
для: butaev© Я согласен с версией Миши.

Со своей стороны могу лишь отметить следующее:

1. Счетчик считает cookies - соответственно не различает одних и тех же посетителей заходящих "Из дома" и "С работы", однако в отношении Ека-мамы это не очень существенный фактор, поскольку основная аудитория это "Домохозяйки". И в этом смысле сравнение можно считать более менее "чистым". В общем случае различие может быть существенным только в обратную сторону (по счетчику будет больше чем по опросу)
2. Не совершенная БД по гео-таркетингу. Очень часто московские провайдеры в своих филиалах в регионах пользуются IP адресами московской прописки. Т.о. какая-то часть посетителей из Екб. заходит на сайт под московской пропиской. Я не думаю что для Екб. этот факт существенен, ну максимум на 20% Екб. недельный охват по счетчику может быть занижен. И тем не менее этот момент в общем случае надо держать в уме.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 26.02.2008 21:42
цитата
Profile
butaev©

Постов: 2114
Дата регистрации: 01.09.2005
для: Юрий Рязанов©
Добрый день.
1. Предлагаю: "Давай на некоторый срок мы с тобой оставим обсуждение разницы наши видений в текущей задаче о случайных ошибках простой случайной выборки в ГС, где изучаемый признак распределен очень неравномерно". Я ее (эту тему) про себя назвал "задача о перемешивании".
Ты перемешиваешь за счет случайной выборки. Я предлагаю послойное исследование и уже в слое использовать случайный выбор точек.
Сравнение возможных ошибок среднего значения доли, получаемого в результате разового исследования при использовании той или иной стратегии, требует продуманных расчетов, а на них у меня пока просто не хватает времени (загрузка...)". Может они покажут, что ты прав или нет разницы. Но пока не проведу, поддерживать разговор об этом бесполезно.

Жизнь она проще.

2. Давай вернемся к старой задаче, из которой эта дискуссия образовалась: об ошибках определения AIR издания порядка 2% и необходимом объеме выборки.
Пусть суммарная ошибка будет в 1,5 раза больше случайной. "Завяжем" их этой простой формулой. Пусть период, по которому мы выдаем средние значение рейтинга - AIR будет пол года.
Далее, если принять видение Михаила Дымшица, каждый из N (6. 12,. 24,. 72) номеров вышедших за пол года "отдельная песня", то задача сведется к определению ошибки доли одного номера (она для практических задач должна лежать плюс минус 0,5%; от 1,5% до 2,5%).
Если же считать, что показателями аудитории одного издания изменяются гладко во времени и их значения могут гулять только в каком-то коридоре (анти Дымшиц), то получится другое решение.
Вот об этом и хотелось обменяться мнениями.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 27.02.2008 15:26
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор butaev:
для: Юрий Рязанов©
Добрый день.
1. Предлагаю: "Давай на некоторый срок мы с тобой оставим обсуждение ….

Жаль….

2. Давай вернемся к старой задаче, из которой эта дискуссия образовалась: об ошибках определения AIR издания порядка 2% и необходимом объеме выборки. Пусть период, по которому мы выдаем средние значение рейтинга - AIR будет пол года.
……...
Далее, если принять видение Михаила Дымшица, каждый из N (6. 12,. 24,. 72) номеров вышедших за пол года "отдельная песня",……
Если же считать, что показателями аудитории одного издания изменяются гладко .. получится другое решение.
Вот об этом и хотелось обменяться мнениями.


В условиях эргодичности: «среднее по времени равно среднему по ансамблю» - ошибка среднего по N номерам, будет равна ошибке 1 номера.
Нет никаких сомнений что это условие не выполняется. Соответственно при расчете ошибки надо дискретизировать 6-ти месячный цикл кратно периоду изданий и ошибка в расчете на 1 номер вырастет на корень из N.
В практической плоскости это сделать не возможно. К примеру ежедневные издания вовсе не возможно будет измерить и т.д. Единственным выходом остается всеж предположение о эргодичности. И чтобы к нему хоть как-то приблизится желательно проводить измерения в «характерные» периоды времени, в которых потребление квазистационарно (исключить период отпусков, праздники, форс-мажорные дни и т.д.). Собственно так и поступают все измерители.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 28.02.2008 00:02
цитата
Profile
butaev©

Постов: 2114
Дата регистрации: 01.09.2005
для: Юрий Рязанов©
Добрый день.
1. Ответ на "Жаль".
Да мне самому жаль. За жизнь я несколько раз хотел найти время и вывести все от и до. И никогда не хватало времени.
Когда "приоткрыли занавес" в начале 90-х и наши "социологи" стали продавать все ранее сделанное на Запад, я впервые узнал, что американцы для истории и науки не покупают документы опросов (а обычно для этих целей покупается все первичные анкеты и т. д.; и стоит это прилично), если есть подозрения, что выборка использовалась неслучайная или правильней не совсем случайная. Меня удивил такой огульный подход. И с тех пор никак не найду времени сделать строгое сравнение этих 2 стратегий.
2. Цитирую тебя: "Единственным выходом остается всеж предположение о эргодичности. И чтобы к нему хоть как-то приблизится желательно проводить измерения в «характерные» периоды времени, в которых потребление квазистационарно (исключить период отпусков, праздники, форс-мажорные дни и т.д.). Собственно так и поступают все измерители".
Я уже писал в своих постах год назад, что мне не понятно, не только как это можно выделить «характерные» периоды времени, но даже, как принять обоснованное решение: только что замеренный рейтинг последнего номера выброс, или правильное измерение, если мы получили значение значительно отличающееся от рейтинга других номеров. И чем с более малорейтинговым изданием/программой мы имеем дело, тем острей стоит этот вопрос.
И ладно бы я один был такой на нашем Форуме. Нет, этот вопрос о выбросах поднимал не только я.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 28.02.2008 12:24
цитата
Profile
Юрий Рязанов©

Постов: 2128
Дата регистрации: 07.04.2005

Цитата, автор butaev:

для: Юрий Рязанов©
И с тех пор никак не найду времени сделать строгое сравнение этих 2 стратегий….


О каких 2-х стратегиях ты говоришь, я так и не понял! Ну вообще ничего.


…. как принять обоснованное решение: только что замеренный рейтинг последнего номера выброс, или правильное измерение, если мы получили значение значительно отличающееся от рейтинга других номеров. И чем с более малорейтинговым изданием/программой мы имеем дело, тем острей стоит этот вопрос.
И ладно бы я один был такой на нашем Форуме. Нет, этот вопрос о выбросах поднимал не только я.


И этого я понять никак не могу!

1. Не возможно на существующих выборках для низкорейтинговых изданий измерить рейтинг последнего номера. Всегда приводятся данные за период! Выброс это или нет, смотри данные за прошлые периоды (лучше трекинг). И все.
2. Почему ты пишешь про остроту вопроса? Что за острота, когда рейтинги малые!!! Какая разница от того что ты Охватишь 1% или 3% свою ЦА одним объявлением?
В практическом плане результат будет все равно нулевым! Да, можно убиться и измерить неравномерность медиапотребления более достоверно, однако это никак не изменит нулевой результат от единичного размещения.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 28.02.2008 20:36
цитата
< 1 2 3 4 5 6 7 8 >
В настоящий момент эту тему просматривают: участников - 0, гостей - 9.
Только зарегистрированные пользователи могут оставлять сообщения в этом форуме


Форумы на Sostav.ru / Маркетинговые исследования / Тема про ОШИБКИ измерения и НЕ МОНОТОННОСТИ признака
© "ООО Состав.ру" 1998-2024

тел/факс: +7 495 225 1331 адрес: 109004, Москва, Пестовский пер., д. 16, стр. 2

При использовании материалов портала ссылка на Sostav.ru обязательна!
Администрация Sostav.ru просит Вас сообщать о всех замеченных технических неполадках на E-mail
Rambler's Top100   18+   Словарь маркетинговых терминов