|
|
|
|
|
|
коррекция размера выборки при малой ГС |
|
Постов: 219 Дата регистрации: 01.03.2006 |
в двух разных источниках нашла две разные формулы, которые позволяют скорректировать выборку в меньшую сторону в случае, если ее объем превышает 5% от ГС.
Первая формула: Выборка_корр=выборка*КОРЕНЬ ((ГС-выборка)/(ГС-1))
Вторая формула: Выборка_корр=выборка/(1+(выборка-1)/ГС)
Так какая же из них верна? И вообще на чем основаны эти формулы корректировки? |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
12.03.2006 14:50 | |
|
|
|
Постов: 2114 Дата регистрации: 01.09.2005 |
Добрый вечер Flo.
http://forum.gfk.ru/texts/index.html#197 в презентации уважаемого Асхата - модератора форума ГФК с названием "Выборочный метод в маркетинговых исследованиях", в конце, есть пример вывода формулы необходимого объема выборки, исходя из предположении о нормальном распределении измеряемой характеристики, при разных методах ее (выборки) организации. Если Вы помните мат. статистику, то за 20 минут Вы сделаете такие же расчеты для биноминального распределения характеристики (распределения Парето). Вывод формул имеет одну и ту же логику.
Если исходить из предположения, что вклад случайной (статистической) ошибки в получаемые данные основной, то других формул быть не может.
Если нет, то дело сильно усложняется. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
12.03.2006 23:49 | |
|
|
|
Постов: 219 Дата регистрации: 01.03.2006 |
спасибо, посмотрела, разобраться более или менее смогу..но у меня постоянно неразрешимый вопрос- на основании чего я могу сказать еще до исследования, что признак имеет нормальное распределение? |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 08:16 | |
|
|
|
Постов: 219 Дата регистрации: 01.03.2006 |
вобщем, что-то у меня уже вообще сомнения, правильно ли я делаю. Суть в следующем. Опрос клиентов на предмет их лояльности. Все клиенты делятся условно на три группы с помощью вопросов фильтров в начале анкеты. 1 группа, 2 группа и 3 группа. В зависимости от принадлежности к группе, выбирается нужные блок вопросов из анкеты. То есть грубо говоря получается три разных анкеты. Тогда получается, мне надо рассчитывать три различные выборки? Тогда какой признак мне брать в основу расчета этого объема? Хочу заметить, что все вопросы анкеты носят характер оценки по 10 балльной шкале. Причем проблема такая- по нашей базе я могу точно определить принадлежность к 3 группе- то есть могу рассчитать ГС этих клиентов, а вот различие между 1 и 2 группой определить заранее не могу! |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 09:28 | |
|
|
|
Постов: 4827 Дата регистрации: 25.08.2004 |
для: Flo©
А по какому признаку Вы их сегментировали?
А размер каждой из групп хотя бы ориентирочно известен? Речь о порядке 10, 100, 500, 1000, 10000, 100000? |
|
-------- Следует отличать неразвитые мысли от тщательно развитых не-мыслей. |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 10:32 | |
|
|
|
Постов: 219 Дата регистрации: 01.03.2006 |
основной признак деления- была ли в течение года страховая выплата. Я в страховой компании работаю. То есть все клиента прошедшего года делятся на тех, у кого выплата была и тех, у кого не была. Это легко определить по базе, поэтому я сделала две ГС. Далее. Есть еще один признак деления- это тип продажи для каждого клиента. Есть продажи активные и пассивные. НО я не могу по базе заранее определить, кто относитяс к активным а кто к пассивным! То есть это можно выяснить только в ходе опроса.
И я тогда делаю следующим образом. Есть две ГС. Одна с выплатами, а другая без. Внутри каждой из этих групп они все еще делятся как активные-пассиные. И я определяю два объема для двух выборок на основании как раз признака "тип продажи". То есть использую формулы расчета выборки с использованием доли признака, где доля- это доля например активных продаж. Меня что смущает- этот признак же не случайный как бы...то есть просто я не имею возможности его изучить до опроса...а в формулах я так понимаю этот признак подразумевается случайным. С другой стороны ведь случайно то, что человек попал под активные продажи, а не под пассивные. Или не случайно? ыыы...путаюсь :( |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 10:38 | |
|
|
|
Постов: 219 Дата регистрации: 01.03.2006 |
ГС тех кто без выплаты около 1400, тех кто с выплатами примерно 380 |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 10:39 | |
|
|
|
Постов: 4827 Дата регистрации: 25.08.2004 |
для: Flo©
И так групп у вас 4, а не 3.
Я так понимаю, общая картина по клиентам в целом не требуется.
Если стоит задача выяснить % активных и пассивных продаж в группах выплаты/не выплаты. То, соответственно, Вы предполагаете, что у вас максимальный разброс признака. То есть 50/50. И, исходя из этого, рассчитываете размер выборки в группе выплат и группе не выплат.
Ели же задача изучить отдельно каждую из 4-х возможных групп, то признак у Вас оценка. Но куда Вам дробить, когда у Вас и так ГС – смешная?
Вам в пору сплошное исследование проводить. Тем более с 10-ти бальной шкалой.
P.S. Предлагаю Вам принять волевое решение. Опросить по 50 представителей каждой из групп. Обычно этого бывает достаточно. Если позволяет доступность респондентов и ресурсы, можно и по 100. Но вот я сильно сомневаюсь, что в группах с выплатами Вам удастся набрать нужное число респондентов.
|
|
-------- Следует отличать неразвитые мысли от тщательно развитых не-мыслей. |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 11:29 | |
|
|
|
Постов: 219 Дата регистрации: 01.03.2006 |
да дело в том, что в зависимости от принадлежности к каждой из этих групп задаются разные вопросы! то есть они конечно похожи, но не идентичны все таки. Ну вы мне скажите- я правильно сделаю, если посчитаю выборку на основании признака активные-пассивные? я имею в виду, что в формуле расчета присутствует доля признака p, и мне же нужно решить, какой признак я буду брать в основу. Поэтому я беру изначально, что активных и пассивных 50 на 50, и считаю две выборки- для невыплатников и выплатников. А после опроса будет уже получено выборочное соотношение активных-пассивных и я скорректирую ошибку выборки. Так? |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 12:42 | |
|
|
|
Постов: 219 Дата регистрации: 01.03.2006 |
признаюсь честно, я это уже сделала- рассчитала выборку именно таким образом. И опрос уже почти завершен. Просто я литературу почитала и у меня возникли сомнения, права ли я. Исходя из наших возможностей было дано задание опросить 100 выплатников и 200 невыплатников. Цифра округлена конечно. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 12:44 | |
|
|
|
Постов: 219 Дата регистрации: 01.03.2006 |
Цитата, автор F3:
для: Flo©
Ели же задача изучить отдельно каждую из 4-х возможных групп, то признак у Вас оценка. Но куда Вам дробить, когда у Вас и так ГС – смешная?
Вам в пору сплошное исследование проводить. Тем более с 10-ти бальной шкалой.
P.S. Предлагаю Вам принять волевое решение. Опросить по 50 представителей каждой из групп. Обычно этого бывает достаточно. Если позволяет доступность респондентов и ресурсы, можно и по 100. Но вот я сильно сомневаюсь, что в группах с выплатами Вам удастся набрать нужное число респондентов.
|
задача вообще изучить основные критерии, по которым клиенты формируют свою лояльность к нам. Просто изначально есть гипотеза, что эти критерии различны для выплатников и для активных-пассивных продаж. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 12:47 | |
|
|
|
Постов: 4827 Дата регистрации: 25.08.2004 |
для: Flo©
Любопытно.
А что такое "изучить основные критерии, по которым клиенты формируют свою лояльность к нам"?
Но, в любом случае, логичнее использовать общий инструмент. Попросите оценить все критерии, а после проверьте значимость оценок различных факторов для разных групп.
Если их много, то проще пожертвовать разрядностью и перейти с 10 на 5 бальную шкалу.
Но это мы уже уходим от вопросов конструирования выборки.
Может Вам уже к специалистам обратиться?
|
|
-------- Следует отличать неразвитые мысли от тщательно развитых не-мыслей. |
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 17:16 | |
|
|
|
Постов: 219 Дата регистрации: 01.03.2006 |
ну у меня задача построения модели лояльности, я помимо работы еще диплом пишу..это история очень длинная...
ладно, я тогда оставлю этот способ расчета на основании признака активные-пассивные продажи.
а я думала вы тут специалисты ;) :)
единственное, что не могу понять, почитав литературу по расчету выборок- все формулы основаны на нормальном распределении, но в основе определения объема выборки лежит признак дихотомического характера- то есть да/нет. Разве можно использовать пастулаты нормального распределения в данном случае? |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 17:34 | |
|
|
|
Просто маркетолог Постов: 5216 Дата регистрации: 17.11.2003 |
для: Flo© У меня всегда есть добрый совет - когда дискуссия уходит в вопросы теории выборок - надо обращаться на forum.gfk.ru :) Здесь мало теоретиков и гораздо больше практиков.
По делу: для проверки такого рода гипотезы однозначно надо задавать ОДИНАКОВЫЕ блоки вопросов всем респондентам, в противном случае вы не сможете получить различия по признакам лояльности. Естественно, исключая свойственные только одной группе вопросы. И анализ делать только на совпадающих блоках. Тогда вы сможете проанализировать общую ГС ваших клиентов, а не по отдельному сегменту.
По выборке соглашусь с F3 полностью - нечего воду мутить на 2000 потребителей ГС :) - по 50 и хватит :) Тем более, что ошибка в любом случае (кроме сплошного опроса) будет порядка 4-5%... На малых ГС ошибка очень резко возрастает. На том же gfk.ru была формула расчета для таких случаев. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 18:04 | |
|
|
|
Постов: 219 Дата регистрации: 01.03.2006 |
так мне надо выявить различие в лояльности тех клиентов, которые выплату получали и тех, кто не получал...
я бы может и не мутила с выборкой, но мне это еще в диплом писать- как бы не придрались. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 18:09 | |
|
|
|
Просто маркетолог Постов: 5216 Дата регистрации: 17.11.2003 |
для: Flo© В таком случае блоки, по которым проводятся дифференциации, должны быть одинаковыми!!!
А насчет выборки - я тут задумался. Ведь признак "активный/пассивный" - это одна из характеристик ГС, а не главный признак выборки. То есть ГС надо рассматривать в любом случае только по одному признаку - либо "выплата/невыплата" либо "активный/пассивный". И на основании этого строить все гипотезы. Если изначально ГС на признаке "выплата/невыплата", то и анализ по нему, а там уж сколько получится активных, а сколько пассивных, это будет результаттом исследования. Или наоборот. Это исследование рассматривать как установочное, а потом уже проводить второе (либо квотировать результаты этого) и делать анализ по признаку "пассивный/активный" (соответственно, "выплата/невыплата" - результаты анализа).
Я понятно высказался? :) |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 18:22 | |
|
|
|
Постов: 219 Дата регистрации: 01.03.2006 |
нууу...понятно, только это в данный момент реализовать невозможно в силу сроков))) а можно ли прямо уж утверждать, что это не главный признак выборки? ведь заранее неизвестно, что определяет ту же лояльность- а вдруг она существенно зависит от типа продажи? |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 18:44 | |
|
|
|
Просто маркетолог Постов: 5216 Дата регистрации: 17.11.2003 |
для: Flo© А это Вы как раз в процессе исследования и установите :) Если лояльный сегмент характеризуется как раз этим признаком, то это будет явно выражено. Различите понятия - гипотеза и признак выборки! В вашем случае это может звучать так:
"Лояльность клиентов зависит от способа продаж". Тогда выборка должна быть репрезентативной по способу продаж. И наплевать на критерий выплаты. Или "Лояльность клиента зависит от наличия выплат" - и тогда выборка должна быть репрезентативной по этому признаку. Сейчас у вас вторая гипотеза, потому что по первой Вы все равно выборку построить не можете.
Итог - делайте как делали, потом квотируйте выборку по способам продаж и делайте второй анализ уже по этому признаку. И все будет хорошо! (Даже с доверительным интервалом в 7% :) |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 19:07 | |
|
|
|
Постов: 219 Дата регистрации: 01.03.2006 |
а что 7% это очень плохо да?))) |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 19:31 | |
|
|
|
Постов: 219 Дата регистрации: 01.03.2006 |
а почему нельяз считать на основании типа продаж? формула предполагает, что изначально можно брать самый "худший" вариант вариации- 50 на 50. Я же даже могу прикинуть немного соотношение активных и пассивных. А потом уже после опроса скорректирую полученную ошибку. |
|
|
0 |
|
0 |
Комментарий понравился? |
|
0 |
|
0 |
13.03.2006 19:40 | |
|
|
|
| Только зарегистрированные пользователи могут оставлять сообщения в этом форуме |
|
|
|
|
|
© "ООО Состав.ру" 1998-2024
тел/факс: +7 495 225 1331 адрес: 109004, Москва, Пестовский пер., д. 16, стр. 2
При использовании материалов портала ссылка на Sostav.ru обязательна! Администрация Sostav.ru просит Вас сообщать о всех замеченных технических неполадках на E-mail
|
|
|