Слово и фраза: Искать: Сортировать по:
Форумы на Sostav.ru / Маркетинговые исследования / вопрос по расчету выборки
коррекция размера выборки при малой ГС
1 2 3 4 5 6 >

Profile
Flo©

Постов: 219
Дата регистрации: 01.03.2006
в двух разных источниках нашла две разные формулы, которые позволяют скорректировать выборку в меньшую сторону в случае, если ее объем превышает 5% от ГС.
Первая формула: Выборка_корр=выборка*КОРЕНЬ ((ГС-выборка)/(ГС-1))
Вторая формула: Выборка_корр=выборка/(1+(выборка-1)/ГС)

Так какая же из них верна? И вообще на чем основаны эти формулы корректировки?

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 12.03.2006 14:50
цитата
Profile
butaev©

Постов: 2114
Дата регистрации: 01.09.2005
Добрый вечер Flo.
http://forum.gfk.ru/texts/index.html#197 в презентации уважаемого Асхата - модератора форума ГФК с названием "Выборочный метод в маркетинговых исследованиях", в конце, есть пример вывода формулы необходимого объема выборки, исходя из предположении о нормальном распределении измеряемой характеристики, при разных методах ее (выборки) организации. Если Вы помните мат. статистику, то за 20 минут Вы сделаете такие же расчеты для биноминального распределения характеристики (распределения Парето). Вывод формул имеет одну и ту же логику.
Если исходить из предположения, что вклад случайной (статистической) ошибки в получаемые данные основной, то других формул быть не может.
Если нет, то дело сильно усложняется.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 12.03.2006 23:49
цитата
Profile
Flo©

Постов: 219
Дата регистрации: 01.03.2006
спасибо, посмотрела, разобраться более или менее смогу..но у меня постоянно неразрешимый вопрос- на основании чего я могу сказать еще до исследования, что признак имеет нормальное распределение?

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 08:16
цитата
Profile
Flo©

Постов: 219
Дата регистрации: 01.03.2006
вобщем, что-то у меня уже вообще сомнения, правильно ли я делаю. Суть в следующем. Опрос клиентов на предмет их лояльности. Все клиенты делятся условно на три группы с помощью вопросов фильтров в начале анкеты. 1 группа, 2 группа и 3 группа. В зависимости от принадлежности к группе, выбирается нужные блок вопросов из анкеты. То есть грубо говоря получается три разных анкеты. Тогда получается, мне надо рассчитывать три различные выборки? Тогда какой признак мне брать в основу расчета этого объема? Хочу заметить, что все вопросы анкеты носят характер оценки по 10 балльной шкале. Причем проблема такая- по нашей базе я могу точно определить принадлежность к 3 группе- то есть могу рассчитать ГС этих клиентов, а вот различие между 1 и 2 группой определить заранее не могу!

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 09:28
цитата
Profile
F3©

Модератор
Постов: 4827
Дата регистрации: 25.08.2004
для: Flo©
А по какому признаку Вы их сегментировали?

А размер каждой из групп хотя бы ориентирочно известен? Речь о порядке 10, 100, 500, 1000, 10000, 100000?
--------
Следует отличать неразвитые мысли от тщательно развитых не-мыслей.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 10:32
цитата
Profile
Flo©

Постов: 219
Дата регистрации: 01.03.2006
основной признак деления- была ли в течение года страховая выплата. Я в страховой компании работаю. То есть все клиента прошедшего года делятся на тех, у кого выплата была и тех, у кого не была. Это легко определить по базе, поэтому я сделала две ГС. Далее. Есть еще один признак деления- это тип продажи для каждого клиента. Есть продажи активные и пассивные. НО я не могу по базе заранее определить, кто относитяс к активным а кто к пассивным! То есть это можно выяснить только в ходе опроса.
И я тогда делаю следующим образом. Есть две ГС. Одна с выплатами, а другая без. Внутри каждой из этих групп они все еще делятся как активные-пассиные. И я определяю два объема для двух выборок на основании как раз признака "тип продажи". То есть использую формулы расчета выборки с использованием доли признака, где доля- это доля например активных продаж. Меня что смущает- этот признак же не случайный как бы...то есть просто я не имею возможности его изучить до опроса...а в формулах я так понимаю этот признак подразумевается случайным. С другой стороны ведь случайно то, что человек попал под активные продажи, а не под пассивные. Или не случайно? ыыы...путаюсь :(

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 10:38
цитата
Profile
Flo©

Постов: 219
Дата регистрации: 01.03.2006
ГС тех кто без выплаты около 1400, тех кто с выплатами примерно 380

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 10:39
цитата
Profile
F3©

Модератор
Постов: 4827
Дата регистрации: 25.08.2004
для: Flo©
И так групп у вас 4, а не 3.
Я так понимаю, общая картина по клиентам в целом не требуется.

Если стоит задача выяснить % активных и пассивных продаж в группах выплаты/не выплаты. То, соответственно, Вы предполагаете, что у вас максимальный разброс признака. То есть 50/50. И, исходя из этого, рассчитываете размер выборки в группе выплат и группе не выплат.

Ели же задача изучить отдельно каждую из 4-х возможных групп, то признак у Вас оценка. Но куда Вам дробить, когда у Вас и так ГС – смешная?
Вам в пору сплошное исследование проводить. Тем более с 10-ти бальной шкалой.

P.S. Предлагаю Вам принять волевое решение. Опросить по 50 представителей каждой из групп. Обычно этого бывает достаточно. Если позволяет доступность респондентов и ресурсы, можно и по 100. Но вот я сильно сомневаюсь, что в группах с выплатами Вам удастся набрать нужное число респондентов.
--------
Следует отличать неразвитые мысли от тщательно развитых не-мыслей.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 11:29
цитата
Profile
Flo©

Постов: 219
Дата регистрации: 01.03.2006
да дело в том, что в зависимости от принадлежности к каждой из этих групп задаются разные вопросы! то есть они конечно похожи, но не идентичны все таки. Ну вы мне скажите- я правильно сделаю, если посчитаю выборку на основании признака активные-пассивные? я имею в виду, что в формуле расчета присутствует доля признака p, и мне же нужно решить, какой признак я буду брать в основу. Поэтому я беру изначально, что активных и пассивных 50 на 50, и считаю две выборки- для невыплатников и выплатников. А после опроса будет уже получено выборочное соотношение активных-пассивных и я скорректирую ошибку выборки. Так?

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 12:42
цитата
Profile
Flo©

Постов: 219
Дата регистрации: 01.03.2006
признаюсь честно, я это уже сделала- рассчитала выборку именно таким образом. И опрос уже почти завершен. Просто я литературу почитала и у меня возникли сомнения, права ли я. Исходя из наших возможностей было дано задание опросить 100 выплатников и 200 невыплатников. Цифра округлена конечно.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 12:44
цитата
Profile
Flo©

Постов: 219
Дата регистрации: 01.03.2006

Цитата, автор F3:

для: Flo©
Ели же задача изучить отдельно каждую из 4-х возможных групп, то признак у Вас оценка. Но куда Вам дробить, когда у Вас и так ГС – смешная?
Вам в пору сплошное исследование проводить. Тем более с 10-ти бальной шкалой.

P.S. Предлагаю Вам принять волевое решение. Опросить по 50 представителей каждой из групп. Обычно этого бывает достаточно. Если позволяет доступность респондентов и ресурсы, можно и по 100. Но вот я сильно сомневаюсь, что в группах с выплатами Вам удастся набрать нужное число респондентов.




задача вообще изучить основные критерии, по которым клиенты формируют свою лояльность к нам. Просто изначально есть гипотеза, что эти критерии различны для выплатников и для активных-пассивных продаж.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 12:47
цитата
Profile
F3©

Модератор
Постов: 4827
Дата регистрации: 25.08.2004
для: Flo©
Любопытно.
А что такое "изучить основные критерии, по которым клиенты формируют свою лояльность к нам"?

Но, в любом случае, логичнее использовать общий инструмент. Попросите оценить все критерии, а после проверьте значимость оценок различных факторов для разных групп.
Если их много, то проще пожертвовать разрядностью и перейти с 10 на 5 бальную шкалу.

Но это мы уже уходим от вопросов конструирования выборки.
Может Вам уже к специалистам обратиться?
--------
Следует отличать неразвитые мысли от тщательно развитых не-мыслей.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 17:16
цитата
Profile
Flo©

Постов: 219
Дата регистрации: 01.03.2006
ну у меня задача построения модели лояльности, я помимо работы еще диплом пишу..это история очень длинная...
ладно, я тогда оставлю этот способ расчета на основании признака активные-пассивные продажи.
а я думала вы тут специалисты ;) :)
единственное, что не могу понять, почитав литературу по расчету выборок- все формулы основаны на нормальном распределении, но в основе определения объема выборки лежит признак дихотомического характера- то есть да/нет. Разве можно использовать пастулаты нормального распределения в данном случае?

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 17:34
цитата
Profile
Arsenij©
Просто маркетолог
Постов: 5216
Дата регистрации: 17.11.2003
для: Flo© У меня всегда есть добрый совет - когда дискуссия уходит в вопросы теории выборок - надо обращаться на forum.gfk.ru :) Здесь мало теоретиков и гораздо больше практиков.

По делу: для проверки такого рода гипотезы однозначно надо задавать ОДИНАКОВЫЕ блоки вопросов всем респондентам, в противном случае вы не сможете получить различия по признакам лояльности. Естественно, исключая свойственные только одной группе вопросы. И анализ делать только на совпадающих блоках. Тогда вы сможете проанализировать общую ГС ваших клиентов, а не по отдельному сегменту.
По выборке соглашусь с F3 полностью - нечего воду мутить на 2000 потребителей ГС :) - по 50 и хватит :) Тем более, что ошибка в любом случае (кроме сплошного опроса) будет порядка 4-5%... На малых ГС ошибка очень резко возрастает. На том же gfk.ru была формула расчета для таких случаев.
--------
Мое хобби и не более того - Суздаль.
Магазин подарков Леарта - швейцарские ножи Wenger, ручки Parker и Waterman, и еще много всего.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 18:04
цитата
Profile
Flo©

Постов: 219
Дата регистрации: 01.03.2006
так мне надо выявить различие в лояльности тех клиентов, которые выплату получали и тех, кто не получал...
я бы может и не мутила с выборкой, но мне это еще в диплом писать- как бы не придрались.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 18:09
цитата
Profile
Arsenij©
Просто маркетолог
Постов: 5216
Дата регистрации: 17.11.2003
для: Flo© В таком случае блоки, по которым проводятся дифференциации, должны быть одинаковыми!!!

А насчет выборки - я тут задумался. Ведь признак "активный/пассивный" - это одна из характеристик ГС, а не главный признак выборки. То есть ГС надо рассматривать в любом случае только по одному признаку - либо "выплата/невыплата" либо "активный/пассивный". И на основании этого строить все гипотезы. Если изначально ГС на признаке "выплата/невыплата", то и анализ по нему, а там уж сколько получится активных, а сколько пассивных, это будет результаттом исследования. Или наоборот. Это исследование рассматривать как установочное, а потом уже проводить второе (либо квотировать результаты этого) и делать анализ по признаку "пассивный/активный" (соответственно, "выплата/невыплата" - результаты анализа).

Я понятно высказался? :)
--------
Мое хобби и не более того - Суздаль.
Магазин подарков Леарта - швейцарские ножи Wenger, ручки Parker и Waterman, и еще много всего.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 18:22
цитата
Profile
Flo©

Постов: 219
Дата регистрации: 01.03.2006
нууу...понятно, только это в данный момент реализовать невозможно в силу сроков))) а можно ли прямо уж утверждать, что это не главный признак выборки? ведь заранее неизвестно, что определяет ту же лояльность- а вдруг она существенно зависит от типа продажи?

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 18:44
цитата
Profile
Arsenij©
Просто маркетолог
Постов: 5216
Дата регистрации: 17.11.2003
для: Flo© А это Вы как раз в процессе исследования и установите :) Если лояльный сегмент характеризуется как раз этим признаком, то это будет явно выражено. Различите понятия - гипотеза и признак выборки! В вашем случае это может звучать так:
"Лояльность клиентов зависит от способа продаж". Тогда выборка должна быть репрезентативной по способу продаж. И наплевать на критерий выплаты. Или "Лояльность клиента зависит от наличия выплат" - и тогда выборка должна быть репрезентативной по этому признаку. Сейчас у вас вторая гипотеза, потому что по первой Вы все равно выборку построить не можете.
Итог - делайте как делали, потом квотируйте выборку по способам продаж и делайте второй анализ уже по этому признаку. И все будет хорошо! (Даже с доверительным интервалом в 7% :)
--------
Мое хобби и не более того - Суздаль.
Магазин подарков Леарта - швейцарские ножи Wenger, ручки Parker и Waterman, и еще много всего.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 19:07
цитата
Profile
Flo©

Постов: 219
Дата регистрации: 01.03.2006
а что 7% это очень плохо да?)))

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 19:31
цитата
Profile
Flo©

Постов: 219
Дата регистрации: 01.03.2006
а почему нельяз считать на основании типа продаж? формула предполагает, что изначально можно брать самый "худший" вариант вариации- 50 на 50. Я же даже могу прикинуть немного соотношение активных и пассивных. А потом уже после опроса скорректирую полученную ошибку.

Да 0 Нет 0
Пользователь в OffLine Послать приватное сообщение Добавить пользователя в список друзей 13.03.2006 19:40
цитата
1 2 3 4 5 6 >
В настоящий момент эту тему просматривают: участников - 0, гостей - 20.
Только зарегистрированные пользователи могут оставлять сообщения в этом форуме


Форумы на Sostav.ru / Маркетинговые исследования / вопрос по расчету выборки
© "ООО Состав.ру" 1998-2024

тел/факс: +7 495 225 1331 адрес: 109004, Москва, Пестовский пер., д. 16, стр. 2

При использовании материалов портала ссылка на Sostav.ru обязательна!
Администрация Sostav.ru просит Вас сообщать о всех замеченных технических неполадках на E-mail
Rambler's Top100   18+   Словарь маркетинговых терминов