Современные статистические методы анализа. Понятие об индексах. начальный уровень динамического ряда

статистика» биостатистикой» .

1. номинальную;
2. ординальную;
3. интервальную;

выборки

репрезентативной

выборочной рамки простой случайной выборкой интервальная выборка

стратифицированной выборки

кластерная и квотная выборки

нулевой гипотезы

альтернативной гипотезы мощности

доверительной вероятности».

Название: Основы статистического анализа данных
Детальное описание:

После завершения любого научного исследования, фундаментального или экспериментального, производится статистический анализ полученных данных. Чтобы статистический анализ был успешно проведен и позволил решить поставленные задачи, исследование должно быть грамотно спланировано. Следовательно, без понимания основ статистики невозможно планирование и обработка результатов научного эксперимента. Тем не менее, медицинское образование не дает не только знания статистики, но даже основ высшей математики. Поэтому очень часто можно столкнуться с мнением, что вопросами статобработки в биомедицинских исследованиях должен заниматься только специалист по статистике, а врачу-исследователю следует сосредоточиться на медицинских вопросах своей научной работы. Подобное разделение труда, подразумевающее помощь в анализе данных, вполне оправдано. Однако понимание принципов статистики необходимо хотя бы для того, чтобы избежать некорректной постановки задачи перед специалистом, общение с которым до начала исследования является в такой же степени важным, как и на этапе обработки данных.

Прежде чем говорить об основах статистического анализа, следует прояснить смысл термина «статистика» . Существует множество определений, но наиболее полным и лаконичным является, на наш взгляд, определение статистики как «науки о сборе, представлении и анализе данных». В свою очередь, использование статистики в приложении к живому миру называют «биометрией» или «биостатистикой» .

Следует заметить, что очень часто статистику сводят только к обработке экспериментальных данных, не обращая внимания на этап их получения. Однако статистические знания необходимы уже во время планирования эксперимента, чтобы полученные в ходе него показатели могли дать исследователю достоверную информацию. Поэтому, можно сказать, что статистический анализ результатов эксперимента начинается еще до начала исследования.

Уже на этапе разработки плана исследователь должен четко представлять себе, какого типа переменные будут в его работе. Все переменные можно разделить на два класса: качественные и количественные. То, какой диапазон может принимать переменная, зависит от шкалы измерений. Можно выделить четыре основных шкалы:

1. номинальную;
2. ординальную;
3. интервальную;
4. рациональную (шкалу отношений).

В номинальной шкале (шкале «названий») присутствуют лишь условные обозначения для описания некоторых классов объектов, например, «пол» или «профессия пациента». Номинальная шкала подразумевает, что переменная будет принимать значения, количественные взаимоотношения между которыми определить невозможно. Так, невозможно установить математические отношения между мужским и женским полом. Условные числовые обозначения (женщины - 0, мужчины - 1, либо наоборот) даются абсолютно произвольно и предназначены только для компьютерной обработки. Номинальная шкала является качественной в чистом виде, отдельные категории в этой шкале выражают частотами (количество или доля наблюдений, проценты).

Ординальная (порядковая) шкала предусматривает, что отдельные категории в ней могут выстраиваться по возрастанию или убыванию. В медицинской статистике классическим примером порядковой шкалы является градация степеней тяжести заболевания. В данном случае мы можем выстроить тяжесть по возрастанию, но все еще не имеем возможности задать количественные взаимоотношения, т. е. дистанция между значениями, измеренными в ординальной шкале, неизвестна или не имеет значения. Установить порядок следования значений переменной «степень тяжести» легко, но при этом невозможно определить, во сколько раз тяжелое состояние отличается от состояния средней тяжести.

Ординальная шкала относится к полуколичественным типам данных, и ее градации можно описывать как частотами (как в качественной шкале), так и мерами центральных значений, на чем мы остановимся ниже.

Интервальная и рациональная шкалы относятся к чисто количественным типам данных. В интервальной шкале мы уже можем определить, насколько одно значение переменной отличается от другого. Так, повышение температуры тела на 1 градус Цельсия всегда означает увеличение выделяемой теплоты на фиксированное количество единиц. Однако в интервальной шкале есть и положительные и отрицательные величины (нет абсолютного нуля). В связи с этим невозможно сказать, что 20 градусов Цельсия - это в два раза теплее, чем 10. Мы можем лишь констатировать, что 20 градусов настолько же теплее 10, как 30 - теплее 20.

Рациональная шкала (шкала отношений) имеет одну точку отсчета и только положительные значения. В медицине большинство рациональных шкал - это концентрации. Например, уровень глюкозы 10 ммоль/л - это в два раза большая концентрация по сравнению с 5 ммоль/л. Для температуры рациональной шкалой является шкала Кельвина, где есть абсолютный ноль (отсутствие тепла).

Следует добавить, что любая количественная переменная может быть непрерывной, как в случае измерения температуры тела (это непрерывная интервальная шкала), или же дискретной, если мы считаем количество клеток крови или потомство лабораторных животных (это дискретная рациональная шкала).

Указанные различия имеют решающее значение для выбора методов статистического анализа результатов эксперимента. Так, для номинальных данных применим критерий «хи-квадрат», а известный тест Стьюдента требует, чтобы переменная (интервальная либо рациональная) была непрерывной.

После того как будет решен вопрос о типе переменной, следует заняться формированием выборки . Выборка - это небольшая группа объектов определенного класса (в медицине - популяция). Для получения абсолютно точных данных нужно исследовать все объекты данного класса, однако, из практических (зачастую - финансовых) соображений изучают только часть популяции, которая и называется выборкой. В дальнейшем, статистический анализ позволяет исследователю распространить полученные закономерности на всю популяцию с определенной степенью точности. Фактически, вся биомедицинская статистика направлена на получение наиболее точных результатов из наименее возможного количества наблюдений, ведь при исследованиях на людях важен и этический момент. Мы не можем позволить себе подвергать риску большее количество пациентов, чем это необходимо.

Создание выборки регламентируется рядом обязательных требований, нарушение которых может привести к ошибочным выводам из результатов исследования. Во-первых, важен объем выборки. От объема выборки зависит точность оценки исследуемых параметров. Здесь следует обратить внимание на слово «точность». Чем больше размеры исследуемых групп, тем более точные (но не обязательно правильные) результаты получает ученый. Для того же, чтобы результаты выборочных исследований можно было переносить на всю популяцию в целом, выборка должна быть репрезентативной . Репрезентативность выборки предполагает, что в ней отражены все существенные свойства популяции. Другими словами, в исследуемых группах лица разного пола, возраста, профессий, социального статуса и пр. встречаются с той же частотой, что и во всей популяции.

Однако перед тем как начать выбор исследуемой группы, следует определиться с необходимостью изучения конкретной популяции. Примером популяции могут быть все пациенты с определенной нозологией или люди трудоспособного возраста и т. д. Так, результаты, полученные для популяции молодых людей призывного возраста, вряд ли удастся экстраполировать на женщин в постменопаузе. Набор характеристик, которые будет иметь изучаемая группа, определяет «обобщаемость» данных исследования.

Формировать выборки можно различными путями. Самый простой из них - выбор с помощью генератора случайных чисел необходимого количества объектов из популяции или выборочной рамки (sampling frame). Такой способ называется «простой случайной выборкой ». Если случайным образом выбрать начальную точку в выборочной рамке, а затем взять каждый второй, пятый или десятый объекты (в зависимости от того каких размеров группы требуются в исследовании), то получится интервальная выборка . Интервальная выборка не является случайной, так как никогда не исключается вероятность периодических повторений данных в рамках выборочной рамки.

Возможен вариант создания так называемой «стратифицированной выборки », которая предполагает, что популяция состоит из нескольких различных групп и эту структуру следует воспроизвести в экспериментальной группе. Например, если в популяции соотношение мужчин и женщин 30:70, тогда в стратифицированной выборке их соотношение должно быть таким же. При данном подходе критически важно не балансировать выборку избыточно, то есть избежать однородности ее характеристик, в противном случае исследователь может упустить шанс найти различия или связи в данных.

Кроме описанных способов формирования групп есть еще кластерная и квотная выборки . Первая используется в случае, когда получение полной информации о выборочной рамке затруднено из-за ее размеров. Тогда выборка формируется из нескольких групп, входящих в популяцию. Вторая - квотная - аналогична стратифицированной выборке, но здесь распределение объектов не соответствует таковому в популяции.

Возвращаясь к объему выборки, следует сказать, что он тесно связан с вероятностью статистических ошибок первого и второго рода. Статистические ошибки могут быть обусловлены тем, что в исследовании изучается не вся популяция, а ее часть. Ошибка первого рода - это ошибочное отклонение нулевой гипотезы . В свою очередь, нулевая гипотеза - это предположение о том, что все изучаемые группы взяты из одной генеральной совокупности, а значит, различия либо связи между ними случайны. Если провести аналогию с диагностическими тестами, то ошибка первого рода представляет собой ложноположительный результат.

Ошибка второго рода - это неверное отклонение альтернативной гипотезы , смысл которой заключается в том, что различия либо связи между группами обусловлены не случайным совпадением, а влиянием изучаемых факторов. И снова аналогия с диагностикой: ошибка второго рода - это ложноотрицательный результат. С этой ошибкой связано понятие мощности , которое говорит о том, насколько определенный статистический метод эффективен в данных условиях, о его чувствительности. Мощность вычисляется по формуле: 1-β, где β - это вероятность ошибки второго рода. Данный показатель зависит преимущественно от объема выборки. Чем больше размеры групп, тем меньше вероятность ошибки второго рода и выше мощность статистических критериев. Зависимость эта как минимум квадратичная, то есть уменьшение объема выборка в два раза приведет к падению мощности минимум в четыре раза. Минимально допустимой мощностью считают 80%, а максимально допустимый уровень ошибки первого рода принимают 5%. Однако всегда следует помнить, что эти границы заданы произвольно и могут изменяться в зависимости от характера и целей исследования. Как правило, научным сообществом признается произвольное изменение мощности, однако в подавляющем большинстве случаев уровень ошибки первого рода не может превышать 5%.

Все сказанное выше имеет непосредственное отношение к этапу планирования исследования. Тем не менее, многие исследователи ошибочно относятся к статистической обработке данных только как к неким манипуляциям, выполняемым после завершения основной части работы. Зачастую после окончания никак не спланированного эксперимента, появляется непреодолимое желание заказать анализ статистических данных на стороне. Но из «кучи мусора» даже специалисту по статистике будет очень сложно выудить ожидаемый исследователем результат. Поэтому при недостаточных знаниях биостатистики необходимо обращаться за помощью в статистическом анализе еще до начала эксперимента.

Обращаясь к самой процедуре анализа, следует указать на два основных типа статистических техник: описательные и доказательные (аналитические). Описательные техники включают в себя методы позволяющие представить данные в компактном и легком для восприятия виде. Сюда можно отнести таблицы, графики, частоты (абсолютные и относительные), меры центральной тенденции (средние, медиана, мода) и меры разброса данных (дисперсия, стандартное отклонение, межквартильный интервал и пр.). Другими словами, описательные методы дают характеристику изучаемым выборкам.

Наиболее популярный (хотя и зачастую ошибочный) способ описания имеющихся количественных данных заключается в определении следующих показателей:

количество наблюдений в выборке или ее объем;
средняя величина(среднее арифметическое);
стандартное отклонение- показатель того, насколько широко изменяются значения переменных.

Важно помнить, что среднее арифметическое и стандартное отклонение - это меры центральной тенденции и разброса в достаточно небольшом числе выборок. В таких выборках значения у большинства объектов с равной вероятностью отклонены от среднего, а их распределение образует симметричный «колокол» (гауссиану или кривую Гаусса-Лапласа). Такое распределение еще называют «нормальным», но в практике медицинского эксперимента оно встречается лишь в 30% случаев. Если же значения переменной распределены несимметрично относительно центра, то группы лучше описывать с помощью медианы и квантилей (процентилей, квартилей, децилей).

Завершив описание групп, необходимо ответить на вопрос об их взаимоотношениях и о возможности обобщить результаты исследования на всю популяцию. Для этого используются доказательные методы биостатистики. Именно о них в первую очередь вспоминают исследователи, когда идет речь о статистической обработке данных. Обычно этот этап работы называют «тестированием статистических гипотез».

Задачи тестирования гипотез можно разделить на две большие группы. Первая группа отвечает на вопрос, имеются ли различия между группами по уровню некоторого показателя, например, различия в уровне печеночных трансаминаз у пациентов с гепатитом и здоровых людей. Вторая группа позволяет доказать наличие связи между двумя или более показателями, например, функции печени и иммунной системы.

В практическом плане задачи из первой группы можно разделить на два подтипа:

сравнение показателя только в двух группах(здоровые и больные, мужчины и женщины);
сравнение трех и более групп(изучение разных доз препарата).

Необходимо учитывать, что статистические методы существенно отличаются для качественных и количественных данных.

В ситуации, когда изучаемая переменная - качественная и сравниваются только две группы, можно использовать критерий «хи-квадрат». Это достаточно мощный и широко известный критерий, однако, он оказывается недостаточно эффективным в случае, если количество наблюдений мало. Для решения данной проблемы существуют несколько методов, такие как поправка Йейтса на непрерывность и точный метод Фишера.

Если изучаемая переменная является количественной, то можно использовать один из двух видов статистических критериев. Критерии первого вида основаны на конкретном типе распределения генеральной совокупности и оперируют параметрами этой совокупности. Такие критерии называют «параметрическими», и они, как правило, базируются на предположении о нормальности распределения значений. Непараметрические критерии не базируются на предположении о типе распределения генеральной совокупности и не используют ее параметры. Иногда такие критерии называют «свободными от распределения» (distribution-free tests). В определенной степени это ошибочно, поскольку любой непараметрический критерий предусматривает, что распределения во всех сравниваемых группах будут одинаковыми, иначе могут быть получены ложноположительные результаты.

Существует два параметрических критерия применяемых к данным, извлеченным из нормально распределенной совокупности: t-тест Стьюдента для сравнения двух групп и F-тест Фишера, позволяющий проверить равенство дисперсий (он же - дисперсионный анализ). Непараметрических же критериев значительно больше. Разные критерии отличаются друг от друга по допущениям, на которых они основаны, по сложности вычислений, по статистической мощности и т. д. Однако наиболее приемлемыми в большинстве случаев считаются критерий Вилкоксона (для связанных групп) и критерий Манна-Уитни, также известный как критерий Вилкоксона для независимых выборок. Эти тесты удобны тем, что не требуют предположения о характере распределения данных. Но если окажется, что выборки взяты из нормально распределенной генеральной совокупности, то их статистическая мощность будет несущественно отличаться от таковой для теста Стьюдента.

Полное описание статистических методов можно найти в специальной литературе, однако, ключевым моментом является то, что каждый статистический тест требует набора правил (допущений) и условий для своего использования, и механический перебор нескольких методов для поиска «нужного» результата абсолютно неприемлем с научной точки зрения. В этом смысле статистические тесты близки к лекарственным препаратам - у каждого есть показания и противопоказания, побочные эффекты и вероятность неэффективности. И столь же опасным является бесконтрольное применение статистических тестов, ведь на них базируются гипотезы и выводы.

Для более полного понимания вопроса точности статистического анализа необходимо определить и разобрать понятие «доверительной вероятности». Доверительная вероятность - это величина, принятая в качестве границы между вероятными и маловероятными событиями. Традиционно, она обозначается буквой «p». Для многих исследователей единственной целью выполнения статистического анализа является расчет заветного значения p, которое словно проставляет запятые в известной фразе «казнить нельзя помиловать». Максимально допустимой доверительной вероятностью считается величина 0,05. Следует помнить, что доверительная вероятность - это не вероятность некоторого события, а вопрос доверия. Выставляя перед началом анализа доверительную вероятность, мы тем самым определяем степень доверия к результатам наших исследований. А, как известно, чрезмерная доверчивость и излишняя подозрительность одинаково негативно сказываются на результатах любой работы.

Уровень доверительной вероятности показывает, какую максимальную вероятность возникновения ошибки первого рода исследователь считает допустимой. Уменьшение уровня доверительной вероятности, иначе говоря, ужесточение условий тестирования гипотез, увеличивает вероятность ошибок второго рода. Следовательно, выбор уровня доверительной вероятности должен осуществляться с учетом возможного ущерба от возникновения ошибок первого и второго рода. Например, принятые в биомедицинской статистике жесткие рамки, определяющие долю ложноположительных результатов не более 5% - это суровая необходимость, ведь на основании результатов медицинских исследований внедряется либо отклоняется новое лечение, а это вопрос жизни многих тысяч людей.

Необходимо иметь в виду, что сама по себе величина p малоинформативна для врача, поскольку говорит только о вероятности ошибочного отклонения нулевой гипотезы. Этот показатель ничего не говорит, например, о размере терапевтического эффекта при применении изучаемого препарата в генеральной совокупности. Поэтому есть мнение, что вместо уровня доверительной вероятности лучше было бы оценивать результаты исследования по величине доверительного интервала. Доверительный интервал - это диапазон значений, в котором с определенной вероятностью заключено истинное популяционное значение (для среднего, медианы или частоты). На практике удобнее иметь оба эти значения, что позволяет с большей уверенностью судить о применимости полученных результатов к популяции в целом.

В заключение следует сказать несколько слов об инструментах, которыми пользуется специалист по статистике, либо исследователь, самостоятельно проводящий анализ данных. Давно ушли в прошлое ручные вычисления. Существующие на сегодняшний день статистические компьютерные программы позволяют проводить статистический анализ, не имея серьезной математической подготовки. Такие мощные системы как SPSS, SAS, R и др. дают возможность исследователю использовать сложные и мощные статистические методы. Однако далеко не всегда это является благом. Не зная о степени применимости используемых статистических тестов к конкретным данным эксперимента, исследователь может провести расчеты и даже получить некоторые числа на выходе, но результат будет весьма сомнительным. Поэтому, обязательным условием для проведения статистической обработки результатов эксперимента должно быть хорошее знание математических основ статистики.

ФЕДЕРАЛЬНОЕ АНЕНСТВО ПО ОБРАЗОВАНИЮ

ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

«ЮГОРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»

ИНСТИТУТ ДОПОЛНИТЕЛЬНОГО ОБРАЗОВАНИЯ

ПРОФЕССИОНАЛЬНАЯ ПЕРЕПОДГОТОВКА ПО ПРОГРАММЕ

«ГОСУДАРСТВЕННОЕ И МУНИЦИПАЛЬНОЕ УПРАВЛЕНИЕ»

РЕФЕРАТ

По дисциплине: «Статистика»

«Статистические методы исследования»

Выполнила:

Ханты-Мансийск

Введение

1. Методы статистического исследования.

1.1. Метод статистического наблюдения

1.4. Вариационные ряды

1.5. Выборочный метод

1.6. Корреляционный и регрессионный анализ

1.7. Ряды динамики

1.8. Статистические индексы

Заключение

Список использованной литературы

Полная и достоверная статистическая информация является тем необходимым основанием, на котором базируется процесс управления экономикой. Вся информация, имеющая народнохозяйственную значимость, в конечном счете, обрабатывается и анализируется с помощью статистики.

Именно статистические данные позволяют определить объемы валового внутреннего продукта и национального дохода, выявить основные тенденции развития отраслей экономики, оценить уровень инфляции, проанализировать состояние финансовых и товарных рынков, исследовать уровень жизни населения и другие социально-экономические явления и процессы. Овладение статистической методологией - одно из условий познания конъюнктуры рынка, изучения тенденций и прогнозирования, принятия оптимальных решений на всех уровнях деятельности.

Статистическая наука - это отрасль знаний, изучающая явления общественной жизни с их количественной стороны в неразрывной связи с их качественным содержанием в конкретных условиях места и времени. Статистическая практика - это деятельность по сбору, накоплению, обработке и анализу цифровых данных, характеризующих все явления в жизни общества.

Говоря о статистике следует помнить, что цифры в статистике не абстрактные, а выражают глубокий экономический смысл. Каждый экономист должен уметь пользоваться статистическими цифрами, анализировать их, уметь использовать для обоснования своих выводов.

Статистические законы действуют в пределах времени и места, в которых они обнаружены.

Окружающий мир состоит из массовых явлений. Если отдельный факт зависит от законов случая, то масса явлений подчиняется закономерностям. Для обнаружения этих закономерностей используется закон больших чисел.

Для получения статистической информации органы государственной и ведомственной статистики, а также коммерческие структуры проводят различного рода статистические исследования. Процесс статистического исследования включает три основные стадии: сбор данных, их сводка и группировка, анализ и расчет обобщающих показателей.

От того, как собран первичный статистический материал, как он обработан и сгруппирован в значительной степени зависят результаты и качество всей последующей работы, а в конечном итоге при нарушениях могут привести к абсолютно ошибочным выводам.

Сложной, трудоемкой и ответственной является заключительная, аналитическая стадия исследования. На этой стадии рассчитываются средние показатели и показатели распределения, анализируется структура совокупности, исследуется динамика и взаимосвязь между изучаемыми явлениями и процессами.

На всех стадиях исследования статистика использует различные методы. Методы статистики - это особые примы и способы изучения массовых общественных явлений.

На первой стадии исследования применяются методы массового наблюдения, собирается первичный статистический материал. Основное условие - массовость, т.к. закономерности общественной жизни проявляются в достаточно большом массиве данных в силу действия закона больших чисел, т.е. в сводных статистических характеристиках случайности взаимопогашаются.

На второй стадии исследования, когда собранная информация подвергается статистической обработке, используется метод группировок. Применение метода группировок требует непременного условия - качественной однородности совокупности.

На третьей стадии исследования проводится анализ статистической информации с помощью таких методов как метод обобщающих показателей, табличный и графический методы, методы оценки вариации, балансовый метод, индексный метод.

Аналитическая работа должна содержать элементы предвидения, указывать на возможные последствия складывающихся ситуаций.

Руководство статистикой в стране осуществляет Государственный комитет Российской Федерации по статистике. Как федеральный орган исполнительной власти он осуществляет общее руководство статистикой в стране, предоставляет официальную статистическую информацию Президенту, Правительству, Федеральному Собранию, федеральным органам исполнительной власти, общественным и международным организациям, разрабатывает статистическую методологию, координирует статистическую деятельность федеральных и региональных организаций исполнительной власти, осуществляет анализ экономико-статистической информации, составляет национальные счета и делает балансовые расчеты.

Система органов статистики в РФ образована в соответствии с административно территориальным делением страны. В республиках, входящих в РФ, имеются Республиканские комитеты. В автономных округах, краях, областях, в Москве и Санкт-Петербурге действуют Государственные комитеты по статистике.

В районах (городах) - управления (отделы) государственной статистики. Кроме государственной существует еще ведомственная статистика (на предприятиях, ведомствах, министерствах). Она обеспечивает внутренние потребности в статистической информации.

Цель данной работы – рассмотреть статистические методы исследования.

1. Методы статистического исследования

Между наукой-статистикой и практикой существует тесная взаимосвязь: статистика использует данные практики, обобщает и разрабатывает методы проведения статистических исследований. В свою очередь в практической деятельности применяются теоретические положения статистической науки для решения конкретных управленческих задач. Знание статистики необходимо современному специалисту для принятия решений в условиях стохастики (когда анализируемые явления подвержены влиянию случайностей), для анализа элементов рыночной экономики, в сборе информации, в связи с увеличением числа хозяйственных единиц и их типов, аудите, финансовом менеджменте, прогнозировании.

Для изучения предмета статистики разработаны и применяются специфические приемы, совокупность которых образует методологию статистики (методы массовых наблюдений, группировок, обобщающих показателей, динамических рядов, индексный метод и др.). Применение в статистике конкретных методов предопределяется поставленными задачами и зависит от характера исходной информации. При этом статистика опирается на такие диалектические категории, как количество и качество, необходимость и случайность, причинность, закономерность, единичное и массовое, индивидуальное и общее. Статистические методы используются комплексно (системно). Это обусловлено сложностью процесса экономико-статистического исследования, состоящего из трех основных стадий: первая - сбор первичной статистической информации; вторая - статистическая сводка и обработка первичной информации; третья - обобщение и интерпретация статистической информации.

Общей методологией изучения статистических совокупностей является использование основных принципов которыми руководствуются в любой науке. К этим принципам, как к своего рода началам относятся следующие:

1. объективность изучаемых явлений и процессов;

2. выявление взаимосвязи и системности в которых проявляется содержание изучаемых факторов;

3. целеполагание, т.е. достижение поставленных целей со стороны исследователя, изучающего соответствующие статистические данные.

Это выражается в получении сведений о тенденциях, закономерностях и возможных последствиях развития изучаемых процессов. Знание закономерностей развития социально-экономических процессов, интересующих общество, имеет важное практическое значение.

К числу особенностей статистического анализа данных следует отнести метод массового наблюдения, научной обоснованности качественного содержания группировок и его результатов, вычисление и анализ обобщенных и обобщающих показателей изучаемых объектов.

Что касается конкретных методов экономической, промышленной или статистики культуры, населения, национального богатства и т.п., то здесь могут быть свои специфические методы сбора, группировки и анализа соответствующих совокупностей (суммы фактов).

В экономической статистике, например, широко применяется балансовый метод как наиболее распространенный метод взаимной увязки отдельных показателей в единой системе экономических связей в общественном производстве. К методам применяемым в экономической статистике также относятся составление группировок, исчисление относительных показателей (процентное соотношение), сравнения, исчисление различных видов средних величин, индексов и т.п.

Метод связующих звеньев состоит в том, что два объемных, т.е. количественных показателя сопоставляются на основе существующего между ними отношения. Например, производительность труда в натуральных показателях и отработанного времени, или объем перевозок в тоннах и средней дальности перевозок в км.

При анализе динамики развития народного хозяйства основным методом выявления этой динамики (движения) является индексный метод, методы анализа временных рядов.

При статистическом анализе основных экономических закономерностей развития народного хозяйства важным методом статистики является вычисление тесноты связей между показателями с помощью корреляционного и дисперсионного анализа и др.

Кроме названных методов широкое распространение получили математико-статистические методы исследования которые расширяются по мере движения масштабов применения ЭВМ и создания автоматизированных систем.

Этапы статистического исследования:

1. Статистическое наблюдение – массовый научно организованный сбор первичной информации об отдельных единицах изучаемого явления.

2. Группировка и сводка материала – обобщение данных наблюдения для получения абсолютных величин (учетно-оценочных показателей) явления.

3. Обработка статистических данных и анализ результатов для получения обоснованных выводов о состоянии изучаемого явления и закономерностях его развития.

Все этапы статистического исследования тесно связаны друг с другом и одинаково важны. Недостатки и ошибки, возникающие на каждой стадии, сказываются на все исследовании в целом. Поэтому правильное использование специальных методов статистической науки на каждом этапе позволяет получить достоверную информацию в результате статистического исследования.

Методы статистического исследования:

1. Статистическое наблюдение

2. Сводка и группировка данных

3. Расчет обобщающих показателей (абсолютные, относительные и средние величины)

4. Статистические распределения (вариационные ряды)

5. Выборочный метод

6. Корреляционно-регрессионный анализ

7. Ряды динамики

Задача статистики – исчисление статистических показателей и их анализ, благодаря чему управляющие органы получают всестороннюю характеристику управляемого объекта, будь то вся национальная экономика или отдельные ее отрасли, предприятия и их подразделения. Управлять социально-экономическими системами нельзя, не располагая оперативной, достоверной и полной статистической информацией.

Статистическое наблюдение - это планомерный, научно-организованный и, как правило, систематический сбор данных о явлениях общественной жизни. Оно осуществляется путем регистрации заранее намеченных существенных признаков с целью получения в дальнейшем обобщающих характеристик этих явлений.

Например, при проведении переписи населения о каждом жителе страны записываются сведения о его поле, возрасте, семейном положении, образовании и др., а затем статистические органы определяют на основе этих сведений численность населения страны, его возрастную структуру, размещение по территории страны, семейный состав и другие показатели.

К статистическому наблюдению предъявляются следующие требования: полнота охвата изучаемой совокупности, достоверность и точность данных, их однообразие и сопоставимость.

Формы, виды и способы статистического наблюдения

Статистическое наблюдение осуществляется в двух формах: отчетность и специально организованное статистическое наблюдение.

Отчетностью называют такую организационную форму статистического наблюдения, при которой сведения поступают в статистические органы от предприятий, учреждений и организаций в виде обязательных отчетов об их деятельности.

Отчетность может быть общегосударственной и внутриведомственной.

Общегосударственная - поступает в вышестоящие органы и в органы государственной статистики. Она необходима для целей обобщения, контроля, анализа и прогнозирования.

Внутриведомственная - используется в Министерствах и ведомствах для оперативных нужд.

Отчетность утверждается Госкомстатом РФ. Отчетность составляется на основании первичного учета. Особенность отчетности в том, что она обязательна, документально обоснована и юридически подтверждена подписью руководителя.

Специально-организованное статистическое наблюдение - наблюдение, организуемое с какой-нибудь особой целью для получения сведений, которых нет в отчетности, или для проверки и уточнения данных отчетности. Это перепись населения, скота, оборудования, всевозможные единовременные учеты. Как, например, бюджетные обследования домашних хозяйств, опросы общественного мнения и т.п.

Виды статистического наблюдения можно сгруппировать по двум признакам: по характеру регистрации фактов и по охвату единиц совокупности.

По характеру регистрации фактов статистическое наблюдение может быть: текущим или систематическим и прерывным .

Текущее наблюдение - это непрерывный учет, например, производства продукции, отпуск материала со склада и т.д., т.е. регистрация осуществляется по мере совершения факта.

Прерывное наблюдение может быть периодическим, т.е. повторяющимся через определенные промежутки времени. Например, перепись скота на 1 января или регистрация цен на рынке на 22 число каждого месяца. Единовременное наблюдение организуется по мере надобности, т.е. без соблюдения периодичности или вообще единожды. Например, изучение общественного мнения.

По охвату единиц совокупности наблюдение может быть сплошным и несплошным.

При сплошном наблюдении обследованию подвергаются все единицы совокупности. Например, перепись населения.

При несплошном наблюдении обследуется часть единиц совокупности. Несплошное наблюдение можно подразделить на подвиды: выборочное, монографическое, метод основного массива.

Выборочное наблюдение - это наблюдение, основанное на принципе случайного отбора. При правильной его организации и проведении выборочное наблюдение дает достаточно достоверные данные об изучаемой совокупности. В некоторых случаях им можно заменить сплошной учет, т.к. результаты выборочного наблюдения с вполне определенной вероятностью можно распространить на всю совокупность. Например, контроль качества продукции, изучение продуктивности скота и т.д. В условиях рыночной экономики сфера применения выборочного наблюдения расширяется.

Монографическое наблюдение - это детальное, глубокое изучение и описание характерных в каком-то отношении единиц совокупности. Оно проводится с целью выявления имеющихся и намечающихся тенденций в развитии явления (выявление недостатков, изучения передового опыта, новых форм организации и т.д.)

Метод основного массива заключается в том, что обследованию подвергается наиболее крупные единицы, которые вместе взятые имеют преобладающий удельный вес в совокупности по основному для данного исследования признаку (признакам). Так при изучении работы рынков в городах обследованию подвергаются рынки крупных городов, где проживает 50% всего населения, а оборот рынков составляет 60% от общего оборота.

По источнику сведений различают непосредственное наблюдение, документальное и опрос.

Непосредственным называют такое наблюдение, при котором сами регистраторы путем замера, взвешивания или подсчета устанавливают факт и производят запись его в формуляре (бланке) наблюдения.

Документальное - предполагает запись ответов на основании соответствующих документов.

Опрос - это наблюдение, при котором ответы на вопросы записываются со слов опрашиваемого. Например, перепись населения.

В статистике сведения об изучаемом явлении могут быть собраны различными способами: отчетным, экспедиционным, самоисчислением, анкетным, корреспондентским.

Сущность отчетного способа заключается в предоставлении отчетов в строго обязательном порядке.

Экспедиционный способ заключается в том, что специально привлеченные и обученные работники записывают сведения в формуляр наблюдения (перепись населения).

При самоисчислении (саморегистрации) формуляры заполняют сами опрашиваемые. Этот способ применяется, например, при изучении маятниковой миграции (передвижения населения от места жительства до места работы и обратно).

Анкетный способ - это сбор статистических данных с помощью специальных вопросников (анкет), рассылаемых определенному кругу лиц или публикуемых в периодической печати. Этот способ применяется очень широко, особенно в различных социологических обследованиях. Однако он имеет большую долю субъективизма.

Сущность корреспондентского способа заключается в том, что статистические органы договариваются с определенными лицами (добровольными корреспондентами), которые берут на себя обязательство вести наблюдение за какими-либо явлениями в установленные сроки и сообщать результаты в статистические органы. Так, например, проводятся экспертные оценки по конкретным вопросам социально-экономического развития страны.

1.2. Сводка и группировка материалов статистического наблюдения

Сущность и задачи сводки и группировки

Сводка - это операция по отработке конкретных единичных фактов, образующих совокупность и собранных в результате наблюдения. В результате сводки множество индивидуальных показателей относящихся к каждой единице объекта наблюдения, превращаются в систему статистических таблиц и итогов, проявляются типические черты и закономерности изучаемого явления в целом.

По глубине и точности обработки различают сводку простую и сложную.

Простая сводка - это операция по подсчету общих итогов, т.е. по совокупности единиц наблюдения.

Сложная сводка - это комплекс операций, включающих группировку единиц наблюдения, подсчет итогов по каждой группе и по объекту в целом, оформление результатов в виде статистических таблиц.

Проведение сводки включает следующие этапы:

Выбор группировочного признака;

Определение порядка формирования группы;

Разработка системы показателей для характеристики групп и объекта в целом;

Разработка макетов таблиц для представления результатов сводки.

По форме обработки сводка бывает:

Централизованная (весь первичный материал поступает в одну вышестоящую организацию, например, Госкомстат РФ, и там полностью обрабатывается);

Децентрализованная (обработка собранного материала идет по восходящей линии, т.е. материал подвергается сводке и группировке на каждой ступени).

На практике обычно сочетают обе формы организации сводки. Так, например, при переписи предварительные итоги получают в порядке децентрализованной сводки, а сводные окончательные - в результате централизованной разработки бланков переписи.

По технике выполнения сводка бывает механизированной и ручной.

Группировкой называется расчленение изучаемой совокупности на однородные группы по определенным существенным признакам.

На основе метода группировок решаются центральные задачи исследования, обеспечивается правильное применение других методов статистического и статистико-математического анализа.

Работа по составлению группировок сложная и трудная. Приемы группировок разнообразны, что обусловлено разнообразием группировочных признаков и различными задачами исследования. К основным задачам, решаемым с помощью группировок относятся:

Выделение социально -экономических типов;

Изучение структуры совокупности, структурных сдвигов в ней;

Выявление связи между явлениями и взаимозависимости.

Виды группировок

В зависимости от задач, решаемых с помощью группировок, выделяют 3 типа группировок: типологические, структурные и аналитические.

Типологическая группировка решает задачу выявления социально-экономических типов. При построении группировки этого вида основное внимание должно быть уделено идентификации типов и выбору группировочного признака. Исходят при этом из сущности изучаемого явления. (таблица 2.3).

Структурная группировка решает задачу изучения состава отдельных типических групп по какому-то признаку. Например, распределение постоянного населения по возрастным группам.

Аналитическая группировка позволяет выявить взаимосвязи между явлениями и их признаками, т.е. выявить влияние одних признаков (факторных) на другие (результативные). Взаимосвязь проявляется в том, что с возрастанием факторного признака возрастает или убывает значение результативного признака. В основе аналитической группировки всегда лежит факторный признак, а каждая группа характеризуется средними величинами результативного признака.

Например, зависимость объема розничного товарооборота от величины торговой площади магазина. Здесь факторный (группировочный) признак - торговая площадь, а результативный - средний на 1 магазин объем товарооборота.

По сложности группировка бывает простой и сложной (комбинированной).

В простой группировке в основании один признак, а в сложной - два и более в сочетании (в комбинации). В этом случае сначала группы образуются по одному (основному) признаку, а затем каждая из них делится на подгруппы по второму признаку и т.д.

1.3. Абсолютные и относительные статистические величины

Абсолютные статистические величины

Исходной, первичной формой выражения статистических показателей являются абсолютные величины. Абсолютные величины характеризуют размер явлений в мерах массы, площади, объема, протяженности, времени и т.д.

Индивидуальные абсолютные показатели получаются, как правило, непосредственно в процессе наблюдения в результате замера, взвешивания, подсчета, оценки. В некоторых случаях абсолютные индивидуальные показатели представляют собой разность.

Сводные, итоговые объемные абсолютные показатели получают в результате сводки и группировки.

Абсолютные статистические показатели всегда являются числами именованными, т.е. имеют единицы измерения . Существует 3 типа единиц измерения абсолютных величин: натуральные, трудовые и стоимостные.

Натуральные единицы измерения - выражают величину явления в физических мерах, т.е. мерах веса, объема, протяженности, времени, счета, т.е. в килограммах, кубических метрах, километрах, часах, штуках и т.д.

Разновидностью натуральных единиц являются условно-натуральные единицы измерения , которые используются для сведения воедино нескольких разновидностей одной и той же потребительной стоимости. Одну из них принимают за эталон, а другие пересчитываются с помощью специальных коэффициентов в единицы меры этого эталона. Так, например, мыло с разным содержанием жирных кислот пересчитывают на 40% содержание жирных кислот.

В отдельных случаях для характеристики какого-либо явления одной единицы измерения недостаточно, и используется произведение двух единиц измерения.

Примером может служить грузооборот в тонно-километрах, производство электроэнергии в киловатт-часах и др.

В условиях рыночной экономики наибольшее значение имеют стоимостные (денежные) единицы измерения (рубль, доллар, марка и т.д.). Они позволяют получить денежную оценку любых социально-экономических явлений (объем продукции, товарооборота, национального дохода и т.п.). Однако, следует помнить, что в условиях высоких темпов инфляции показатели в денежной оценке становятся несопоставимыми. Это следует учитывать при анализе стоимостных показателей в динамике. Для достижения сопоставимости показатели необходимо пересчитывать в сопоставимые цены.

Трудовые единицы измерения (человеко-часы, человеко-дни) используются для определения затрат труда на производстве продукции, на выполнение какой-нибудь работы и т.п.

Относительные статистические величины, их сущность и формы выражения

Относительными величинами в статистике называются величины, выражающие количественное соотношение между явлениями общественной жизни. Они получаются в результате деления одной величины на другую.

Величина с которой производится сравнение (знаменатель) называется основанием, базой сравнения; а та, которая сравнивается (числитель) - называется, сравниваемой, отчетной или текущей величиной.

Относительная величина показывает, во сколько раз сравниваемая величина больше или меньше базисной, или какую долю первая составляет от второй; а в отдельных случаях - сколько единиц одной величины приходится на единицу (или на 100, на 1000 и т.д.) другой (базисной) величины.

В результате сопоставления одноименных абсолютных величин получаются отвлеченные неименованные относительные величины, показывающие во сколько раз данная величина больше или меньше базисной. В этом случае базисная величина принимается за единицу (в результате получается коэффициент ).

Кроме коэффициента широко распространенной формой выражения относительных величин являются проценты (%). В этом случае базисная величина принимается за 100 единиц.

Относительные величины могут выражаться в промилле (‰), в продецимилле (0 / 000). В этих случаях база сравнения принимается соответственно за 1 000 и за 10 000. В отдельных случаях база сравнения может быть принята и за 100 000.

Относительные величины могут быть числами именованными. Ее наименование представляет собой сочетание наименований сравниваемого и базисного показателей. Например, плотность населения чел/кв. км (сколько человек приходится на 1 квадратный километр).

Виды относительных величин

Виды относительных величин подразделяются в зависимости от их содержания. Это относительные величины: планового задания, выполнения плана, динамики, структуры, координации, интенсивности и уровня экономического развития, сравнения.

Относительная величина планового задания представляет собой отношение величины показателя, устанавливаемой на планируемый период к величине его, достигнутой к планируемому периоду.

Относительной величиной выполнения плана называется величина, выражающая соотношение между фактическим и плановым уровнем показателя.

Относительная величина динамики представляет собой отношение уровня показателя за данный период к уровню этого же показателя в прошлом.

Три вышеперечисленные относительные величины связаны между собой, а именно: относительная величина динамики равна произведению относительных величин планового задания и выполнения плана.

Относительная величина структуры представляет собой отношение размеров части к целому. Она характеризует структуру, состав той или иной совокупности.

Эти же величины в процентах называют удельным весом.

Относительной величиной координации называют соотношение частей целого между собой. В результате получают, во сколько раз данная часть больше базисной. Или сколько процентов от нее составляет или сколько единиц данной структурной части приходится на 1 единицу (100 или 1000 и т.д. единиц) базисной структурной части.

Относительная величина интенсивности характеризует развитие изучаемого явления или процесса в другой среде. Это отношение двух взаимосвязанных явлений, но разных. Оно может быть выражено и в процентах, и в промилле, и продецемилле, и именованной. Разновидностью относительной величины интенсивности является показатель уровня экономического развития , характеризующий производство продукции на душу населения.

Относительная величина сравнения представляет собой соотношение одноименных абсолютных показателей по разным объектам (предприятиям, районам, областям, странам и т.д.). Он может быть выражен как в коэффициентах, так и в процентах.

Средние величины их сущность и виды

Статистика, как известно, изучает массовые социально-экономические явления. Каждое из этих явлений может иметь различное количественное выражение одного и того же признака. Например, заработная плата одной и той же профессии рабочих или цены на рынке на один и тот же товар и т.д.

Для изучения какой-либо совокупности по варьирующим (количественно изменяющимся) признакам статистика использует средние величины.

Средняя величина - это обобщающая количественная характеристика совокупности однотипных явлений по одному варьирующему признаку.

Важнейшее свойство средней величины заключается в том, что она представляет значение определенного признака во всей совокупности одним числом, несмотря на количественные различия его у отдельных единиц совокупности, и выражает то общее, что присуще всем единицам изучаемой совокупности. Таким образом, через характеристику единицы совокупности она характеризует всю совокупность в целом.

Средние величины связаны с законом больших чисел. Суть этой связи заключается в том, что при осреднении случайные отклонения индивидуальных величин в силу действия закона больших чисел взаимопогашаются и в средней выявляется основная тенденция развития, необходимость, закономерность однако, для этого среднюю необходимо вычислять на основе обобщения массы фактов.

Средние величины позволяют сравнивать показатели, относящиеся к совокупностям с различной численностью единиц.

Важнейшим условием научного использования средних величин в статистическом анализе общественных явлений является однородность совокупности, для которой исчисляется средняя. Одинаковая по форме и технике вычисления средняя в одних условиях (для неоднородной совокупности) фиктивная, а в других (для однородной совокупности) соответствует действительности. Качественная однородность совокупности определяется на основе всестороннего теоретического анализа сущности явления. Так, например, при исчислении средней урожайности требуется, чтобы исходные данные относились к одной и той же культуре (средняя урожайность пшеницы) или группе культур (средняя урожайность зерновых). Нельзя вычислять среднюю для разнородных культур.

Математические приемы, используемые в различных разделах статистики, непосредственно связаны с вычислением средних величин.

Средние в общественных явлениях обладают относительным постоянством, т.е. в течение какого-то определенного промежутка времени однотипные явления характеризуются примерно одинаковыми средними.

Средине величины очень тесно связаны с методом группировок, т.к. для характеристики явлений необходимо исчислять не только общие (для всего явления) средние, но и групповые (для типических групп этого явления по изучаемому признаку).

Виды средних величин

От того, в каком виде представлены исходные данные для расчета средней величины, зависит по какой формуле она будет определятся. Рассмотрим наиболее часто применяемые в статистике виды средних величин:

Среднюю арифметическую;

Среднюю гармоническую;

Среднюю геометрическую;

Среднюю квадратическую.

1.4. Вариационные ряды

Сущность и причины вариации

Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для глубокого анализа изучаемого процесса или явления.

Необходимо учитывать и разброс или вариацию значений отдельных единиц, которая является важной характеристикой изучаемой совокупности. Каждое индивидуальное значение признака складывается под совместным воздействием многих факторов. Социально-экономические явления, как правило, обладают большой вариацией. Причины этой вариации содержатся в сущности явления.

Показатели вариации определяют как группируются значения признака вокруг средней величины. Они используются для характеристики упорядоченных статистических совокупностей: группировок, классификаций, рядов распределения. В наибольшей степени вариации подвержены курсы акций, объёмы спроса и предложения, процентные ставки в разные периоды и в разных местах.

Абсолютные и относительные показатели вариации

По смыслу определения вариация измеряется степенью колеблемости вариантов признака от уровня их средней величины, т.е. как разность х-х. На использовании отклонений от средней построено большинство показателей применяемых в статистике для измерения вариаций значений признака в совокупности.

Самым простейшим абсолютным показателем вариации является размах вариации R=xmax-xmin . Размах вариации выражается в тех же единицах измерения, что и Х. Он зависит только от двух крайних значений признака и, поэтому, недостаточно характеризует колеблемость признака.

Абсолютные показатели вариации зависят от единиц измерения признака и затрудняют сравнение двух или нескольких различных вариационных рядов.

Относительные показатели вариации вычисляются как отношение различных абсолютных показателей вариации к средней арифметической. Наиболее распространённым из них является коэффициент вариации.

Коэффициент вариации характеризует колеблемость признака внутри средней. Самые лучшие значения его до 10%, неплохие до 50%, плохие свыше 50%. Если коэффициент вариации не превышает 33%, то совокупность по рассматриваемому признаку можно считать однородной.

1.5. Выборочный метод

Сущность выборочного метода заключается в том, чтобы по свойствам части (выборки) судить о численных характеристиках целого (генеральной совокупности), по отдельным группам вариантов их общей совокупности, которая иногда мыслится как совокупность неограниченно большого объема. Основу выборочного метода составляет та внутренняя связь, которая существует в популяциях между единичным и общим, частью и целым.

Выборочный метод имеет очевидные преимущества перед сплошным изучением генеральной совокупности, так как сокращает объем работы (за счет уменьшения числа наблюдении) позволяет экономить силы и средства, получать информацию о таких совокупностях, полное обследование которых практически невозможно или нецелесообразно.

Опыт показал, что правильно произведенная выборка довольно хорошо представляет или репрезентирует (от лат. represento-представляю) структуру и состояние генеральной совокупности. Однако полного совпадения выборочных данных с данными обработки генеральной совокупности, как правило, не бывает. В этом и заключается недостаток выборочного метода, на фоне которого видны преимущества сплошного описания генеральной совокупности.

В виду неполного отображения выборкой статистических характеристик (параметров) генеральной совокупности перед исследователем возникает важная задача: во-первых, учитывать и соблюдать те условия, при которых выборка наилучшим образом репрезентирует генеральную совокупность, а во-вторых, в каждом конкретном случае устанавливать, с какой уверенностью можно перенести результаты выборочного наблюдения на всю генеральную совокупность, из которой выборка взята.

Репрезентативность выборки зависит от целого ряда условий и прежде всего от того, как она осуществляется, или планомерно (т. е. по заранее намеченной схеме), или путем непланомерного отбора вариант из генеральной совокупности. В любом случае выборка должна быть типичной и вполне объективной. Эти требования должны выполняться неукоснительно как наиболее существенные условия репрезентативности выборки. Прежде чем обрабатывать выборочный материал, его нужно тщательно проверить и освободить выборку от всего лишнего, что нарушает условия репрезентативности. В то же время при образовании выборки нельзя поступать по произволу, включать в ее состав только те варианты, которые кажутся типичными, а все остальные браковать. Доброкачественная выборка должна быть объективной, т. е. производиться без предвзятых побуждений, при исключении субъективных влияний на ее состав. Выполнению этого условия репрезентативности отвечает принцип рендомизации (от англ. rendom-случай), или случайного отбора вариант из генеральной совокупности.

Этот принцип положен в основу теории выборочного метода и должен соблюдаться во всех случаях образования репрезентативной выборочной совокупности, не исключая и случаев планомерного или преднамеренного отбора.

Существуют различные способы отбора. В зависимости от способа отбора различают выборки следующих типов:

Случайная выборка с возвратом;

Случайная выборка без возврата;

Механическая;

Типическая;

Серийная.

Рассмотрим образование случайных выборок с возвратом и без возврата. Если выборка производится из массы изделий (например, из ящика), то после тщательного перемешивания следует брать объекты случайно, т. е. так, что бы они все имели одинаковую вероятность попасть в выборку. Часто для образования случайной выборки элементы генеральной совокупности предварительно номеруются, а каждый номер записывается на отдельной карточке. В результате получается пачка карточек, число которых совпадает с объемом генеральной совокупности. После тщательного перемешивания из этой пачки берут по одной карточке. Объект, имеющий одинаковый номер с карточкой считается попавшим в выборку. При этом возможны два принципиально различных способа образования выборочной совокупности.

Первый способ - вынутая карточка после фиксации ее номера возвращается в пачку, после чего карточки снова тщательно перемешиваются. Повторяя такие выборки по одной карточке, можно образовать выборочную совокупность любого объема. Выборочная совокупность, образованная по такой схеме, получила название случайной выборки с возвратом.

Второй способ - каждая вынутая карточка после ее записи обратно не возвращается. Повторяя по такой схеме выборки по одной карточке, можно получить выборочную совокупность любого заданного объема. Выборочную совокупность, образованную по данной схеме называют случайной выборкой без возврата. Случайная выборка без возврата образуется в том случае, если из тщательно перемешанной пачки сразу берут нужное число карточек.

Однако при большом объеме генеральной совокупности описанный выше способ образования случайной выборки с возвратом и без возврата оказывается очень трудоемким. В этом случае пользуются таблицами случайных чисел, в которых числа расположены в случайном порядке. Доля того, что бы отобрать, например, 50 объектов из пронумерованной генеральной совокупности, открывают любую страницу таблицы случайных чисел и выписывают подряд 50 случайных чисел; в выборку попадают те объекты, номера которых совпадают с выписанными случайными числами, если случайное число таблицы окажется больше объема генеральной совокупности, то такое число пропускают.

Заметим, что различие между случайными выборками с возвратом и без возврата стирается, если они составляют незначительную часть большой генеральной совокупности.

При механическом способе образования выборочной совокупности, подлежащие обследованию элементы генеральной совокупности отбираются через определенный интервал. Так, например, если выборка должна составлять 50% генеральной совокупности, то отбирается каждый второй элемент генеральной совокупности. Если выборка десяти процентная, то отбирается каждый десятый ее элемент и т. д.

Следует отметить, что иногда механический отбор может не обеспечить репрезентативной выборки. Например, если отбирается каждый двенадцатый обтачиваемый валик, причем сразу же после отбора производят замену резца, то отобранными окажутся все валики, обточенные затупленными резцами. В таком случае необходимо устранить совпадение ритма отбора с ритмом замены резца, для чего следует отбирать хотя бы каждый десятый валик из двенадцати обточенных.

При большом количестве выпускаемой однородной продукции, когда в ее изготовлении принимают участие различные станки, и даже цеха, для образования репрезентативной выборки пользуются типическим способом отбора. В этом случае, генеральную совокупность предварительно разбивают на непересекающиеся группы. Затем из каждой группы, по схеме случайной выборки с возвратом или без возврата отбирают определенной число элементов. Они и образуют выборочную совокупность, которая называется типической.

Пусть, например, выборочным путем исследуется продукция цеха, в котором имеются 10 станков, производящих одну и ту же продукцию. Пользуясь схемой случайной выборки с возвратом или без возврата, отбирают изделия, сначала из продукции, сделанной на первом, затем на втором и т. д. станках. Такой способ отбора позволяет образовать типическую выборку.

Иногда на практике бывает целесообразно пользоваться серийным способом отбора, идея которого заключается в том, что генеральную совокупность разбивают на некоторое количество непересекающихся серий и по схеме случайной выборки с возвратом или без возврата контролируют все элементы лишь отобранных серий. Например, если изделия изготовляются большой группой станков-автоматов, то сплошному обследованию подвергают продукцию только нескольких станков. Серийным отбором пользуются в случае, если обследуемый признак колеблется в различных сериях незначительно.

О том, какому способу отбора следует отдать предпочтение в той или иной ситуации, следует судить, исходя из требований поставленной задачи и условий производства. Заметим, что на практике при составлении выборки часто используют одновременно несколько способов отбора в комплексе.

1.6. Корреляционный и регрессионный анализ

Регрессионный и корреляционный анализы - это эффективные методы, которые разрешают анализировать значительные объемы информации с целью исследования вероятной взаимосвязи двух или больше переменных.

Задачи корреляционного анализа сводятся к измерению тесноты известной связи между варьирующими признаками, определению неизвестных причинных связей (причинный характер которых должен быть выяснен с помощью теоретического анализа) и оценки факторов, оказывающих наибольшее влияние на результативный признак.

Задачами регрессионного анализа являются выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчётных значений зависимой переменной (функции регрессии).

Решение всех названных задач приводит к необходимости комплексного использования этих методов.

1.7. Ряды динамики

Понятие о рядах динамики и виды рядов динамики

Рядом динамики называется ряд последовательно расположенных во времени статистических показателей, которые в своем изменении отражают ход развития изучаемого явления.

Ряд динамики состоит из двух элементов: момента или периода времени , которым относятся данные и статистических показателей (уровней) . Оба элемента вместе образуют члены ряда . Уровни ряда обычно обозначают через "y", а период времени - через "t".

По длительности времени, к которым относятся уровни ряда, ряды динамики делятся на моментные и интервальные.

В моментных рядах каждый уровень характеризует явления на момент времени . Например: число вкладов населения в учреждениях сберегательного банка РФ, на конец года.

В интервальных рядах динамики каждый уровень ряда характеризует явление за период времени . Например: производство часов в РФ по годам.

В интервальных рядах динамики уровни ряда можно суммировать и получить общую величину за ряд следующих друг за другом периодов. В моментных рядах эта сумма не имеет смысла.

В зависимости от способа выражения уровней ряда различают ряды динамики абсолютных величин, относительных величин и средних величин.

Ряды динамики могут быть с равным и неравным интервалами. Понятие интервала в моментных и интервальных рядах различные. Интервал моментного ряда - это период времени от одной даты до другой даты, на которые приведены данные. Если это данные о числе вкладов на конец года, то интервал равен от конца одного года, до конца другого года. Интервал интервального ряда - это период времени за который обобщены данные. Если это производство часов по годам, то интервал равен одному году.

Интервал ряда может быть равным и неравным как в моментных, так и в интервальных рядах динамики.

С помощью рядов динамики определяют скорость и интенсивность развития явлений, выявляют основную тенденцию их развития, выделяют сезонные колебания, сравнивают развитие во времени отдельных показателей разных стран, выявляют связи между развивающимися во времени явлениями.

1.8. Статистические индексы

Понятие об индексах

Слово "index" латинское и означает "показатель", "указатель". В статистике под индексом понимается обобщающий количественный показатель, выражающий соотношение двух совокупностей, состоящих из элементов, непосредственно не поддающихся суммированию. Например, объем продукции предприятия в натуральном выражении суммировать нельзя (кроме однородной), а для обобщающей характеристики объема это необходимо. Нельзя суммировать цены на отдельные виды продукции и т.д. Для обобщающей характеристики таких совокупностей в динамике, в пространстве и по сравнению с планом применяются индексы. Кроме сводной характеристики явлений индексы позволяют дать оценку роли отдельных факторов в изменении сложного явления. Индексы используются и для выявления структурных сдвигов в народном хозяйстве.

Индексы рассчитываются как для сложного явления (общие или сводные), так и для отдельных его элементов (индивидуальные индексы).

В индексах, характеризующих изменение явления во времени различают базисный и отчетный (текущий) периоды. Базисный период - это период времени к которому относится величина, принятая за базу сравнения. Обозначается он подстрочным знаком "0". Отчетный период - это период времени, к которому относится величина, подвергающаяся сравнению. Обозначается он подстрочным знаком "1".

Индивидуальные индексы - это обычная относительная величина.

Сводный индекс - характеризует изменение всей сложной совокупности в целом, т.е. состоящей из несуммируемых элементов. Следовательно, чтобы рассчитать такой индекс надо преодолеть несуммарность элементов совокупности.

Это достигается введением дополнительного показателя (соизмерителя). Сводный индекс состоит из двух элементов: индексируемой величины и веса.

Индексируемая величина - это показатель, для которого рассчитывается индекс. Вес (соизмеритель) - это дополнительный показатель вводимый для целей соизмерения индексируемой величины. В сводном индексе в числителе и знаменателе всегда сложная совокупность, выраженная суммой произведений индексируемой величины и веса.

В зависимости от объекта исследования как общие, так и индивидуальные индексы подразделяются на индексы объемных (количественных) показателей (физического объема продукции, посевной площади, численности рабочих и др.) и индексы качественных показателей (цены, себестоимости, урожайности, производительности труда, заработной платы и др.).

В зависимости от базы сравнения индивидуальные и общие индексы могут быть цепными и базисными .

В зависимости от методологии расчета общие индексы имеют две формы: агрегатную и форму среднего индекса.

Правильно проведённый сбор, анализ данных и статистические расчёты позволяют обеспечить заинтересованные структуры и общественность информацией о развитии экономики, о направлении её развития, показать эффективность использования ресурсов, учесть занятость населения и его трудоспособность, определить темпы роста цен и влияние торговли на сам рынок или отдельно взятую сферу.

Список использованной литературы

1. Глинский В.В., Ионин В.Г. Статистический анализ. Учебное пособие.- М.: ФИЛИНЪ, 1998 г.-264 с.

2. Елисеева И.И., Юзбашев М.М. Общая теория статистики. Учебник.-

М.: Финансы и статистика, 1995 г.-368 с.

3. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики. Учебник.-М.: ИНФРА-М, 1996 г.-416 с.

4. Костина Л.В. Методика построения статистических графиков. Методическое пособие.- Казань, ТИСБИ, 2000 г.-49 с.

5. Курс социально-экономической статистики: Учебник/под ред. проф. М.Г. Назарова.-М.: Финстатинформ, ЮНИТИ-ДИАНА, 2000 г.-771 с.

6. Общая теория статистики: статистическая методология в изучении коммерческой деятельности: Учебник/под ред. А.А. Спирина, О.Э.Башеной-М.: Финансы и статистика, 1994 г.-296 с.

7. Статистика: курс лекций/ Харченко Л.П., Долженкова В.Г., Ионин В.Г. и др.- Новосибирск,: НГАЭиУ, М.: ИНФРА-М, 1997 г.-310 с.

8. Статистический словарь/ гл.ред. М.А. Королёв.-М.: Финансы и статистика, 1989 г.-623 с.

9. Теория статистики: Учебник/под ред. проф. Шмойловой Р.А.- М.: Финансы и статистика, 1996 г.-464 с.

Курс знакомит студентов с основными задачами и методами прикладной статистики .

Цели курса - связать теорию и практику, научить студентов «видеть» статистические задачи в различных предметных областях и правильно применять методы прикладной статистики, показать на практических примерах возможности и ограничения статистических методов. Курс имеет скорее методологическую, чем математическую направленность и не содержит доказательств теорем.

Каждый метод описывается по единой схеме:

постановка задачи;
примеры прикладных задач из области биологии, экономики, социологии, производства, медицины;
базовые предположения и границы применимости;
описание метода (для методов проверки статистических гипотез: нулевая гипотеза и альтернативы, статистика, её нулевое распределение);
достоинства, недостатки, ограничения, «подводные камни»;
сравнение с другими методами.

Курс читается студентам 4 курса кафедры математических методов прогнозирования ВМиК МГУ с 2007 года и студентам 4 курса факультета управления и прикладной математики МФТИ с 2011 года. Предполагается, что студенты уже прослушали курсы теории вероятностей и математической статистики.

Программа курса

Введение

Обзор необходимых сведений из теории вероятностей и математической статистики.

Понятия простой выборки и статистики . Примеры статистик: моменты , асимметрия и эксцесс , вариационный ряд и порядковые статистики, эмпирическое распределение .
Статистические точечные оценки и их свойства: несмещённость , состоятельность , оптимальность , робастность .
Интервальные оценки , понятия доверительного интервала и уровня доверия . Доверительные интервалы для среднего и медианы.
Часто используемые распределения: нормальное, хи-квадрат, Фишера, Стьюдента, Бернулли, биномиальное, Пуассона.
Проверка статистических гипотез , основные понятия: уровень значимости , достигаемый уровень значимости (p-value), ошибки I и II рода. Односторонние и двусторонние альтернативы.
Свойства достигаемых уровней значимости. Статистическая и практическая значимость.
Свойства критериев: несмещённость , состоятельность , мощность .

Параметрическая проверка гипотез

Критерии нормальности: критерий хи-квадрат (Пирсона), критерий Шапиро-Уилка , критерии, основанные на различиях между эмпирической и теоретической функциями распределения, критерий Колмогорова-Смирнова (Лиллиефорса). Упрощённая проверка нормальности по асимметрии и эксцессу: критерий Харке-Бера.
Нормальные параметрические критерии для проверки гипотез: гипотезы о положении , гипотезы о рассеивании .
Гипотезы о средних: t- и z-критерии Стьюдента для одной и двух выборок, связанные выборки
Гипотезы о дисперсиях: критерии хи-квадрат и Фишера .
Гипотезы о значениях параметра распределения Бернулли: сравнение значения параметра с заданным, сравнение параметров распределений двух выборок (случаи связанных и независимых выборок).
Доверительный интервал для параметра распределения Бернулли: Вальда, Уилсона. Доверительные интервалы Уилсона для разности параметров двух выборок.

Непараметрическая проверка гипотез

Множественная проверка гипотез

Дисперсионный анализ (ANOVA)

Однофакторная модель. Независимые выборки: критерии Фишера, Краскела-Уоллиса , Джонкхиера . Связанные выборки: критерии Фишера, Фридмана и Пейджа . Предположение сферичности.
Модель со случайным эффектом, разделение дисперсии.
Модель с фиксированным эффектом, уточнение различий: методы LSD и HSD, критерии Неменьи и Даннета .
Проверка гипотезы о равенстве дисперсий: критерии Бартлета и Флайнера-Киллиана .
Двухфакторная модель. Взаимодействие факторов, его интерпретация. Двухфакторный нормальный анализ . Иерархический дизайн.

Анализ зависимостей

Линейный регрессионный анализ

Обобщения линейной регрессии

Обобщённые линейные модели. Связующая функция. Оценка параметров методом максимального правдоподобия.
Доверительные интервалы и оценка значимости коэффициентов, критерии Вальда и отношения правдоподобия.
Меры качества обобщённых линейных моделей: аномальность, информационные критерии.
Постановка задачи логистической регрессии . Логит, интерпретация коэффициентов логистической регрессии.
Проверка линейности логита: сглаженные диаграммы рассеяния, дробные полиномы.
Классификация на основе логистической регрессии: чувствительность, специфичность, выбор порога.
Регрессия счётного признака. Пуассоновская модель.
Предположение о равенстве матожидания и дисперсии и его проверка. Отрицательная биномиальная модель. Устойчивая оценка дисперсии коэффициентов.

Анализ временных рядов

Последовательный анализ

[Вальд, Mukhopadhyay]

Применение в задачах проверки гипотез о значениях параметра биномиального распределения: сравнение значения с заданным, сравнение двух значений.
Применение в задачах проверки гипотез о значениях параметров нормального распределения: сравнение значения среднего с заданными (симметричный и несимметричный варианты), сравнение значения дисперсии с заданным.
Последовательные доверительные интервалы для среднего нормальной совокупности с неизвестной дисперсией (двухэтапная, последовательная процедуры). Процедуры для разности средних двух нормальных совокупностей, случаи равных и неравных дисперсий.
Непараметрические последовательные доверительные интервалы для среднего и медианы.

Анализ причинно-следственных связей

Неразрешимость парадокса Симпсона в рамках классической статистики.
Причинные графы, цепочки, вилки, коллайдеры. D-разделимость.
Интервенции. Оценка эффекта по обзервационным данным. Хирургия графа и формула корректировки (adjustment formula).
Правило причинного эффекта. Варианты для отсутствия родителей: правило задней двери, правило передней двери.
Propensity score, обратное вероятностное взвешивание.
Графы в линейных моделях. Связь со структурными уравнениями.

Литература

Вальд, А. Последовательный анализ. - М.: Физматлит, 1960.
Лагутин, М.Б. Наглядная математическая статистика. В двух томах. - М.: П-центр, 2003.
Кобзарь, А.И. Прикладная математическая статистика. - М.: Физматлит, 2006.
Agresti, A. Categorical Data Analysis. - Hoboken: John Wiley & Sons, 2013.
Bonnini, S., Corain, L., Marozzi, M., Salmaso S. Nonparametric Hypothesis Testing: Rank and Permutation Methods with Applications in R. - Hoboken: John Wiley & Sons, 2014.
Bretz, F., Hothorn, T., Westfall, P. Multiple Comparisons Using R. - Boca Raton: Chapman and Hall/CRC, 2010.
Cameron, A.A., Trivedi, P.K. Regression Analysis of Count Data. - Cambridge: Cambridge University Press, 2013.
Dickhaus, T. Simultaneous Statistical Inference With Applications in the Life Sciences. - Heidelberg: Springer, 2014.
Good, P. Permutation, Parametric and Bootstrap Tests of Hypotheses: A Practical Guide to Resampling Methods for Testing Hypotheses. - New York: Springer, 2005.
Hastie, T. , Tibshirani, R. , Friedman, J. The Elements of Statistical Learning, 2nd edition . - Springer, 2009. - 533 p. ()
Hosmer, D.W., Lemeshow S., Sturdivant, R.X. Applied Logistic Regression. - Hoboken: John Wiley & Sons, 2013.
Hyndman, R.J., Athanasopoulos G. Forecasting: principles and practice. - OTexts, 2015. https://www.otexts.org/book/fpp
Kanji, G.K. 100 statistical tests. - London: SAGE Publications, 2006.
Mukhopadhyay, N., de Silva, B. M. Sequential methods and their applications. - Boca Raton: Chapman and Hall/CRC, 2009.
Olsson, U. Generalized Linear Models: An Applied Approach. - Lund: Studentlitteratur, 2004.
Pearl J., Glymour M., Jewell N.P. Causal Inference in Statistics: A Primer. - Chichester: John Wiley & Sons, 2016.
Tabachnick, B.G., Fidell, L.S. Using Multivariate Statistics. - Boston: Pearson Education, 2012.
Wooldridge, J. Introductory Econometrics: A Modern Approach. - Mason: South-Western Cengage Learning, 2013.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

3. Ряды динамики
Литература

1. Абсолютные и относительные величины

В результате сводки и группировки статистического материала в руках исследователя оказывается самая разнообразная информация об изучаемых явлениях и процессах. Однако, останавливаться на полученных результатах было бы большой ошибкой, потому что, даже сгруппированные по заданным признакам и отраженные в табличной или графической форме, эти данные пока являются только своего рода иллюстрацией, промежуточным результатом, который должен быть подвергнут анализу - в данном случае, статистическому. Статистический анализ - это представление изучаемого объекта в качестве расчлененной системы, т.е. комплекса элементов и связей, образующих в своем взаимодействии органическое целое .

В результате такого анализа должна быть построена модель изучаемого объекта, причем, поскольку речь идет о статистике, при построении модели должны быть использованы статистические значимые элементы и связи.

Собственно, на выявление таких значимых элементов и связей и направлен статистический анализ.

Абсолютные показатели (величины) - величины суммарные, подсчитанные или взятые из сводных статистических отчетов без всяких преобразований. Абсолютные показатели всегда именные и отражаются в тех единицах измерения, которые были заданы при составлении программы статистического наблюдения (количество возбужденных уголовных дел, количество совершенных преступлений, количество разводов и т.д.).

Абсолютные показатели являются базовыми для любых дальнейших статистических операций, однако сами они для анализа малопригодны. По абсолютным показателям, например, трудно судить об уровне преступности в разных городах или регионах и практически нельзя ответить на вопрос, где преступность выше, а где ниже, так как города или регионы могут существенно различаться численности населения, территории и другим важным параметрам.

Относительные величины в статистике представляют собой обобщающие показатели, которые раскрывают числовую форму соотношения двух сопоставляемых статистических величин. При исчислении относительных величин наиболее часто сравнивают две абсолютные, но можно сопоставлять и средние, и относительные величины, получая новые относительные показатели. Самый простой пример вычисления относительной величины - ответ на вопрос: во сколько раз одно число больше другого?

Приступая к рассмотрению относительных величин, необходимо учитывать следующее. В принципе, сравнивать можно все, что угодно, даже линейные размеры листа бумаги А4 с количеством продукции, выпускаемой Ломоносовским фарфоровым заводом. Однако, такое сравнение ничего нам не даст. Важнейшее условие для плодотворного вычисления относительных величин можно сформулировать следующим образом:

1. единицы измерения сравниваемых величин должны быть одними и теми же или вполне сопоставимыми. Числа преступлений, уголовных дел и осужденных - показатели коррелируемые, т.е. взаимосвязанные, но не сопоставимые по единицам измерения. В одном уголовном деле может быть рассмотрено несколько преступлений и осуждена группа лиц; несколько осужденных могут совершить одно преступление и, наоборот, один осужденный - множество деяний. Числа преступлений, дел и осужденных сопоставимы с численностью населения, количеством персонала системы уголовной юстиции, уровнем жизни народа и другими данными одного и того же года. Более того, в течение одного года рассматриваемые показатели вполне сопоставимы и между собой.

2. Сопоставляемые данные обязательно должны соответствовать друг другу по времени или территории их получения либо по тому и другому параметрам вместе.

Абсолютная величина, с которой сравниваются другие в е личины, называется основанием или базой сравнения, а сравн и ваемый показатель - величиной сравнения . Например, при расчете отношения динамики преступности в России в 2000-2010 гг. данные 2000 г. будут базовыми. Они могут приниматься за единицу (тогда относительная величина будет выражена в форме коэффициента), за 100 (в процентах). В зависимости от размерности сравниваемых величин выбирают наиболее удобную, показательную и наглядную форму выражения относительной величины.

Если сравниваемая величина намного превосходит основание, получаемое отношение лучше выразить в коэффициентах. Например, преступность за определённый период (в годах) увеличилась в 2,6 раза. Выражение в разах в данном случае будет показательнее, чем в процентах. В процентах относительные величины выражаются тогда, когда величина сравнения не сильно отличается от базы.

Относительные величины, применяемые в статистике, в том числе и правовой, бывают разных видов. В правовой статистике применяются следующие виды относительных величин:

1. отношения, характеризующие структуру совокупности, или отношения распределения;

2. отношения части к целому, или отношения интенсивности;

3. отношения, характеризующие динамику;

4. отношения степени и сравнения.

Относительная величина распределения - это относительная величина, выражаемая в процентах отдельных частей совокупности изученных явлений (преступлений, преступников, гражданских дел, исков, причин, мер предупреждения и т.д.) к их общему итогу, принимаемому за 100% . Это - самый распространенный (и простой) вид относительных данных, применяемых в статистике. Это, например, структура преступности (по видам преступлений), структура судимости (по видам преступлений, по возрасту осужденных) и т.д.

статистический анализ абсолютная величина

Отношение интенсивности (отношение части к целому) - обобщающая относительная величина, которая отражает распространенность определенного признака в наблюдаемой совокупности.

Самый распространенный показатель интенсивности, применяемый в правовой статистике - интенсивности преступности. Интенсивность преступности обычно отражается посредством коэффициента преступности, т.е. числа преступлений на 100 или 10 тыс. жителей.

КП= (П*100000)/Н

где П - абсолютное число учтенных преступлений, Н - абсолютная численность населения.

Обязательное условие, определяющее саму возможность вычисления таких показателей, как было сказано выше - все используемые абсолютные показатели берутся на одной территории и за один промежуток времени.

Отношения, характеризующие динамику , представляют собой обобщающие относительные величины, показывающие изменение во времени тех или иных показателей правовой статистики . За временной интервал обычно принимается год.

За основание (базу), равное 1, или 100%, принимаются сведения об изучаемом признаке определенного года, который был чем-то характерен для изучаемого явления. Данные базового года выполняют роль неподвижной базы, к которой процентируются показатели последующих лет.

Задачи статистического анализа часто требуют ежегодных (или по иным периодам) сопоставлений, когда за базу принимаются данные каждого предыдущего года (месяца или другого периода). Подобная база называется подвижной . Обычно это используется при анализе временных рядов (рядов динамики).

Отношения степени и сравнения позволяют сопоставлять различные показатели в целях выявления, какая величина насколько больше другой, в какой мере одно явление отличается от другого или схоже с ним, что имеется общего и отличительно в наблюдаемых статистических процессах и т.д.

Индекс - это специально созданный относительный показатель сравнения (во времени, пространстве, при сравнении с прогнозом и т.д.), показывающий, во сколько раз уровень изучаемого явления в одних условиях отличается от уровня того же явления в других условиях. Наиболее распространены индексы в экономической статистике, хотя они играют определенную роль и при анализе правовых явлений.

Без индексов не обойтись в случаях, когда необходимо сопоставить несоизмеримые показатели, простое суммирование которых невозможно. Поэтому обычно индексы определяют как числа-показатели для измерения средней динамики совокупности разнородных элементов .

В статистике индексы обычно обозначают буквой I (i). Прописная буква или заглавная - зависит от того, идет ли речь об индивидуальном (частном) индексе или он общем.

Индивидуальные индексы (i) отражают отношение показателя текущего периода к соответствующему показателю сравниваемого периода.

Сводные индексы используются при анализе соотношения сложных социально-экономических явлений и состоят из двух частей: собственно индексируемой величины и соизмерителя ("веса").

2. Средние величины и их применение в правовой статистике

Результатом обработки абсолютных и относительных показателей является построение рядов распределения. Ряд распределения - это упорядоченные по качественным или количественным признакам распределения единиц совокупности . Анализ этих рядов лежит в основе любого статистического анализа, каким бы сложным в дальнейшем он не оказался.

Ряд распределения может быть построен на основании качественных или количественных признаков. В первом случае он называется атрибутивным , во втором - вариационным . При этом различия количественного признака называется вариацией , а сам этот признак - вариантой . Именно с вариационными рядами чаще всего приходится иметь дело правовой статистике.

Вариационный ряд всегда состоит из двух колонок (граф). В одной указывается значение количественного признака в порядке возрастания, которые, собственно, и называют вариантами, которые обозначаются x . В другой колонке (графе) указывается число единиц, которые свойственны той или иной варианте. Они называются частотами и обозначаются латинской буквой f .

Таблица 2.1

Варианта x
Частота f

Частота проявления того или иного признака очень важна при вычислении других значимых статистических показателей, а именно - средних и показателей вариации.

Вариационные ряды, в свою очередь, могут быть дискретными или интервальными . Дискретные ряды, как следует из названия, построены на основании дискретно варьирующих признаков, а интервальными - на основании непрерывных вариаций. Так, например, распределение правонарушителей по возрасту может быть как дискретным (18, 19,20 лет и т.д.), так и непрерывным (до 18 лет, 18-25 лет, 25-30 лет и т.д.). Причем сами интервальные ряды могут строиться как по дискретному, так и по непрерывному принципу. В первом случае границы смежных интервалов не повторяются; в нашем примере интервалы будут выглядеть так: до 18 лет, 18-25, 26-30, 31-35 и т.д. Такой ряд называется непрерывный дискретный ряд . Интервальный ряд с непрерывной вариацией предполагает совпадение верхней границы предыдущего интервала с нижней границей последующей.

Самый первый показатель, описывающий вариационные ряды - это средние величины . Они играют важную роль в правовой статистике, поскольку только с их помощью можно охарактеризовать совокупности по количественному варьирующему признаку, по которому можно их сравнивать. С помощью средних величин можно сравнивать интересующие нас совокупности юридически значимых явлений по тем или иным количественным признакам и делать из этих сравнений необходимые выводы.

Средние величины отражают самую общую тенденцию (закономерность ), присущую всей массе изучаемых явлений. Она проявляется в типичной количественной характеристике, т.е. в средней величине всех имеющихся (варьирующих) показателей.

Статистикой разработано много видов средних величин: средняя арифметическая, геометрическая, кубическая, гармоническая и т.д. Однако в правовой статистике они практически не применяются, поэтому мы будем рассматривать только два вида средние - среднюю арифметическую и среднюю геометрическую.

Самая распространенная и хорошо известная средняя - это средняя арифметическая . Для ее расчета высчитывается сумма показателей и делится на общее число показателей. Например, семья из 4-х человек состоит из родителей возрастом 38 и 40 лет и двоих детей возрастом 7год и 10 лет. Мы суммируем возраст: 38+40+7+10 и полученную сумму 95 делим на 4. Полученный средний возраст семьи - 23,75 года. Или рассчитаем среднемесячную нагрузку следователей, если в отделе из 8 человек за месяц раскрыто 25 дел. Делим 25 на 8 и получаем 3,125 дела в месяц на следователя.

В правовой статистике средняя арифметическая используется при расчете нагрузки сотрудников (следователей, прокуроров, судей и т.д.), расчете абсолютного прироста преступности, расчете выборки и т.д.

Однако в приведенным примере среднемесячная нагрузка на следователя рассчитана неверно. Дело в том, что простая средняя арифметическая не учитывает частоту изучаемого признака. В нашем примере среднемесячная нагрузка на следователя столь же корректна и информативна, как "средняя температура по больнице" из известного анекдота, которая, как известно, комнатная. Для того, чтобы при расчете средней арифметической учитывать частоту проявлений изучаемого признака, используется так средняя арифметическая взвешенная илисредняя для дискретных вариационных рядов. (Дискретный вариационный ряд - последовательность изменения признака по дискретным (прерывистым) показателям).

Средняя арифметическая взвешенная (средняя взвешенная) не имеет принципиальных отличий от простой средней арифметической. В ней суммирование одного и того же значения заменено умножением этого значения на его частоту, т.е. в этом случае каждое значение (варианта) взвешивается по частоте встречаемости.

Так, вычисляя по среднюю нагрузку следователей, мы должны умножим число дел на число следователей, который расследовали именно такое количество дел. Обычно такие расчеты удобно представлять в виде таблиц:

Таблица 2.2

Число дел (варианта х )	Число следователей (частота f )	Произведение вариант на частоты (х f )

2. Вычислим собственно среднюю взвешенную по формуле:

где x - число уголовных дел, а f - число следователей.

Таким образом, средняя взвешенная равна не 3,125, а 4,375. Если вдуматься, то так и должно быть: нагрузка на каждого отдельного следователя возрастает за счет того, что один следователь в нашем гипотетическом отделе оказался бездельником - или, наоборот, расследовал особо важное и сложное дело. Но вопрос интерпретации результатов статистического исследования будет рассматриваться в следующей теме. В некоторых случаях, а именно - в случаях сгруппированных частот дискретного распределения - вычисление средней, на первый взгляд, неочевидно. Предположим, нам необходимо вычислить среднюю арифметическую для распределения лиц, осужденных за хулиганство, по возрасту. Распределение выглядит следующим образом:

Таблица 2.3

(варианта х )	Число осужденных (частота f )	Середина интервала	Произведение вариант на частоты (х f )
		(21-18) /2+18=19,5

Далее средняя высчитывается по общему правилу и составляет для данного дискретного ряда 23,6 года. В случае т. н. открытых рядов, то есть в ситуациях, когда крайние интервалы определяются "менее x " или "больше x ", величина крайних интервалов задается аналогично другим интервалам.

3. Ряды динамики

Общественные явления, изучаемые статистикой, находятся в постоянном развитии и изменении. Социально-правовые показатели могут быть представлены не только в статической форме, отражающей определенное явление, но и как процесс, происходящий во времени и пространстве, а также в виде взаимодействия исследуемых признаков. Иными словами, динамические ряды показывают развитие признака, т.е. его изменение во времени, пространстве или в зависимости от условий среды.

Данный ряд представляет собой последовательность средних величин в указанные периоды времени (за каждый календарный год).

Для более глубокого изучения общественных явлений и их анализа простого сопоставления уровней ряда динамики недостаточно, необходимо исчислять производные показатели ряда динамики: абсолютный прирост, темп роста, темп прироста, средние темпы роста и прироста, абсолютное содержание одного процента прироста.

Расчет показателей рядов динамики осуществляется на основе сравнения их уровней. При этом возможны два способа сопоставления уровней динамического ряда:

базисные показатели, когда все последующие уровни сравнивают с некоторым начальным, принятым за базу;

цепные показатели, когда каждый последующий уровень ряда динамики сопоставляют с предыдущим.

Абсолютный прирост показывает, на сколько единиц уровень текущего периода больше или меньше уровня базисного или предыдущего периода за конкретный промежуток времени.

Абсолютный прирост (П) исчисляется как разность между сравниваемыми уровнями.

Базисный абсолютный прирост:

П б = y i - y баз . (ф.1).

Цепной абсолютный прирост:

П ц = y i - y i -1 (ф.2).

Темп роста (Тр) показывает, во сколько раз (на сколько процентов) уровень текущего периода больше или меньше уровня базисного или предыдущего периода:

Базисный темп роста:

(ф.3)

Цепной темп роста:

(ф.4)

Темп прироста (Тпр) показывает, на сколько процентов уровень текущего периода больше или меньше уровня базисного или предыдущего периода, принятого за базу сравнения, и вычисляется как отношение абсолютного прироста к абсолютному уровню, принятому за базу.

Темп прироста можно также рассчитать путем вычитания из темпа роста 100%.

Базисный темп прироста:

или (ф.5)

Цепной темп прироста:

или (ф.6)

Средний темп роста исчисляется по формуле средней геометрической из темпов роста ряда динамики:

(ф.7)

где - средний темп роста;

- темпы роста для отдельных периодов;

n - число темпов роста.

Подобные задачи с показателем корня больше трех, как правило, решаются при помощи логарифмирования. Из алгебры известно, что логарифм корня равен логарифму подкоренной величины, деленной на показатель корня, и что логарифм произведения нескольких сомножителей равен сумме логарифмов этих сомножителей.

Таким образом, средние темпы роста исчисляются путем извлечения корня n степени из произведений индивидуальных n - цепных темпов роста. Средние темпы прироста представляют собой разность между средним темпом роста и единицей (), или 100%, когда темп роста выражен в процентах:

или

При отсутствии в динамическом ряду промежуточных уровней средние темпы роста и прироста определяются по следующей формуле:

(ф.8)

где - конечный уровень динамического ряда;

- начальный уровень динамического ряда;

n - число уровней (дат).

Очевидно, что показатели средних темпов роста и прироста, исчисленные по формулам (ф.7 и ф.8), имеют одинаковые числовые значения.

Абсолютное содержание 1% прироста показывает, какое абсолютное значение содержит 1% прироста и исчисляется как отношение абсолютного прироста к темпу прироста.

Абсолютное содержание 1% прироста:

базисные: (ф.9)

цепные: (ф.10)

Вычисление и анализ абсолютного значения каждого процента прироста способствуют более глубокому пониманию характера развития исследуемого явления. Данные нашего примера показывают, что, несмотря на колебания темпов роста и прироста за отдельные годы, базисные показатели абсолютного содержания 1% прироста остаются неизменными, в то время как цепные показатели, характеризующие изменения абсолютного значения одного процента прироста в каждом последующем году по сравнению с предыдущим, непрерывно возрастают.

При построении, обработке и анализе рядов динамики часто возникает потребность в определении средних уровней изучаемых явлений за определенные промежутки времени. Средняя хронологическая интервального ряда исчисляется при равных интервалах по формуле средней арифметической простой, при неравных интервалах - по средней арифметической взвешенной:

где - средний уровень интервального ряда;

- исходные уровни ряда;

n - число уровней.

Для моментного ряда динамики при условии равенства промежутков времени между датами исчисление среднего уровня производится по формуле средней хронологической:

(ф.11)

где - средняя хронологическая величина;

y 1 ,., y n - абсолютный уровень ряда;

n - число абсолютных уровней ряда динамики.

Средняя хронологическая из уровней моментного ряда динамики равняется сумме показателей этого ряда, деленной на число показателей без одного; при этом начальный и конечный уровни должны быть взяты в половинном размере, так как число дат (моментов) обычно бывает наединицу больше, чем число периодов.

В зависимости от содержания и формы представления исходных данных (интервальные или моментные ряды динамики, равные или нет временные интервалы) для вычисления различных социальных показателей, например, среднегодовое количество преступлений и правонарушений (по видам), среднего размера остатков оборотных средств, среднесписочного числа правонарушителей и т.п., используют соответствующие аналитические выражения.

4. Статистические методы изучения взаимосвязей

В предыдущих вопросах мы рассматривали, если можно так сказать, анализ "одномерных" распределений - вариационных рядов. Это очень важный, но далеко не единственный вид статистического анализа. Анализ вариационных рядов является основанием для более "продвинутых" видов статистического анализа, в первую очередь - для изучения взаимосвязей . В результате такого исследования вскрываются причинно-следственные отношения между явлениями, что позволяет определить, изменении каких признаков влияет на вариации изучаемых явлений и процессов. При этом признаки, обуславливающие изменение других, называются факторными (факторами), а признаки, изменяющиеся под их воздействием - результативными.

В статистической науке различают два вида связей между различными признаками и их сведениями - функциональную связь (жестко-детерминированную) и статистическую (стохастическую).

Для функциональных связей характерно полное соответствие между изменением факторного признака и изменением результативной величины. Эта взаимосвязь одинаково проявляется у всех единиц любой совокупности. Самый простой пример: повышение температуры отражается на объеме ртути в градуснике. При этом температура окружающей среды выступает в качестве фактора, а объем ртути - в качестве результативного признака.

Функциональные взаимосвязи характерны для явлений, изучаемых такими науками, как химия, физика, механика, в которых есть возможность ставить "чистые" эксперименты, при которых устраняется влияние посторонних факторов. Дело в том, что функциональная связь между двумя возможна только в том случае, если вторая величина (результативный признак) зависит только и исключительно от первой. В общественных явлениях такое наблюдается крайне редко.

Социально-правовые процессы, представляющие собой результат одновременного воздействия большого количества факторов, описываются посредством статистических связей, то есть связей стохастически (случайно ) детерминированных , когда разным значениям одной переменной соответствуют разные значения другой переменной.

Наиболее важный (и распространенный) случай стохастической зависимости - корреляционная зависимость . При такой зависимости причина определяет следствие не однозначно, а лишь с определенной долей вероятности. Выявлению таких связей посвящен отдельный вид статистического анализа - корреляционный анализ.

Основная задача корреляционного анализа - на основе строго математических приемов установить количественное выражение зависимости, существующей между исследуемыми признаками. Существует несколько подходов к тому, как именно вычисляется корреляция и, соответственно, несколько видов коэффициентов корреляции: коэффициент сопряженности А.А. Чупрова (для измерения связи между качественнымипризнаками), коэффициент ассоциации К. Пирсона, а также коэффициенты ранговой корреляции Спирмена и Кендалла. В общем случае такие коэффициенты показывают, с какой вероятностью проявляются изучаемые взаимосвязи. Соответственно, чем коэффициент выше, тем более выраженной является связь между признаками.

Между изучаемыми факторами может существовать как прямая, так и обратная корреляционная зависимость. Прямая корреляционная зависимость наблюдается в случаях, когда изменению значений фактора соответствуют такие же изменения значения результативного признака, то есть, когда увеличивается значение факторного признака, увеличивается и значение результативного, и наоборот. Например, между криминогенными факторами и преступностью существует прямая корреляционная зависимость (со знаком "+"). Если же увеличение значений одного признака вызывает обратные изменения значений другого, то такая связь называется обратной . Например, чем выше социальный контроль в обществе, тем ниже преступность (связь со знаком "-").

И прямые, и обратные связи могут быть прямолинейными и криволинейными.

Прямолинейные (линейные) связи проявляются тогда, когда с увеличением значений признака-фактора происходит возрастание (прямая) или уменьшение (обратная) величины признака-следствия. Математически такая связь выражается уравнением регрессии: у = а + b х, где у - признак-следствие; а и b - соответствующие коэффициенты связи; х - признак-фактор.

Криволинейные связи носят иной характер. Возрастание величины факторного признака оказывает неравномерное влияние на величину результирующего признака. Вначале эта связь может быть прямой, а затем - обратной. Известный пример - связь преступлений с возрастом правонарушителей. Сначала криминальная активность лиц растет прямо пропорционально увеличению возраста правонарушителей (приблизительно до 30 лет), а затем с увеличением возраста преступная активность снижается. Причем вершина кривой распределения правонарушителей по возрасту сдвинута от средней влево (к более молодому возрасту) и является асимметричной.

Корреляционные прямолинейные связи могут быть одн о факторными , когда исследуется связь между одним признаком-фактором и одним признаком-следствием (парная корреляция). Они могут быть и многофакторными, когда исследуется влияние многих взаимодействующих между собой признаков-факторов на признак-следствие (множественная корреляция).

Но, какой бы из коэффициентов корреляции не использовался, какая бы корреляция не исследовалась, установить связь между признаками, исходя только из статистических показателей, невозможно. Первоначальный анализ показателей - это всегда анализ качественный , в ходе которого изучается и уясняется социально-правовая природа явления. При этом используются те научные методы и подходы, которые характерны для отрасли науки, изучающей данное явление (социологии, права, психологии и т.д.). Затем анализ группировок и средних величин позволяет выдвинуть гипотезы, построить модели, определить тип связи и зависимости. Только после этого определяется количественная характеристика зависимости - собственно, коэффициент корреляции.

Литература

1. Аванесов Г.А. Основы криминологического прогнозирования. Учебное пособие. М.: ВШ МВД СССР, 1970.

2. Аврутин К.Е., Гилинский Я.И. Криминологический анализ преступности в регионе: методология, методика, техника. Л., 1991.

3. Адамов Е. и др. Экономика и статистика фирм: Учебник / Под ред. С.Д. Ильенковой. М.: Финансы и статистика, 2008.

4. Балакина Н.Н. Статистика: Учеб. - метод. комплекс. Хабаровск: ИВЭСЭП, филиал в г. Хабаровске, 2008.

5. Блувштейн Ю.Д., Волков Г.И. Динамические ряды преступности: Учебное пособие. Минск, 1984.

6. Боровиков В.П., Боровиков И.П. STATISTICA - Статистический анализ и обработка данных в среде Windows. М.: Информационно-издательский дом "Филинъ”, 1997.

7. Бородин С.В. Борьба с преступностью: теоретическая модель комплексной программы. М.: Наука, 1990.

8. Вопросы статистики // Ежемесячный научно-информационный журнал Госкомстата РФ.М., 2002-2009 гг.

9. Гусаров В.М. Статистика: Учеб. пособие для вузов. М.: ЮНИТИ-ДАНА, 2009.

10. Добрынина Н.В., Нименья И.Н. Статистика: Учеб. - метод. пособие. СПб.: СПбГИЭУ, 2009.

11. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник для вузов / Под ред.И. И. Елисеевой.4-е изд. М.: Финансы и статистика, 1999.

12. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник. - М.: Финансы и статистика, 1995.

13. Еремина Т., Матятина В., Плущевская Ю. Проблемы развития секторов российской экономики // Вопросы экономики. 2009. № 7.

14. Ефимова М.Р., Ганченко О.И., Петрова Е.В. Практикум по общей теории статистики: Учеб. пособие.2-е изд., перераб. и доп. М.: Финансы и статистика, 2009.

15. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. - М.: ИНФРА-М, 1998.

16. Кириллов Л.А. Криминологическое изучение и предупреждение преступности органами внутренних дел М., 1992.

17. Косоплечев Н.П., Методы криминологического исследования. М., 1984.

18. Ли Д.А. Преступность в России: системный анализ. М., 1997.

19. Ли Д.А. Уголовно-статистический учет: структурно-функциональные закономерности. М.: Информационно-издательское агентство "Русский мир”, 1998.

20. Макарова Н.В., Трофимец В.Я. Статистика в Excel: Учеб. пособие. М.: Финансы и статистика, 2009.

21. Нестеров Л.И. Новые веяния в статистике национального богатства // Вопросы статистики. 2008. № 11.

22. Петрова Е.В. и др. Практикум по статистике транспорта: Учеб. пособие. М.: Финансы и статистика, 2008.

23. Преступность в России в девяностых годах и некоторые аспект законности и борьбы с нею. М., 1995.

24. Преступность, статистика, закон // Под ред. проф. А.И. Долговой. М.: Криминологическая ассоциация, 1997.

25. Ростов К.Т. Преступность в регионах России (социально-криминологический анализ). СПб.: СПб академия МВД России, 1998.

26. Руководство для переписчика о порядке проведения Всероссийской переписи населения 2002 года и заполнения переписных документов. М.: ПИК "Офсет", 2003.

27. Савюк Л.К. Правовая статистика: Учебник. М.: Юристъ, 1999.

28. Салин В.Н., Шпаковская Е.П. Социально-экономическая статистика: Учебник для вузов. М.: Гарданика Юрист, 2008.

29. Сиденко А.В., Попов Г.Ю., Матвеева В.М. Статистика: Учебник. М.: Дело и Сервис, 2008.

30. Социальная профилактика правонарушений: советы, рекомендации // Под ред. Д.А. Керимова. М., 1989.

31. Социальная статистика: Учебник для вузов // Под ред. И.И. Елисеевой. 3-е изд. М.: Финансы и статистика, 2009.

Размещено на Allbest.ru

Подобные документы

Рассмотрение основных методов статистического анализа. Исследование Кунгурского муниципального района. Проведение расчетов по показателям ежегодника. Анализ демографии и социально-экономического развития данного района по результатам применения.

курсовая работа , добавлен 24.06.2015

Средняя величина – свободная характеристика закономерностей процесса в тех условиях, в которых он протекает. Формы и методы расчета средних величин. Применение средних величин на практике: расчет дифференциации заработной платы по отраслям экономики.

курсовая работа , добавлен 04.12.2007

Статистические методы анализа разводов. Статистический анализ разводов в Амурской области. Анализ динамики и структуры разводов. Группировка городов и районов Амурской области по количеству разводов за год. Расчет средних величин и показателей вариации.

курсовая работа , добавлен 12.04.2014

Аспекты статистического анализа обеспеченности жильем. Применение статистических методов для анализа обеспеченности жильем населения. Анализ однородности совокупности районов по коэффициенту демографической нагрузки. Корреляционно-регрессионный анализ.

курсовая работа , добавлен 18.01.2009

Организация государственной статистики в России. Требования, предъявляемые к собираемым данным. Формы, виды и способы статистического наблюдения. Подготовка статистического наблюдения. Ошибки статистического наблюдения. Методы контроля за статистикой.

реферат , добавлен 02.12.2007

Разработка программы наблюдения уголовно-правовой статистики, ее основные этапы и предъявляемые требования, методы и порядок реализации. Определение состояния преступности в исследуемом районе. Правила оформления результатов статистического наблюдения.

контрольная работа , добавлен 18.05.2010

Классификация статистической документации. Виды документов: письменные, иконографические, статистические и фонетические. Методы и способы анализа материалов: неформализованные (традиционные) и формализованные. Порядок осуществления контент-анализа.

презентация , добавлен 16.02.2014

Понятие средней величины. Метод средних величин в изучении общественных явлений. Актуальность применения метода средних величин в изучении общественных явлений обеспечивается возможностью перехода от единичного к общему, от случайного к закономерному.

курсовая работа , добавлен 13.01.2009

Понятие статистического наблюдения. Анализ прямолинейных и криволинейных корреляционных связей. Знакомство с формулами и величинами статистического наблюдения. Анализ расчетов взаимосвязи индексов, построение гистограммы, элементы ряда распределения.

контрольная работа , добавлен 27.03.2012

Характеристика основных показателей статистического анализа социальной обусловленности общественного здоровья в Российской Федерации. Уровни оценки здоровья с точки зрения социальной медицины. Классификация детской части населения по группам здоровья.

Статистические методы анализа данных принято делить на две большие группы: одномерные методы статистического анализа и многомерные методы.

Одномерные методы анализа - это методы, которые применяют в случаях, если существует единый измеритель для оценки каждого элемента выборки, либо если этих измерителей несколько, каждая переменная анализируется отдельно от всех остальных . В центре внимания данных методов находится анализ средних значений и показателей вариации переменных.

Классификация одномерных методов осуществляется по характеру исходных данных (метрические или неметрические), а также по количеству и типу выборок. Так, выборки делят на зависимые (парные) - это выборки, сформированные из одной генеральной совокупности и независимые выборки - это выборки, сформированные из различных генеральных совокупностей. На практике независимыми считают выборки, сформированные из различных страт (в случае использования стратифицированной или квотной выборки), например, мужчин и женщин или групп респондентов с различным уровнем дохода.

К одномерным методам анализа данных относят:

· Методы проверки гипотез (z-критерий, t-критерий, F-критерий, χ2-критерий и т.п.).

Более подробно проверку гипотез смотри: Гмурман В. Е. Теория вероятностей и математическая статистика.

· Методы анализа статистических рядов распределения.

· Однофакторный дисперсионный анализ.

· Другие методы.

Многомерные методы анализа - это методы, которые применяют в случаях, если для оценки каждого элемента выборки используется два или больше измерителя и эти переменные анализируются одновременно . В центре внимания данной группы методов уже находятся анализ взаимосвязей, связей и сходства между переменными.

Выделяют следующие многомерные методы:

1) Методы выявления зависимости между переменными – это методы, в которых одна или несколько переменных являются зависимыми, а другие независимыми. К этой группе относят:

· корреляционно-регрессионный анализ;

· дисперсионный и ковариационный анализ;

· дискриминантный анализ;

· совместный анализ.

2) Методы выявления взаимозависимости между переменными – это методы, позволяющие группировать данные на основе сходства. В данных методах нет деления переменных на зависимые и независимые. К этой группе относят:

· кластерный анализ;

· факторный анализ;

· многомерное шкалирование.

Выбор методов анализа данных осуществляется на основе:

· цели, задач, рабочих гипотез маркетингового исследования;

· типа маркетингового исследования (поисковое или итоговое; описательное или причинно-следственное);

· типа собранных данных - метрические и неметрические переменные;

· шкал, используемых в исследовании;

· объема и метода выборки;

· метода сбора данных;

· области применения и ограничений статистических методов анализа данных.

По сути все предшествующие этапы маркетингового исследования предопределяют выбор стратегии анализа данных. Немалую роль при этом играет опыт и квалификация самого исследователя. В заключении отметим, что сложные многомерные методы статистического анализа данных используются не всегда. Очень часто исследователь ограничивается лишь предварительным (базовым) анализом данных и его графической интерпретацией.

Конечно же, необходимо помнить, что анализ данных маркетингового исследования - это не последний его этап, за ним следует разработка практических рекомендаций и формирование отчета исследования.