Какие ошибки свойственны только выборочному наблюдению

Все ошибки
подразделяются, во-первых, на ошибки
регистрации, которые свойственны любому
наблюдению (не только выборочному, но
и сплошному) и возникают по вине
наблюдателя и по вине отвечающего.
Во-вторых, на ошибки репрезентативности
свойственные только выборочному
наблюдению и представляющие собой
величину возможных расхождений между
показателями выборочной и генеральной
совокупностями. Ошибки репрезентативности
могут быть систематическими — из-за
неправильного, с нарушением научного
принципа случайности, отбора единиц. И
случайными – зависят от степени
однородности совокупности и от объема
выборки; возникают даже в том случае,
если систематические ошибки
репрезентативности устранены.

Предельная ошибка
рассчитывается по формуле:

для средней ∆x=tμx;
для доли ∆p=tμp
, где t
– коэффициент кратности (доверия), а μ
– средняя ошибка.

Коэффициент
кратности по размеру (величине) зависит
от заданной вероятности, с которой
гарантируется результат и в этой связи
берется по специальным таблицам.

В экономических
расчетах чаще всего используются
сочетания: доверительная вероятность
р=0,95 t=1,96,
р=0,954 t=2,0,
р=0,997 t=3,0.

Средняя ошибка
для:

S2
– выборочная дисперсия (дисперсия
признака выборочной совокупности)

n
– объем выборочной совокупности (число
единиц, попавших в выборку)

N
– объем генеральной совокупности (число
единиц, входящих в генеральную
совокупность.

Кроме того, в рамках
выборочного наблюдения можно определять
необходимый объем выборки, который с
практической вероятностью обеспечивает
заданную точность выборки:

15. Доверительный интервал и его исчисление.

Прежде всего
выборочное наблюдение дает возможность
определить среднюю арифметическую
выборочной совокупности и величину
предельной ошибки этой средней, которая
показывает (с определенной вероятностью)
на сколько выборочная средняя может
отличаться от генеральной средней в
большую и меньшую стороны.

Тогда величина
искомой генеральной средней находится
в доверительном интервале:

,
где

х – среднее значение
признака выборочной совокупности,

x
– предельная
ошибка средней

х – генеральная
средняя (среднее значение признака в
генеральной совокупности)

Аналогичным образом
для доли величина генеральной доли
находится в доверительном интервале:

w-∆р
≤ р ≤ w+∆р

w
– выборочна доля (доля единиц)

р
предельная ошибка доли

р — генеральная
доля (доля единиц, обладающих данным
признаком в генеральной совокупности).

16. Корреляционная зависимость и методы ее выявления.

В зависимостях
одни признаки (факторные) выступают в
качестве причин, обусловливающих
изменение других признаков (результативных).

Вообще зависимости
между признаками бывают либо функциональными
(полное соответствие между изменениями
факторного признака и изменениями
результативной величины), либо
корреляционными (нет полного соответствия,
и воздействие отдельных факторов
проявляется лишь в среднем при массовом
наблюдении факторных данных).

Корреляционная
связь – это такая связь, которая
проявляется не в каждом отдельном
случае, а в массе случаев в средних
величинах в форме тенденции.

Статистическое
исследование такой связи ставит своей
конечной целью получение модели
корреляционной зависимости для ее
практического использования.

Основной задачей
корреляционного метода является
определение по данным большого числа
наблюдений того, как с изменением
факторного признака при прочих равных
условиях меняется среднее значение
результативного признака. Эта задача
решается путем определения формы связи
и нахождения уравнения этой связи двух
или нескольких переменных.

Такая работа
осуществляется в несколько этапов: 1.
проводится логический анализ сущности
изучаемого явления и причинно-следственных
связей. В результате устанавливаются
результативный показатель (у) и факторы
его изменения (х1,
х2,
…, хn).
Связь только двух признаков у и х
называется парной корреляцией. Корреляция
бывает множественной, если на результативный
признак влияют несколько факторов. При
этом по общему направлению связи бывают
прямыми (с увеличением признака х
увеличивается и признак у) и обратными
(наоборот); 2.
устанавливается сам факт наличия и
направления корреляционной зависимости
(КЗ) между результативным и факторным
признаками. Для выявления КС либо строят
таблицу: сверху вниз по нарастающей –
значения фактора, слева направо по
нарастающей – значения результативного
признака; тогда если частоты повторения
данного сочетания факторного и
результативного признаков концентрируются
от сверху слева до вниз направо корреляция
предполагается. Либо по методу
аналитической группировки и определения
групповых средних все единицы совокупности
разбиваются на группы по величине
факторного признака и для каждой группы
определяется средняя величина
результативного признака; по этим данным
стоится график эмпирической линии связи
(линии регрессии), вид которой не только
позволяет судить о возможном наличии
связи, но и дает некоторое представление
о ее форме. 3.
измеряется степень тесноты и проводится
оценка существенности КС. Для определения
степени тесноты парной линейной
зависимости служит линейной коэффициент
корреляции:

Чем ближе значение
линейного коэффициента К (изменяется
от «-» до «+» 1) по абсолютной величине к
единице, тем связь теснее. Знак при нем
указывает направление связи: «+» —
соответствует прямой зависимости, а
«-» — обратной. 4.
после установления достаточной степени
тесноты связи выполняется построение
модели связи (уравнения регрессии).

Соседние файлы в предмете Статистика

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

Ошибки в статистике

Ошибки в статистике (сплошных и выборочных) могут возникнуть ошибки двух видов: репрезентативности и регистрации.

Ошибки репрезентативности характерны только для выборочного наблюдения и возникают в результате того, что выборочная совокупность не полностью воспроизводит генеральную. Они определяются как расхождение между значениями показателей, полученных по выборке, и значениями показателей этих же величин, которые были бы получены при проведенном сплошном наблюдении с одинаковой степенью точности.

Ошибки регистрации могут иметь случайный, систематический и непреднамеренный характер.

Случайные ошибки часто уравновешивают друг друга, так как они не имеют преимущественного направления в сторону преувеличения (преуменьшении) значения изучаемого показателя. Данные ошибки имеют объективный характер и возникают в следствии случайных различий между единицами, попавшими в выборку, и единицами генеральной совокупности. В результате и структуры этих совокупностей чаще всего не совпадают. Научным обоснованием случайных ошибок являются теория вероятностей и ее предельные теоремы.

Систематические ошибки направлены в одну сторону в результате предумышленного нарушения правил отбора. Их можно избежать при правильной организации и проведении наблюдения.

Ошибка выборки в статистике

Ошибка выборки или ошибка репрезентативности определяется как разница между значением показателя, который был получен по выборке, и генеральным параметром. Она характерна только для выборочных наблюдений. Чем больше значение этой ошибки, тем в большей степени выборочные показатели отличаются от соответствующих им генеральных показателей.

Ошибку выборки часто определяют по формулам:

1. Для среднего количественного признака:

Ошибка выборки

где первое — среднее значение признака в генеральной совокупности или генеральная средняя;
второе — выборочная средняя.

2. Для доли (альтернативного признака):

Выборочная доля

где w — выборочная доля;
р — генеральная доля, или доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности.

Ошибки выборки возникают вследствие двух причин из-за нарушения принципа случайности как основного принципа выборки (систематические ошибки) и в результате случайного отбора (случайные ошибки). Выборки являются случайными величинами и могут принимать разные значения.

Источник: Балинова B.C. Статистика в вопросах и ответах: Учеб. пособие. — М.: ТК. Велби, Изд-во Проспект, 2004. — 344 с.

2.4. Точность статистического наблюдения

Под точностью статистического наблюдения понимают степень соответствия значения наблюдаемого показателя, вычисленного по материалам обследования, его действительной величине. Расхождение, или разница, между ними называется ошибкой статистического наблюдения.

Различают две группы ошибок:

  1. ошибки регистрации;
  2. ошибки репрезентативности.

Ошибки регистрации присущи любому статистическому наблюдению, как сплошному, так и несплошному. Они делятся на случайные ошибки регистрации и систематические ошибки регистрации.

Случайными ошибками регистрации называют ошибки, возникающие вследствие действия случайных факторов. К ним можно отнести различного рода непреднамеренные описки: например, вместо возраста человека «15 лет» указано «5 лет», у Ивановой Марии Петровны в графе пол отмечен «Мужской» и т. п. Такие ошибки легко выявляются методом логического анализа, например, если человеку 8 лет, но имеется высшее образование, а в графе «Семейное положение» указано «Состоит в браке», то, естественно, следует исправить возраст. Если объем исследуемой совокупности велик или велика доля отбора при выборочном наблюдении, случайные ошибки регистрации имеют тенденцию взаимопогашаться вследствие действия закона больших чисел, поскольку ошибки, как правило, разнонаправлены и искажают статистический показатель как в большую, так и в меньшую сторону. При небольшом объеме наблюдения требуется тщательная выверка его результатов — логический анализ данных.

Систематические ошибки регистрации чаще всего имеют однонаправленные искажения: они либо увеличивают, либо уменьшают статистический показатель, и, что характерно, подобная ситуация повторяется от обследования к обследованию. Так, по результатам переписей (практически всех!) число замужних женщин превышает число женатых мужчин — мужчинам приятнее ощущать себя неженатыми, а для женщины как бы «стыдно» быть не замужем. Другой пример, когда человек округляет свой возраст — вместо 32 лет говорит 30, вместо 79-80 и т. п. (это явление широко известно и даже получило свое название — «аккумуляция возрастов»). Систематические ошибки регистрации могут возникать и из-за неточностей измерительных приборов, если сбор информации проводят путем непосредственного наблюдения.

Ошибки репрезентативности присущи только несплошному обследованию. Они также делятся на случайные и систематические ошибки.

Случайные ошибки репрезентативности возникают из-за того, что обследованию подвергается не вся совокупность в целом, а только ее часть, и, следовательно, при несплошном наблюдении они присутствуют всегда. В теории статистики разработаны специальные методы для оценки величин таких ошибок, на их основе для наблюдаемых показателей строят доверительные интервалы, т.д. эти ошибки вычисляются и находятся как бы «под контролем».

Хуже обстоит дело, если наряду со случайными ошибками имеются и ошибки систематические.

Систематические ошибки репрезентативности возникают, если при несплошном наблюдении кардинально нарушаются технологии отбора единиц из генеральной совокупности объектов, но чаще — если в ходе обследования не удается получить информацию обо всех отобранных для наблюдения единицах, например, вследствие отказа отвечать на вопросы анкеты, или если человека не удалось застать дома и т. п.

Ошибки статистического наблюдения для наглядности можно изобразить в виде схемы (рис. 2.1).

Виды ошибок статистического наблюдения

Рис.
2.1.
Виды ошибок статистического наблюдения

Для повышения точности наблюдения необходимо:

  1. правильно разработать формуляр статистического наблюдения: вопросы должны быть четкими, однозначными, не допускающими двойного толкования;
  2. иметь хорошо обученный персонал для проведения обследования;
  3. строго придерживаться выбранной технологии обследования (если проводится несплошное наблюдение) и помнить, что если не удается опросить какую-то конкретную единицу, отобранную для наблюдения, замена ее на другую единицу может привести к возникновению систематической ошибки репрезентативности;
  4. провести логический анализ данных, основанный на логических взаимосвязях показателей, после сбора всей совокупности анкет или формуляров;
  5. целесообразно провести и арифметический контроль данных, т.д. заново пересчитать расчетные величины, если какие-либо показатели получаются в результате определенных арифметических действий;
  6. предпринять определенные меры по восстановлению данных при наличии незаполненных анкет или формуляров либо при получении результатов обследования сделать поправку на неответы респондентов.

Понравилась статья? Поделить с друзьями:

Интересное по теме:

  • Какие ошибки процесса доказывания являются наиболее существенными
  • Какие ошибки присущи сплошному статистическому наблюдению тест
  • Какие ошибки присущи только несплошному наблюдению
  • Какие ошибки присущи только выборочному наблюдению
  • Какие ошибки при собеседовании

  • Добавить комментарий

    ;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: