Понятие ошибки регистрации и ошибки репрезентативности

  1. Точность статистического наблюдения. Ошибки регистрации и ошибки репрезентативности. Арифметический и логический контроль качества информации.

Точность
статистического наблюдения

называют степень соответстия величины
какого – либо показателя (значение
какого- либо признака), определенной по
материалам статистического наблюдения
действительной его величине.

Ошибки рагистрации
– отклонения значения показателя,
полученного в ходе статистического
наблюдения от фактического, действительного
его значения. Возможны как при сплошном,
так и при несплошном наблюдении. Ошибки
регистрации деляться на случайные и
систематические.

Ошибка
репрезентативности

– это отклонение значения показателя
обследований совокупности от его
величины по исходной совокупности.
Такие ошибки характерны только для
несплошного наблюдени. Возникают потому,
что отобранная и обследованная
совокупность недостаточно точно
воспроизводит (репрезентирует) всю
исходную совокупность в целом. Также
бывают случайными и систиматическими.

Чтобы устранить
обнаруженные ошибки в материалах
статистического наблюдения, производиться
контроль собранных данных первичного
учета, который осуществляеться в двух
напрвлениях:

  • Счетный, или
    арифметический контроль – заключается
    в проверке точности арифметических
    расчетов, применявшихся при составлении
    отчетности или заполнении формуляров
    статистического наблюдения;

  • Логический контроль
    – заключается в проверке ответов на
    вопросы программы наблюдения путем их
    логического осмысления или путем
    сравнения полученных данных с другими
    источниками по этому же вопросу.

  1. Виды статистического наблюдения по времени регистрации фактов: непрерывное (текущее), периодическое и единовременное.

Статистические
признаки классифицируют по 3 признакам:

    1. по времени

    2. по способу
      проведения

    3. по полноте охвата

По времени наблюдения
различают:

  1. текущие наблюдения
    – сбор данных, который проводиться
    постоянно, т.к. данные фиксируются по
    мере их возникновения.

  2. периодическое
    наблюдение – это сбор данных через
    равные промежутки времени

  3. единовременное
    наблюдение – это сбор данных, который
    проводиться время от времени без
    закономерности определения.

  1. Виды статистического наблюдения по охвату единиц совокупности: сплошное, выборочное, основного массива, монографическое.

Статистические
признаки классифицируют по 3 признакам:

    1. по времени

    2. по способу
      проведения

    3. по полноте охвата

По полноте охвата
различают:

  1. сплошное наблюдение
    – это сбор данных о всех единицах
    совокупности.

  2. несплошное
    наблюдение – это сбор данных не о всех
    единицах совокупности. (выборочное
    анкетирование)

  3. монографическое
    наблюдение или монографическое
    обследование – это подробное описание
    отдельных единиц наблюдения в
    статистической совокупности.

  4. обследование
    основного массива – это наблюдение за
    частью наиболее крупных единиц, которые
    преобладают в исследованной совокупности.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

2.4. Точность статистического наблюдения

Под точностью статистического наблюдения понимают степень соответствия значения наблюдаемого показателя, вычисленного по материалам обследования, его действительной величине. Расхождение, или разница, между ними называется ошибкой статистического наблюдения.

Различают две группы ошибок:

  1. ошибки регистрации;
  2. ошибки репрезентативности.

Ошибки регистрации присущи любому статистическому наблюдению, как сплошному, так и несплошному. Они делятся на случайные ошибки регистрации и систематические ошибки регистрации.

Случайными ошибками регистрации называют ошибки, возникающие вследствие действия случайных факторов. К ним можно отнести различного рода непреднамеренные описки: например, вместо возраста человека «15 лет» указано «5 лет», у Ивановой Марии Петровны в графе пол отмечен «Мужской» и т. п. Такие ошибки легко выявляются методом логического анализа, например, если человеку 8 лет, но имеется высшее образование, а в графе «Семейное положение» указано «Состоит в браке», то, естественно, следует исправить возраст. Если объем исследуемой совокупности велик или велика доля отбора при выборочном наблюдении, случайные ошибки регистрации имеют тенденцию взаимопогашаться вследствие действия закона больших чисел, поскольку ошибки, как правило, разнонаправлены и искажают статистический показатель как в большую, так и в меньшую сторону. При небольшом объеме наблюдения требуется тщательная выверка его результатов — логический анализ данных.

Систематические ошибки регистрации чаще всего имеют однонаправленные искажения: они либо увеличивают, либо уменьшают статистический показатель, и, что характерно, подобная ситуация повторяется от обследования к обследованию. Так, по результатам переписей (практически всех!) число замужних женщин превышает число женатых мужчин — мужчинам приятнее ощущать себя неженатыми, а для женщины как бы «стыдно» быть не замужем. Другой пример, когда человек округляет свой возраст — вместо 32 лет говорит 30, вместо 79-80 и т. п. (это явление широко известно и даже получило свое название — «аккумуляция возрастов»). Систематические ошибки регистрации могут возникать и из-за неточностей измерительных приборов, если сбор информации проводят путем непосредственного наблюдения.

Ошибки репрезентативности присущи только несплошному обследованию. Они также делятся на случайные и систематические ошибки.

Случайные ошибки репрезентативности возникают из-за того, что обследованию подвергается не вся совокупность в целом, а только ее часть, и, следовательно, при несплошном наблюдении они присутствуют всегда. В теории статистики разработаны специальные методы для оценки величин таких ошибок, на их основе для наблюдаемых показателей строят доверительные интервалы, т.д. эти ошибки вычисляются и находятся как бы «под контролем».

Хуже обстоит дело, если наряду со случайными ошибками имеются и ошибки систематические.

Систематические ошибки репрезентативности возникают, если при несплошном наблюдении кардинально нарушаются технологии отбора единиц из генеральной совокупности объектов, но чаще — если в ходе обследования не удается получить информацию обо всех отобранных для наблюдения единицах, например, вследствие отказа отвечать на вопросы анкеты, или если человека не удалось застать дома и т. п.

Ошибки статистического наблюдения для наглядности можно изобразить в виде схемы (рис. 2.1).

Виды ошибок статистического наблюдения

Рис.
2.1.
Виды ошибок статистического наблюдения

Для повышения точности наблюдения необходимо:

  1. правильно разработать формуляр статистического наблюдения: вопросы должны быть четкими, однозначными, не допускающими двойного толкования;
  2. иметь хорошо обученный персонал для проведения обследования;
  3. строго придерживаться выбранной технологии обследования (если проводится несплошное наблюдение) и помнить, что если не удается опросить какую-то конкретную единицу, отобранную для наблюдения, замена ее на другую единицу может привести к возникновению систематической ошибки репрезентативности;
  4. провести логический анализ данных, основанный на логических взаимосвязях показателей, после сбора всей совокупности анкет или формуляров;
  5. целесообразно провести и арифметический контроль данных, т.д. заново пересчитать расчетные величины, если какие-либо показатели получаются в результате определенных арифметических действий;
  6. предпринять определенные меры по восстановлению данных при наличии незаполненных анкет или формуляров либо при получении результатов обследования сделать поправку на неответы респондентов.

Как мы уже знаем, репрезентативность — свойство выборочной совокупности представлять характеристику генеральной. Если совпадения нет, говорят об ошибке репрезентативности — мере отклонения статистической структуры выборки от структуры соответствующей генеральной совокупности. Предположим, что средний ежемесячный семейный доход пенсионеров в генеральной совокупности составляет 2 тыс. руб., а в выборочной — 6 тыс. руб. Это означает, что социолог опрашивал только зажиточную часть пенсионеров, а в его исследование вкралась ошибка репрезентативности. Иными словами, ошибкой репрезентативности называется расхождение между двумя совокупностями — генеральной, на которую направлен теоретический интерес социолога и представление о свойствах которой он хочет получить в конечном итоге, и выборочной, на которую направлен практический интерес социолога, которая выступает одновременно как объект обследования и средство получения информации о генеральной совокупности.

Наряду с термином «ошибка репрезентативности» в отечественной литературе можно встретить другой — «ошибка выборки». Иногда они употребляются как синонимы, а иногда «ошибка выборки» используется вместо «ошибки репрезентативности» как количественно более точное понятие.

Ошибка выборки — отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности.

На практике ошибка выборки определяется путем сравнения известных характеристик генеральной совокупности с выборочными средними. В социологии при обследованиях взрослого населения чаще всего используют данные переписей населения, текущего статистического учета, результаты предшествующих опросов. В качестве контрольных параметров обычно применяются социально-демографические признаки. Сравнение средних генеральной и выборочной совокупностей, на основе этого определение ошибки выборки и ее уменьшение называется контролированием репрезентативности. Поскольку сравнение своих и чужих данных можно сделать по завершении исследования, такой способ контроля называется апостериорным, т.е. осуществляемым после опыта.

В опросах Института Дж. Гэллапа репрезентативность контролируется по имеющимся в национальных переписях данным о распределении населения по полу, возрасту, образованию, доходу, профессии, расовой принадлежности, месту проживания, величине населенного пункта. Всероссийский центр изучения общественного мнения (ВЦИОМ) использует для подобных целей такие показатели, как пол, возраст, образование, тип поселения, семейное положение, сфера занятости, должностной статус респондента, которые заимствуются в Государственном комитете по статистике РФ. В том и другом случае генеральная совокупность известна. Ошибку выборки невозможно установить, если неизвестны значения переменной в выборочной и генеральной совокупностях.

Специалисты ВЦИОМ обеспечивают при анализе данных тщательный ремонт выборки, чтобы минимизировать отклонения, возникшие на этапе полевых работ. Особенно сильные смещения наблюдаются по параметрам пола и возраста. Объясняется это тем, что женщины и люди с высшим образованием больше времени проводят дома и легче идут на контакт с интервьюером, т.е. являются легко достижимой группой по сравнению с мужчинами и людьми «необразованными»35.

Ошибка выборки обусловливается двумя факторами: методом формирования выборки и размером выборки.

Ошибки выборки подразделяются на два типа — случайные и систематические. Случайная ошибка — это вероятность того, что выборочная средняя выйдет (или не выйдет) за пределы заданного интервала. К случайным ошибкам относят статистические погрешности, присущие самому выборочному методу. Они уменьшаются при возрастании объема выборочной совокупности.

Второй тип ошибок выборки — систематические ошибки. Если социолог решил узнать мнение всех жителей города о проводимой местными органами власти социальной политике, а опросил только тех, у кого есть телефон, то возникает предумышленное смещение выборки в пользу зажиточных слоев, т.е. систематическая ошибка.

Таким образом, систематические ошибки — результат деятельности самого исследователя. Они наиболее опасны, поскольку приводят к довольно значительным смещениям результатов исследования. Систематические ошибки считаются страшнее случайных еще и потому, что они не поддаются контролю и измерению.

Они возникают, когда, например:

  1. выборка не соответствует задачам исследования (социолог решил изучить только работающих пенсионеров, а опросил всех подряд);
  2. налицо незнание характера генеральной совокупности (социолог думал, что 70% всех пенсионеров не работает, а оказалось, что не работает только 10%);
  3. отбираются только «выигрышные» элементы генеральной совокупности (например, только обеспеченные пенсионеры).

Внимание! В отличие от случайных ошибок систематические ошибки при возрастании объема выборки не уменьшаются.

Обобщив все случаи, когда происходят систематические ошибки, методисты составили их реестр. Они полагают, что источником неконтролируемых перекосов в распределении выборочных наблюдений могут быть следующие факторы:

  • нарушены методические и методологические правила проведения социологического исследования;
  • выбраны неадекватные способы формирования выборочной совокупности, методы сбора и расчета данных;
  • произошла замена требуемых единиц наблюдения другими, более доступными;
  • отмечен неполный охват выборочной совокупности (недополучение анкет, неполное их заполнение, труднодоступность единиц наблюдения).

Намеренные ошибки социолог допускает редко. Чаще ошибки возникают из-за того, что социологу плохо известна структура генеральной совокупности: распределение людей по возрасту, профессии, доходам и т.д.

Систематические ошибки легче предупредить (по сравнению со случайными), но их очень трудно устранить. Предупреждать систематические ошибки, точно предвидя их источники, лучше всего заранее — в самом начале исследования.

Вот некоторые способы избежать ошибок выборки:

  • каждая единица генеральной совокупности должна иметь равную вероятность попасть в выборку;
  • отбор желательно производить из однородных совокупностей;
  • надо знать характеристики генеральной совокупности;
  • при составлении выборочной совокупности надо учитывать случайные и систематические ошибки.

Если выборочная совокупность (или просто выборка) составлена правильно, то социолог получает надежные результаты, харастеризующие всю генеральную совокупность. Если она составлена неправильно, то ошибка, возникшая на этапе составления выборки, на каждом следующем этапе проведения социологического исследования приумножается и достигает в конечном счете такой величины, которая перевешивает ценность проведенного исследования. Говорят, что от такого исследования больше вреда, нежели пользы.

Подобные ошибки могут произойти только с выборочной совокупностыо. Чтобы избежать или уменьшить вероятность ошибки, самый простой способ — увеличивать размеры выборки (в идеале до объема генеральной: когда обе совокупности совпадут, ошибка выборки вообще исчезнет). Экономически такой метод невозможен. Остается другой путь — совершенствовать математические методы составления выборки. Они то и применяются на практике. Таков первый канал проникновения в социологию математики. Второй канал — математическая обработка данных.

Особенно важной проблема ошибок становится в маркетинговых исследованиях, где используются не очень большие выборки. Обычно они составляют несколько сотен, реже — тысячу респондентов. Здесь исходным пунктом расчета выборки выступает вопрос об определении размеров выборочной совокупности. Численность выборочной совокупности зависит от двух факторов:

  1. стоимости сбора информации,
  2. стремления к определенной степени статистической достоверности результатов, которую надеется получить исследователь.

Конечно, даже не искушенные в статистике и социологии люди интуитивно понимают, что чем больше размеры выборки, т.е. чем ближе они к размерам генеральной совокупности в целом, тем более надежны и достоверны полученные данные. Однако выше мы уже говорили о практической невозможности сплошных опросов в тех случаях, когда они проводятся на объектах, численность которых превышает десятки, сотни тысяч и даже миллионы. Понятно, что стоимость сбора информации (включающая оплату тиражирования инструментария, труда анкетеров, полевых менеджеров и операторов по компьютерному вводу) зависит от той суммы, которую готов выделить заказчик, и слабо зависит от исследователей. Что же касается второго фактора, то мы остановимся на нем чуть подробнее.

Итак, чем больше величина выборки, тем меньше возможная ошибка. Хотя необходимо отметить, что при желании увеличить точность вдвое вам придется увеличить выборку не в два, а в четыре раза. Например, чтобы сделать в два раза более точной оценку данных, полученных путем опроса 400 человек, вам потребуется опросить не 800, а 1600 человек. Впрочем, вряд ли маркетинговое исследование испытывает нужду в стопроцентной точности. Если пивовару необходимо узнать, какая часть потребителей пива предпочитает именно его марку, а не сорт его конкурента, — 60% или 40%, то на его планы никак не повлияет разница между 57%, 60 или 63%.

Ошибка выборки может зависеть не только от ее величины, но и от степени различий между отдельными единицами внутри генеральной совокупности, которую мы исследуем. Например, если нам нужно узнать, какое количество пива потребляется, то мы обнаружим, что внутри нашей генеральной совокупности нормы потребления у различных людей существенно различаются (гетерогенная генеральная совокупность). В другом случае мы будем изучать потребление хлеба и установим, что у разных людей оно различается гораздо менее существенно {гомогенная генеральная совокупность). Чем больше различия (или гетерогенность) внутри генеральной совокупности, тем больше величина возможной ошибки выборки. Указанная закономерность лишь подтверждает то, что нам подсказывает простой здравый смысл. Таким образом, как справедливо утверждает В. Ядов, «численность (объем) выборки зависит от уровня однородности или разнородности изучаемых объектов. Чем более они однородны, тем меньшая численность может обеспечить статистически достоверные выводы».

Определение объема выборки зависит также от уровня доверительного интервала допустимой статистической ошибки. Здесь имеются в виду так называемые случайные ошибки, которые связаны с природой любых статистических погрешностей. В.И. Паниотто приводит следующие расчеты репрезентативной выборки с допущением 5%-ной ошибки:
Это означает,что если вы, опросив, предположим, 400 человек в районном городе, где численность взрослого платежеспособного населения составляет 100 тыс. человек, выявили, что 33% опрошенных покупателей предпочитают продукцию местного мясокомбината, то с 95%-ной вероятностью можете утверждать, что постоянными покупателями этой продукции являются 33+5% (т.е. от 28 до 38%) жителей этого города.

Можно также воспользоваться расчетами института Гэллапа для оценки соотношения размеров выборки и ошибки выборки.

   Расхождение между действительными значениями изучаемых величин и значениями, установленными в процессе статистического наблюдения, и называют ошибкой наблюдения. Ошибки являются следствием неточности при установлении и регистрации значений изучаемых признаков.
   В зависимости от причин возникновения различают следующие виды ошибок:
   1) ошибки регистрации;
   2) ошибки репрезентативности (представительности);
   3) случайные ошибки;
   4) систематические ошибки;
   5) преднамеренные ошибки;
   6) непреднамеренные ошибки.
   Ошибки регистрации — это отклонения между значением показателя, полученным в ходе статистического наблюдения, и фактическим, действительным его значением. Этот вид ошибок возникает при сплошном и несплошном наблюдениях.
   Ошибки репрезентативности (представительности) — собственное расхождение величины изучаемого признака в отобранной части совокупности и во всей совокупности. Ошибки репрезентативности свойственны только несплошному наблюдению.
   Случайная ошибка — это результат действия различных случайных факторов, оговорок при ответах, описок, неправильности измерения. Случайные ошибки действуют как в направлении увеличения, так и в направлении уменьшения значений изучаемых признаков.
   При достаточно большой обследуемой совокупности в результате действия закона больших чисел эти ошибки взаимно погашаются.
   Систематические ошибки регистрации всегда имеют одинаковую тенденцию либо к увеличению, либо к уменьшению значения показателей по каждой единице наблюдения, и поэтому величина показателя по совокупности в целом будет включать в себя накопленную ошибку. Систематические ошибки могут появляться в результате несовершенства измерительных приборов, неправильности округлений результатов, неясной формулировки программы.
   Преднамеренные и непреднамеренные ошибки определяются степенью тенденциозности подхода к установлению факта. Преднамеренные ошибки выражаются в сознательном искажении значений признаков. Непреднамеренные ошибки возникают независимо от сознания людей, участвующих в статистическом наблюдении.
   Для выявления ошибок наблюдения применяют следующие виды контроля:
   1) счетный контроль. Заключается в проверке итогов подсчета данных, а также в использовании количественных связей между показателями;
   2) логический контроль. Осуществляется путем проверки содержательной связи между значениями признаков. При логическом контроле отыскиваются недопустимые отклонения значений признака от наиболее вероятных.

20. Понятие о выборочном наблюдении

Выборочное наблюдение — это такое наблюдение, при котором обследованию подвергается часть единиц изучаемой совокупности, отобранных на основе научно разработанных принципов, обеспечивающих получение достаточного количества достоверных данных для характеристики совокупности в целом.
   Основные принципы выборочного наблюдения следующие: случайность отбора наблюдаемого явления; репрезентативность выборки.
   В основе принципа случайности лежит равная возможность для каждой единицы попасть в выборку. Репрезентативные выборки обеспечивают достаточным числом отобранных единиц. Средние и относительные показатели, полученные на основе выборочных данных, должны достаточно полно воспроизводить или представлять соответствующие показатели совокупности в целом.
   Выборочное наблюдение предполагает проведение таких этапов, как:
   1) определение объекта и целей выборочного наблюдения;
   2) выбор схемы отбора единиц наблюдения;
   3) расчет объема выборки;
   4) проведение случайного отбора установленного числа единиц из генеральной совокупности;
   5) наблюдение отобранных единиц по установленной программе;
   6) расчет выборочных характеристик в соответствии с программой выборочного наблюдения;
   7) определение ошибки, ее размера;
    8) распространение выборочных данных на генеральную совокупность;
   9) анализ полученных данных.
   Выборочное наблюдение имеет следующие основные преимущества и недостатки:
   1) преимущества:
   а) его можно осуществить по более широкой программе;
   б) его требует меньше затрат на проведение;
   в) его организуют в тех случаях, когда невозможно воспользоваться отчетностью;
   2) недостатки:
   а) полученные данные всегда содержат ошибку;
   б) о результатах наблюдения можно судить лишь с определенной степенью достоверности.
   Вся совокупность единиц, из которых производится отбор, называется генеральной совокупностью. Часть единиц генеральной совокупности, отобранная в случайном порядке, составляет выборочную совокупность. Характеристиками генеральной и выборочной совокупности служат доля и средняя величина, а также дисперсия и среднее квадратическое отклонение. Средняя величина является характеристикой количественных признаков, а дол я — характеристикой альтернативных признаков.
   Среднее значение признака генеральной совокупности называется генеральной средней, обозначается , выборочной совокупности — выборочной средней, обозначается .
   Доля генеральной совокупности называется генеральной долей и обозначается р, доля выборочной совокупности называется выборочной долей и обозначается w. Численность генеральной совокупности обозначается N, а численность выборочной — n.

12. Ошибки выборочного наблюдения

Ошибка выборки — расхождение между характеристиками выборки и характеристиками генеральной совокупности. Она зависит от ряда факторов: степени вариации изучаемого признака, численности выборки, методов отбора единиц в выборочную совокупность, принятого уровня достоверности результата исследования. Ошибка выборки состоит из ошибки регистрации и ошибки репрезентативности, которые бывают систематическими и случайными.
   

Конец бесплатного ознакомительного фрагмента

Ошибки в статистике

Ошибки в статистике (сплошных и выборочных) могут возникнуть ошибки двух видов: репрезентативности и регистрации.

Ошибки репрезентативности характерны только для выборочного наблюдения и возникают в результате того, что выборочная совокупность не полностью воспроизводит генеральную. Они определяются как расхождение между значениями показателей, полученных по выборке, и значениями показателей этих же величин, которые были бы получены при проведенном сплошном наблюдении с одинаковой степенью точности.

Ошибки регистрации могут иметь случайный, систематический и непреднамеренный характер.

Случайные ошибки часто уравновешивают друг друга, так как они не имеют преимущественного направления в сторону преувеличения (преуменьшении) значения изучаемого показателя. Данные ошибки имеют объективный характер и возникают в следствии случайных различий между единицами, попавшими в выборку, и единицами генеральной совокупности. В результате и структуры этих совокупностей чаще всего не совпадают. Научным обоснованием случайных ошибок являются теория вероятностей и ее предельные теоремы.

Систематические ошибки направлены в одну сторону в результате предумышленного нарушения правил отбора. Их можно избежать при правильной организации и проведении наблюдения.

Ошибка выборки в статистике

Ошибка выборки или ошибка репрезентативности определяется как разница между значением показателя, который был получен по выборке, и генеральным параметром. Она характерна только для выборочных наблюдений. Чем больше значение этой ошибки, тем в большей степени выборочные показатели отличаются от соответствующих им генеральных показателей.

Ошибку выборки часто определяют по формулам:

1. Для среднего количественного признака:

Ошибка выборки

где первое — среднее значение признака в генеральной совокупности или генеральная средняя;
второе — выборочная средняя.

2. Для доли (альтернативного признака):

Выборочная доля

где w — выборочная доля;
р — генеральная доля, или доля единиц, обладающих данным значением признака в общем числе единиц генеральной совокупности.

Ошибки выборки возникают вследствие двух причин из-за нарушения принципа случайности как основного принципа выборки (систематические ошибки) и в результате случайного отбора (случайные ошибки). Выборки являются случайными величинами и могут принимать разные значения.

Источник: Балинова B.C. Статистика в вопросах и ответах: Учеб. пособие. — М.: ТК. Велби, Изд-во Проспект, 2004. — 344 с.

Понравилась статья? Поделить с друзьями:

Интересное по теме:

  • Понятие ошибки обвинения
  • Понятие юридических ошибок и их свойства
  • Понять ошибку синоним
  • Понятность речи примеры ошибок
  • Понятие ошибки квантования

  • Добавить комментарий

    ;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: