Критерии оценки сочинений и изложений
Критерии оценки сочинений и изложений
Сочинения и изложения – основные формы проверки умения правильно и последовательно излагать мысли, уровня речевой подготовки учащихся.
Сочинения и изложения в 5-9 классах проводятся в соответствии с требованиями раздела программы «развитие навыков связной речи».
Примерный объект текста для подробного изложения: в 5 классе – 100-150 слов, в 4 классе – 150-200 слов, в 7 классе –200 –250 слов, в 8 классе – 250-350, в 9-350-450 слов
Объем текстов итоговых контрольных подробных изложений в 8 и 9 классах может быть увеличен на 50 слов в связи с тем, что на таких уроках не проводится подготовительная работа.
Рекомендуется следующий примерный объем классных сочинений:
К указанному объему сочинений учитель должен относиться как к примерному, так как объем ученического сочинения зависит от обстоятельств, в частности от стиля и жанра сочинения, характера темы и замысла, темпа письма учащихся, их общего развития.
С помощью сочинений и изложений проверяются: 1). Умение раскрывать тему; 2). Умение использовать языковые средства в соответствии со стилем, темой и задачей высказывания; 3). Соблюдение языковых норм и правил правописания.
Любое сочинение и изложение оценивается двумя отметками: первая ставится за содержание и речевое оформление, вторая – за грамотность, т.е. за соблюдение орфографических, пунктуационных и языковых норм. Обе оценки считаются оценками по русскому языку, за исключением случаев, когда проводится работа, проверяющая знания учащихся по литературе. В этом случае первая оценка (за содержание и речь) считается оценкой по литературе.
Содержание сочинения и изложения оценивается по следующим критериям:
- соответствие работы ученика теме и основной мысли;
полнота раскрытия темы;
правильность фактического материала;
последовательность изложения.
При оценке речевого оформления сочинений и изложений учитывается:
разнообразие словаря и грамматического строя речи;
стилевое единство и выразительность речи;
число речевых недочетов.
Грамотность оценивается по числу допущенных учеником ошибок – орфографических, пунктуационных и грамматических.
Оценка
Содержание и речь
Грамотность
«5»
— Содержание работы полностью соответствует теме
— Фактические ошибки отсутствуют
— Содержание излагается последовательно
— Работа отличается богатством словаря, разнообразием используемых синтаксических конструкций, точностью словоупотребления
— Достигнуто стилевое единство и выразительность текста
— В целом в работе допускается 1 недочет в содержании и 1-2 речевых недочета
Допускается:
— орфографическая, или 1 пунктуационная, или 1 грамматическая ошибка
«4»
— Содержание работы в основном соответствует теме (имеются незначительные отклонения от темы)
— Содержание в основном достоверно, но имеются единичные фактические неточности
— имеются незначительные нарушения последовательности в изложении мыслей
— лексический и грамматический строй речи достаточно разнообразен, отличается единством и достаточной выразительностью
— Стиль работы отличается единством и достаточной выразительностью
— В целом в работе допускается не более 2 недочетов в содержании и не более 3-4 речевых недочетов
Допускается:
2 орфографические и 2 пунктуационные, или1 орфографическая и 3 пунктуационные ошибки, или 4 пунктуационные ошибки при отсутствии орфографических ошибок, а также 2 грамматические ошибки
«3»
— В работе допущены существенные отклонения от темы
— Работа достоверна в главном, но в ней имеются отдельные фактические неточности
— Допущены отдельные нарушения последовательности изложения
— Беден словарь и однообразны употребляемые синтаксические конструкции, встречается неправильное словоупотребление
-Стиль работы не отличается единством, речь недостаточно выразительна
В целом в работе допускается не более 4 недочетов в содержании и не более 5 речевых недочетов
Допускается:
4 орфографические и 4 пунктуационные ошибки, или 3 орфографические ошибки и 5 пунктуационных ошибок, или 7 пунктуационных при отсутствии орфографических ошибок (в V классе-5 орфографических и 4 пунктуационные ошибки), а также 4 грамматические ошибки
«2»
— Работа не соответствует теме
— Допущено много фактических неточностей
— Нарушена последовательность изложения мыслей во всех частях работы, отсутствует связь между ними, работа не соответствует плану
— Крайне беден словарь, работа написана короткими однотипными предложениями со слабовыраженной связью между ними, часты случаи неправильного словоупотребления
— Нарушено стилевое единство текста
В целом в работе допущено более 6 недочетов в содержании и до 7 недочетов речевых
Допускается:
7 орфографических и 7 пунктуационных ошибок, или 6 орфографических и 8 пунктуационных ошибок, 5 орфографических и 9 пунктуационных ошибок, 8 орфографических и 6 пунктуационных ошибок, а также 7 грамматических ошибок
Примечания.
При оценке сочинения необходимо учитывать самостоятельность, оригинальность замысла ученического сочинения, уровень его композиционного и речевого оформления. Наличие оригинального замысла, его хорошая реализация позволяют повысить первую оценку за сочинение на один балл.
Если объем сочинения в полтора-два раза больше указанного в настоящих нормах, то при оценке работы следует исходить их нормативов, увеличенных для отметки «4» на одну, а для отметки «3» на две единицы. Например, при оценке грамотности «4» ставится при трех орфографических, двух пунктуационных и двух грамматических ошибках или при соотношениях: 2-3-2, 2-2-3; «3» ставится при соотношениях: 6-4-4, 4-6-4, 4-4-6. при выставлении оценки «5» превышение объема сочинения не принимается во внимание.
Первая оценка (за содержание и речь) не может быть положительной, если не раскрыта тема высказывания, хотя по остальным показателям оно написано удовлетворительно.
На оценку сочинения и изложения распространяются положения об однотипных и негрубых ошибках, а также о сделанных учеником исправлениях, приведенные в разделе «Оценка диктантов».
Ф — фактическая ошибка или неточность.
[ ] — Лишняя часть (лишнее слово, выражение)
V — Пропуск
Z — Не выделен абзац
Z — Не оправдано выделен абзац
— Нарушен порядок слов
< — Недостаточно сказано, надо расширить, развернуть
# — Не соответствует основной мысли сочинения
УСЛОВНЫЕ ГРАФИЧЕСКИЕ ОБОЗНАЧЕНИЯ
С – недочеты в содержании
Р – речевые недочеты
I – орфографические ошибки
V – пунктуационные ошибки
Г- грамматические ошибки
Выставление оценок:
С-Р 0-2 «4»I- V- Г 4-3-1 «3»
Г1 – ошибочное словообразование (ветелинар, раздумчивый взгляд)
Г2 – ошибочное формообразование (в кине пил кофей, нет время).
Г3 – ошибка в согласовании (недорослями называют молодых людей, плохо воспитанными родителями).
Г4 – нарушение видо – временной относительности глагольных форм (мальчик сидел за столом и раскрашивал картинки)
Г5 – ошибки в управлении (не дождусь до отъезда, всматриваюсь на лицо)
Г6 – нарушение согласования между подлежащими и сказуемыми (крестьянство страдали от гнета)
Г7 – ошибки в употреблении причастных оборотов (узкая дорожка была покрыта проваливающимся снегом под ногами).
Г8 – ошибки в употреблении деепричастных оборотов (покатавшись на катке, болят ноги. На картинке изображен мальчик, широко расставив ноги и упершись руками в колени)
Г9 – ошибки в построении предложений с однородными членами (эта книга научила меня честности, смелости и уважать друзей)
Г10 – ошибки в построении сложного предложения (машина пришла, то нужно ехать)
Г11 – ошибка в смешении прямой и косвенной речи (Игорь сказал, что хочу свою голову положить либо напиться шлемом из Дона)
Г12 – пропуски необходимых слов (Владик кое – как прибил доску и побежал в волейбол)
Г13 – нарушение границ предложения (охотник положил ружье, привязал собаку. И пошел к зверю).
ГРАММАТИЧЕСКИЕ ОШИБКИ И ВИДИМЫ И СЛЫШИМЫ
Речевые недочеты
М – неправильное употребление местоимения (я вынула книгу из сумки и положила ее на стол) (книгу или сумку?)
П — неоправданное повторение одного и того же слова (недавно прочла интересную книгу. В этой книге рассказывается о подвиге молодогвардейцев).
Л – неправильное употребление слова в несвойственном значении (чтобы быть грамотным и с большим жаргоном словом, надо много читать)
Р1 – нарушение лексической сочетаемости (пожилая лошадь, дешевые цены, коричневые глаза)
Р2 – употребление лишнего дублирующего слова (плеоназм) (прилетели пернатые птицы, старый старик, молодой юноша)
Р3 – употребление рядом однокоренных слов (тавтология) (в рассказе «Муму» рассказывается)
Р4 – употребление слов иной стилевой окраски (земляника подлизывается к ревизору)
Р5 – неудачное употребление экспрессивного, эмоционально –окрашенного средства (у Олега Кошевого были дружки – Иван Зелепухов и Сережа Пеголепин)
Р6 – неоправданное употребление диалектных и просторечных слов. (на пришкольном участке мы выращиваем картофель, морковь и бураки)
Р7 – смешение лексики разных исторических эпох (на картине Васнецова богатыри одеты в кольчуги, брюки, варежки)
Р8 – бедность и однообразие синтаксических конструкций (мужчина был одет в прожженный ватник. Ватник был грубо заштопан. Сапоги были почти новые. Носки изъедены молью)
Р9 – неудачный порядок слов
(есть немало произведений, повествующих о детстве автора в мировой литературе.)
Нормы оценок
Отметка «5» – без ошибок.Отметка «4» – 1 грубая и 1-2 негрубые ошибки.
Отметка «3» – 2-3 грубые и 1-2 негрубые ошибки или 3 и более негрубых ошибки.
Отметка «2» – 4 и более грубых ошибки.
Работа, состоящая из задач
Отметка «5» – без ошибок.
Отметка «4» –1-2 негрубые ошибки.
Отметка «3» –1 грубая и 3-4 и более негрубых ошибки.
Отметка «2» – 2 и более грубых ошибки.
Комбинированная работа:
Отметка «5» – без ошибок.
Отметка «4» – 1 грубая и 1-2 негрубые ошибки, при этом грубых ошибок не должно быть в задаче.
Отметка «3» – 2-3 грубые и 3-4 негрубые ошибки, при этом ход решения должен быть верным.
Отметка «2» – 4 и более грубых ошибки.
Контрольный устный счет:
Отметка «5» – без ошибок.
Отметка «4» – 1-2 ошибки.
Отметка «3» – 3-4 ошибки.
Отметка «2» – 5 и более ошибок.
Грубые ошибки:
1.Вычислительные ошибки в примерах и задачах.
2.Ошибки на незнание порядка выполнения арифметических действий.
3. Неправильное решение задачи (пропуск действия, неправильный выбор действий, лишние действия).
4. Не решена до конца задача или пример.
5. Невыполненное задание.
Негрубые ошибки:
1. Нерациональный прием вычислений.
2. Неправильная постановка вопроса к действию при решении задачи.
3. Неверно сформулированный ответ задачи.
4. Неправильное списывание данных (чисел, знаков).
5. Не доведение до конца преобразований.
За грамматические ошибки, допущенные в работе, оценка по математике не снижается.
За неряшливо оформленную работу, несоблюдение правил каллиграфии оценка по математике снижается на 1 балл, но не ниже «3».
2. ОЦЕНКА ПИСЬМЕННЫХ РАБОТ ПО РУССКОМУ ЯЗЫКУ.
2.1. ДИКТАНТ.
Объем диктанта:
1-й класс – 15-17 слов.
2-й класс – 1-2 четверть – 25-35 слов.
3-4 четверть – 35-52 слова.
3-й класс – 1-2 четверть – 45-53 слова.
3-4 четверть – 53-73 слова.
4-й класс – 1-2 четверть – 58-77 слов.
3-4 четверть – 76-93 слова.
Отметка «5» – за работу, в которой нет ошибок.
Отметка «4» – за работу, в которой допущено 1-2 ошибки.
Отметка «3» – за работу, в которой допущено 3-5 ошибок.
Отметка «2» – за работу, в которой допущено более 5 ошибок.
Учет ошибок в диктанте:
1. Повторная ошибка в одном и том же слове считается за 1 ошибку (например, ученик дважды в слове «песок» написал вместо «е» букву «и»).
2. Ошибки на одно и то же правило, допущенные в разных словах, считаются как две ошибки (например, ученик написал букву «т» вместо «д» в слове «лошадка» и букву «с» вместо «з» в слове «повозка»).
Ошибкой считается:
1. Нарушение орфографических правил при написании слов, включая ошибки на пропуск, перестановку, замену и вставку лишних букв в словах.
2. Неправильное написание слов, не регулируемых правилами, круг которых очерчен программой каждого класса (слова с непроверяемыми написаниями).
3. Отсутствие знаков препинания, изученных в данный момент в соответствии с программой; отсутствие точки в конце предложения не считается за ошибку, если следующее предложение написано с большой буквы.
Примечание:
2 исправления считаются за 1 ошибку.
Примечание.
При оценке контрольной работы учитывается в первую очередь правильность ее выполнения.
При оценивании работы учитель принимает во внимание каллиграфический навык.
При оценивании работы принимается во внимание не только количество, но и характер ошибок. Например, ошибка на невнимание в меньшей мере влияет на оценку, чем ошибки на изученное правило, в особенности на давно изученные орфограммы.
2.2. ГРАММАТИЧЕСКОЕ ЗАДАНИЕ.
Отметка «5» – без ошибок.
Отметка «4» – правильно выполнено не менее 3/4 заданий.
Отметка «3» – правильно выполнено не менее 1/2 заданий
Отметка «2» – правильно выполнено менее 1/2 заданий.
2.3. КОНТРОЛЬНОЕ СПИСЫВАНИЕ
Отметка «5» – за безукоризненно выполненную работу, в которой нет исправлений.
Отметка «4» – за работу, в которой допущена 1 ошибка и 1-2 исправления.
Отметка «3» – за работу, в которой допущены 2-3 ошибки и 1-2 исправления.
Отметка «2» – за работу, в которой допущены 4 и более ошибок.
2.4. СЛОВАРНЫЙ ДИКТАНТ
Объем: 2-й класс – 8-10 слов. 3-й класс – 10-12 слов. 4-й класс – 12-15 слов. |
Отметка «5» – без ошибок. Отметка «4» – 1 ошибка и 1 исправление. Отметка «3» – 2 ошибки и 1 исправление. Отметка «2» – 3-5 ошибок. |
3. СОЧИНЕНИЕ И ИЗЛОЖЕНИЕ.
Любое сочинение и изложение оценивается двумя отметками: первая ставится за содержание и речевое оформление (соблюдение языковых норм и правил выбора стилистических средств), вторая—за соблюдение орфографических и пунктуационных норм.
Обе оценки считаются оценками по русскому языку, за исключением случаев, когда проводится работа, проверяющая знания учащихся по литературе. В этом случае первая оценка (за содержание и речь) считается оценкой по литературе.
3.1. ИЗЛОЖЕНИЕ.
Отметка за содержание и речевое оформление:
Отметка «5» – правильно и последовательно воспроизведен авторский текст.
Отметка «4» – незначительно нарушена последовательность изложения мыслей, имеются единичные (1-2) фактические и речевые неточности.
Отметка «3» – имеются некоторые отступления от авторского текста, допущены отдельные нарушения в последовательности изложения мыслей, в построении 2-3 предложений, беден словарь.
Отметка «2» – имеются значительные отступления от авторского текста, пропуск важных эпизодов, главной части, основной мысли и др., нарушена последовательность изложения мыслей, отсутствует связь между частями, отдельными предложениями, крайне однообразен словарь.
Отметка за соблюдение орфографических и пунктуационных норм:
Отметка «5» – нет речевых и орфографических ошибок, допущено 1 исправление.
Отметка «4» – имеются 1-2 орфографические ошибки и допущено 1 исправление.
Отметка «3» – имеются 3-6 орфографические ошибки и 1-2 исправления.
Отметка «2» – имеются более 6 орфографических ошибок.
3.2. СОЧИНЕНИЕ.
Отметка за содержание и речевое оформление:
Отметка «5» – логически последовательно раскрыта тема.
Отметка «4» – незначительно нарушена последовательность изложения мыслей, имеются единичные (1-2) фактические и речевые неточности.
Отметка «3» – имеются некоторые отступления от темы, допущены отдельные нарушения в последовательности изложения мыслей, в построении 2-3 предложений, беден словарь.
Отметка «2» – имеются значительные отступления от темы, пропуск важных эпизодов, главной части, основной мысли и др., нарушена последовательность изложения мыслей, отсутствует связь между частями, отдельными предложениями, крайне однообразен словарь.
Отметка за соблюдение орфографических и пунктуационных норм:
Отметка «5» – нет речевых и орфографических ошибок, допущено 1 исправление.
Отметка «4» – имеются 1-2 орфографические ошибки и допущено 1 исправление.
Отметка «3» – имеются 3-6 орфографических ошибки и 1-2 исправления.
Отметка «2» – имеются более 6 орфографических ошибок.
КРИТЕРИИ ОЦЕНИВАНИЯ ИТОГОВОГО СОЧИНЕНИЯ (ИЗЛОЖЕНИЯ)
Loading…
Приложение 4 к письму
Рособрнадзора от №
Критерии оценивания итогового сочинения (изложения)
1. Критерии оценивания итогового сочинения организациями, реализующими образовательные программы среднего общего образования 3
1. Критерии оценивания итогового сочинения организациями, реализующими образовательные программы среднего общего образования
К проверке по критериям оценивания допускаются итоговые сочинения, соответствующие установленным требованиям:
Требование № 1. «Объем итогового сочинения»
Рекомендуемое количество слов – от 350.
Максимальное количество слов в сочинении не устанавливается. Если в сочинении менее 250 слов (в подсчёт включаются все слова, в том числе и служебные), то выставляется «незачет» за невыполнение требования № 1 и «незачет» за работу в целом (такое сочинение не проверяется по критериям оценивания).
Требование № 2. «Самостоятельнос
Итоговое сочинение выполняется самостоятельно. Не допускается списывание сочинения (фрагментов сочинения) из какого-либо источника или воспроизведение по памяти чужого текста (работа другого участника, текст, опубликованный в бумажном и (или) электронном виде, и др.).
Допускается прямое или косвенное цитирование с обязательной ссылкой на источник (ссылка дается в свободной форме). Объем цитирования не должен превышать объем собственного текста участника.
Если сочинение признано несамостоятельны
Итоговое сочинение, соответствующее установленным требованиям, оценивается по критериям:
«Соответствие теме»;
«Аргументация. Привлечение литературного материала»;
«Композиция и логика рассуждения»;
«Качество письменной речи»;
«Грамотность».
Критерии № 1 и № 2 являются основными.
Для получения «зачета» за итоговое сочинение необходимо получить «зачет» по критериям № 1 и № 2 (выставление «незачета» по одному из этих критериев автоматически ведет к «незачету» за работу в целом), а также дополнительно «зачет» по одному из других критериев.
Критерий № 1 «Соответствие теме»
Данный критерий нацеливает на проверку содержания сочинения.
Участник должен рассуждать на предложенную тему, выбрав путь ее раскрытия (например, отвечает на вопрос, поставленный в теме, или размышляет над предложенной проблемой и т.п.).
«Незачет» ставится только в случае, если сочинение не соответствует теме или в нем не прослеживается конкретной цели высказывания, то есть коммуникативного замысла. Во всех остальных случаях выставляется «зачет».
Критерий № 2 «Аргументация. Привлечение литературного материала»
Данный критерий нацеливает на проверку умения использовать литературный материал (художественные произведения, дневники, мемуары, публицистику, произведения устного народного творчества (за исключением малых жанров), другие литературные источники) для аргументации своей позиции.
Участник должен строить рассуждение, привлекая для аргументации не менее одного произведения отечественной или мировой литературы, избирая свой путь использования литературного материала; при этом он может показать разный уровень осмысления художественного текста: от элементов смыслового анализа (например, тематика, проблематика, сюжет, характеры и т.п.) до комплексного анализа произведения в единстве формы и содержания и его интерпретации в аспекте выбранной темы.
«Незачет» ставится при условии, если сочинение написано без привлечения литературного материала или в нем существенно искажено содержание произведения, или литературные произведения лишь упоминаются в работе, не становясь опорой для аргументации. Во всех остальных случаях выставляется «зачет».
Критерий № 3 «Композиция и логика рассуждения»
Данный критерий нацеливает на проверку умения логично выстраивать рассуждение на предложенную тему. Участник должен выдерживать соотношение между тезисом и доказательствами
«Незачет» ставится при условии, если грубые логические нарушения мешают пониманию смысла сказанного или отсутствует тезисно-доказате
Критерий № 4 «Качество письменной речи»
Данный критерий нацеливает на проверку речевого оформления текста сочинения.
Участник должен точно выражать мысли, используя разнообразную лексику и различные грамматические конструкции, при необходимости уместно употреблять термины.
«Незачет» ставится при условии, если низкое качество речи (в том числе речевые ошибки) существенно затрудняет понимание смысла сочинения. Во всех остальных случаях выставляется «зачет».
Критерий № 5 «Грамотность»
Данный критерий позволяет оценить грамотность выпускника.
«Незачет» ставится при условии, если на 100 слов приходится в сумме более пяти ошибок: грамматических, орфографических, пунктуационных.
Итоговое изложение пишется подробно.
К проверке по критериям оценивания допускаются итоговые изложения, соответствующие установленным требованиям:
Требование № 1.«Объем итогового изложения»
Рекомендуемое количество слов – 250-300.
Максимальное количество слов в изложении не устанавливается: участник должен исходить из содержания исходного текста.
Если в изложении менее 150 слов (в подсчёт включаются все слова, в том числе и служебные), то выставляется «незачет» за невыполнение требования № 1 и «незачет» за работу в целом (такое изложение не проверяется по критериям оценивания).
Требование № 2. «Самостоятельнос
Итоговое изложение выполняется самостоятельно. Не допускается списывание изложения из какого-либо источника (работа другого участника, исходный текст и др.).
Если изложение признано несамостоятельны
Итоговое изложение (подробное), соответствующее установленным требованиям, оценивается по критериям:
1. «Содержание изложения»;
2. «Логичность изложения»;
3. «Использование элементов стиля исходного текста»;
4. «Качество письменной речи»;
5. «Грамотность».
Критерии № 1 и № 2 являются основными.
Для получения «зачета» за итоговое изложение необходимо получить «зачет» по критериям № 1 и № 2 (выставление «незачета» по одному из этих критериев автоматически ведет к «незачету» за работу в целом), а также дополнительно «зачет» по одному из других критериев.
Критерий № 1 «Содержание изложения»
Проверяется умение участника передать содержание исходного текста.
«Незачет» ставится при условии, если участник существенно исказил содержание исходного текста или не передал его содержания. Во всех остальных случаях выставляется «зачет».
Критерий №2 «Логичность изложения»
Проверяется умение участника логично, последовательно излагать содержание исходного текста, избегать неоправданных повторов и нарушений последовательнос
«Незачет» ставится при условии, если грубые логические нарушения мешают пониманию смысла изложенного. Во всех остальных случаях выставляется «зачет».
Критерий № 3 «Использование элементов стиля исходного текста»
Проверяется умение участника сохранить в изложении отдельные элементы стиля исходного текста.
«Незачет» ставится при условии, если в изложении полностью отсутствуют элементы стиля исходного текста. Во всех остальных случаях выставляется «зачет».
Критерий № 4 «Качество письменной речи»
Проверяется умение участника выражать мысли, используя разнообразную лексику и различные речевые конструкции.
«Незачет» ставится при условии, если низкое качество речи (в том числе грубые речевые ошибки) существенно затрудняет понимание смысла изложения. Во всех остальных случаях выставляется «зачет».
Критерий № 5 «Грамотность»
Проверяется грамотность участника.
«Незачет» ставится при условии, если на 100 слов приходится в сумме более десяти ошибок: грамматических, орфографических, пунктуационных.
3. Рекомендуемые критерии оценивания итогового сочинения организациями, реализующими образовательные программы высшего образования
Данные критерии носят рекомендательный характер. Образовательная организация высшего образования вправе разработать собственные критерии оценивания итогового сочинения, в том числе на основе предложенных.
Сочинение оценивается по десяти критериям и с учетом его объема и самостоятельност
Критерии № 1 и № 2 являются основными.
Если при проверке сочинения по критерию № 1 или № 2 поставлено 0 баллов, то сочинение дальше не проверяется: по всем остальным критериям выставляется 0 баллов.
Критерии оценивания | Баллы |
К1. Соответствие теме | |
Участник раскрывает тему сочинения или в той или иной форме рассуждает на предложенную тему, выбрав убедительный путь её раскрытия (например, отвечает на вопрос, поставленный в теме, или размышляет над предложенной проблемой и т.п.), коммуникативный замысел сочинения выражен ясно. | 2 |
Участник поверхностно рассуждает на предложенную тему или рассуждает на тему, близкую к предложенной, коммуникативный замысел сочинения прослеживается. | 1 |
Сочинение не соответствует теме, и/или коммуникативный замысел сочинения не прослеживается. | 0 |
К2. Аргументация. Привлечение литературного материала | |
Участник при раскрытии темы сочинения строит рассуждение на основе произведения (произведений) отечественной или мировой литературы по собственному выбору, показывая разный уровень осмысления литературного материала: от элементов смыслового анализа (например, тематика, проблематика, сюжет, характеры и т.п.) до комплексного анализа художественного текста в единстве формы и содержания; выбор литературного произведения и аспекты его анализа оправданны с точки зрения темы; допущено не более 1 фактической ошибки, связанной со знанием литературного материала (ошибка в написании автора и названия произведения, имен персонажей и топонимов произведения, в изложении сюжетной линии, литературных и исторических фактов и т.п.) | 2 |
Участник строит рассуждение с опорой на литературный материал, но ограничивается общими высказываниями по поводу художественного произведения, и/или привлекает литературный материал не вполне уместно с точки зрения выбранной темы, и/или ограничивается простым пересказом художественного произведения, и/или допущено 2–4 фактические ошибки, связанные со знанием литературного материала. | 1 |
сочинение написано без привлечения литературного материала, или литературные произведения лишь упоминаются в работе, не становясь опорой для рассуждения, и/или сочинение содержит 5 и более фактических ошибок, связанных со знанием литературного материала. | 0 |
К3. Композиция | |
Сочинение отличается композиционной цельностью, логичностью изложения мыслей и соразмерностью частей, внутри смысловых частей нет нарушений последовательнос | 2 |
Сочинение отличается композиционной цельностью, его части логически связаны между собой, но внутри смысловых частей есть не более 2 нарушений последовательнос и/или в сочинении прослеживается композиционный замысел, но есть не более 2 нарушений композиционной связи между смысловыми частями, и/или мысль не развивается. | 1 |
Логические нарушения мешают пониманию смысла написанного, или отсутствует тезисно-доказате | 0 |
К4. Качество речи | |
Сочинение характеризуется точностью выражения мысли,, использованием разнообразной лексики и различных грамматических конструкций, уместным употреблением терминов. | 2 |
Сочинение характеризуется точностью выражения мысли, но прослеживается однообразие грамматического строя речи.
| 1 |
Низкое качество речи существенно затрудняет понимание смысла, и/ или сочинение отличается бедностью словаря и однообразием грамматического строя речи. | 0 |
К5. Оригинальность сочинения | |
Сочинение характеризуется творческим, нестандартным подходом к раскрытию темы (присутствуют интересные мысли, или неожиданные и вместе с тем убедительные аргументы, или оригинальные наблюдения и проч.) или яркостью стиля. | 1 |
В сочинении не продемонстрирова | 0 |
К6. Речевые нормы | |
Речевых ошибок нет, или допущено 1–2 речевые ошибки. | 2 |
Допущено 3–4 речевые ошибки. | 1 |
Допущено 5 и более речевых ошибок. | 0 |
К7. Орфографические нормы |
|
Орфографических ошибок нет, или допущена 1 ошибка. | 3 |
Допущено 2–3 орфографические ошибки. | 2 |
Допущено 4–5 орфографических ошибок. | 1 |
Допущено более 5 орфографических ошибок. | 0 |
К8. Пунктуационные нормы |
|
Пунктуационных ошибок нет, или допущена 1 ошибка. | 3 |
Допущено 2–3 пунктуационные ошибки. | 2 |
Допущено 4–5 пунктуационных ошибок. | 1 |
Допущено более 5 пунктуационных ошибок. | 0 |
К9. Грамматические нормы |
|
Грамматических ошибок нет, или допущена 1 грамматическая ошибка. | 2 |
Допущено 2–3 грамматические ошибки. | 1 |
Допущено 4 и более грамматических ошибок. | 0 |
К10. Фактическая точность в фоновом (не литературном) материале | |
Фактические ошибки отсутствуют. | 1 |
Допущены фактические ошибки (1 и более) в фоновом материале. | 0 |
МАКСИМАЛЬНЫЙ БАЛЛ | 20 |
Рекомендации по переводу баллов в 10-балльную шкалу
Отметка по десятибалльной системе | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
Первичный балл | 0-4 | 5-6 | 7-8 | 9-10 | 11-12 | 13-14 | 15-16 | 17 | 18 | 19 | 20 |
Итоговое изложение для лиц с ограниченными возможностями здоровья, детей-инвалидов и инвалидов может по их желанию проводиться в устной форме. Оценивание итогового изложения указанной категории участников итогового изложения проводится по двум установленным требованиям «Объем итогового изложения» и «Самостоятельнос
Оценка сочинений и изложений — Сайт учителя русского языка и литературы
ОЦЕНКА СОЧИНЕНИЙ И ИЗЛОЖЕНИЙ ПО РУССКОМУ ЯЗЫКУ
Сочинения и изложения – основные формы проверки умения правильно и последовательно излагать мысли, уровня речевой подготовки учащихся.
Сочинения и изложения в 4-8 классах проводятся в соответствии с требованиями раздела программы «Развития навыков связной речи».
Примерный объем текста для подробного изложения: в 5 классе – 100-150 слов, в 6 классе – 150-200 слов, в 7 классе – 200-2500, в 8 классе – 250-350, в 9 классе – 350-450 слов.
Объем текстов итоговых контрольных подробных изложений в 8 и 9 классов может быть увеличен на 50 слов в связи с тем, что на таких уроках не проводится подготовительная работа.
К указанному объему сочинений учитель должен относиться как к примерному, так как объем ученического сочинения зависит от многих обстоятельств, в частности от стиля и жанра сочинения, от почерка.
С помощью сочинений и изложений проверяются: 1) умение раскрывать тему; 2) умение использовать языковые средства в соответствии со стилем, темой и задачей высказывания; 3) соблюдение языковых норм и правил правописания.
Любое сочинение и изложение оценивается двумя отметками: первая ставится за содержание и речевое оформление, вторая – за грамотность, т.е. за соблюдение орфографических, пунктуационных и языковых норм. Обе оценки считаются оценками по русскому языку, за исключением случаев, когда проводится работа, проверяющая знания учащихся по литературе. В этом случае первая оценка (за содержание и речь) считается оценкой по литературе.
Содержание сочинения и изложения оценивается по следующим критериям:
соответствие работы ученика теме и основной мысли;
полнота раскрытия темы;
правильность фактического материала;
последовательность изложения.
При оценке речевого оформления сочинений и изложений учитывается:
Разнообразие словаря и грамматического строя речи;
Стилевое единство и выразительность речи;
Число речевых недочетов.
Грамотность оценивается по числу допущенных учеником ошибок – орфографических, пунктуационных и грамматических.
Оценка «5» 1. Содержание работы полностью соответствует теме.
2. Фактические ошибки отсутствуют.
3. Содержание излагается последовательно.
4. Работа отличается богатством словаря, разнообразием используемых
синтаксических конструкций, точностью словоупотребления.
5. Достигнуто стилевое единство и выразительность текста.
В целом в работе допускается 1 недочет в содержании и 1 – 2 речевых недочета.
Грамотность: допускается 1 орфографическая, или 1 пунктуационная, или 1 грамматическая ошибка.
Оценка «4» 1.Содержание работы в основном соответствует теме (имеются незначительные отклонения от темы).
2.Содержание в основном достоверно, но имеются единичные фактические неточности.
3.Имеются незначительные нарушения последовательности в изложении мыслей.
4. Лексический и грамматический строй речи достаточно разнообразен.
5.Стиль работы отличается единством и достаточной выразительностью.
В целом в работе допускается не более 2 недочетов в содержании и не более 3 – 4 речевых недочетов.
Грамотность: допускаются 2 орфографические и 2 пунктуационные ошибки, или 1 орфографическая и 3 пунктуационные ошибки, или 4 пунктуационные ошибки при отсутствии орфографических ошибок, а также 2 грамматические ошибки.
Оценка «3» 1. В работе допущены существенные отклонения от темы.
2.Работа достоверна в главном, но в ней имеются отдельные фактические неточности.
3. Допущены отдельные нарушения последовательности изложения.
4. Беден словарь и однообразны употребляемые синтаксические конструкции, встречается неправильное словоупотребление.
5. Стиль работы не отличается единством, речь недостаточно выразительна.
В целом в работе допускается не более 4 недочетов в содержании и 5 речевых недочетов.
Грамотность: допускаются 4 орфографические и 4 пунктуационные ошибки, или 3 орфографические и 5 пунктуационных ошибок, или 7 пунктуационных при отсутствии орфографических ошибок ( в 5 классе – 5 орфографических и 4 пунктуационные ошибки), а также 4 грамматичсеские ошибки.
Оценка «2» 1. Работа не соответствует теме.
2. Допущено много фактических неточностей.
3. Нарушена последовательность изложения мыслей во всех частях работы, отсутствует связь между ними, работа не соответствует плану.
4. Крайне беден словарь, работа написана короткими однотипными предложениями со слабо выраженной связью между ними, часты случаи неправильного словоупотребления.
5. Нарушено стилевое единство текста.
В целом в работе допущено 6 недочетов в содержании и до 7 речевых недочетов.
Грамотность: допускаются 7 орфографических и 7 пунктуационных ошибок, или 6 орфографических и 8 пунктуационных ошибок, 5 орфографических и 9 пунктуационных ошибок, 8 орфографических и 6 пунктуационных ошибок, а также 7 грамматических ошибок.
Оценка «1» В работе допущено более 6 недочетов в содержании и более 7 речевых недочетов.
Грамотность: имеется более 7 орфографических, 7 пунктуационных и 7 грамматических ошибок.
Примечания.
1. При оценке сочинения необходимо учитывать самостоятельность, оригинальность замысла ученического сочинения, уровень его композиционного и речевого оформления. Наличие оригинального замысла, его хорошая реализация позволяют повысить первую оценку за сочинение на один балл.
2. Если объем сочинения в полтора – два раза больше указанного в настоящих нормах, то при оценке работы следует исходить из нормативов, увеличенных для отметки «4» на одну, а для отметки «3» на две единицы. Например, при оценке грамотности «4» ставится при 3 орфографических, 2 пунктуационных и 2 грамматических ошибках или при соотношениях: 2 – 3 – 2, 2 – 2 – 3; «3» ставится при соотношениях: 6 – 4 – 4 , 4 – 6 – 4, 4 – 4 – 6. При выставлении оценки «5» превышение объема сочинения не принимается во внимание.
3. Первая оценка (за содержание и речь) не может быть положительной, если не раскрыта тема высказывания, хотя по остальным показателям оно написано удовлетворительно.
4. На оценку сочинения и изложения распространяются положения об однотипных и негрубыхошибках, а также о сделанных учеником исправлениях, приведенные в разделе «Оценка диктантов».
Нормы оценки знаний, умений, навыков
Нормы оценки знаний, умений, навыков
учащихся по русскому языку.
Оценка диктантов.
Диктант — одна из основных форм проверки орфографической и пунктуационной грамотности. Для диктантов целесообразно использовать связные тексты… Объём диктанта устанавливается:
Для 5 класса — 90-100 слов.
Для 6 класса — 100-110 слов.
Для 7 класса — 110-120 слов.
Для 8 класса — 120-150 слов.
Для 9 класса — 150-170 слов.
(При подсчете слов учитываются как самостоятельные, так и служебные слова).
Контрольный словарный диктант проверяет усвоение слов с непроверяемыми и труднопроверяемыми орфограммами. Он может состоять из следующего количества слов:
Для 5 классов.— 15 — 20.
Для 6 классов — 20 — 25.
Для 7 классов — 25 — 30.
Для 8 классов — ЗО — 35.
Для 9 классов — 35 — 40.
Диктант, имеющий целью проверку подготовки учащихся по определенной теме, должен включать основные орфограммы или пунктограммы этой темы, а также обеспечивать выявление прочности ранее приобретенных навыков.
Итоговые диктанты, проводимые в конце четверти и года, проверяют подготовку учащихся, как правило, по всем изученным темам.
Для контрольных диктантов следует подбирать такие тексты, в которых изучаемые в данной теме орфограммы и пунктограммы были бы представлены не менее 2-3 случаями. В целом количество проверяемых орфограмм и пунктограмм не должно превышать:
В 5 классе — 12 различных орфограмм и 2-3 пунктограммы.
В 6 классе — 16 различных орфограмм и 3-4 пунктограмм.
В 7 классе — 20 различных орфограмм и 4-5 пунктограмм;
В 8 классе — 24 различных орфограмм и 10 пунктограмм.
В 9 классе — 24 различных орфограмм и 15 пунктограмм.
В диктантах должно быть:
В 5 классах — не более 5 слов,
В 6-7 классах — не более 7 слов,
В 8-9 классах — не более 10 различных слов с непроверяемыми и труднопроверяемыми написаниями, правописанию которых ученики специально обучались.
До конца первой четверти (а в 5 классе — до конца первого полугодия) сохраняется объем текста, рекомендованный для предыдущего класса.
При оценке диктанта исправляются, но не учитываются орфографические и пунктуационные ошибки:
в переносе слов;
на правила, которые не включены в школьную программу;
на ещё не изученные правила;
в словах с непроверяемыми написаниями, над которыми не проводилась специальная работа;
в передаче авторской пунктуации.
Исправляются, но не учитываются описки, неправильные написания, искажающие звуковой облик слова, например: «рапотает» (вместо — работает), «дулпо» (вместо —дупло), «мемля» (вместо — земля).
При оценке диктанта важно также учитывать характер ошибки. К негрубым относятся ошибки: 1) в исключениях из правил; 2) в написании большой буквы в составных собственных наименованиях; 3) в случаях слитного и раздельного написания приставок в наречиях, образованных от существительных с предлогами, правописание которых не регулируется правилами; 4) в случаях раздельного и слитного написания НЕ с прилагательными и причастиями, выступающими в роли сказуемого; 5) в написании Ы и И после приставок; б) в случаях трудного различения НЕ и НИ (Куда он только не обращался! Куда он ни обращался, никто не мог дать ему ответ. Никто иной не…; не кто иной, как; ничто иное не… ; не что иное, как.) ; 7) в собственных именах нерусского происхождения; 8) в случаях, когда вместо одного знака препинания поставлен другой; 9) в пропуске одного из сочетающихся знаков препинания или в нарушении их последовательности.
При подсчете ошибок две негрубые считаются за одну ошибку. Необходимо учитывать также повторяемость и однотипность ошибок. Если ошибка повторяется в одном и том же слове или в корне однокоренных слов, то она считается за одну ошибку. Первые три однотипные ошибки считаются за одну, каждая следующая подобная ошибка учитывается самостоятельно.
ЗАМЕЧАНИЕ. Если в одном непроверяемом слове допущены 2 и более ошибок, то все они считаются за одну ошибку.
При наличии в контрольном диктанте более 5 поправок (исправление неверного написания на верное) оценка снижается на один балл.
Отличная оценка не выставляется при наличии трех и более исправлений. Диктант оценивается одной оценкой.
Оценка «5» выставляется за безошибочную работу, а также при наличии в ней 1 негрубой орфографической или 1 негрубой пунктуационной ошибки.
Оценка «4» выставляется при наличии в диктанте 2 орфографических и 2 пунктуационных ошибок, или 1 орфографической и 3 пунктуационных, или при отсутствии орфографических ошибок, но при 4 пунктуационных. Оценка «4» может выставляться при 3 орфографических, если среди них есть однотипные.
Оценка «3» выставляется за диктант, в котором допущены 4 орфографические и 4 пунктуационные ошибки, или 3 орфографические и 5 пунктуационных, или 7 пунктуационных ошибок при отсутствии орфографических ошибок. В 5 классе допускается выставление оценки «3» за диктант при 5 орфографических и 4 пунктуационных ошибках. Оценка «3» может быть поставлена также при наличии 6 орфографических и 6 Пунктуационных, если среди тех и других имеются однотипные и негрубые ошибки.
Оценка «2» выставляется за диктант, в котором допущено до 7 орфографических и 7 пунктуационных ошибок, или 6орфографических и 8 пунктуационных ошибок, 5 орфографических и 9 пунктуационных ошибок, 8 орфографических и 6пунктуационных ошибок.
При большем количестве ошибок диктант оценивается баллом «1». При некоторой вариативности количества ошибок, учитываемых при выставлении оценки за диктант, следует принимать во внимание предел, превышение которого не позволяет выставлять данную оценку. Таким пределом является дня оценки «4» — 2 орфографические ошибки, для оценки «3» — 4 орфографические ошибки (для 5 класса — 5 орфографических ошибок), для оценки «2» — 7 орфографических ошибок.
В комплексной контрольной работе, состоящей из диктанта и дополнительного (фонетического, лексического, орфографического, грамматического) задания, выставляются две оценки (за каждый вид работы).
ПРИМЕЧАНИЕ. Орфографические и пунктуационные ошибки, допущенные при выполнений дополнительных заданий, учитывается при выведении оценки за диктант.
При оценке контрольного словарного диктата рекомендуется руководствоваться следующим:
Оценка «5» — за диктант, в котором нет ошибок.
Оценка «4» — если допущены 1-2 ошибки.
Оценка; «3» — если допущены 3-4 ошибки.
Оценка «2» — если допущено до 7 ошибок.
«1» — при большем количестве ошибок.
Оценка сочинений и изложений.
Сочинения и изложения — основные формы проверки умения правильно и последовательно излагать мысли, уровня речевой подготовки учащихся.
Примерный объем текста для подробного изложения:
В 5 классе — 100-150 слов.
В 6 классе — 150-200 слов.
В 7 классе — 200-250 слов.
В 8 классе — 250-350 слов.
В 9 классе — 350-450 слов.
Объем текстов итоговых контрольных подробных изложений в 8 и 9 классах может быть увеличен на 50 слов в связи с тем, что на таких уроках не проводится подготовительная работа.
Рекомендуется следующий примерный объем классных сочинений:
В 5 классах — 0,5 — 1,0 страницы.
В 6 классе — 1,0 — 1,5 страницы.
В 7 классе — 1,5 — 2,0 страницы.
В 8 классе — 2,0 — 3,0 страницы.
В 9 классе — 3,0 — 4,0.
С помощью сочинений и изложений проверяются:
умение раскрывать тему;
умение использовать языковые средства в соответствии со стилем, темой и задачей высказывания;
соблюдение языковых норм и правил правописания.
Любое сочинение и изложение оценивается двумя отметками: первая ставится за содержание и речевое оформление, вторая—за грамотность, т.е. за соблюдение орфографических, пунктуационных и языковых норм. Обе оценки считаются оценками по русскому языку, за исключением случаев, когда проводится работа, проверяющая знания учащихся по литературе. В этом случае первая оценка (за содержание и речь) считается оценкой по литературе.
Сочинение и изложение должны соответствовать следующим критериям: соответствие работы ученика теме и основной мысли; полнота раскрытия темы; правильность фактического материала; описательность изложения.
В характеристике речевого оформления сочинений и изложений омечают разнообразие словаря и грамматического строя речи; стилевое единство и выразительность речи; число речевых недочетов.
Грамотность оценивается по числу допущенных учеником ошибок— орфографических, пунктуационных и грамматических. Так, для оценки «5»-допускается: 1 орфографическая, или 1 пунктуационная, или 1 грамматическая ошибка; «4»-допускается: 2 орфографические и 2 пунктуационные, или 1 орфографическая и 3 пунктуационных, или 4 пунктуационные при отсутствии орфографических, а также 2 грамматические ошибки; «3»-допускаются: 4 орфографические и 4 пунктуационные, или 3 орфографических и 5 пунктуационных, или 7 пунктуационных при отсутствии орфографических ошибок (в 5 классе — 5 орфографических и 4 пунктуационные ошибки), а также 4 грамматические ошибки; «2»-допускаются: 7 орфографических и 7 пунктуационных ошибок, или 6 орфографических и 8 пунктуационных, или 5 орфографических и 9 пунктуационных, или 8 орфографических и 6 пунктуационных ошибок, а также 7 грамматических ошибок; «1»-имеется более 7 орфографических, 7 пунктуационных, 7 грамматических ошибок.
Основные критерии оценки за содержание и речь.
Оценка «5»: Содержание работы полностью соответствует теме. Фактические ошибки отсутствуют. Содержание излагается последовательно. Работа отличается богатством словаря, разнообразием используемых синтаксических конструкций, точностью словоупотребления. Достигнуто стилевое единство и выразительность текста, В целом в работе допускается 1 недочет в содержании и 1-2 речевых недочета.
Оценка «4»: Содержание работы в основном соответствует теме (имеются незначительные отклонения от темы). Содержание в основном достоверно, но имеются единичные фактические неточности. Имеются незначительные нарушения последовательности в изложении мыслей. Лексический и грамматический строй речи достаточно разнообразен. Стиль работы отличается единством и достаточной выразительностью. В целом в работе допускается не более 2 недочетов в содержании и не более 3-4 речевых недочетов.
Оценка «3»: В работе допущены существенные отклонения от темы.• Работа достоверна в главном, но в ней имеются отдельные фактические неточности. Допущены отдельные нарушения последовательности изложения; беден словарь, и однообразны употребляемые синтаксические конструкции, встречается неправильное словоупотребление. Стиль работы не отличается единством, речь недостаточно выразительна. В целом в работе допускается не более 4 недочетов в содержании и 5 речевых недочетов.
Оценка «2»: Работа не соответствует теме. Допущено много фактических неточностей. Нарушена последовательность изложения мыслей во всех частях работы, отсутствует связь между ними, работа не соответствует плану. Крайне беден словарь, работа написана короткими однотипными предложениями со слабо выраженной связью между ними, часты случаи неправильного словоупотребления. Нарушено стилевое единство текста. В целом в работе допущено 6 недочетов в содержании и до 7 речевых недочетов.
Оценка «1»: В работе допущено более 6 недочетов в содержании и более 7 речевых недочетов.
Примечания.
При оценке сочинения необходимо учитывать самостоятельность, оригинальность замысла ученического сочинения, уровень его композиционного и речевого оформления. Наличие оригинального замысла, его хорошая реализация позволяет повысить первую оценку за сочинение на один балл.
Если объём сочинения в полтора-два раза больше указанного в настоящих нормах, то при оценке работы следует исходить из нормативов, увеличенных для отметки «4» на одну, а для отметки «3» на две единицы… При выставлении оценки «5» превышение объема сочинения не принимается во внимание.
Первая оценка (за содержание и речь) не может быть положительной, если не раскрыта тема высказывания, хотя по остальным показателям оно написано удовлетворительно.
На оценку сочинения и изложения распространяются положения об однотипных и негрубых ошибках, а также сделанных учеником исправлениях (см. раздел «Оценка диктантов»).
Оценка обучающих работ.
Обучающие работы (различные упражнения и диктанты неконтрольного характера) оцениваются более строго, чем контрольные работы.
При оценке обучающих работ учитывается:
Доля самостоятельности учащихся;
Этапы обучения;
Объем работы;
Четкость, аккуратность, каллиграфическая правильность письма.
Если возможные ошибка были; предупреждены в хода работы, оценки «5» и «4» ставятся только в том случае, когда ученик не допустил ошибок или допустил, но исправил. При этом выбор одной из оценок при одинаковом уровне грамотности и содержания определяется степенью аккуратности записи, подчеркиваний и других особенностей оформления, а также наличием или отсутствием описок.
Самостоятельные работы, выполненные без предшествовавшего анализа возможных ошибок, оцениваются по нормам для контрольных работ соответствующего или близкого вида.
Выведение итоговых оценок.
За учебную четверть и учебный год ставится итоговая оценка. Она является единой и отражает в обобщенном виде все стороны подготовки ученика по русскому языку: усвоение теоретического материала, овладение умениями, речевое развитие, уровень орфографической и пунктуационной грамотности. Итоговая оценка не должна выводиться механически, как среднее арифметическое предшествующих оценок. Решающим при её определении следует считать фактическую подготовленность ученика по всем показателям ко времени выведения этой оценки.
Однако, для того чтобы стимулировать серьезное отношение учащихся к занятиям на протяжении всего учебного года, при выведении итоговых оценок необходимо учитывать результаты их текущей успеваемости. При выведении итоговой оценки преимущественное значение придаётся оценкам, отражающим степень владения навыками (орфографическими, пунктуационными, речевыми). Поэтому итоговая оценка за грамотность не может быть положительной, если на протяжении четверти (года) большинство контрольных диктантов, сочинений, изложений за орфографическую, пунктуационную, речевую грамотностъ оценивалось баллом «2» или «1».
…Нормативы оценок за устные ответы и письменные работы учащихся 5 —11 -х классов нерусской национальности обучающихся в массовых школах по программам и учебникам для русских школ, могут увеличиваться на 1-2 ошибки, допустимые для соответствующей оценки.
Если проверять итоговое сочинение по-честному
Русский язык с этого года — единственный обязательный экзамен для всех (математику окончательно разделили), результаты ЕГЭ по русскому влияют на общий балл каждого абитуриента. И что мы видим? Критерии оценивания сочинений не позволяют объективно оценить работы. Эксперты проверяют по-разному. Очень часто баллы завышены или занижены. Результаты итогового сочинения сильно завышены. Объективности, ради которой ввели ЕГЭ, мы не получили.
Критерии оценивания ФИПИ
Вы не задумывались, почему так много курсов по подготовке к ЕГЭ по русскому организовали студенты? Если прыщавый мальчик в видеоролике говорит что-то типа: «Я сам сдал два года назад ЕГЭ на 92 балла и легко подготовлю вас на 100 баллов», — нельзя сказать, что он сильно много о себе думает или обманывает клиентов. Действительно, экзамен стал таким, что к нему может подготовить и неспециалист. Может, и не на все 100 баллов, но на 70 точно.
Подготовку студенты видят своеобразно. По тестовой части «никакой лишней теории, только то, что будет на экзамене», по сочинению «воспользуйтесь нашей базой аргументов». Словом, учат угадывать, дают списать и искренне считают это методикой работы. К «лишней теории», например, можно отнести больше половины материала по орфографии и пунктуации. А если с грамотностью вообще беда, за орфографию и пунктуацию можно не браться. На итоговом сочинении «зачёт» за грамотность ставится при пяти ошибках на 100 слов. Среднее сочинение — 300 слов. То есть можно допустить 15(!) ошибок и получить пятёрку, а при 20 ошибках — четвёрку. На ЕГЭ из 58 первичных баллов (24 из них — сочинение) только шесть даётся при полном отсутствии орфографических и пунктуационных ошибок в сочинении. Шесть, а не тридцать или хотя бы двенадцать!
Вспомните: раньше ставилось две оценки — за грамотность и за содержание. И двойка за грамотность равнялась общей двойке. А сейчас практическая грамотность даёт не более 10 процентов от 100 и потеря этих 10 процентов вообще ничем не грозит. Большую часть баллов набирают за другие заслуги. За знание теории, соблюдение этических норм, отсутствие фактических ошибок, намёк на анализ текста и т. п.
Может быть, тогда содержание работ оценивается гибко? Пусть пишут с ошибками, но показывают умение рассуждать. Опять нет. Критерии ФИПИ загоняют школьника в жёсткий шаблон сочинения. За каждую необходимую часть работы выпускник получает по баллу. При этом, разумеется, никто не старается выразить своё мнение и показать творческие способности. Все заняты сбором баллов и пишут ровно то, что требуется. А большинство критериев касается наличия определённой части сочинения, а не качества этой части. Если нужен литературный аргумент, главное, чтоб был короткий пересказ какой-то книги и хоть одно предложение, связывающее пересказ с темой работы.
Очень часто видим, что произведение выпускник не читал даже в кратком изложении, пересказ списал, немного переделав, к теме за уши притянул и даже приблизительно не понимает, о чем пишет. Но формально аргумент есть? Есть. Извольте поставить баллы. И так почти по всем пунктам. Слабые работы проверяющие обязаны оценивать высоко, если требования выполнены. Хотя бы потому что при сомнениях «решается в пользу ребёнка». Вот как высказываются эксперты о проверке письменных работ: «Ищем „с фонарём“ каждую позицию по каждому критерию. Вовсе не случайно после апелляции чаще баллы уменьшаются, а не увеличиваются».
Человеческий фактор
Положим, по поводу критериев можно спорить. Но, думаю, никто не будет спорить с тем, что работы должны оцениваться по любым принятым критериям примерно одинаково. Однако сочинения пока ещё, слава Богу, проверяют не роботы, а люди. И люди эти разные. Одни видят ошибки, другие — нет, одни добрые, другие — справедливые. Да что там. Один эксперт может ставить баллы немного по-разному, когда только приступил к работе и когда устал, когда сносное сочинение попадается среди заштампованного бреда и когда такое же по уровню сочинение оказывается в пачке сильных работ.
Сейчас эксперты возмутятся, скажут, что они лично объективны и ставят оценки строго по критериям. Да, конечно, половина работ оценена по критериям, но сравнивать честно заработанные баллы будут с баллами заниженными или (что чаще) завышенными. Вот что рассказала мне Юлия Мацкявичене: «Провожу курсы, вебинары по инициативе „Фоксфорда“ и „Российского учебника“. Я пересмотрела более 20 работ своих учеников и пришла к выводу: у экспертов нет единого мнения насчёт критериев. Могут пропустить 8(!) ошибок и поставить два балла в К8. Либо завышены баллы, либо занижены. А работа так называемого 100-балльника (регион не буду называть, догадаются) имеет массу ошибок и грамматических, и речевых. Я очень недовольна проверкой этого года, как и прошлого тоже». А вот что показывает наш опрос:
На вебинарах для преподавателей мы часто обсуждаем реальные сочинения учеников и проводим голосование: кто сколько баллов поставил бы. Мнения всегда расходятся. Часто разлёт в 3-4 балла по одному критерию. На экзамене в таких случаях перепроверяют работу, усредняют оценку, но, этого, как видим, недостаточно.
ЕГЭ превращается в лотерею, в которой зачастую выигрывают не грамотные думающие ребята, а везунчики, которые 11 лет за счет наших налогов валяли дурака, а потом за два месяца подготовились к экзамену. Нет тут ни объективности, ни справедливости, ни здравого смысла.
Пыль в глаза
На ЕГЭ оценки чаще несколько завышаются, чем занижаются. Только одному мальчику в этом году мы порекомендовали подать апелляцию, остальным советовали тихо радоваться своему везению. Но на ЕГЭ критериев много и завалить сочинение крайне сложно. 8 — 10 баллов за что-нибудь да поставят. А вот результаты итогового сочинения рождают мысли о фальсификации на уровне страны.
Каждую осень мы проверяем на сайте сотни работ, пишем, что не так, даём рекомендации. Больше чем за половину сочинений накануне экзамена даже по очень мягким критериям ФИПИ нельзя ставить зачет. Ученики не могут удержаться в рамках темы, списывают, демонстрируют полное незнание произведений. И мы видим только сочинения тех, кто вообще начал готовиться: пришёл на вебинары, прислал сочинение на бесплатную проверку. Не раз приходилось слышать/читать от пользователей, что в классе остальные вообще не готовятся. Откуда тогда 95 процентов зачётов на самом экзамене (не считая пересдач)? А оттуда, что измотанные эксперты не хотят бесплатно писать объяснения, обосновывая «незачеты», и вообще не хотят проблем. Например, таких. Прислали этой осенью скан проверенной работы, попросили совета. Учителя в группе ВК дружно сошлись на «незачёте». Потом человек, выложивший сочинение анонимно, написал мне в личку (разумеется, здесь я сохраняю анонимность): «Ситуация с этим сочинением возникла вот такая. Я проверяла его и поставила „незачёт“. Другие учителя согласились со мной. Но директор сказала, что мы над ней издеваемся. И тишина… Вскоре я узнаю, что создан новый приказ с фамилиями других проверяющих. Сочинение было отправлено на перепроверку, и теперь эта работа зачтена. Вот так. Это единственный мой „незачёт“, но остальные работы тоже очень слабые».
Если проверять итоговое сочинение по-честному, то по-честному придётся и признаться, что значительная часть выпускников вообще не может быть допущена к ЕГЭ, а следовательно, и получить аттестаты.
Об авторе: Юлия Фишман, администратор сайта уроков русского языка «Могу писать», организатор бесплатных курсов по подготовке к итоговому сочинению и ЕГЭ-сочинению.
Оценка сочинения
Сочинение по литературе в старших классах проводится, как правило, аудиторно: задача ученика — научиться самостоятельно писать сочинение без обращения к источникам информации в строго отведённое время. Сочинение пишут в тетради для творческих работ, которая хранится в учебном кабинете.
Темы сочинений становятся известны учащимся перед началом работы. Ученик выбирает одну из предложенных тем и раскрывает её на основе анализа художественного(-ых) произведения(-й) Образец комплекта тем сочинений (на примере комплекта по роману И.С. Тургенева «Отцы и дети» прилагается — файл внизу страницы).
Оценивается сочинение двумя отметками: в числителе — отметка за содержание, включающее в себя следование требованиям к объёму, соответствие теме, полноту её раскрытия, композиционную стройность, логичность, речевую грамотность; в знаменателе — отметка за грамотность с учётом количества орфографических, пунктуационных и грамматических ошибок.
В основу оценки сочинений по литературе положены следующие критерии в пределах программы данного класса:
— правильное понимание темы, глубина и полнота её раскрытия,
— верная передача фактов, объяснение событий и поведения героев исходя из идейно-эстетического содержания произведения,
— доказательность основных положений, привлечение материала, важного и существенного для раскрытия темы,
— умение делать выводы и обобщения,
— точность в цитатах и умение включать их в текст сочинения;
— соразмерность частей сочинения, логичность связей и переходов между ними;
— точность и богатство лексики, умение пользоваться изобразительными средствами языка;
— самостоятельность суждений и выводов.
Минимальный объём сочинения в расчёте на один академический час:
- в 5-6 классах – 110 слов,
- в 7-8 классах – 150 слов,
- в 9-11 классах – 200 слов.
При написании сочинения в течение двух академических часов рекомендуемый минимальный объём удваивается.
В соответствии с рекомендациями Федерального института педагогических измерений при подсчёте слов учитываются как самостоятельные, так и служебные части речи. Подсчитывается любая последовательность слов, написанных без пробела (например, «всё-таки» – одно слово, «всё же» – два слова). Инициалы с фамилией считаются одним словом (например, «М.Ю. Лермонтов» – одно слово). Любые другие символы, в частности, цифры, при подсчёте не учитываются (например, «5 лет» – одно слово). Не учитываются при подсчёте слов цитаты из текстов, если ученик имеет право в процессе написания сочинения этими текстами пользоваться. Если цитаты воспроизводятся по памяти, то учитываются при подсчёте слов наравне с остальным содержанием сочинения.
Отметка «5» ставится за сочинение
— глубоко и аргументированно раскрывающее тему, свидетельствующее об отличном знании текста произведения и других материалов, необходимых для её раскрытия, умение делать выводы и обобщения;
— стройное по композиции, логичное и последовательное в изложении мыслей;
— написанное правильным литературным языком и стилистически соответствующее содержанию;
— допускаются одна-две неточности в содержании.
Отметка «4» ставится за сочинение
— достаточно полно и убедительно раскрывающее тему с незначительными отклонениями от неё; обнаруживающее хорошее знание литературного материала и других источников по теме сочинения, умение пользоваться ими для обоснования своих мыслей, а также делать выводы и обобщения;
— логичное и последовательное в изложении содержания;
— написанное правильным литературным языком; стилистически соответствующее содержанию;
— допускаются две-три неточности в содержании, а также не более трёх-четырёх речевых недочётов.
Отметка «3» ставится за сочинение, в котором
— в основном раскрывается тема, в целом дан верный, но односторонний или недостаточно полный ответ на вопрос, сформулированный в теме, допущены отклонения от неё, или допущены отдельные ошибки в изложении фактического материала; обнаруживается недостаточное умение делать выводы и обобщения;
— материал излагается достаточно логично, но имеются отдельные нарушения последовательности выражения мыслей;
— обнаруживается удовлетворительное владение основами письменной речи; в работе имеется не более 4-5 речевых недочётов (ошибок).
Отметка «2» ставится за сочинение, которое
— не раскрывает тему, свидетельствует о поверхностном знании текста произведения, состоит из путаного пересказа отдельных событий без вывода и обобщений или из общих положений, не опирающихся на текст;
— характеризуется случайным расположением материала, отсутствием связи между частями;
— отличается бедностью словаря, наличием грубых речевых ошибок;
— по объёму менее рекомендованного минимума (в старших классах минимальный рекомендуемый объём составляет 200 слов при условии, что сочинение пишется в течение одного академического часа).
Отметка «1» ставится за сочинение
— написанное не на данную тему, свидетельствующее о полном незнании текста произведения и о неумении излагать свои мысли;
— содержащее большее число ошибок, чем это установлено для оценки «2»;
— списанное из внешнего источника.
Буквой Ф обозначается фактическая ошибка.
Буквой Р — речевая ошибка.
Буквой Л — логическая ошибка.
При проверке сочинений выставляется также вторая отметка — за грамотность.
Отметка «5» ставится при отсутствии орфографических, пунктуационных и грамматических ошибок ИЛИ при наличии одной негрубой ошибки.
Отметка «4» ставится, если ученик допустил в сумме не более 4 орфографических, пунктуационных и грамматических ошибок.
Отметка «3» ставится, если ученик допустил в сумме не более 7 орфографических, пунктуационных и грамматических ошибок.
Отметка «2» ставится при наличии не более 14 орфографических, пунктуационных и грамматических ошибок, если их плотность не превышает 5 на 100 слов.
Отметка «1» ставится при наличии 15 и более ошибок, либо если их плотность превышает 5 на 100 слов.
Отметка выше неудовлетворительной ставится только при условии, если в сочинении выдержан минимальный объём.
Знаком I обозначается орфографическая ошибка.
Знаком V обозначается пунктуационная ошибка.
Сокращение Гр. указывает на грамматическую ошибку.
2 Назад к основам: что такое ошибки переписи и как их измерить? | Исследования и планы измерения охвата при переписи 2010 года: промежуточная оценка
с определением данных. (Перечисление человека определялось данными, если сообщалось как минимум два основных элемента данных, включая имя как элемент). Вменение элементов использовалось, когда все члены домохозяйства были определены данными, но некоторые основные элементы не были указаны. Вменение всего человека использовалось, когда по крайней мере один член домохозяйства был определен данными, но по крайней мере один другой член не был.(Следовательно, любое перечисление, которое не определяется данными, приводит к вменению всего человека.) Для членов домохозяйства, для которых данные не определены, вся основная информация была вменена с использованием характеристик других членов домохозяйства. Наконец, использовались четыре типа вменения для всего домохозяйства, в зависимости от того, было ли известно количество жителей, количество жителей не было известно, но был известен статус проживания, статус проживания не был известен, но было известно, что адрес был жилой единицей, и, наконец, не было известно, был ли адрес жилой единицей.
Как обсуждалось в главе 3, результат индивидуального условно исчисленного подсчета не следует рассматривать как правильный или неправильный, а скорее следует оценивать алгоритм условного исчисления на основе его вклада в смещение и дисперсию оценочных подсчетов для различных географических областей. и демографические группы. Следовательно, вменение для всего человека и всего домохозяйства может увеличить ошибки при подсчете переписи для любых демографических и географических областей, в которых находятся данные люди. Кроме того, вменение характеристик может повлиять на качество подсчета связанных демографических групп.
На сегодняшний день были приняты два подхода к оценке общего (охвата) качества переписных счетов. Одно из мнений состоит в том, что качество переписи следует измерять отдельно по областям, оценивая процентную чистую ошибку охвата для каждой области, например, для каждого штата. Вторая точка зрения состоит в том, что качество переписи для данного домена должно измеряться вместо этого процентом ошибок переписи — под ошибкой переписи мы подразумеваем совокупность пропусков, ошибочных подсчетов, дублирования и ошибок в неправильном месте, при этом все ошибки получают одинаковое значение. масса.Эту статистику часто называют уровнем грубых ошибок переписи.
Как объяснялось в главе 1, Бюро переписи отходит от точки зрения, согласно которой первичным показателем качества переписи должна быть чистая ошибка, поскольку чистая ошибка игнорирует ошибки упущения, ошибочного подсчета и дублирования, которые уравновешиваются для некоторых уровней агрегирования. С одной стороны, такие ошибки, которые отменяются на каком-то уровне, могут способствовать ошибкам в мерах на более низком уровне, на котором они не отменяются. С другой стороны, уровень грубых ошибок переписи также является недостаточным в качестве сводного показателя, поскольку многие переписи в неправильном месте будут влиять только на более подробные агрегированные показатели.Это свидетельствует в пользу отдельной обработки ошибок в неправильном местоположении. Более того, поскольку ошибки покрытия компонентов имеют частично различные причины, важно разделить сводные данные по этим различным компонентам, чтобы их величины можно было оценить индивидуально, а не пытаться объединить их в одну меру ошибки. Эти последние два пункта служат аргументом в пользу отдельных мер четырех компонентов ошибки охвата переписи: дубликатов, ошибочных подсчетов, пропусков и переписей в неправильном месте.Кроме того, для ошибок в неправильном расположении, а не для измерения процентной ошибки, которое было бы подходящим для пропусков, ошибочных перечислений и дубликатов,
Проблемы с данными и анализом: ошибки, основные темы и потенциальные решения
Предварительные темы, которые мы представляем, основаны на наших предыдущих публикациях в этой области и несистематической оценке литературы (11, 18). Выявление этих тем представляет наши мнения с нашей собственной точки зрения; нет никаких математических доказательств того, что это лучшие темы, но они оказались полезными для нас.
Темы типов ошибок.
Было предложено множество тем или таксонов ошибок. Мы отметили ошибки, связанные с измерением, дизайном исследования, тиражированием, статистическим анализом, аналитическим выбором, смещением цитирования, смещением публикаций, интерпретацией, а также неправильным использованием или пренебрежением простой математикой (18). Мы также кратко описали тему признания ошибок недействительной (11), которую мы расширяем ниже. Другие классифицировали ошибки по стадиям исследовательского процесса. Bouter et al. (16), например, классифицировали «ненадлежащее поведение в исследованиях» по четырем областям: отчетность, сотрудничество, сбор данных и дизайн исследования.Многие элементы, относящиеся к различным темам или таксонам, пересекаются: ненадлежащее поведение одного человека в ходе исследования может быть классифицировано как статистическая ошибка другого.
Ошибки, приводящие к «неверным данным».
Мы определяем неверные данные как данные, полученные с помощью ошибочных или недостаточно качественных методов сбора, дизайна исследований или методов выборки, так что их использование для решения конкретного научного вопроса является научно необоснованным. В одном примере самооценка потребления энергии использовалась для оценки фактического потребления энергии.Этот метод включает в себя просьбу к людям вспомнить свое диетическое питание одним или несколькими способами, а затем получение оценки потребления метаболизируемой энергии на основе этих отчетов. Метод, по сравнению с объективными измерениями фактического потребления энергии, оказывается недействительным (19), а не просто «ограниченным» или «несовершенным». Ошибки измерения достаточно велики и неслучайны, поэтому они привели к последовательным и статистически значимым корреляциям в противоположном направлении от истинной корреляции для некоторых отношений.Более того, взаимосвязи между ошибками и другими факторами достаточно многочисленны и сложны, поэтому их нельзя просто исправить. Опасения по поводу этого метода были высказаны несколько десятилетий назад (20), и тем не менее его использование продолжается. Мы призвали прекратить его использование (19).
К другим распространенным примерам неверных данных относятся смешанные эффекты партии с интересующими переменными исследования (21) и неправильная идентификация или контаминация клеточной линии (22). Что касается искажения или загрязнения, данные плохи из-за неудачного проектирования и часто не подлежат восстановлению.
Плохие данные представляют собой одну из наиболее вопиющих тем ошибок, потому что обычно нет правильного способа анализа неправильных данных, и часто невозможно сделать научно обоснованные выводы по исходным интересующим вопросам. Это также может быть одной из самых сложных ошибок для классификации, поскольку она может зависеть от такой информации, как контекст, в котором используются данные, и подходят ли они для определенной цели.
Ошибки управления данными.
Ошибки управления данными, как правило, носят скорее идиосинкразический, чем систематический характер.Ошибки, которые мы видели (а иногда и делали), являются результатом не повторения чужих ошибок, а создания специальных методов обработки, хранения или иного управления данными. В одном случае группа случайно использовала переменные с обратным кодированием, сделав свои выводы противоположными тому, что подтверждали данные (23). В другом случае авторы получили неполный набор данных, потому что были пропущены целые категории данных; при исправлении качественные выводы не изменились, а количественные — более чем в 7 раз (24).Такие идиосинкразические ошибки управления данными могут возникать в любом проекте и, как и ошибки статистического анализа, могут быть исправлены путем повторного анализа данных. В некоторых случаях идиосинкразические ошибки можно предотвратить, придерживаясь контрольных списков (как предложено в ссылке 25).
Ошибки при долгосрочном хранении и совместном использовании данных могут сделать выводы неподтвержденными, поскольку данные недоступны для повторного анализа. Многие метааналитики, в том числе и мы, пытались получить дополнительную информацию об исследовании, но не смогли, потому что авторы не ответили, не смогли найти данные или не были уверены, как они рассчитали свои исходные результаты.Однажды мы попросили авторов поделиться данными из публикации с неправдоподобными базовыми дисбалансами и другими потенциальными статистическими аномалиями; они не смогли предоставить данные, и журнал отозвал статью (26). Иногда мы изо всех сил пытались найти наши собственные необработанные данные из более ранних исследований и приветствуем достижения в области управления данными, репозиториев данных и прозрачности данных.
Ошибки статистического анализа.
Ошибки статистического анализа связаны с методами, которые ненадежно подтверждают выводы.Это может произойти, если основные предположения анализа не выполняются, в расчетах используются неправильные значения, неправильно указан статистический код, выбраны неправильные статистические методы или неверно истолкован результат статистического теста, независимо от качества исходных данных. Мы написали о трех таких ошибках (11). Во-первых, неправильный анализ кластерных рандомизированных исследований (27) может неуместно и неявно предполагать независимость наблюдений. Что еще хуже, когда есть только один кластер на группу, кластеры полностью смешиваются с обработкой, что приводит к нулевым степеням свободы для проверки групповых эффектов.Это тоже привело к ретракции (28). Во-вторых, размеры эффекта для метаанализа могут неправильно обрабатывать несколько групп лечения (например, предполагать независимость, несмотря на совместное использование контрольной группы) или не использовать правильный компонент дисперсии в расчетах. В свою очередь, метааналитические оценки из этих расчетов размера эффекта могут быть неверными и иногда требуют корректировки (29). В-третьих, неуместно сравнивать номинальную значимость двух независимых статистических тестов как средство сделать вывод о дифференциальных эффектах (30).Эта «разница в номинальной значимости» [DINS (31)] ошибка иногда допускается в исследованиях с более чем одной группой, в которых окончательные измерения сравниваются с исходным уровнем отдельно для каждой группы; если одна значима, а другая нет, автор может ошибочно заключить, что эти две группы различны. Мы отметили и попытались исправить ошибки DINS (например, ссылки 32 и 33).
Влияние этих ошибок на выводы может быть серьезным. Однако, когда эффекты лечения неправильно анализируются, мы часто не можем сразу сказать, что выводы ложны, а, скорее, мы можем сказать, что анализ ненадежен для статистических выводов и выводов.Для решения проблемы необходимо связаться с авторами и редакторами (например, ссылка 28). В других случаях выводы могут быть заведомо неверными. Если в исследовании допущена ошибка DINS и точечные оценки каждой группы идентичны, очевидно, что соответствующий межгрупповой тест не будет статистически значимым. К счастью, природа статистических ошибок такова, что, если авторы и журналы желают, а лежащие в основе данные неплохие, то ошибки анализа можно исправить. К сожалению, исправление ошибок часто требует сложного процесса, который подчеркивает ограничения самокорректирующейся природы науки (11).
Ошибки в логике.
Исследование, отфильтрованное через призму плохой логики, хотя и не является ошибкой данных или анализа, может исказить выводы, что приведет к выводам, которые не вытекают из данных, анализа или фундаментальных предпосылок.
В литературе появляются классические логические заблуждения. « Cum hoc, ergo propter hoc » (с этим, следовательно, из-за этого; общий из данных поперечного сечения) и « post hoc, ergo propter hoc » (после этого, следовательно, из-за этого; общий с продольными данными ) являются двумя примерами логических ошибок, которые предполагают, что наблюдаемые ассоциации являются достаточным доказательством причинной связи.Предположение, что причинно-следственная связь основана на данных наблюдений, является обычным явлением (34, 35). В некоторых случаях в статьях тщательно описываются ассоциации, а не формулировки причинно-следственной связи, например: «По оценкам, диетические факторы связаны со значительной долей смертей от болезней сердца, инсульта и диабета 2 типа» (36). Однако последующая шумиха в СМИ или сообщения авторов могут поддаться этим заблуждениям [например, «Кризис питания нашей страны: около 1000 смертей от сердечно-сосудистых заболеваний и диабета каждый день (!) Из-за плохого питания» (37)].
Аргументы, основанные на авторитете, репутации и доводах ad hominem , также распространены. Эти аргументы могут быть сосредоточены на характеристиках авторов, уровне журнала или престиже авторских институтов, чтобы укрепить или опровергнуть исследование. В одном из примеров аргументации ad hominem автор был пренебрежительно идентифицирован только как «консультант химической промышленности с конкурирующими интересами», чтобы пассивно отклонить аргументы, в то время как они также исходили из авторитета и репутации, отрицательно противопоставляя аргументы других авторов аргументам. «Независимые научные организации» (38).Авторитет и репутация могут служить полезными эвристиками для принятия повседневных решений; использование их для подтверждения или опровержения качества доказательств в опубликованных статьях не имеет отношения к науке.
Другие логические заблуждения очевидны в литературе, но одна из них, которая связывает другие воедино, утверждает, что выводы, сделанные на основе ошибочных исследований, являются ложными — это «заблуждение». Идентификация ошибки в статье или рассуждения не может использоваться для того, чтобы сказать, что выводы неверны; скорее, мы можем только сказать, что выводы ненадежны до дальнейшего анализа.
Ошибки связи.
Ошибки связи не обязательно влияют на данные и методы, но являются недостатками в логике, используемой для связи результатов с выводами. В простейшем случае общение может быть чрезмерным — экстраполяция выходит за рамки того, что нам может сказать исследование. Авторы, обсуждая преимущества и ограничения испытаний на животных при прогнозировании риска рака у человека, отметили: «Проблема испытаний на животных заключается в том, что результаты испытаний на животных часто неправильно экстраполируются на людей» (39).Они рассказывают об исследованиях, в которых дозировки, применяемые для животных, были на порядок больше, чем ожидалось для людей. В одном исследовании животным вводили дозу даминозида (регулятора роста растений), для получения которого человеку потребовалось бы потреблять «28 000 фунтов яблок в день в течение 10 лет» — ошибки экстраполяции как по видам, так и по дозировке.
Другие формы ошибочной экстраполяции очевидны. Исследование реакции на небольшие, однодневные воздействия может быть неуместным для экстраполяции на хронические воздействия (как показано в исх.40). Влияние на такие результаты, как потребление энергии, линейно экстраполируется на изменение веса (41), несмотря на то, что энергетический баланс является динамической нелинейной системой (42). Связи эпидемиологических исследований экстраполируются на действия общественного здравоохранения (43). В случае экстраполяции исследование может быть идеально выполнено в рамках имеющихся ограничений, но не поддерживает заявленные выводы. Эти ошибки можно определить путем более тщательного анализа данных и методов, что, по общему признанию, может быть обременительным и сложным.
Предубеждения в отношении публикаций, отчетности и цитирования — это другие формы ошибок коммуникации, которые могут привести к некорректной форме данных при рассмотрении коллекции научных отчетов как самих данных. Если ученые не могут опубликовать некоторые результаты по какой-либо причине, то совокупность данных, используемых для обобщения наших научных знаний (например, метаанализа), является неполной.
P-hacking и связанные с ним практики (44) [например, степени свободы исследователя (45) и p-fiddling (46), среди других названий] представляют собой форму выборочной отчетности и также могут считаться ошибками статистического анализа.В большинстве случаев не существует единого, общепризнанного метода анализа определенного набора данных, поэтому попытка проведения нескольких анализов может считаться с научной точки зрения целесообразной для проверки надежности результатов. Однако p-hacking использует значение P из анализа как правило, по которому выбирается конкретный анализ, а не уместность самого анализа, часто без полного раскрытия того, как было выбрано это значение P . Выводы сомнительны, потому что «нераскрытая гибкость в сборе и анализе данных позволяет представить что-либо как значимое» (45).Ярким примером является публикация явно весьма статистически значимых результатов в «Библейском коде», которые позже были опровергнуты как вариант p-hacking (9).
Темы содействующих факторов.
Ученые — люди; мы делаем ошибки и ошибочно догадываемся, иногда из самых лучших побуждений. Научные процессы призваны ограничить эти человеческие слабости, но люди по-прежнему сообщают о выводах, полученных с помощью ошибочных методов, данных или интерпретаций. Иногда ошибки становятся очевидными только со временем и улучшением технологий.Понимание и определение того, что способствует ошибкам, которые затуманивают научные процессы, может стать ключом к повышению надежности научных результатов.
Незнание.
Очевидной способствующей темой является простое незнание, будь то отдельное лицо, исследовательская группа, рецензент, редакторы или другие. Хотя мы и другие специалисты каталогизировали и опубликовали существование ошибок, это только подтверждает, что ошибки известны нам и научному сообществу в целом, но не обязательно каждому человеку.Другими словами, эти ошибки являются «известными неизвестными»: ошибками, известными науке, но не конкретному ученому. В нашем общении с исследовательскими группами, которые, по нашему мнению, допустили статистические ошибки, реакция часто вызывает удивление, потому что они не знали об ошибках или последствиях аналитического выбора или выбора дизайна исследования.
Плохие примеры в литературе могут сами по себе увековечить невежество. Подверженность любым ошибкам, которые мы представили выше, без надлежащего и многократного исправления может привести к тому, что ученый будет полагать, что статья, методы и логика были правильными; в конце концов, он прошел экспертную оценку и остается неисправленным.Эффективная рецензия после публикации может быть особенно полезной для смягчения незнания за счет использования таких ошибок в качестве поучительных примеров того, чего не следует делать. Также важно понимать, что некоторые ошибки еще не были сделаны, идентифицированы или исправлены, и поэтому ошибки в настоящее время являются неизвестными неизвестными. Время может быть наиболее важным компонентом для выявления этих еще не выявленных ошибок.
Плохое начало исследования.
Плохо продуманное исследование представляет фундаментальные проблемы для оставшейся части процесса проведения, анализа и отчетности по исследованию.Начало исследования может разделиться на генерацию гипотез и проверку гипотез, хотя эти две ветви, безусловно, способствуют друг другу. Если исследование начато с мыслью об открытии, но без четкого научного плана, выбор, сделанный по ходу дела, следует за данными. Это не проблема как таковая, если окончательные результаты сообщаются как странствующее исследование. И наоборот, плохо спланированная проверка гипотезы может позволить исследователям выбирать варианты методов или анализа, основанные не на строгом вопросе или теории, а на интересах и ожиданиях.Регулярно используемый пример — это опыт К. Гленна Бегли, которому после неудачной попытки воспроизвести результаты другой исследовательской группы один из первоначальных авторов сказал, что эксперимент проводился несколько раз, но они опубликовали только те результаты, которые « сделал лучший рассказ »(47). Формирование гипотез после того, как результаты уже известны [так называемое HARKing (48) или постфактумное повествование] представляет собой фасад тщательно проведенного исследования, но на самом деле путь от гипотезы через сбор данных к строгим выводам сокращается, если смотреть на результатах и применяя историю, которая соответствует данным.В некоторых отношениях классические исследования генетики гороха Грегора Менделя согласуются с этой последней моделью, а данные, вероятно, слишком совершенны, чтобы возникать естественным путем (49).
Ожидания публикации.
Публикации служат академической валютой, и, таким образом, академики могут быть вынуждены опубликовать что-то — иногда что угодно — чтобы увеличить эту валюту, получить срок пребывания в должности или сохранить финансирование. Это так называемая парадигма «опубликовай или исчезни». Учитывая расширение числа журналов, существует меньше препятствий для публикации, и более современные ожидания могут включать в себя желание публиковаться в журналах с более высоким рейтингом; привлечь больше внимания; или сообщить о положительных, новых или захватывающих результатах.
Могут быть и личные ожидания: после месяцев экспериментов или лет сбора данных от проекта требуется что-то «полезное». Не все стоит публиковать, если это не добавляет знаний. Если данные плохие, методы некорректны или выводы недействительны, публикация не будет способствовать расширению знаний, а скорее может умалить их значение. Целенаправленное давление, основанное на публикациях, может оттолкнуть поведение от строгой науки. В 1975 году Пол Фейерабенд выразил озабоченность по поводу увеличения количества публикаций без сопутствующего увеличения знаний, отметив: «Большинство ученых сегодня лишены идей, полны страха, они намерены добиться каких-то ничтожных результатов, чтобы внести свой вклад в поток бессмысленных идей. статьи, которые сейчас составляют «научный прогресс» во многих областях »(50).
Волнение.
Многие ученые начали свои исследования из-за врожденного интереса: глубокого любопытства, стремления к открытиям или личной связи с проблемой в мире. Проведение экспериментов, анализ данных и наблюдение за миром — это не только аспекты науки, но также отражают личные интересы и увлечения. Таким образом, когда результаты дают что-то интересное — будь то просто интеллектуально стимулирующее или имеющее глубокое практическое значение — страсть и волнение рискуют превзойти тот факт, что наука создана как «великое противоядие от яда энтузиазма и суеверий» (51).Во время коллоквиума Саклера, на котором построен этот выпуск PNAS, сэр Филип Кэмпбелл отметил эту дихотомию возбуждения и строгости. Комментируя свое обучение, он заметил: «Культура в лаборатории заключалась в том, что если я делал какое-либо интересное заявление о том, что я открывал, мой руководитель предполагал, что это было сотрудничество между матерью-природой и моим оборудованием, чтобы сказать неправду. И мне действительно пришлось потрудиться, чтобы убедить его, если я когда-либо действительно думал, что у меня есть что-то интересное »(52).
Ресурсы.
Будь то время, персонал, образование или деньги, строгая наука требует ресурсов.Недостаток ресурсов может привести к ошибкам. Если времени мало, можно отказаться от адекватных проверок на строгость; если персонала слишком мало, команды может не хватить для завершения проекта; при недостаточном образовании может не хватать соответствующего опыта; а при недостаточном финансировании точная методология может оказаться недоступной. Приходится идти на практические компромиссы, иногда ценой строгости.
Конфликт приоритетов.
Недостаточная проверка методов, результатов или выводов из-за конфликта приоритетов также может способствовать появлению или игнорированию ошибок.Исследователь может сознательно знать лучше, чем совершать определенные ошибки или сокращать путь, но приоритеты могут конкурировать за ресурсы, внимание или силу воли. Результатом может быть небрежная наука, небрежное поведение или искажение наблюдений. Фактически, между учеными может быть некоторое несоответствие в отношении внимания к таким конфликтам: согласно одному метаанализу, более высокая креативность связана с более низким уровнем сознательности по сравнению с теми, у кого более низкая креативность (53). Часто невозможно определить, уступили ли авторы этим противоречивым приоритетам, они намеренно отклонились от научной строгости или допустили честные ошибки.Чаще всего обсуждают приоритеты вокруг раскрытия потенциальных финансовых конфликтов, но есть много других источников конфликта. Когда люди так полностью верят в идею или построили на идее всю карьеру и имидж, публикация чего-либо противоположного будет противоречить укоренившейся идеологии (54, 55). В других случаях идеология, которую может отстаивать автор, считается справедливой. Например, при детском ожирении многие предполагаемые причинные факторы дихотомически подразделяются на плохие (экранное время и сидячий образ жизни) или хорошие (грудное вскармливание и время с семьей), в зависимости от преобладающего духа времени.В интересах защиты детей от ожирения исследователи могут поддаться предвзятости Белой шляпы, которая включает «искажение информации в интересах того, что может быть воспринято как праведные цели» (56). В свою очередь, будущие исследования могут повторять праведную позицию независимо от истинных последствий, например, когда возможность предвзятости публикации была проигнорирована в отчете Всемирной организации здравоохранения о грудном вскармливании и ожирении (57).
Мы поясняем, что, хотя преднамеренность важна для отделения небрежности от умышленных проступков и, возможно, для исправления ошибок или выговора злоумышленникам, как преднамеренные, так и непреднамеренные отклонения от передовой практики приводят к ошибочным публикациям в научной литературе.
Ошибки в измерении потребления питательных веществ — Адекватность питательных веществ
Изменчивость в отчетности и регистрации потребления пищи
Тщательное изучение ошибок в отчетности, записи и кодировании данных обследований потребления пищи помогает выявить случайные ошибки внутри человека и те, которые носят систематический характер.
• Случайная ошибка . Иногда респондент случайным образом завышает, а иногда занижает. Различия также возникают между людьми, когда один человек занижает данные, а другой — завышает.Даже если эти ошибки случайны, они представляют проблему при анализе данных о населении. Однако систематическая ошибка, затрагивающая целые подгруппы населения, может иметь более серьезные последствия для анализа таких данных. Например, если все или большинство членов низших социально-экономических групп переоценивают потребление таких статусных продуктов, как мясо, могут возникнуть искаженные оценки потребления железа.
• Систематическая систематическая ошибка . В NFCS большое значение имеет систематическое занижение данных по населению в целом.был признан. В результате Министерство сельского хозяйства США (USDA) провело или профинансировало многочисленные исследования, направленные на решение этих проблем. Литература, относящаяся к этим вопросам, кратко рассматривается в следующих параграфах.
Целью любого диетического обследования является определение того, что люди едят, точнее, определение продуктов и добавок, которые люди обычно едят или обычно потребляют. Методы диетического обследования можно разделить на две общие категории: методы, основанные на памяти (вспоминании) и методы, основанные на записях.В процедурах, основанных на памяти, испытуемых просят вспомнить всю еду и напитки, потребленные в течение определенного времени, обычно 24 часа. Методы ведения записей принимают несколько форм: общая процедура состоит в том, чтобы попросить субъектов вести дневник, фиксируя все продукты и напитки, потребляемые в течение определенного количества дней, чаще всего в течение периодов до 7 дней. В некоторых случаях респондентам предоставляются пластиковые или бумажные модели пищевых продуктов и измерительные устройства, чтобы помочь в оценке размеров порций. В других случаях они получают только конкретные письменные или устные инструкции или и то, и другое.Как упоминалось ранее, методы отзыва и записи были объединены при сборе данных о трехдневном рационе питания для лиц в NFCS 1977–1978 гг.
В последние годы было опубликовано несколько обзоров диетических методов (Beal and Laus, 1982; Becker et al ., 1960; Burk and Pao, 1976; Marr, 1971), а также множество статей, посвященных качеству определенных диет. методы. Аспект качества, вызывающий наибольшую озабоченность, — это достоверность, особенно в отношении систематической ошибки в данных о рационе питания.
Действительный метод — это метод, который измеряет то, что он намеревается измерить, — истинный набор предметов. Методы питания могут быть подтверждены только знанием истинного потребления или некоторыми чувствительными лабораторными измерениями потребления. Блок (1982) отмечает, что трудно определить истинное потребление в течение длительного периода времени. Следовательно, валидация часто заключается в сравнении одного метода исследования питания с другим. Такая проверка ограничена отсутствием согласия относительно «истинного» или эталонного метода. Сходства в двух методах могут не выявить общие ошибки при сравнении двух методов.Отсутствие точной записи всех продуктов, съеденных во время опроса, может повлиять на последующее вспоминание. Это также может повысить наблюдательность респондента, так что последующее воспоминание будет более полным, чем первоначальная ежедневная запись, как при опросе или оценке питания.
Ненавязчивые наблюдения за фактическим приемом пищи были сделаны за людьми в различных учреждениях, таких как дети в начальных школах (Comstock et al ., 1981; Graves and Shannon, 1983; Lachance, 1976; Meredith et al ., 1951), студенты в кафетериях колледжей (Krantzler et al ., 1982; Mullen et al ., 1984; Raker, 1979), пожилые люди в местах совместного приема пищи (Gersovitz et al ., 1978; Madden и др., ., 1976), пациенты в домах престарелых (Caliendo, 1981), подростки в отделении метаболических исследований (Greger and Etnyre, 1978), молодые мальчики, потребляющие пищу дома в течение однодневного периода (Stunkard and Waxman, 1981 ), кормящие женщины, помещенные в больницу (Linusson et al ., 1975) и пациентов с массовым ожирением в центре клинических исследований (Bray et al ., 1978). Такие настройки оптимальны для этих исследований, потому что порции стандартизированы или заранее определены. Эти наблюдения обычно проводились в течение коротких периодов времени или даже при однократном приеме пищи, хотя Mullen et al сообщили о наблюдениях в течение 28 последовательных дней. (1984) и Кранцлер и др. . (1982) в своем исследовании студентов в столовой общежития.Однако институциональный распорядок может изменить режим питания и воспоминания по сравнению с обычным населением.
Предостережения относительно проверки должны быть приняты во внимание, прежде чем будут рассмотрены точность и систематическая погрешность в данных о потреблении пищи. Например, существуют ли систематические ошибки в диетическом потреблении, о котором сообщают некоторые подгруппы населения, такие как молодые и пожилые люди, или в отчетности о конкретных пищевых продуктах или группах пищевых продуктов — систематические ошибки, которые могут повлиять на сообщаемое потребление питательных веществ?
Результаты нескольких проверочных исследований показывают, что данные о низком потреблении могут быть завышены, а о высоком — занижены, что приводит к синдрому плоского склона (Gersovitz et al ., 1978; Мэдден и др. , 1976; Stunkard and Waxman, 1981), хотя можно точно вспомнить средние поступления для групп. Однако синдром плоского наклона может быть не чем иным, как ослаблением наклона, возникающим из-за случайной ошибки в независимой переменной, как было описано многими авторами.
Систематические предубеждения могут существовать в отчетах о питании отдельных подгрупп населения, но они не были рассмотрены в достаточной степени, чтобы делать выводы. Например, Кэмпбелл и Доддс (1967) использовали 24-часовой отзыв для сбора информации о питании пожилых и молодых пациентов, госпитализированных с различными заболеваниями легких.Их цель состояла в том, чтобы проверить степень ошибки, когда 24-часовой отзыв использовался для сбора информации от пожилых людей, у которых нарушение памяти может повлиять на отзыв. Данные 24-часового отзыва были проверены путем приглашения субъектов на основе известного меню. В этом исследовании пожилые люди занижали количество калорий чаще, чем молодые, а мужчины занижали количество калорий, чем женщины. Потребление пищи, полученное без зондирования, было примерно на 25% ниже, чем полученное с зондированием.
Марр (1971) пришел к выводу, что у маленьких детей трудно получить достоверные данные о питании.Например, необходимо полагаться на заместителя, такого как родитель, чтобы предоставить информацию о приеме детей младшего возраста. Кроме того, не родители, а другие лица, осуществляющие уход за ребенком, часто обеспечивают ребенка едой, что затрудняет получение необходимых данных. В Соединенных Штатах пищу все чаще едят вдали от дома маленькие дети, поскольку все больше и больше дошкольников посещают детские учреждения.
Предварительное исследование 29 детей дошкольного возраста было разработано для изучения относительной полезности дневного дневника питания и 24-часового отзыва (H.Смициклас-Райт и П. Холмберг, Государственный университет Пенсильвании, личное сообщение, 1985). Исследователи наблюдали за фактическим потреблением во время обеда детьми, посещающими детский сад, а затем попросили 14 матерей предоставить данные о рационе питания за 24 часа. Семь из 14 матерей не предоставили данных о приеме пищи, когда их дети находились в центре. Остальные матери не смогли правильно определить пункты меню, завысили размер порций или и то, и другое. 15 родителей, которые предоставили информацию в виде однодневной записи, предоставили более полные данные, хотя эти родители также имели тенденцию неправильно определять продукты или переоценивать размеры порций.Для интерпретации данных важно знать, присутствовал ли суррогатный репортер на всех приемах пищи.
Ретроспективные истории диеты сравнивались с прямыми измерениями потребления пищи пациентами с ожирением, госпитализированными в метаболическое отделение (Bray et al ., 1978). Были получены три ретроспективные оценки диетического анамнеза с интервалом в 1 месяц. В первой истории потребление энергии недооценивалось. К третьему году оценки потребления энергии повысились — в частности, из-за улучшения отчетности о потреблении алкоголя.Таким образом, третий анамнез, вероятно, обеспечил лучшую корреляцию между истинным и заявленным потреблением энергии.
Лански и Браунелл (1982) также исследовали точность записей о питании заявителей в рамках программы снижения веса. Тридцать женщин оценили количество 10 продуктов, выставленных в больших и малых контейнерах. Размер контейнера не повлиял на оценку количества, но количество всех 10 продуктов было завышено. Величина завышения варьировалась от небольшого завышения для колы и апельсинового сока до большого завышения для картофельных чипсов, ветчины и индейки.Ни Брей и др. . (197) 8, ни Лански и Браунелл (1982) не представили сопоставимые данные по субъектам с нормальным весом, чтобы определить, были ли ошибки в сообщении о потреблении и регистрации размеров порций ограничены только людьми с ожирением. А. Блейк (Университет штата Пенсильвания, личное сообщение, 1985) обнаружил, что размеры порций недооценивались как субъектами с ожирением, так и людьми с нормальным весом. Этот исследователь предоставил предварительно взвешенные порции продуктов на обед, на котором присутствовали субъекты, с которыми на следующий день связались для 24-часового отзыва.Большинство испытуемых, как страдающих ожирением, так и нормальных, недооценили количество съеденных порций.
Сопко и др. . (1984) обнаружили, что мужчины с ожирением сообщали от 78% до 93% от их фактического потребления в эксперименте с контролируемым кормлением. Хотя исследование не было истинным подтверждением, Hallfrisch et al . (1982) заметили, что при 7-дневной диете мужчины сообщили о 80%, а женщины сообщили о 65% потребленных калорий в последующие 6-недельные экспериментальные периоды.
Эти результаты ставят под сомнение достоверность отзыва или регистрации приема пищи.Отчеты о потреблении пищи и энергии, лишь немного превышающих базальные энергетические потребности взрослых женщин, трудно согласовать с данными населения, показывающими 40% -ную распространенность избыточного веса и 25,7% -ную распространенность ожирения, о чем свидетельствует индекс массы тела (Van Itallie and Woteki, 1985).
Выборочное занижение данных также предлагается путем сравнения потребления пива, вина и дистиллированного спирта, о котором сообщалось для взрослых мужчин и женщин в NFCS и Национальном обследовании здоровья и питания (NHANES), с оценками исчезновения алкоголя, как сообщает Бюро по борьбе с алкоголем, огнестрельным оружием и табаком (Pao et al ., 1982). Точно так же Schnakenberg et al . (1981), изучая сообщаемое потребление пищи 62 мужчин в военной столовой в течение 7-дневного периода по сравнению с наблюдаемым и взвешенным приемом пищи, обнаружили, что 13% занижали свое потребление калорий более чем на 30%, а 34% недооценивали свое потребление калорий. потребление от 10% до 20%. Только 5% переоценены более чем на 30%.
Напротив, де Сен-Жор (1980), который отслеживал статус веса, чтобы проверить точность потребления энергии, сообщаемой оплачиваемыми образованными субъектами в течение 12-недельного периода, пришел к выводу, что зарегистрированное потребление было приемлемой мерой фактического потребления.Как сообщалось ранее, А. Блейк (Университет штата Пенсильвания, личное сообщение, 1985), сравнивая количество запомненных приемов пищи с наблюдаемым и взвешенным приемом пищи у тучных и не страдающих ожирением субъектов, не обнаружил разницы между двумя группами, но подтвердил тенденцию к завышению оценок. . малое потребление и занижение более высокого потребления. Она обнаружила, что расчетные размеры порций для большинства продуктов питания отличаются от фактических менее чем на 10%.
Одной из причин расхождения между фактическим и заявленным потреблением может быть сложность, с которой респонденты сталкиваются при оценке размеров порций.Гатри (1984) обнаружил, что для 13 продуктов питания от 6% до 75% взрослых субъектов мужского и женского пола сообщили о размерах порций, которые более чем на 50% отличаются от размеров взвешенных порций. Тем не менее, только 26% респондентов постоянно занижали или завышали все элементы в еде. Х. Смициклас-Райт и Х. Гатри (Университет штата Пенсильвания, личное сообщение, 1984) показали, что способность студентов студенческого возраста оценивать с точностью до 1 унции объем жидкости, содержащейся в стаканах, варьируется от 30% до 70%, в зависимости от от размера и формы контейнера.
Янг и др. . (1952) обнаружили, что для различных продуктов ошибка обычно заключается в переоценке порций. Компенсация этого смещения производилась путем использования нуля для всех пропусков данных при вычислении средних значений. Они пришли к выводу, что для группы ошибки в оценке размеров порций для большинства типов продуктов питания, вероятно, находятся в пределах 20% от фактических порций, за исключением отзыва детей, который имеет большую ошибку.
Кранцлер и др. . (1982) сообщили о 24-часовых воспоминаниях и 3-дневных или 7-дневных записях студентов, которых периодически наблюдали в течение 28-дневного периода, в течение которого они принимали пищу в столовой общежития.Они сообщили, что о продуктах, которые потребляются регулярно, то есть о тех, которые составляют основную часть еды, сообщалось лучше, чем о таких продуктах, как приправы, орехи и семена. Оценки молочных продуктов, мяса и рыбы были самыми точными. Гатри (1984) сообщила, что немногие испытуемые в ее исследовании забыли основные блюда, но каждый шестой респондент забыл упомянуть заправку для салата. Поскольку две трети респондентов использовали более 20 г (около 130 ккал) заправки для салатов, одно это упущение могло представлять собой значительную ошибку в суточном потреблении.
Из приведенного выше обсуждения следует, что ошибки в сообщении о диетическом потреблении, несомненно, существуют. Исследования также предполагают, что направление ошибок варьируется от исследования к исследованию и, возможно, от группы населения к группе населения. В отдельном упражнении комитет сравнил распределение потребления, о котором сообщалось в нескольких недавних крупных опросах. Были различия, предполагающие систематическую ошибку в оценке потребления пищи или данных о составе пищи, но они не были последовательными по питательным веществам.Доказательства недостаточно согласованы, чтобы предположить, как эти систематические ошибки влияют на оценки отдельных питательных веществ. Однако ясно, что они могут сделать это заметно. Поскольку NFCS 1977–1978 не включал данные о пищевых добавках, в нем, безусловно, недооценивалось их потребление.
Снижение влияния ошибок пропуска на оценки площади и изменения площади
Основные моменты
- •
Дополнены литературные рекомендации, относящиеся к оценке на основе выборки.
- •
Отсутствие изменений земель на картах может внести большую неопределенность в оценки площади.
- •
При разбивке по классам карты пропуски изменений, как правило, имеют большой вес.
- •
Субстраты в лесных слоях вряд ли будут содержать ошибки, смягчающие влияние пропусков.
- •
Построение эффективных стратификаций снижает влияние пропусков.
Abstract
Получить информацию о земной поверхности и ее изменениях с течением времени никогда не было так просто, но для принятия обоснованных решений по управлению землей необходимо, чтобы эта информация была точной и точной.В последние годы, в основном из-за неизбежности ошибок классификации в картах, основанных на дистанционном зондировании, и заметного влияния этих ошибок на последующие оценки площади, важность и использование основанных на выборке оценок площади земного покрова и изменений земель возросло. Оценка площади земного покрова и его изменение путем выборки часто становятся более эффективными, если априори знают исследуемую территорию, которая будет анализироваться (например, стратификация). Спутниковые данные, полученные бесплатно практически для всей поверхности суши Земли, являются отличным источником для построения стратификаций ландшафта в виде карт.Ошибки пропусков, определяемые как единицы выборки, наблюдаемые как изменение земель, но нанесенные на карту как стабильный класс, могут вносить значительную неопределенность в оценки параметров, полученные из данных выборки (например, оценки площадей изменения земель). Последствия ошибок из-за упущения усугубляются в ситуациях, когда площадь нетронутого леса велика по сравнению с площадью изменения лесов, что является обычной ситуацией в странах, которые стремятся получить ориентированные на результат платежи за сокращение обезлесения и связанных с ним выбросов углерода. Наличие ошибок, связанных с упущением в таких ситуациях, может помешать получению статистически достоверных свидетельств сокращения обезлесения и, таким образом, предотвратить выплаты.Международные доноры и страны, заинтересованные в смягчении последствий изменения климата, ищут рекомендаций о том, как уменьшить влияние ошибок, связанных с упущением, на оценки площадей изменения земель. В этой статье представлены основные причины влияния ошибок из-за пропусков на оценки площадей, тематические исследования, освещающие реальные примеры этих эффектов, и предлагаются возможные решения. Представлены практические подходы к эффективному разделению больших стабильных слоев, которые могут уменьшить влияние ошибок пропусков и немедленно улучшить качество оценок.Однако необходимы дополнительные исследования, прежде чем можно будет дать дальнейшие рекомендации о том, как сдерживать, смягчать и потенциально устранять последствия ошибок, связанных с упущениями.
Ключевые слова
Оценка точности
Схема выборки
Схема реагирования
Оценка площади
Изменение земель
Ошибка пропусков
Рекомендуемые статьи Цитирующие статьи (0)
Полный текст© 2019 Elsevier Inc. Все права защищены.
Рекомендуемые статьи
Цитирующие статьи
Частота диагностических ошибок при амбулаторном лечении: оценки трех крупных обсервационных исследований с участием взрослого населения США
Фон
Диагностические ошибки представляют серьезную угрозу для качества и безопасности здравоохранения в амбулаторных условиях.1, 2 Частота амбулаторных диагностических ошибок неизвестна, 3 частично из-за различных определений в исследованиях и сложности обнаружения этих ошибок, которые обычно возникают во многих эпизодах лечения с течением времени. В недавнем обзоре Грабера обсуждалось использование нескольких методов для изучения диагностических ошибок, включая вскрытия, обзоры случаев, опросы, отчеты об инцидентах, стандартизованные пациенты, повторные обзоры и заявления о халатности.3 Однако большинство из этих методов имеют ограниченное применение при определении частоты диагностической ошибки в амбулаторной врачебной практике.
Оценка диагностических ошибок на основе популяционных данных может помочь приоритизировать текущие усилия по обеспечению безопасности пациентов. Мы стремились оценить частоту амбулаторных диагностических ошибок среди взрослого населения США, синтезируя данные трех предыдущих исследований клинических популяций, в которых использовались концептуально сходные определения диагностической ошибки4–6
Методы
Источники данных включали два предыдущих исследования, в которых использовались электронные триггеры или алгоритмы для выявления необычных моделей повторных посещений (исследование первичной медико-санитарной помощи) или отсутствия последующего наблюдения за патологическими клиническими данными для колоректального рака (CRC) (исследование рака толстой кишки), оба наводящие на мысль о диагностических ошибках.4, 6 В третьем исследовании изучались последовательные случаи рака легких в двух учреждениях (исследование рака легких) .5 Во всех трех исследованиях диагностические ошибки были подтверждены с помощью обзора диаграммы и определены как упущенные возможности для своевременной постановки правильного диагноза на основе имеющихся данных. . Критерии диагностических ошибок были сопоставимы в трех исследованиях и исключали атипичные представления и соответствующие решения для просмотра и ожидания.
Триггеры в исследовании первичной медико-санитарной помощи6 были основаны на возникновении неожиданных повторных посещений и, следовательно, были выборочными для неправильной диагностики острых состояний и обострений хронических состояний.Триггером 1 было плановое посещение первичной медико-санитарной помощи с последующей незапланированной госпитализацией в течение 14 дней; триггером 2 было индексное посещение первичной медико-санитарной помощи, за которым следовало одно или несколько внеплановых посещений в течение 14 дней. Контрольные посещения не соответствовали ни одному критерию. Мы рассмотрели для включения все посещения первичной медико-санитарной помощи (n = 212 165 посещений и 81 483 уникальных пациента) в двух крупных системах здравоохранения в период с 1 октября 2006 г. по 30 сентября 2007 г. Для обзора записей мы просмотрели все записи триггера 1 с одного из сайтов. (n = 220 записей) и случайным образом выбрали остальные со второго сайта, в результате чего была проанализирована выборка из 674 записей из 1086 выбранных посещений.Поддерживая рекордный коэффициент выборки из каждой системы здравоохранения, который соответствовал триггеру 1, мы рассмотрели 669 из 14 777 посещений, выбранных триггером 2, и 614 из 193 810 контрольных посещений без триггера. Ошибки в инициированных и не инициированных (контрольных) случаях были расценены как возникшие, когда при более раннем посещении первичной медико-санитарной помощи существовали адекватные данные, позволяющие предположить окончательный правильный диагноз, или если документально подтвержденные аномальные результаты во время посещения должны были вызвать дополнительную оценку, которая должна была выявил правильный диагноз.Определение ошибок производилось ретроспективно двумя независимыми оценщиками. При экстраполяции показателей ошибок на всех пациентов первичной медико-санитарной помощи в наших исследовательских центрах мы предположили, что уровни ошибок в случайно выбранных выборках инициированных и не инициированных случаев применимы ко всей когорте инициированных и не инициированных записей в каждой группе клиник.
Хотя мы предположили, что типы ошибок, обнаруженных в исследовании первичной медико-санитарной помощи, вероятно, объясняют большинство амбулаторных диагностических ошибок, мы также стремились оценить частоту ошибок, связанных с первоначальной диагностикой менее распространенных, но серьезных хронических состояний.В отличие от неправильной диагностики острых состояний, эти ошибки могут не проявляться в течение недель или месяцев. В качестве заместителя для таких ошибок в амбулаторной помощи мы получили оценки частоты пропущенной и отсроченной диагностики CRC и рака легких, представленные в двух исследованиях рака, 4, 5 соответственно. Эти состояния были выбраны из-за их относительной частоты в нескольких типах предшествующих обсервационных исследований, связанных с диагностическими ошибками.5, 7–12 В обоих наших исследованиях диагностические ошибки характеризовались отсутствием своевременного наблюдения за конкретными «красными флажками» или «тревожные» признаки5, 10, 13 рака у пациентов, которым в конечном итоге был поставлен диагноз любого из этих видов рака.Например, для CRC это было оперативно определено как отсутствие последующего наблюдения через 60 дней после документального подтверждения гематохезии (ярко-красная кровь в прямой кишке), положительного результата анализа фекальной скрытой крови и железодефицитной анемии. В отношении рака легких мы определили отсутствие последующего наблюдения как неспособность начать дальнейшее расследование или принять соответствующие меры в течение 7 дней после задокументированного «красного флажка», такого как ненормальный рентгеновский снимок грудной клетки. Ни одна из этих данных не совпадала с данными исследования первичной медико-санитарной помощи. Мы предположили, что отсутствие последующих мер по этим «красным флажкам» объясняет все диагностические ошибки, связанные с этими типами рака.
Мы экстраполировали частоту диагностических ошибок, полученных в результате наших исследований, на взрослое население США, 14 используя исследование первичной медико-санитарной помощи в качестве прокси для оценки частоты диагностических ошибок для острых состояний (и обострений существующих состояний), а два исследования рака — на консервативные оценки. оценить частоту пропущенного диагноза CRC и рака легких (в качестве заместителя для других серьезных хронических состояний). Из-за неоднородности включенных состояний мы предположили, что они представляют собой спектр заболеваний, подверженных риску амбулаторных диагностических ошибок.
Результаты
В исследовании первичной медико-санитарной помощи были проанализированы образцы инициированных посещений и контрольных посещений, чтобы определить процент посещений, содержащих ошибки. Эти проценты были экстраполированы на более крупные выборки с запуском и без запуска. Для триггера 1 была обнаружена 141 ошибка в 674 проверенных посещениях, что дает 20,9% ошибок. Экстраполяция на все 1086 посещений триггера 1 дала оценку 227,2 ошибки. Для триггера 2 за 669 проверенных посещений было обнаружено 36 ошибок, что дает 5 ошибок.4%. Экстраполяция на все 14 777 посещений триггера 2 дала оценку 795,2 ошибки. Наконец, для контрольных посещений из 614 проверенных посещений было обнаружено 13 ошибок, что дает коэффициент ошибок 2,1%. Экстраполяция на все 193 810 контрольных посещений дала оценку 4103,5 ошибок. Таким образом, мы подсчитали, что в трех группах произошло 5126 ошибок. Затем мы разделили эту цифру на количество уникальных пациентов первичной медико-санитарной помощи в исходной когорте (81 483) и получили расчетную частоту ошибок, равную 6.29%. Поскольку примерно 80,5% взрослого населения США ежегодно обращаются за амбулаторной помощью 15, такой же показатель применительно ко всем взрослым в США дает оценку в 5,06% (см. Диаграмму 1).
Рисунок 1Схема синтеза данных о частоте диагностических ошибок из трех исследований.
В исследовании рака толстой кишки были выявлены ошибки в диагностике CRC у 26 из 291 773 пациентов, получавших амбулаторную помощь (0,009%). Экстраполируя взрослое население США, обращающееся за амбулаторной помощью, мы оценили, что 0,007% всех взрослых будут иметь ошибки, связанные с CRC в год.В исследовании рака легких мы обнаружили 127 ошибок в 587 случаях рака легких, что дает 21,64% ошибок. Экстраполируя 80,5% взрослого населения США, обращающегося за амбулаторной помощью, и 0,072% населения, у которого ежегодно диагностируется рак легких 16, мы оцениваем, что 0,013% всех взрослых будут иметь ошибки, связанные с раком легких, в год.
Объединение оценок из трех исследований дает частоту амбулаторных диагностических ошибок 5,08%, или примерно 12 миллионов взрослых в США ежегодно.Основываясь на нашей предыдущей работе17, мы подсчитали, что около половины ошибок могут привести к серьезному ущербу.
Обсуждение
Хотя диагностические ошибки трудно определить и измерить, появляется все больше свидетельств их важности и частоты в нескольких типах состояний.3, 7, 11, 18 Применяя совокупную частоту диагностических ошибок из трех предыдущих исследований, проведенных нашей группой, мы оцениваем, что около 12 миллионов взрослых в США могут ежегодно сталкиваться с амбулаторными диагностическими ошибками.Наши оценки в целом согласуются с данными широкой общественности о диагностических ошибках. Недавний телефонный опрос случайной вероятностной выборки из более чем 2000 взрослых в США показал, что более одного из 10 респондентов сообщили о «диагностических неудачах» 19. не реже одного или двух раз в месяц.20 Таким образом, другие недавние данные подтверждают наш вывод о том, что диагностические ошибки являются обычным явлением.
Предыдущие оценки частоты диагностических ошибок в значительной степени основывались на мнении экспертов.Например, по оценке Эльштейна, ошибки встречаются примерно в 10–15% диагнозов21. Как отмечает Грабер, многие методы изучения диагностических ошибок имеют ограниченное применение при вычислении частоты возникновения проблемы. Например, количество вскрытий снизилось, 22 количество самоотчетов остается низким, а данные о заявлениях о врачебной халатности склонны к предвзятости и нерепрезентативны11, 20, 23-25. С другой стороны, популяционные исследования опирались на обзоры медицинских карт, которые обычно являются золотым стандартом для определения диагностической ошибки.26 Наш метод электронного триггера облегчил выборочную проверку записей, что сделало процесс определения ошибок более эффективным, чем последовательные или случайные проверки записей. Наша оценка, основанная на большом размере выборки, вероятно, будет наиболее надежной на данный момент для учета частоты диагностических ошибок в повседневной амбулаторной практике.
Хотя неизвестно, сколько пациентов пострадают от диагностических ошибок, наша предыдущая работа17 предполагает, что около половины диагностических ошибок потенциально могут привести к серьезному ущербу.Хотя это только приблизительная оценка и не означает, что все пострадавшие действительно пострадают, этот риск потенциально составляет около 6 миллионов амбулаторных пациентов в год. Кроме того, хотя вклад двух видов рака в общую оценку был небольшим, мы считали важным включить их, чтобы показать их относительный вклад. Это связано с тем, что отсроченная диагностика рака считается одним из наиболее вредных и дорогостоящих типов диагностических ошибок в амбулаторных условиях, и его значение стало очевидным не только в заявлениях о злоупотреблении служебным положением, но и в ретроспективных исследованиях последовательных случаев рака, опросах и исследованиях неспособность отслеживать отклонения от нормы результатов анализов.5, 7–12 Во многих из этих исследований рак легких и CRC являются наиболее распространенными видами рака, диагностика которых откладывается.
Наши оценки ограничены нашими предположениями об обобщаемости. Чтобы определение диагностической ошибки было единообразным во всех исследованиях, мы использовали только данные нашей собственной работы. В других исследованиях использовались другие методы и определения диагностических ошибок, и мы полагали, что это сделает наши экстраполяции более слабыми. Подобно другим методам изучения медицинских ошибок, наш триггер не был достаточно чувствительным, чтобы фиксировать все типы диагностических ошибок в амбулаторных условиях.Наши триггеры неадекватно фиксируют ошибки в диагностике необычных заболеваний, некоторые из которых могут развиваться в течение длительного периода времени в амбулаторных условиях. Возможно, наши исследования не смогли адекватно рассмотреть другие типы распространенных хронических состояний, которые могут быть уязвимы для диагностических ошибок27. Например, недавнее исследование из Великобритании предполагает, что возможности диагностики хронической обструктивной болезни легких на более ранней стадии упускаются из виду. в большинстве случаев28. Хотя это и кажется заманчивым, мы не экстраполировали наши косвенные оценки хронического состояния на все типы рака или другие типы хронических заболеваний, потому что было бы невозможно сделать это точно.Наконец, обзоры диаграмм по своей сути будут пропускать ошибки из-за проблем, связанных с документацией, и этот ложноотрицательный показатель в значительной степени неизвестен. Таким образом, все эти ограничения предполагают, что мы недооценили частоту диагностических ошибок, и частота могла быть намного больше 5%.
В заключение, мы оцениваем частоту диагностической ошибки как минимум в 5% у взрослых амбулаторных пациентов в США, что влечет за собой существенный риск для безопасности пациентов. Эта популяционная оценка должна стать основой для политиков, организаций здравоохранения и исследователей, чтобы активизировать усилия по измерению и сокращению диагностических ошибок.
Благодарности
Мы благодарим Энни Брэдфорд, доктора философии, за помощь в медицинском редактировании.
Мощность от данных! Ошибка отсутствия выборки
Архивный контент
Информация, помеченная как архивная, предназначена для справочных, исследовательских или учетных целей. Он не регулируется веб-стандартами правительства Канады и не изменялся и не обновлялся с момента его архивирования. Свяжитесь с нами, чтобы запросить формат, отличный от доступных.
Помимо ошибки выборки, связанной с процессом отбора выборки, обследование подвержено большому количеству ошибок. Эти ошибки обычно называют «ошибками, не связанными с выборкой».
Ошибки, не связанные с выборкой, можно определить как ошибки, возникающие в ходе всех обследований, кроме выборки. В отличие от ошибок выборки, они могут присутствовать как в выборочных обследованиях, так и в переписи населения.
Ошибки, не связанные с выборкой, можно разделить на две группы: случайных ошибок и систематических ошибок .
- Случайные ошибки — это непредсказуемые ошибки, возникающие в результате оценки. Обычно они отменяются, если используется достаточно большая выборка. Однако, когда эти ошибки действительно вступают в силу, они часто приводят к повышенной вариабельности интересующей характеристики (, т.е. , чем больше разница между единицами генеральной совокупности, тем больше размер выборки, необходимый для достижения определенного уровня надежности).
- Систематические ошибки — это ошибки, которые имеют тенденцию накапливаться по всей выборке.Например, если в анкете есть ошибка, это может вызвать проблемы с ответами респондента, что, в свою очередь, может привести к ошибкам обработки и т. Д. Ошибки такого типа часто приводят к смещению окончательных результатов.
Ошибки, не связанные с выборкой, чрезвычайно трудно, если вообще возможно, измерить. Поскольку случайные ошибки имеют тенденцию аннулироваться, систематические ошибки являются основной причиной для беспокойства. В отличие от дисперсии выборки, смещение, вызванное систематическими ошибками, не может быть уменьшено путем увеличения размера выборки.
Ошибки, не связанные с выборкой
- может присутствовать во всех аспектах процесса обследования, кроме выборки
- существуют как в выборочных обследованиях, так и в переписи населения
- трудно измерить
Ошибки, не связанные с выборкой, могут возникать из-за проблем с охватом, ответом, отсутствием ответа, обработкой данных, оценкой и анализом. Ниже приводится объяснение каждого из этих типов ошибок.
Ошибка охвата возникает, когда единицы опущены, дублированы или ошибочно включены в генеральную совокупность или выборку.Пропуски называются «неполным охватом», в то время как дублирование и неправомерные включения называются «избыточным охватом». Ошибки охвата вызваны дефектами в структуре опроса, такими как неточность, неполнота, дублирование, несоответствие или устаревание. Ошибки охвата также могут возникать в полевых процедурах (, например, , при проведении опроса интервьюер пропускает несколько домохозяйств или лиц).
Ошибки ответа возникают, когда данные неправильно запрошены, предоставлены, получены или записаны.Эти ошибки могут возникать из-за неэффективности анкеты, интервьюера, респондента или процесса опроса.
Ошибки, связанные с неполучением ответов, являются результатом того, что на вопросы анкеты не было получено достаточных ответов. Есть два типа ошибок отсутствия ответа: полное и частичное.
- Ошибки полного отсутствия ответа
Эти ошибки возникают, когда в результаты не включаются ответы определенных единиц в выбранной выборке. Причины этого типа ошибки могут заключаться в том, что респондент недоступен или временно отсутствует, респондент не может или отказывается участвовать в опросе, или жилье пустует.Если значительное количество людей не ответят на опрос, результаты могут быть необъективными, поскольку характеристики не ответивших могут отличаться от характеристик тех, кто участвовал. - Ошибки частичного отсутствия ответа
Этот тип ошибки возникает, когда респондент предоставляет неполную информацию. Некоторым людям может быть трудно понять некоторые вопросы. Чтобы уменьшить эту форму предвзятости, следует проявлять осторожность при разработке и тестировании вопросников. Соответствующие стратегии редактирования и вменения также помогут свести к минимуму эту систематическую ошибку.
Дополнительную информацию о редактировании и вменении можно найти в главе «Обработка данных».
Ошибки обработки иногда возникают во время подготовки файлов окончательных данных. Например, ошибки могут возникать при кодировании, захвате, редактировании или вменении данных. Смещение кодера обычно является результатом плохого обучения или неполных инструкций, расхождений в производительности кодера (, т.е. , усталость, болезнь), ошибок ввода данных или неисправности машины (некоторые ошибки обработки вызваны ошибками в компьютерных программах).То же самое можно сказать и о зафиксированных ошибках. Иногда ошибки неправильно идентифицируются на этапе редактирования. Даже при обнаружении ошибок их можно исправить неправильно из-за плохих процедур вменения.
Статистическое управление Канады и другие агентства по сбору данных прилагают много усилий для разработки и мониторинга обследований, чтобы сделать их как можно более безошибочными. Если используется неподходящий метод оценки, то смещение все равно может быть внесено, независимо от того, насколько безошибочным было обследование до оценки.
Вот пример потенциально несоответствующей оценки. Мы знаем, что глобальное потепление — это проблема, по которой ведется много споров. Чтобы точно измерить это явление, нужно знать, как найти приемлемую «среднюю глобальную температуру». На рисунке 1 показано общее изображение данных об изменении климата. Он показывает среднее повышение глобальной температуры от 0,3 ° до 0,6 ° C за почти 140 лет.
Измерения, составляющие набор данных, были выполнены на различных метеостанциях по всему миру.В этом случае популяция — это набор метеорологических измерений, из которых можно взять образец.
Некоторые ученые сомневаются в точности графика, подобного рисунку 1, потому что они считают, что оценки выборочного обследования смещены.
Ученые утверждают, что измерения температуры должны отражать отношение массы суши Земли к массе воды. Например, если масса суши составляет половину массы воды (морей и океанов), то в местах над водой должно производиться вдвое больше измерений, чем над сушей.Фактически, на Рисунке 1 несколько измерений было сделано с мест над поверхностью воды, тогда как подавляющее большинство измерений было получено с метеостанций на суше.
Почему это может повлиять на оценки выборочного обследования?
Температура на суше обычно выше, чем на поверхности воды, из-за явления, известного как «эффект городского теплового острова». Если выборка слишком сильно взвешена в пользу наземных температур и оценки не принимают это во внимание (как утверждают некоторые ученые), то результаты могут не отражать глобальное среднее значение.
Для получения дополнительной информации об оценке см. Главу «Методы выборки».
Ошибки анализа — это ошибки, которые возникают при использовании неправильных аналитических инструментов или когда предварительные результаты предоставляются вместо окончательных. Ошибки, возникающие при публикации результатов данных, также считаются ошибками анализа.
Ошибки модели в оценках биомассы деревьев, вычисленных с приближением к отсутствующей ковариационной матрице | Углеродный баланс и управление
Модель биомассы
Модель, которую мы рассматриваем для наземной биомассы живых деревьев, является параметрической и может быть выражена как
$$ y_ {i} = f \ left ({{\ mathbf {x}} _ {i}; {\ mathbf {b}}} \ right) + e_ {i} $$
(1)
где y и — биомасса надземного лесного дерева (AGB в кг) i -го дерева, f — известная функция (линейная или нелинейная), x и — это вектор-строка регрессионных переменных p × 1, включая точку пересечения (если есть), b — это вектор параметров модели q × 1 и e и — остаточная ошибка.Для линейной модели p = q .
Модель f соответствует n наблюдениям x и и и и ( i = 1,…, n ) позволяет прогнозировать ожидаемую биомассу, скажем, в j -м дереве \ (\ left ({\ hat {y} _ {j}} \ right) \) от знания x j и расчетные параметры \ ({\ hat {\ mathbf {b}}} \).{2} \) — оценка дисперсии остатков несоответствия ( e и ) деревьев, используемых для соответствия модели в (1), и ∂ f ( x j | b ) ∂ −1 b — вектор производных (градиентов) по параметрам модели, а \ (\ hat {\ text {cov}} \ left ({{\ hat {\ mathbf { b}}}} \ right) \) — оценка ковариации параметров модели. {2} \) — известная оценка коэффициента детерминации.{2} \) зависит от распределения выборки \ (f \ left ({{\ mathbf {x}} _ {b, j} | {\ hat {\ mathbf {b}}}} \ right) \), который может сильно отличаться от распределения в исходной выборке, использованной при подгонке модели. Большинство функций биомассы подгоняются к приблизительному равномерному распределению объясняющих переменных, поскольку это обеспечивает оптимальность большой выборки для подгонки модели [39, гл. 7.5]. Однако для типично небольших выборок в исследованиях биомассы это больше не выполняется. Наша повторная выборка из целевой популяции позволяет получить более надежные и реалистичные оценки желаемой ковариационной матрицы.Хотя при условии, что указанный коэффициент детерминации не был максимизирован за счет комбинации процедур выбора модели и переменных и схемы выборки C . paribus отдает предпочтение линейной модели.
Восстановление путем переоснащения
Восстановленная оценка остаточной дисперсии (см. {*} \), где e * j — случайная выборка из гамма-распределения с параметрами ν и ν . -1 (т.{2} + V \ left ({\ hat {y} _ {i}} \ right)} \ right) $$
(5)
Восстановление недиагональных элементов в \ (\ text {c} \ widetilde {\ text {o}} v \ left ({{\ hat {\ mathbf {b}}}} \ right) \)
В некоторых случаях оценки ошибок в \ ({\ hat {\ mathbf {b}}} \) доступны, но без оценок ковариации. В этом сценарии заменяющая ковариационная матрица может быть восстановлена из
$$ \ begin {align} \ text {c} \ widetilde {\ text {o}} v \ left ({\ hat {b} _ {k}, \ шляпа {b} _ {l \ ne k}} \ right) & = \ text {c} \ widetilde {\ text {o}} rr \ left ({\ frac {{\ partial f \ left ({{\ mathbf {x}} _ {j} | {\ mathbf {b}}} \ right)}} {{\ partial b_ {k}}}, \ frac {{\ partial f \ left ({{\ mathbf {x} } _ {j} | {\ mathbf {b}}} \ right)}} {{\ partial b_ {l}}}} \ right) _ {{{\ mathbf {b}} \ Equiv {\ hat {\ mathbf {b}}}}} \\ & \ quad \ times \ sqrt {{\ text {v}} \ widetilde {\ text {a}} {\ text {r}} \ left ({b_ {k}} \ right) {\ text {v}} \ widetilde {\ text {a}} {\ text {r}} \ left ({b_ {l}} \ right)}, \ quad k, l = 1, \ ldots , q \ end {align} $$
(6)
Надежное восстановление
Восстановленный заменитель \ ({\ text {c}} \ widetilde {\ text {o}} {\ text {v}} \ left ({{\ hat {\ mathbf {b}}}} \ right) \) может существенно отличаться от целевой ковариационной матрицы \ ({\ text {c}} \ widetilde {\ text {o}} {\ text {v}} \ left ({{\ hat {\ mathbf {b} }}} \ right) \) при раздаче x j в выборках, взятых из совокупности, предназначенной для прогнозирования AGB, отличается от распределения x и в исходной, но неизвестной выборке, использованной для подгонки модели [39, гл.{2} \). Выбор степеней свободы для распределения t произвольный; это отражает тот факт, что большинство размеров выборки, поддерживающей модель биомассы деревьев, находятся в диапазоне 6–30 [21]. Уменьшение вдвое этих размеров выборки приводит к увеличению на 3–21% 95% процентилей по сравнению с распределением учащихся t . Надежные альтернативы коэффициентам корреляции в [6] могут быть вычислены с взвешиванием градиентов, пропорциональных обратной величине \ (abs \ left ({\ tilde {e} _ {i}} \ right) \).
Взвешенное восстановление
В регрессиях с положительно оцененной зависимой переменной ( y ) нередко наблюдается увеличение дисперсии остатков регрессии с увеличением y [73, гл. 5.1]. Подход на основе взвешенных наименьших квадратов (WLS) к подгонке модели был бы подходящим. Если f ( x и ; b ) был установлен с использованием WLS для восстановления замены для \ ({\ text {c}} \ hat {\ text {o}} {\ text {v}} \ left ({{\ hat {\ mathbf { b}}}} \ right) \) также следует использовать схему взвешивания.{- 1} $$
(8)
, где W — это диагональная матрица n × n весов суммы к одному w 1 ,…, w n . В моделях древесной биомассы веса обычно бывают пропорциональны обратной величине, скажем, DBH. 2 j , что дает следующие веса w j = TDBH 2 × DBH −2 j , где TDBH 2 — сумма DBH 2 j над n деревьями.Надежная альтернатива [8] получается прямым расширением [7].
Схема взвешивания также необходима, когда деревья для подгонки модели были выбраны с помощью схемы выбора с неравной вероятностью. Тогда веса должны быть пропорциональны обратной величине вероятности включения в выборку [73, с. 41].
Число B повторений повторной выборки
Значение B было определено адаптивно путем мониторинга ошибки Монте-Карло как функции от B [74].В наших примерах мы зафиксировали B на 800. При этом значении B ошибка Монте-Карло в определителе \ ({\ text {c}} \ widetilde {\ text {o}} {\ text {v }} \ left ({{\ hat {\ mathbf {b}}}} \ right) \) было меньше 4%.
Сравнение восстановленных и фактических ковариационных матриц
Восстановленный заменитель ковариационной матрицы может значительно отличаться от неизвестной целевой оценки, когда совместное распределение независимых переменных в выборке, используемой для подгонки, отличается от совместного распределения в целевой совокупности для модельное приложение.В наших демонстрациях мы, в большинстве случаев, знали фактические оценки недостающей ковариационной матрицы. Поэтому представляет интерес проверить гипотезу о равенстве восстановленного заменителя и фактической оценки. Мы используем М-тест Бокса, чтобы получить статистический критерий Хи-квадрат и вероятность этого критерия при нулевой гипотезе отсутствия разницы [75, с. 281]. Тот же тест применялся в примерах, где неизвестна только ковариация в \ ({\ hat {\ mathbf {b}}} \).
Приложения
Примеры из Германии
Мы демонстрируем описанные выше процедуры восстановления с 15 уравнениями биомассы (Таблица 1) и данными (HT, DBH) с 335 участков в первой национальной инвентаризации лесов Германии (BWI-1987).Обратите внимание, что данные представляют деревья, выбранные с вероятностью, пропорциональной их базовой площади. Поэтому их средние значения HT и DBH больше, чем средние значения деревьев, выбранных с равной вероятностью. Однако для демонстрации этот факт не имеет значения.
Существует четыре уравнения (линейное, нелинейное, взвешенное, невзвешенное) для каждого из трех видов (БУК, СОСНА, ЕЛЬ). Каждое уравнение (№ 1–12) было получено из размера выборки n = 50 случайно выбранных деревьев из пяти участков BWI.Пять участков были исключены из любой процедуры восстановления. При подгонке модели в качестве зависимой переменной использовались прогнозы BWI для дерева AGB (кг на дерево), умноженные на случайную равномерно распределенную ошибку на интервале [0,9, 1,1], диаметр на контрольной высоте 1,3 м (DBH) и дерево рост (HT) использовался в качестве предикторов. Сводка данных BWI приведена в Таблице 7. Остальные три уравнения биомассы (№ 13–15) являются обобщенными уравнениями AGB для конкретных видов из Муукконена и Хейсканена [76].Предполагается, что они применимы во всей зоне умеренного климата. Аналитик может предпочесть обобщенное уравнение биомассы местной / региональной модели, полученной из относительно небольшого размера выборки и, возможно, из подгруппы населения с иным соотношением между AGB и объясняющими переменными, чем в популяции, предназначенной для оценки AGB.
Таблица 7 Средние значения DBH, HT и AGB деревьев из Национального реестра Германии 1987 года, использованные в этом исследованииПримеры из Мексики
Четыре линейных (в логарифмическом масштабе) уравнения биомассы [53] с опубликованными оценками \ (\ hat {R} _ {adj} ^ {2} \), \ (\ hat {\ sigma } _ {e} \), а стандартные ошибки коэффициентов регрессии используются для демонстрации процедур восстановления.Уравнения (№ 1–4) приведены в таблице 8. Три нелинейных уравнения биомассы для Quercus spp. [52] с неизвестными стандартными ошибками коэффициентов регрессии (№ 5–7).
Таблица 8 Уравнения биомассы надземных лесных деревьев (AGB кг дерева −1 ) для пяти видов и группы видов в МексикеПроцедуры восстановления демонстрируются данными национальной инвентаризации лесов Мексики 2004–2009 гг. [47, 48]. В частности, были включены 132 пробных участка и 1843 дерева с известными DBH и HT (Таблица 9).
Таблица 9 Сводные данные о размере деревьев (средняя DBH см, средняя HT m), плотности стволов по группам видов ( N га −1 ) и прогнозы биомассы надземных лесных деревьев, зависящие от модели (AGB Mg ha −1 ) на участках NFI Мексики (2004–2009 гг.)Применение восстановленной статистики
Вышеупомянутые процедуры восстановления мотивированы необходимостью предоставить инвентаризационные оценки AGB с оценкой ошибок выборки и модели. {t} _ {{| {\ mathbf {b}} = {\ hat {\ mathbf {b}}}}} {\ text {c}} \ widetilde {\ text {o}} {\ text {v}} \ left ({{\ шляпа {\ mathbf {b}}}} \ right) \, \ overline {{\ frac {{\ partial f \ left ({{\ mathbf {x}} _ {j} | {\ mathbf {b}}}) \ right)}} {{\ partial {\ mathbf {b}}}}}} _ {{| {\ mathbf {b}} = {\ hat {\ mathbf {b}}}}} $$
(9)
где n s — это количество деревьев видов s в выборке инвентаризации, а черта вверху указывает среднее значение по n с деревьев.{2} \ hat {V} \ left ({\ hat {\ lambda} _ {s}} \ right) \) [70, с. 228], если предположить нулевую ковариацию между плотностью стержня и AGB. При допущении независимости ошибок модели для разных видов дисперсия ошибок модели для группы или всех видов вместе взятых рассчитывается как сумма дисперсий отдельных видов. Когда одно уравнение биомассы используется для более чем одного вида, будет ковариация ошибок модели среди видов, использующих уравнение биомассы [12].