Наука в кризисе: эмпирическое обоснование, воспроизводимость и социальный контекст
Пирамида доказательств и байесовское доверие
Научные доказательства имеют границы применимости и требуют байесовского доверия (степени уверенности). Ни один элемент пирамиды доказательств (например, одно РКИ) сам по себе не является абсолютным доказательством. Каждый элемент несет разный вес, и решения должны приниматься на основе совокупности данных.
Доверительные интервалы и размер выборки
Доверительный интервал — это оценка точности полученного результата (например, величины эффекта). Он показывает диапазон, в котором с высокой вероятностью находится истинное значение.
Пример: График клинических исследований показывает, что величина эффекта имеет широкий доверительный интервал в исследованиях с малой выборкой и очень узкий — в исследованиях с большой выборкой.
Ключевая зависимость: Размер доверительного интервала напрямую зависит от размера выборки. Большие выборки увеличивают точность оценки.
Однако: Огромные выборки позволяют обнаруживать микроскопические, статистически значимые, но клинически незначимые эффекты. Важен прагматический и ценностный аспект: наука избирательна и исследует значимые для текущей парадигмы явления.
Моделирование и проблема переноса условий
Наука часто использует модели (например, идеальный газ), которые являются абстракциями, но обладают высокой предсказательной силой.
Проблема переноса: Эксперименты в искусственных, максимально контролируемых условиях часто не воспроизводятся в естественных, экологических условиях. Это создает иллюзию понимания.
Примеры:
- Исследования лекарств на строго соблюдающих протокол пациентах показывают эффект, который исчезает в реальной жизни.
- Исследования на животных с искусственно вызванными состояниями могут показать эффект препарата, который не будет наблюдаться у людей с естественным течением болезни.
Вывод: Важно максимально приблизить условия эксперимента к реальности, чтобы ответить на практический, а не теоретический вопрос.
Кризис воспроизводимости: масштаб, причины и реакция
Кризис воспроизводимости — это системная проблема, когда многие опубликованные научные результаты не подтверждаются при повторных исследованиях.
Данные из различных дисциплин:
- Медицина: Из 53 знаковых доклинических исследований рака воспроизвелись только 6.
- Психология: В проекте воспроизводимости 100 знаковых экспериментов воспроизвелись только 36%.
- Опрос Nature: 70% исследователей не смогли воспроизвести результаты коллег; более 50% не смогли воспроизвести свои собственные эксперименты.
- 90% опрошенных ученых признают существование кризиса.
Научное сообщество не игнорирует проблему: Тревогу начали бить ученые изнутри (например, статья Иоаннидиса "Why Most Published Research Findings Are False" в 2005 году).
Системные и методологические корни кризиса
Неправильная интерпретация статистической значимости (p-value)
Статистическая значимость (p < 0.05) — это вероятность получить наблюдаемый результат при условии, что нулевая гипотеза верна (эффекта нет).
Распространённая ошибка: Исследователи часто ошибочно трактуют p-value как вероятность того, что эффект реален (95%), что является грубой инверсией логики.
Модель "Дерева гипотез" и проблема мощности
- Предположим: Только 10% проверяемых гипотез истинны.
- Для ложных гипотез: Порог p < 0.05 означает, что в 5% случаев мы получим "значимый" результат по случайности (ложноположительные).
- Для истинных гипотез: Тест с мощностью 80% обнаружит эффект только в 80% случаев (истинноположительные).
Итог модели: Доля ложноположительных среди всех "значимых" результатов может составлять 36% и более. В реальности, при низкой мощности исследований (часто 8-31%), эта доля становится подавляющей.
Публикационное смещение (Publication Bias)
Журналы и исследователи предпочитают публиковать "положительные" результаты. Исследования с нулевым или отрицательным результатом часто остаются "в столе", искажая общую картину.
Трагедия общин и равновесие Нэша
Текущая система (p < 0.05, акцент на положительные результаты) невыгодна науке в целом, но ни один журнал или учёный не может изменить правила в одиночку. Для изменений нужна координация всего научного сообщества.
Закон Гудхарта и накрутка метрик
Когда количественные метрики (число публикаций, цитирования) становятся самоцелью и основой для карьеры ("публикуйся или умри"), они подменяют истинную цель — получение надежного знания. Любая вводимая метрика со временем начинает накручиваться.
Метапроблема: человеческий фактор и социальный контекст
Мотивированное мышление
Мотивированное мышление — подход, когда исследователь изначально имеет идеологическую позицию и подбирает данные для ее подтверждения, а не для ответа на беспристрастный вопрос.
Институциональный подход vs. подход к личности: Помимо воспитания "идеальных ученых", необходимо создавать институциональные механизмы (пререгистрация, независимые проверки), которые будут ограничивать возможность ошибок даже для неидеальных исследователей.
Роль личности, среды и неравенство
- Мужество скептика: Пример нейрофизиолога Карла Лешли, публично отказавшегося от своей теории, показывает важность научной добросовестности.
- Неравенство возможностей: Учёный из США или Европы имеет больше шансов быть услышанным, чем коллега из России или СНГ. Важны нетворкинг и пиар.
- Перекосы критического мышления: Гиперкритичность также может привести к крайностям (примеры Джона Иоаннидиса и Андреаса Гётше).
Наука как социальный процесс
- Табуированность тем часто связана с социальным давлением, лоббированием и сложностью получения финансирования для непопулярных исследований.
- «Трикстеры» в науке (вроде Д. Бема) полезны, так как выявляют слабые места методологии.
- Правило «бабушки Талеба»: если результат звучит сенсационно и неожиданно — скорее всего, он не воспроизведётся.
Состязательное сотрудничество — идеал самоисправления
Идеальный пример — проверка «эффекта обратного действия». Авторы оригинального и нового исследований провели совместную работу, согласовали дизайн и вместе пришли к выводу, что эффекта, вероятно, не существует. Это модель того, как наука должна себя корректировать.
Эпистемологические выводы и практические советы
Байесовский подход и отказ от наивных позиций
Наивный реализм: Всё, что говорит наука, — истина в последней инстанции.
Наивный антиреализм: Всё, что говорит наука, — чепуха.
Байесовский подход: Доверие к гипотезам — это весы, на которые кладутся свидетельства. Доверие должно быть градуированным и зависеть от качества доказательств.
Метафизические интуиции
Метафизические посылки (вера в математический платонизм, физикалистский редукционизм) могут влиять на мотивацию и амбициозность исследователей.
Финальные рекомендации
- Проясните основания своей веры. Изучите философию науки, чтобы сделать информированный выбор.
- Не останавливайтесь в любопытстве. Изучайте противоположные точки зрения, будьте готовы менять мнение.
- Относитесь к науке трезво. Это мощный, но несовершенный инструмент. Доверяйте ей с умом, оценивая степень доказательности каждого конкретного утверждения.
Итоговые выводы
- Научное знание вероятностно. Доверять ему нужно с определенной степенью уверенности, понимая границы методов.
- Кризис воспроизводимости — реальная системная проблема, коренящаяся в устаревших статистических конвенциях и институциональных стимулах, а не только в индивидуальной недобросовестности.
- Ключ к улучшению — в правильном подходе и институциональных изменениях: Четкая формулировка вопроса, пререгистрация, приближение условий к реальности, а также координация всего сообщества для пересмотра стандартов.
- Наука — это социальный институт и мастерская, а не храм истины. Её сила — в механизмах самокоррекции и состязательного сотрудничества. Это прагматичный инструмент, который постоянно развивается, сталкиваясь с внутренними противоречиями.