Пишите нам на адрес |
Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...
|
|
Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа ОТЗЫВ врача-кардиолога М.В. Емельяненко, ФКУ «Центральный военный госпиталь имени П.В. Мандрыка» МО РФ, Москва, о проведённом статистическом анализе. Хочу выразить глубокую признательность за качественный и весьма объёмный труд, проделанный Вами по статистическому анализу моей базы данных. Особенную благодарность, без сомнения, хотелось бы выразить руководителю проекта «БИОМЕТРИКА» - Василию Петровичу Леонову. Причина такой благодарности следующая. Помимо структурированного статистического анализа присланных в Ваш адрес медицинских данных, Вы подробно и, что самое невероятное, – доступным образом разъяснили мне суть каждого метода, который был применён при анализе моей матрицы. (далее...) ОТЗЫВ Ахметова А., (Казахстан), о сотрудничестве с БИОМЕТРИКОЙ. Когда я взялся за написание диссертации, то вначале я пытался самостоятельно выполнить статистический анализ собранных мною данных. Для этого пробовал использовать EXCEL и STATISTICA. Однако по мере расширения набора используемых методов анализа, всё яснее стал осознавать, что я не понимаю как сами методы, так и получаемые результаты. Чтобы лучше в этом разобраться, стал очень часто посещать сайт БИОМЕТРИКА. Иногда ежедневно по 2-3 часа читал на этом сайте разные статьи. Особенно полезными были обзоры по Кузбассу, по кардиологии, а также статья "Долгое прощание с лысенковщиной". (далее...)" Новые полезные книги... (Заказать книгу можно через издательство) Ланг Т., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов. Пер. с англ. В.П. Леонова. 2016 - 480 с. Актуальность этого издания весьма велика. По-прежнему в биомедицинских статьях и диссертациях публикуется масса статистических нелепостей, как образцы "статистического самоудовлетворения" и "статистического макияжа". Например, в двух диссертациях, выполненных в 2014 и 2015 гг. в Алтайском медуниверситете по разным специальностям, но при этом в полностью идентичных описаниях, состоящих из 94 слов, написано следующее. «Полученные данные были статистически обработаны с использованием программ Microsoft Offis Exel 2007. Достоверность различий между средними величинами определяли с помощью критерия значимости Стьюдента (t). Нормальность распределений в группах оценивали по критерию Шапиро-Уилка». Далее сообщается об использовании критерия Манна-Уитни, и т.д. Очевидно, что под Offis Exel авторы подразумевали Office Excel. Сложнее было бы об этом догадаться, если бы авторы написали Offis Exul. Вывод: оба диссертанта, как и члены двух диссертационных советов, не знают многого, в том числе описанного в этой книге. Например, не знают того, что в пакете Office Excel нет критериев Шапиро-Уилка и Манна-Уитни. Данная книга обучит правильно и хорошо описывать и понимать результаты статистического анализа. Поэтому исследователи станут более качественно выполнять статистический анализ, получая правильную технологию лечения пациентов. Что в результате будет снижать смертность населения, а также себестоимость лечебных процедур. Приложение к русскому изданию книги «Как описывать статистику в
медицине. Руководство для авторов, редакторов и рецензентов». Петри А., Сэбин К. Наглядная медицинская статистика. Учебное пособие. 3-е издание. Пер. с англ. В.П. Леонова. 2015. - 216 с. Предыдущие издания оригинала этой книги были опубликованы в 2000, 2005 и 2009 гг. Третье издание книги, как и два предыдущих, имеет целью донести до читателя основные понятия и принципы медицинской статистики, которые достаточно широко используются зарубежными медиками и биологами. Книга содержит необходимую теоретическую часть, а также в доступной форме даёт практическое описание того, как могут применяться статистические методы в реальных клинических исследованиях. Низкий уровень использования статистики в отечественной медицинской науке является одной из основных причин, по которым уже 111 лет Нобелевские премии по медицине не присуждаются россиянам. Ценность этой книги для медицинской науки определяется и проводимой в России реформой отечественной науки, в том числе реформой ВАК и системы научной аттестации. Учебное пособие предназначено для студентов, аспирантов и докторантов медицинских вузов, биологических факультетов университетов, врачей, исследователей-клиницистов и всех, кто является сторонником доказательной медицины. Банержи А. Медицинская статистика понятным языком: вводный курс. Издательство "Практическая медицина", 2014. - 287 с. Пер. с англ. В.П. Леонова. Т. Гринхальх. Основы доказательной медицины. Издательство "ГЭОТАР-Медиа", 2015. - 336 с. 4-е издание переработанное и дополненное. Пер. с англ. Под ред. И.Н. Денисова, К.И. Сайткулова, В.П. Леонова. RusDASL - российская библиотека данных для изучающих биометрику и биостатистику. DASL (The Data and Story Library ) - под такой аббревиатурой на веб-сайте Carnegie Mellon University размещена известная библиотека исходных статистических данных данных из различных отраслей науки. Теперь аналогичная библиотека открыта на БИОМЕТРИКЕ и для российских пользователей. Кунсткамера Один из моих коллег по университету долгое время собирал коллекцию под названием "Бредотека". В ней он коллекционировал разнообразные примеры бредовых идей, сообщений и высказываний. Другие собирают аналогичные коллекции под названием "Абсурдотека". Свою коллекцию образцов статистической некорректности, а подчас и невежества, мы решили назвать "Кунсткамера". Открыт зал экспонатов журнала "Бюллетень экспериментальной биологии и медицины". Подведены итоги конкурса на эпиграфы к этому разделу Новый экспонат КУНСТКАМЕРЫ: Диссертация Порываевой О.В., Барнаул, 2004 г. "...Полагаю, что отмеченных выше недостатков уже более чем достаточно, чтобы обратиться в ВАК РФ с предложением о повторном изучениии данной работы в экспертном совете ВАК. Обновление раздела КУНСТКАМЕРА - диссертации "Содержание микронутриентов у школьников г. Сургута", "Организационно-методические условия оздоровительных занятий студенток специальной медицинской группы с диагнозом нейроциркуляторная дистония", Сургутский государственный университет. Новый экспонат КУНСTКАМЕРЫ - Диссертация «Анализ полиморфизма генов сердечно-сосудистой системы и системы детоксикации в различных возрастных группах Санкт-Петербурга». Обсуждаемая диссертация являет собой ярчайший пример того, какую злую шутку может сыграть с автором игнорирование проблемы множественных сравнений при статистическом анализе полученных данных. Новый экспонат КУНСTКАМЕРЫ - Диссертация "Оценка проаритмических факторов при постинфарктной систолической дисфункции миокарда и эффективности их фармакологической коррекции", Кемеровская государственная медицинская академия, Кемерово - 2004 г. Новый экспонат КУНСTКАМЕРЫ - Диссертация "Сравнительная характеристика показателей кардиореспираторной системы спортсменов и лиц, не занимающихся спортом, в условиях северного промышленного города", Тюменский государственный университет, Тюмень - 2006 г. Доклад "Почему и как надо учить медиков статистике?" В. Леонов. Зачем нужна статистика в доказательной медицине? В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193. |
Долгое прощание с лысенковщиной Меметический анализ описаний методов статистики Приведенные выше клише, используемые для описания статистических методов, и являются типичными мемами, которыми инфицированы многие авторы биомедицинских публикаций. Часть используемых мемов вполне адекватно описывает несложный статистический инструментарий применяемый авторами. Однако подавляющее большинство меметических описаний несут на себе отпечаток фрагментарности и логической и вербальной незавершенности их конструкции. Фактически в этой ситуации автор уподобляется умельцу, которому в руки попал конструктор типа "Сделай сам" с набором тех или иных элементов, но при том, что в коробке отсутствует программа сборки нужного изделия. По этой причине часто наблюдается отстраненность и удаленность содержательной стороны выполненного анализа и его меметического описания. Нередко встречаются специфические "меметические цепочки" состоящие из дословно повторяющихся предложений следующих в ряду статей или диссертаций. Эта специфика может проявляться по-разному. Ниже мы рассмотрим несколько подобных специфических мемов, и обсудим их возможные инфекционные траектории. В приведенной ниже таблице даны четыре авторских описания, относящиеся к определению ими достоверности различия. Три из них приведены в следующих диссертациях: №1 - Лечение хронического описторхоза препаратом из растительного сырья (попутрилом) и оценка его эффективности. Канд. дисс., 14.00.09 - педиатрия, 1995г.; №2 - Влияние некоторых стимуляторов центральной нервной системы на неспецифическую иммунобиологическую реактивность организма. Канд. дисс., 14.00.09 - инфекционные болезни, 1969г.; №3 - Ультразвуковая и радионуклидная диагностика патологии гепатобилиарной системы у детей дошкольного возраста. Канд. диссер., 14.00.09 - педиатрия, 14.00.19 - лучевая диагностика,1997г. Четвертое же описание приведено в коллективной монографии [102]. Те части мема, которыми наиболее отличаются данные описания, выделены жирным курсивом и цветом.
Как видим, эти четыре описания весьма похожи друг на друга. Менее всего отличаются между собой описания из диссертаций №2-3 и монографии [102]. Наши исследования показали, что данный мем имеет достаточно большой "возраст". К примеру, если кандидатские диссертации №1 и №3 защищены в 1995г. и 1997г, а коллективная монография [102] издана в 1996г., то диссертация 2 датирована еще 1969г. Однако ни в одной из этих работ нет одного и того же исследователя, более одного раза выступающего в роли автора, либо в роли научного руководителя. Это делает более вероятным предположение о том, что "инфицирование" этим мемом произошло от некоего пятого источника, носителя данного мема. Хотя не исключено, что некоторые из авторов упомянутых работ познакомились с ним и через предшествующие работы. Обратим также внимание читателей на наличие в 4-х случаях субмема "показатель точности", причем в 3-х случаях он называется "абсолютным показателем точности". Наши попытки найти наиболее вероятный источник инфицирования этим мемом успеха не имели. Попытаемся выяснить, какой смысл могли вкладывать авторы этих работ в "показатель точности", используя для этой цели следующий мем, использованный в монографии [102] и диссертации №3 и приведенный в таблице ниже.
Авторы монографии [102] не приводят в этом меме объяснения величины (р). В этом случае можно считать, что авторы подразумевают под величиной (р) уровень значимости, и тогда в последнем предложении использованного мема нет противоречия. Действительно, "при p < 0,05" мы имеем доверительную вероятность более 95% . Таким образом, вероятнее всего авторы монографии [102] подразумевали уровень значимости, величина которого дополняет доверительную вероятность до единицы: р = 1 – Рдов. Совершенно иную, противоречивую и бессмысленную конструкцию имеет этот мем в диссертации №3, где величина (р) определяется как "вероятность различия". В одном и том же предложении диссертант утверждает, что "Различие считалось достоверным при p < 0,05, т.е. в тех случаях, когда вероятность различия составляла больше 95%". Таким образом, мы имеем случай рекомбинации мемов, в результате которой новый мутантный мем приобрел достаточно искаженную и лишенную смысла форму. Если рассмотренные выше 4 источника относятся к разным областям медицинской науки, то следующие 2 диссертации - №4 и №5, объединяет не только одна научная специальность 14.00.37 – анестезиология и реаниматология, но и один научный руководитель. №4 - Патогенетическое обоснование вариантов экстракорпоральной детоксикации в комплексной терапии токсической стадии острого разлитого перитонита (экспериментально-клиническое исследование). Канд. дисс., 14.00.37 – анестезиология и реаниматология, 1996г. №5 - Экспериментальная оценка нового метода мембранного плазмафереза. Канд. дисс., 14.00.37 – анестезиология и реаниматология, 1998г. №6 - Оптимизация лечения осложненных острых воспалительных заболеваний придатков матки у юных женщин). Канд. дисс., 14.00.01 – акушерство и гинекология, 1997г. На первый взгляд различие же между этими мемами лишь в двух словах и одной букве. Однако главное
различие между ними в том, что авторы диссертаций №4 и №6 удовлетворились в своей работе только одним "методом" вариационной статистики, тогда как в диссертации №5 использованы уже несколько "методов". Иными словами, первые два диссертанта полагают что "вариационная статистика" и представляет собой один единственный метод, отождествляя его с t-критерием Стьюдента. Третий же диссертант предполагает наличие нескольких методов, которые и необходимы для использования Т-критерия Стьюдента. Как видим, эти две позиции имеют принципиальную разницу между собой. Вместе с тем, данные диссертации объединяет и субмем "в условиях доверительной вероятности", который достаточно верно выражает этот аспект описываемой процедуры. Анализ публикаций показал, что достаточно широко используются оба типа мема, как тот, где постулируется наличие нескольких "методов", так и мем с наличием одного "метода". Отметим, что такое восприятие статистики авторами публикаций характерно не только для "вариационной статистики", но и для других видов статистики. "Статистическую обработку цифрового материала проводили по стандартному методу вариационной статистики на электронно-вычислительной машине ЕС-1033 …" - стр. 58 диссертации "Состояние легочной вентиляции и механики дыхания при острой пневмонии", 14.00.05 – внутренние болезни, 14.00.43 – пульмонология, 1990г. "В эксперименте различие показателей по сравнению с контролем и между возрастными группами оценивались методами вариационной и разностной статистики по критерию Стьюдента и считались достоверными при Р < 0,05" - стр. 46 диссертации "Функции почек и водно-солевой баланс у крыс при гипо- и гиперосмии в динамике беременности", 14.00.17 – нормальная физиология, 1992г. "Вычисление, обработку полученных результатов осуществляли методом математической статистики при помощи программируемого микрокалькулятора "Электроника МК-52" с использованием специальных программ" - стр. 43 диссертации "Регионарная вентиляция, кровоток, механизмы дыхания у здоровых людей, больных хроническим бронхитом и бронхиальной астмой", 14.00.05 – внутренние болезни, 14.00.16 – пат. физиология, 1994г. Интересно, как бы воспринял хирург следующее описание: "Внутриполостная операция производилась методом хирургии"? Анализ мемов со сложной конструкцией не всегда позволяет достаточно надежно представить те понятия и их смысл, которые авторы пытаются описать с помощью рекомбинантных мемов. По своему языку и стилю такие описания нередко напоминают известные произведения А. Платонова "Котлован" и "Чевенгур". Приведем одно из подобных описаний содержащихся на стр. 30 диссертации "Клиника и дифференциальная диагностика инфекционых экзантем у детей", 14.00.09 - педиатрия, 14.00.10 - инфекционные болезни, 1998г. и сделаем попытку его анализа. " Для определения
значимости выборочных показателей,
оценки сущности двух или
нескольких показателей, а также
определения связи между явлениями,
полученных (так в тексте,
выделено нами - В.Л.) в результате
выборочных иследований, были
использованы следующие формулы:
"...(далее идут формулы ошибки
среднего, среднеквадратичного
отклонения и t-критерия Стьюдента -
В.Л.). Итак, каков же смысл первого
утверждения - "определение
значимости выборочных показателей"?
Предположим, что из выборки в 50 наблюдений мы получили выборочный показатель - среднее арифметическое значение систолического давления равное 90 мм рт ст. Что в таком случае мы должны понимать, согласно автору, под "значимостью выборочного показателя"? Как предлагает автор "оценить сущность двух или нескольких показателей", например того же среднего систолического и диастолического давления, содержания иммуноглобулинов, СОЭ и т.д. и какой смысл вкладывает автор в термин "сущность"? Не ясно и то, как собирается автор "определять связи между явлениями", поскольку ни в приводимых ниже формулах, ни в тексте диссертации об этом ничего не сказано. Продолжим авторский текст: "Пределы возможных колебаний (доверительные интервалы) средних величин, полученные в выборочном исследовании принимались равными удвоенной средней ошибке (+2m), что даёт основание с вероятностью 95% отнести полученную закономерность ко всей генеральной совокупности". Итак, в первой половине этого предложения автор пытается объяснить технологию построения им 95%-ных доверительных интервалов. Однако из его объяснения не ясно, какой смысл имеет величина (+2m). Является ли это величина шириной 95%-ного доверительного интервала, либо же это полуширина, и тогда полная ширина доверительного интервала равна 4m? Остановимся на первой версии, согласно которой весь доверительный интервал равен 2m. В этом случае, принимая что данный интервал является симметричным (на это указывает нам используемый автором критерий Стьюдента, а стало быть распределение вероятностей подчиняется нормальному закону), получим, что левая граница интервала будет равна (Хср.-1m), а правая граница интервала будет равна Хср.+1m. Тогда полуширина доверительного интервала будет равна 1m. Но тогда для построения 95%-ного двустороннего доверительного интервала необходимо использовать квантиль уровня 0,975 , который не может быть равен 1 даже для таких объемов выборок, которые равны нескольким сотням и тысячам. Так для бесконечно большого объема выборки он равен 1, 96, для выборки объемом 60 наблюдений соответствующий t-квантиль распределения Стьюдента будет равен 2. Но в этом случае вся ширина для 95%-ного доверительного интервала будет равна учетверённому значению m, а не удвоенному. Итак, какой же доверительный интервал строит диссертант и для каких обхемов выборок? Не меньше вопросов возникает и при изучении второй половины данного предложения, в которой речь идет о "полученной закономерности", поскольку ранее нигде автор ничего не говорит ни о видах закономерностей, ни о методах их оценки. Рассмотрим еще один пример такого сложного мема, синтезированного из нескольких субмемов. "Полученные результаты обработаны методом вариационной статистики с применением t-критерия Стьюдента, Х-квадрат и метода ранжирования непараметрических данных." (статья "Особенности терапии верапамилом, нитратами и корватоном у больных со стенокардией в сочетании с гипотонией", Сибирский медицинский журнал, N2, 1996г., стр. 26.). Первая часть этого мема сообщает об использовании вариационной статистики. Хотя это название и является уже устаревшим (см. например, книгу П.Ф.Рокицкого "Биологическая статистика" (1973г.), где он объясняет свой отказ от прежнего названия "Вариационная статистика"), однако само по себе оно не конфликтует с остальным содержанием мема и статьи. Однако упоминание о t-критерии Стьюдента уже требует выполнения двух обязательных условий, о чем ни в данном меме, ни в самом тексте статьи ничего не сообщается. Из чего можно сделать достаточно обоснованное предположение о том, что авторы не проверяли эти условия. Далее, обратимся к результатам проверки гипотез о равенстве средних в группах, приведенным в таблицах 1-3 на стр. 29. В табл. 1 речь идет о числе приступов стенокардии, т.е. о дискретной величине. Такая же дискретная величина и в табл.3 - число гипоперфузируемых сегментов. По причине дискретности этих величин, имеющих достаточно ограниченное число значений, применение t-критерия Стьюдента невозможно. И только в табл. 2 речь идет о непрерывной величине - продолжительности (времени) пороговой нагрузки, и поэтому в принципе, при выполнении известных ограничений, в данном случае применение t-критерия Стьюдента возможно. Однако остается вопрос, как же проверялись гипотезы в табл. 1 и 3? В анализируемом меме после t-критерия Стьюдента речь идет о критерии "Х-квадрат". Предполагая, что при наборе текста вместо греческой буквы "Хи" была набрана латинская буква "Х", можно далее предположить, что здесь речь идет о критерии "Хи-квадрат". Однако этот критерий не используется для проверки подобных гипотез. Неясно тогда какие же гипотезы и в каких случаях проверялись с его помощью, поскольку в тексте статьи о них ничего не сообщается. Далее в тексте мема упоминается "метод ранжирований непараметрических данных".Что такое "непараметрические данные" видимо известно только кому-то из 8 соавторов этой статьи. Поскольку и в "вариационной статистике", как и в математической статистике, отсутствует такое понятие, как "непараметрические данные"[107, 108]. Итак, какими же статистическими критериями получены выводы в табл. 1 и 3 и что такое "непараметрические данные"? Ещё один пример мема не поддающегося анализу. "Для исследования соотношения определяемых факторов использовался многоуровневый корреляционный анализ" - стр. 21 диссертации "Состояние местного иммунитета при язвенной болезни", 14.00.05 - внутренние болезни, 1994г. Ни контекст этого мема, ни содержание диссертации никак не расшифровывают, что подразумевал диссертант под "многоуровневым корреляционным анализом". Можно предположить, что корреляционный анализ выполнялся последовательно на разных уровнях (в разных иерархически расположенных группах) и затем коэффициенты корреляции для одних и тех же пар признаков разных уровней сравнивались между собой. Однако изложенные в диссертации результаты исследования не содержат ни таких уровней, ни сравнения разноуровневых коэффициентов корреляции. Во многих работах само понятие "закономерности" для авторов ассоциировало с понятием функции и функциональной связи. В частности, нередко в тех местах своего описания, где автор вел речь об оценке зависимостей между различными изучаемыми показателями, наблюдались рекомбинации со словосочетаниями "функциональная зависимость" или "функциональная связь". "Функциональная зависимость между показателями определялась с помощью корреляционного и регрессионного анализа" - стр. 46 диссертации "Функции почек и водно-солевой баланс у крыс при гипо- и гиперосмии в динамике беременности", 14.00.17 - нормальная физиология, 1992г. "Функциональная связь при коэффициенте корреляции (r) до 0,5 оценивалась как слабая, 0,5 - 0,7 средняя, 0,7 - 0,9 сильная и от 0,9 до 1,0 как тесная" - стр. 50 диссертации "Особенности регуляторно-метаболических параметров иммунокомпетентных клеток крови у лиц с разным соматотипом", 14.00.17 - нормальная физиология, 1997г. Элементарное представление о функции сейчас изучается в начальной школе. Обратимся к статье "Функция" в "Советском энциклопедическом словаре" (1982г., стр. 1449): "Функция (матем.), 1) зависимая переменная величина. 2) Соответствие y=f(x) между переменными величинами, в силу которого каждому рассматриваемому значению некоторой величины х(аргумента, или независимого переменного) соответствует определенное значение другой величины y (зависимой переменной, или функции). Такое соответствие может быть задано различным образом, например, формулой, графически или таблицей (типа таблицы логарифмов)." Теперь обратимся к статье "Корреляция" на стр. 642 этого же словаря: "Корреляция (в матем. статистике), вероятностная или статистическая зависимость. В отличие от функциональной зависимости корреляция возникает тогда, когда зависимость одного из признаков от другого осложняется наличием ряда случайных факторов". Аналогичным же образом определяется этот термин и в "Статистическом словаре" (1989г., стр. 213): " Корреляция - зависимость между случайными величинами, не имеющая строго функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой". Итак, функциональная зависимость и корреляционная или регрессионная зависимости являются антиподами. В живых организмах, как наиболее сложных природных творениях, практически не встречаются функциональные зависимости в чистом виде, а преобладают именно вероятностные, статистические. И именно по этой причине столь необходима прикладная статистика как инструмент исследования в биомедицине. Наиболее частая конструкция рекомбинированного мема описания состоит из двух или трех ядер. В одном из них, обычно в первом ядре, упоминается сам факт использования ЭВМ или персонального компьютера. В следующем ядре упоминается название одного или нескольких статистических методов. И завершает эту конструкцию упоминание названия статистического пакета. Как правило, при использовании подобных рекомбинированных мемов далее в тексте авторы уже не возвращаются к их содержимому. Например, выше мы уже упоминали статью "Использование эссенциальных фосфолипидов в лечении больных ишемической болезнью сердца и инсулиннезависимым сахарным диабетом" (Кардиология, 1996, N1, стр. 30-33), где всё описание имеет следующий вид (стр.31): "Полученные данные обрабатывали на ЭВМ методами многомерной статистики". Однако отсутствие в тексте статьи даже намеков на эти самые "многомерные методы" и обсуждения результатов их применения, позволяют высказать вполне обоснованное предположение о том, что данное описание является не более чем камуфляжным мемом. Наличие таких мемов в статьях журнала "Кардиология" не является какой-то редкостью, несмотря на требования самой редакции журнала о детальном описании авторами статей использованных ими статистических методов. |
Архив статьи "Долгое прощание с лысенковщиной"
1997 - 2020.© Василий Леонов. E-mail:
Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.
Отклики читателей статьи "Доказательная или сомнительная?"
Т. Кун "Структура научных революций"