16.05.2011 г. на сайт пришло 2561 человек, открывших 3205 страниц 14.11.2011 г. на сайт пришло 2106 человек, открывших 3250 страниц 14.12.2011 г. на сайт пришло 2640 человек, открывших 3452 страниц 17.01.2012 г. на сайт пришло 2439 человек, открывших 3097 страниц 03.03.2012 г. на сайт пришло 2219 человек, открывших 3019 страниц 30.05.2012 г. на сайт пришло 3512 человек, открывших 4706 страниц 06.03.2014 г. на сайт пришло 2556 человек, открывших 3179 страниц 08.02.2015 г. на сайт пришло 2341 человек, открывших 2682 страницы Если приходят, значит полезное находят.. Наш адрес: |
Выбрав любое изображение, кликните по нему мышкой, и Вы узнаете о статистике ...
|
На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайте БИОМЕТРИКА , рекомендую перейти на файл "Поиски методов или результатов статистического анализа". |
Логистическая регрессия в медицине и биологии В. Леонов
Логистическая регрессия. Введение. В данной серии статей, на уровне доступном для начинающих, рассмотрены цели и направления метода логистической регрессии. В частности, приводятся пояснения, какие надёжные результаты этого метода могут быть использованы для поставленных целей медицинских и биологических исследований. На примерах реальных медицинских массивов данных, поясняется специфика использования данного метода. Объяснено, что метод имеет много алгоритмов оценки уравнений логистической регрессии, что позволяет назходить для использования во врачебной практике самые удобные и надёжные методы лечения. Рассмотрено использование метода к массивам данных, содержащим несколько сотен признаков разной природы. Показано, что корректное создание таких массивов, и их анализ, возможны лишь при участии биостатистиков на самых первых этапах таких исследований. Рассмотрена связь логистической регрессии и ROC-анализа. Приведены многочисленные уравнения логистической регрессии и ROC-кривые, полученные при анализе реальных данных. Объяснена целесообразность использования вместе с методом логистической регрессии набора методов анализа парных взаимосвязей между различными признаками, а также использование более сложных методов многомерной статистики.
Логистическая регрессия. Основные понятия и возможности метода. При научных занятиях метод Данная статья посвящена методу логистической регрессии и особенностям его применения в медицине и смежных науках. Теория логистической регрессии достаточно сложна, поэтому мы рассмотрели ниже лишь основные понятия этого метода, а также привели небольшой обзор решений, полученных автором в последнее время при анализе реальных данных. Статья имеет 3 основных цели. Во-первых, познакомить с основными понятиями и возможностями данного метода. Во-вторых, рассмотреть специфику подхода к постановке и решению таких задач, которые могут быть решены с помошью этого метода. В-третьих, продемонстрировать на примере анализа реальных массивов данных типичные результаты, получаемые при использовании этого метода. N.B.! Перед чтением данной статьи, настоятельно рекомендуем прочитать статью "Логистическая регрессия. Введение"
В разделе «ДОКАЗАТЕЛЬНАЯ МЕДИЦИНА И
СТАТИСТИКА» (http://www.biometrica-tomsk.ru/kuzbass2.htm ) нашего обзора «Доказательная или сомнительная? Медицинская наука Кузбасса:
статистические аспекты» мы уже частично касались возможностей данного метода. Большинство
используемых на практике статистических методов можно рассматривать как способы
оценки статистической взаимосвязи между двумя или более признаками,
переменными. Например, при сравнении средних значений одного количественного
признака двух или более групп пациентов (контроль, больные и т.п.), мы изучаем
статистическую взаимосвязь между одним группирующим признаком, и одним
количественным признаком. В том
случае, когда такая взаимосвязь оказывается статистически значимой, возможно
оценить также и силу, интенсивность этой связи. Для этого могут быть
использованы различные показатели интенсивности такой связи. Как правило, такие
показатели имеют значения в интервале от 0 до 1.
Рассмотрим следующий пример. Изучается
влияние прегравидарной подготовки (признак с двумя градациями: 1 – подготовка
проводилась; 2 – подготовка не проводилась) на исход родов (признак с двумя
градациями: 1 – кесарево сечение; 2 – самопроизвольные роды). Анализ таблиц
сопряжённости показал наличие статистически значимой связи этих двух признаков.
При этом сила такой связи также может быть выражена различными статистиками,
например, коэффициентом контингенции, Фи-коэффициентом,
или V-коэффициентом Крамера: В очередном примере изучается связь между
двумя количественными признаками: уровнем
глюкозы натощак и величиной индекса Homo. Корреляционный анализ
показал наличие статистически значимой связи двух этих признаков. Как и в
предыдущих примерах, интенсивность этой связи также может быть оценена специальной
статистикой, например, коэффициентом корреляции.
Перечисленные выше парные зависимости имеют и вторую ипостась. В них можно оценивать не только показатели интенсивности этой связи, но также оценивать и выражения, с помощью которых по значению одного признака можно оценивать значение второго признака. Точность таких оценок зависит от многих факторов, в том числе и от формы исследуемой взаимосвязи. В подобных парных зависимостях не всегда возможно надёжно указать направление причинно-следственной связи. Нередко оба признака есть следствия множества других причин. Поэтому для их учёта необходимо от парных зависимостей переходить к многомерным методам. В чём принципиальное отличие таких многомерных методов от парных? Рассмотрим это отличие на примере множественной регрессии. Для пары
количественных признаков мы может оценить с помощью коэффициента корреляции
интенсивность этой связи. И для той же пары признаков можем оценить и различные
уравнения регрессии. Они могут иметь такой вид: Y=a + b*X; X=c+d*Y. Если же
зависимость имеет нелинейный характер, то эти уравнения могут выглядеть, например,
так: Y=a*Xb ; Y=a*ln (b+c*Х) или Y=a*exp(b+cX), и т.д.
Теперь перейдём к случаю множественной зависимости. Обозначим эту зависимость как Y=f(x1, x2, … , xk), где Y – зависимая переменная (выходная, результирующая переменная), а xi – независимые переменные (предикторы, объясняющие, предсказывающие признаки). В этом случае для оценки параметров данной множественной зависимости используются не только оценки парных связей вида Y-xi , но и оценки связей между парами предикторов xi - xj . Наиболее часто для оценки таких зависимостей используют метод множественной линейной регрессии. В этом случае зависимой переменной Y является количественный признак, а предикторами (независимыми переменными) xi – также количественные признаки. Классическую модель линейной регрессии можно выразить следующей формулой:
, где a0 – так
называемый свободный член (пересечение), ai – регрессионные
коэффициенты, хi – предикторы (независимые переменные), е – случайная ошибка. Расширением
такой модели может быть выражение вида
. В этой полиномиальной модели используются квадраты
независимых переменных xi2 , а также эффекты их взаимодействия xi*xj .
Если сравнить вторую регрессионную модель с первой моделью, то основное отличие заключается в наличии нелинейных эффектов вида xi2 и xi*xj. Иными словами, первая модель является сугубо линейной моделью, в которой величина зависимой переменной Y равна сумме значений предикторов хi , предварительно умноженных на некоторые весовые коэффициенты аi . Тогда как во второй модели помимо таких аддитивных эффектов используются в данной сумме ещё и нелинейные эффекты. Т.е. вторая модель по своей сути является моделью линейно-нелинейной. По своей структуре такая модель занимает промежуточное положение между линейной и нелинейной моделью. Нелинейные множественные регрессионные модели могут иметь различную структуру. Так одной из наиболее известных нелинейных моделей является мультипликативная производственная функция Кобба-Дугласа, которая была использована в 1928 г. Чарльзом Коббом и Полом Дугласом в работе «Теория производства». В ней авторы попытались выразить взаимосвязь между объёмом выпускаемой продукции Y и объёмами труда и капитала в виде функции Y=A*La*Kb. Как видно из этого выражения, нелинейность соотношения между зависимой переменной Y и предикторами L и K обеспечивается не только фактом перемножения предикторов, но также и предварительным нелинейным преобразованием этих предикторов путём их возведения в степень.
Однако подобные нелинейные преобразования возможно применять не только по отношению к предикторам, но и по отношению к самой зависимой переменной Y. Так достаточно популярно в регрессионном анализе использование семейства степенных преобразований Бокса-Кокса, в котором характер нелинейного преобразования зависимой переменной Y определяется величиной параметра m: W=(Ym – 1)/m, если m равно 0; W=lnY, m = 0. Существует
достаточно много алгоритмов оценки регрессионных коэффициентов таких моделей. Например, метод наименьших квадратов, метод
наименьших модулей, пошаговые алгоритмы отбора предикторов, ридж-регрессия и
т.д. Результатом этих алгоритмов являются уравнения регрессии, по которым можно
оценить интенсивность взаимосвязи зависимой переменной Y и подмножества предикторов. Отметим, что для всех многомерных
методов, в т.ч. и регрессионных моделей всех видов, отличительной особенностью
является поливариантность решений. Т.е. получение по одним и тем же исходным
данным некоторого набора различных решений. Различие уравнений в случае
регрессионного анализа будет обусловлено как различием используемых алгоритмов,
так и различием комбинаций используемых опций (вспомогательных условий) для
каждого из этих алгоритмов.
В случае логистической регрессии (она же логит-регрессия) зависимой переменной Y является дискретный качественный признак, имеющий две или более градаций. Данные градации могут быть закодированы как цифрами, например, 1; 2 и т.п., либо 4; 7; 12 и т.д., либо иными символами, например, буквами А; В; С и т.д. Отметим, что кодировка отдельных градаций цифрами (а не числами!) означает, что в этом случае выполняются лишь соотношения «равно» и «не равно», но не выполняются соотношения «больше» и «меньше». К примеру, если закодировать исход лечения как «1=выздоровление», и «2=пациент умер», то это не означает что градация 2 больше градации 1 в два раза.
Основное отличие логит-регрессии от
множественной линейной регрессии заключается в том, что в данном методе с
помощью полученного уравнения оценивается не само значение зависимой
количественной переменной Y, а лишь вероятность принадлежности наблюдения к той или иной
градации качественного признака. Простейшей моделью логит-регрессии считается
так называемая бинарная логистическая регрессия. В этом случае зависимый
качественный признак имеет всего 2 градации, т.е. является дихотомическим. Отсюда
и название «бинарная», т.е. имеющая 2 градации. Отметим, что, как и в случае множественной линейной регрессии, зависимая
дихотомическая переменная не обязательно является результирующей с точки зрения
причинно-следственных соотношений. Хотя в тех задачах, где полученное уравнение
используется в целях прогноза, зависимая переменная чаще всего представляет
собой именно следствие воздействия на изучаемую систему комбинации значений,
которые принимают предикторы.
Как
известно, вероятность может принимать значения в интервале от 0 (невозможное
событие) до 1 (достоверное событие). Напомним, что в медицине весьма
распространённой ошибкой является использование выражения «достоверное
различие». Критический анализ этого ошибочного оборота приведён в статье «О
неправильном употреблении термина "достоверность" в
российских научных психиатрических и общемедицинских статьях» (URL: http://www.biometrica-tomsk.ru/let1.htm ).
Рассмотрим набор данных, в котором зависимой переменной будет бинарный признак «Исход лечения» с градациями «1=выздоровление», и «2=пациент умер». Обозначим вероятность выздоровления пациента как «р». Поскольку сумма вероятностей этих двух исходов должна равняться 1, то вероятность летального исхода равна «1- р». Далее рассмотрим величину
называемую шансом (Ш). В этом
случае, например, для значения р=0,9 получим значение Ш = 0,9/(1-0,9) = 0,9/0,1
= 9. Смысл этой величины достаточно очевиден. Чем больше будет значение «р»,
тем больше будет и значение Ш. И наоборот. Для «р»=0,5 получим Ш = 1.
Следующее
преобразование позволит использовать не только положительную числовую полуось, на
которой принимает свои значения Ш, но также и отрицательную полуось. Для этого
прологарифмируем Ш. Логарифм Ш
принято называть
логитом. Название логистической регрессии связано с логистической функцией
распределения
(здесь «е» – основание
натурального логарифма, равное примерно 2,718282). В
логистической регрессии вероятность конкретного исхода, например, выздоровления
пациента, можно представить следующим выражением:
,
где Р{(Y=1)|X1, X2, … , Xk} – вероятность
того, что зависимая переменная Y примет значение 1 (пациент выздоровеет), при условии, что у данного пациента k предикторов
приняли следующие конкретные значения: х1 =X1, х2 =X2, … , хk=Xk ( здесь: хj – j-тый предиктор, Xj – конкретное значение j-того предиктора). Параметр «beta» в данных выражениях вычисляется для конкретного i-того
наблюдения с использованием выражения beta= a0 + a1*X1 + a2*X2 + … + aj*Xj , где a0 – свободный член, пересечение
Выражение может быть представлено иначе. Если разделить числитель и знаменатель дроби на величину ebeta, то получим идентичное выражение
.
В тех
случаях, когда параметр beta имеет значения равные нескольким единицам, величина вероятности «р»
оказывается близкой к 1 или 0. Например, при beta=3 имеем Напротив, при значении beta равном –3, получаем следующее выражение:
.
Логистическая регрессия интенсивно
развивалась в последние 30 лет. Метод достаточно сложный и для своего
использования требует знания и понимания многих нюансов. Он имеет гораздо
меньше ограничений, нежели дискриминантный анализ, и в силу этого его всё чаще
применяют для сравнения многомерных группировок наблюдений. Продуктивно использовать его под силу лишь профессиональному статистику. Вот почему об этом как раз и выражают свои подробные мнения учёных из Франции, Германии, Испании и Италии.
Для признака VAR2A имеются следующие градации: 1="больные",
2="контроль" и 3="старше 60".
Цель использования метода логистической регрессии всегда двояка. С одной стороны, получив набор оценок уравнений логистической регрессии, мы получаем набор моделей взаимосвязи выходного, зависимого дискретного признака от наборов качественных и количественных предикторов. Современные методы оценки уравнений логистической регрессии позволяют оценивать не только упомянутые выше регрессионные коэффициенты a0 и aj , но также и достаточно большой набор других важных показателей, характеризующих как отдельные предикторы, так и качество всей модели в целом. В частности, такой показатель, как отношение шансов и 95%-ный доверительный интервал для отношения шансов по каждому предиктору. Весьма важными показателями являются стандартизованные регрессионные коэффициенты. Чем больше модуль такого коэффициента, тем сильнее его влияние на зависимую переменную. Другим важным показателем качества модели является процент конкордации (Percent Concordant). Этот показатель равен доле наблюдений, правильно переклассифицированных в отдельные подгруппы зависимого показателя с помощью уравнения логистической регрессии. Чем ближе этот показатель к 100%, тем выше качество данной модели. Сила связи между фактической принадлежностью к анализируемым подгруппам зависимого признака, и принадлежностью предсказанной по уравнению логит-регрессии, оценивается специальным коэффициентом, аналогом коэффициента корреляции для дискретных признаков, называемым коэффициентом D-Зомера (Somers' D). Данный показатель равен 0 при полном несовпадении, и 1 при полном совпадении. Подобно тому, как во множественной регрессии
возможен анализ аномальных наблюдений, так и в логистической регрессии, возможно
проанализировать влияние отдельных наблюдений на параметры уравнения. При этом
после удаления аномальных наблюдений, возможна повторная оценка параметров
уравнения в более однородной выборке.
Так, для
описанного выше массива данных были получены более 10 уравнений логистической
регрессии, с показателями конкордации от 82 до 95,8%. Вот как, например,
выглядит одно из таких уравнений:
Выше красным цветом выделены строки для признаков, у которых стандартизованные коэффициенты регрессии имеют достаточно большие значения, т.е. именно эти предикторы оказывают максимальное влияние на оценки вероятностей. Количество предикторов в уравнении логистической регрессии говорит о многом. Если обратиться к приведённому выше уравнению, то мы увидим, что в нём присутствует половина всех используемых в исследовании признаков. В этом случае вполне обоснованно говорить о том, что различие подгруппы больных и подгруппы здоровых пациентов имеет достаточно разветвлённую структуру. С другой стороны, это также свидетельствует и о том, что применительно к данному заболеванию выбрана достаточно адекватная система признаков, характеризующих данное заболевание. Об этом же говорит и высокий показатель конкордации. Однако тот факт, что в уравнение логистической регрессии вошла половина всех используемых признаков, вовсе не означает, что при сравнении средних этих признаков для больных и здоровых, мы будем иметь статистически значимые различия. Вполне возможно, что причины включения этих признаков в состав предикторов имеют иную природу, которую мы будем обсуждать ниже в разделе "Логистическая регрессия. Анализ массивов большой размерности".
На этот факт мы уже обращали внимание в разделе "ДОКАЗАТЕЛЬНАЯ МЕДИЦИНА И СТАТИСТИКА" нашего обзора "Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты". Проиллюстрируем это утверждение на рис. 1. Для оценки
статистической значимости всего уравнения в целом, с помощью метода правдоподобия
вычисляется статистика χ2. Так, для приведённого выше уравнения
эта статистика равна 63,3537, что при числе степеней свободы df=19 даёт достигнутый уровень
значимости р<0,001. Т.е. полученное уравнение логистической регрессии
адекватно. Другая статистика χ2 оценивает с помощью критерия
Хосмера-Лемешова качество подгонки, сравнивая наблюдаемые частоты и расчётные.
В случае хорошего согласия имеем для этой статистики уровень значимости более
5%. Для приведённого выше уравнения статистика χ2=2,1075, df=6, р=0,9096. Из чего делаем
вывод о том, что качество подгонки хорошее. Во всех приводимых ниже уравнениях
достигнутый уровень значимости данной статистики также был гораздо более 5%,
т.е. качество подгонки было хорошее.
В реальной
практике полученные уравнения логистической регрессии можно использовать для
прогнозирования того или иного исхода. Например, рассмотрим массив данных(http://www.biometrica-tomsk.ru/rus_dasl.htm ), в котором используются следующие
признаки:
Зависимый признак VAR9A (летальность через полгода) имеет две градации: 1 – выжил, 2 – умер. Проведя оценку коэффициентов уравнения логит-регрессии методом максимального правдоподобия, получили следующий результат: Как видим, все предикторы имеют статистически
значимые коэффициенты регрессии (Pr > ChiSq гораздо меньше критического
уровня). При этом стандартизованные коэффициенты, представленные в последнем
столбце, говорят о доминирующем влиянии двух предикторов. При данном наборе
предикторов процент конкордации равен 82,3%. При использовании пошаговых
алгоритмов оценки уравнений, по мере изменения набора предикторов можно
проследить динамику изменения процента конкордации.
Ниже представлен фрагмент таблицы, содержащей вычисленные значения параметра beta, а также вычисленные с его использованием вероятности принадлежности каждого пациента к каждому из 2-х исходов.
Из этой таблицы видно, что чем меньше значение параметра beta, тем выше вероятность исхода «умер». И наоборот, чем больше значение параметра beta, тем выше вероятность исхода «выжил».
В том случае, когда параметр beta имеет значение вблизи 0, вероятности обоих исходов примерно равны. Очевидно,
что для практического использования полученных моделей в целях прогноза,
следует стремиться к получению таких уравнений логистической регрессии, в
которых процент конкордации будет максимально большим. Первоначально для этого
можно опробовать все доступные алгоритмы оценки уравнения логит-регрессии.
Далее необходимо выяснить структуру парных связей между зависимой переменной, и
каждым предиктором. Одним из возможных путей повышения процента конкордации
является изменение набора потенциальных предикторов. Так на основе детального
анализа упомянутых выше парных взаимосвязей возможен переход от исходной
структуры качественных предикторов к новой структуре этих признаков. Например,
использование вместо одного качественного признака с 4 или 5 градациями
нескольких новых признаков с меньшим числом градаций.
Хороший
эффект может дать и конструирование новых признаков из ранее использовавшихся
количественных признаков. Такие признаки могут быть получены как путём линейных
или нелинейных преобразований исходных переменных, так и конструированием новых
признаков, содержащих эффекты взаимодействия исходных показателей.Так
использование перечисленных выше возможностей позволило в итоге повысить для
данного массива значение процента конкордации от 82,3% до 97,8% . Как правило,
для получения уравнений с высокими значениями процента конкордации приходится
оценивать до нескольких десятков или сотен уравнений, из которых путём последовательной
корректировки опций алгоритмов оценки удаётся получить несколько таких
уравнений.
Имея в своём распоряжении такое уравнение,
врач может определить, значения каких конкретно предикторов необходимо
скорректировать определёнными вмешательствами, чтобы увеличить вероятность
желательного исхода, например, повысить вероятность исхода «пациент выжил».
Признак VAR1A имеет 2 градации: 1=«здоровые дети», и 2=«больные дети». Ниже представлено один из результатов оценки уравнения
Как видим,
все коэффициенты уравнения статистически значимы (достигнутый уровень
значимости Pr > ChiSq значительно меньше критического уровня). Отметим, что
максимальный модуль коэффициента регрессии имеет признак A3. Причём, все
коэффициенты уравнения отрицательны, за исключением свободного члена. Процент
конкордации для данного решения равен 94%. Если отсортировать наблюдения по
величине параметра beta (Value of the Linear Predictor), то увидим следующую
картину:
Одной из важных задач, встречающихся в медицинской практике, является надёжная диагностика заболевания. Некоторые заболевания достаточно трудно диагностируемы. Одним из таких заболеваний является тромбоэмболия лёгочных артерий (ТЭЛА). Очень часто данное заболевание проявляет себя после полостных операций. Массив, список переменных в котором приведён ниже, собран сотрудницей Томского НИИ кардиологии О.В., занимающейся исследованием данной патологии
Standard Wald Standardized Parameter DF Estimate Error Chi-Square Pr > ChiSq Estimate Intercept 1 14.9644 7.0925 4.4516 0.0349 A1 1 1.4450 0.6651 4.7208 0.0298 0.3316 A2 1 4.1727 1.8999 4.8235 0.0281 0.9575 A3 1 2.9009 1.4797 3.8435 0.0499 0.3901 A4 1 -3.0458 1.8059 2.8444 0.0917 -0.5110 A5 1 -3.4584 2.1391 2.6140 0.1059 -0.4651 A6 1 -2.9473 1.6663 3.1284 0.0769 -0.4186 A7 1 -2.1735 1.1627 3.4947 0.0616 -0.2340 A8 1 -2.3661 0.6587 12.9038 0.0003 -0.4865 A9 1 1.0070 0.4880 4.2582 0.0391 0.2622 A10 1 -1.8526 0.6746 7.5412 0.0060 -0.3949 A11 1 -0.7923 0.5162 2.3564 0.1248 -0.1884 A12 1 -0.0315 0.0179 3.1044 0.0781 -0.2224
Следующий массив, созданный исследователем П.К. из Хабаровска, содержал 43 признака, список которых приведён ниже.
В данном исследовании зависимым признаком являлся признак GRUPPA,
имеющий 5 градаций: 1 – компенсированный стеноз, 2 – субкомпенсированный стеноз
(гипермоторный вариант), 3 – субкомпенсированный стеноз (гипомоторный вариант),
4 – декомпенсированный стеноз, и 5 – контрольная группа (норма). При сравнении
между собой 4-х видов стеноза были получены уравнения логистической регрессии,
одно из которых приведено ниже.
Данное уравнение обеспечивало показатель конкордации равный 96,7%. Как
видно из приведённой выше таблицы, в этой модели доминируют 2 предиктора.
Одной из задач исследования было сравнение группы пациентов с хронической почечной недостаточностью с контрольной группой здоровых. Ниже приведено одно из многих полученных уравнений логистической регрессии, содержащее результаты такого сравнения.
Данное уравнение обеспечивало уровень
конкордации равный 89,1%.
Итак, при использовании метода логистической регрессии в реальных исследованиях всегда имеется возможность получения определённого множества моделей взаимосвязи зависимого признака, с подмножеством предикторов. Все эти модели можно анализировать и сравнивать между собой, выделяя в полученных уравнениях предикторы с максимальными абсолютными значениями регрессионных коэффициентов, и максимальными значениями показателя конкордации. В случае использования полученных моделей для повышения вероятностей положительных исходов, необходимо оценить подмножества предикторов всех уравнений, чтобы выбрать уравнения с предикторами, наиболее доступными для корректировки их значений доступными в лечебной практике медицинскими технологиями.
Далее: 2. Логистическая регрессия. Анализ массивов большой размерности |
Мониторинг качества научных медицинских публикаций Обращение межрегионального Общества специалистов доказательной медицины в ВАК РФ СТАТИСТИКА УМЕЕТ МНОГО ГИТИК. Предложения зарубежных исследователей о важных методах статистического анализа Начиная с 2010 года зарубежные исследователи по медицине, биологии, и многим иным направлениям, чаще стали обращаться по своим просьбам статистического анализа в наш НЦ БИОМЕТРИКА. Которые затем часто и упоминают о нас в своих статьях. И поэтому для проведения нами статистического анализа они как раз и поддерживают использование предлагаемых им многих сложных многомерных методов анализа. А также использовать для них и многие стандартные парные методы статистического анализа, но уже по более глубоким аспектам. И получая результаты этих сложных методов статистического анализа, эти исследователи как раз и осознают реально сложными свои технологии. Что и позволяет им обнаруживать и устанавливать детали новых улучшений своих технологий. НЦ БИОСТАТИСТИКА выполняет работы по статистическому анализу экспериментальных данных уже более 30 лет. В его составе исследователи России, США, Израиля, Англии, Канады и других стран. Услугами Центра пользуются аспиранты и докторанты в области медицины, биологии, социологии, психологии и т.д. (См. далее ) Отзывы исследователей по статистическому анализу их баз данных Примеры оформления заказчиками базы данных, описания признаков и целей статистического анализа этой базы данных
Пример "ПРОГРАММА РАБОТ по статистическому анализу" базы данных Исследователя. Леонов В.П. ... При этом содержание подобных "ПРОГРАММ..." определяются приводимыми 5-ю деталями. ... В данном примере "ПРОГРАММЫ..." приводится 22 БЛОКА по конкретным методам анализа и графикам. В. Леонов. Применение методов статистики в кардиологии (по материалам журнала "Кардиология" за 1993-1995 гг.) Журнал "Кардиология!, 1998, № 1 В. Леонов. Статистика в кардиологии. 15 лет спустя. Журнал "Медицинские технологии. Оценка и выбор", 2014, №1, с. 17-28. СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ МЕДИКОВ И БИОЛОГОВ (время и опыт). Леонов В. Леонов В.П. Общие проблемы применения статистики в биомедицине. Леонов В.П. Ошибки статистического анализа биомедицинских данных. Доклад на научно-практическая конференция "Роль эпидемиологических и клинических исследований в здравоохранении: планирование, организация, внедрение результатов в практику", посвящённая памяти доктора медицинских наук, профессора В.П. Алексеева в Якутске (12-13 ноября 2009). Анализ таблиц сопряжённости 2х2 с вычислением многих статистик связи... Можете просматривать все графики по данной тематике... Применение статистики в статьях и диссертациях по медицине и биологии. Часть I. Описание методов статистического анализа в статьях и диссертациях. Международный журнал медицинской практики, 1998 г., вып. 4. В.П. Леонов, П.В. Ижевский ПРИМЕНЕНИЕ СТАТИСТИКИ В СТАТЬЯХ И ДИССЕРТАЦИЯХ ПО МЕДИЦИНЕ И БИОЛОГИИ. ЧАСТЬ III. ПРОБЛЕМЫ ВЗАИМОДЕЙСТВИЯ "АВТОР - РЕДАКЦИЯ - ЧИТАТЕЛЬ". Леонов В.П. Применение статистики в статьях и диссертациях по медицине и биологии. Часть IV. Наукометрия статистической парадигмы экспериментальной биомедицины. Международный журнал медицинской практики, 2002 г. вып. 3. Леонов В.П. Можете просматривать все графики по данной тематике... Леонов В.П. Ошибки статистического анализа биомедицинских данных. Международный журнал медицинской практики, 2007, вып. 2, стр.19-35. «Роющая деятельность кабана». Статья в "Независимой" газете... Сравниваем средние, а также и ... В. Леонов Исследователям в медицине и биологии весьма большую пользу приносит сравнение не только групповых средних, но также и иных параметров. Такими новыми сравнениями являются проверки равенства дисперсий, коэффициентов корреляции, коэффициентов регрессии или векторов групповых средних, сравнение групп многомерными методами, и т.д. В статье объяснена большая ценность обнаружения не нормального распределения признака. Показано, что не нормальное распределение количественного признака, означает наличие взаимосвязей данного признака с другими признаками. Проценты - статистический анализ? Или проценты - арифметический анализ? В. Леонов. Послушать и скачать... При многочисленной работе с описаниями статистических процедур, и т.д., реально появляется усталость. И для улучшения дальнейшей работы можно прослушать хорошие песни и музыку, увидев при этом также интересные видео. В указанной вверху ссылке приведены много разных вариантов видео-песен с сообщениями о Томске и о Томском государственном университете. А также очень много видео-песен с Анной Герман. И с остальными певцами: Мария Максакова, Лев Лещенко, Юрий Антонов, Игорь Скляр, Валерий Ободзинский, Владимир Трошин, Галина Хомчик, Виктория Иванова, Юрий Кукин, Олег Митяев, Юрий Визбор, Юрий Кукин, и т.д. Можно прослушать и скачать используемые при этом видео-файлы *.mp4, применив для этого программу Ummy Video Downloader. Пример "Программы по статистическому анализу". В ноябре 2013 года сайту БИОМЕТРИКА исполнилось 16 лет. А что было раньше? И что теперь? Примеры отличных диссертаций и статей по медицине и биологии, с нашими результатами статистического анализа
О.Я. Васильцева ЗАКОНОМЕРНОСТИ ВОЗНИКНОВЕНИЯ, КЛИНИЧЕСКОГО ТЕЧЕНИЯ И ИСХОДОВ ТРОМБОЭМБОЛИИ ЛЕГОЧНОЙ АРТЕРИИ ПО ДАННЫМ ГОСПИТАЛЬНОГО РЕГИСТРА ПАТОЛОГИИ. Н.Г. Веселовская"ПРОГНОЗИРОВАНИЕ РИСКА РЕСТЕНОЗА КОРОНАРНЫХ АРТЕРИЙ ПОСЛЕ ИХ СТЕНТИРОВАНИЯ У ПАЦИЕНТОВ С ОЖИРЕНИЕМ" И.А. Бирюкова Научно - практическая работа "АРМАКОЭКОНОМИЧЕСКИЕ ИССЛЕДОВАНИЯ РОЗНИЧНОГО РЫНКА ГОРОДА ОМСКА" Г.А. Попова СРАВНИТЕЛЬНОЕ ИЗУЧЕНИЕ ПОДВИДОВ LINUM USITATISSIMUM L . В УСЛОВИЯХ ЗАПАДНОЙ СИБИРИ. (диссертация на соискание учёной степени кандидата биологических наук). А.Г. Сыркина Ретроспективный анализ эффективности и безопасности тромболитической терапии острого инфаркта миокарда у больных пожилого и старческого возраста (диссертация на соискание учёной степени кандидата медицинских наук). В. Леонов. Цели, возможности, и проблемы использования биостатистики в доказательной медицине. Доклад на Конференции по доказательной медицине в Ереване «От доказательной медицины к доказательному здравоохранению» (24 - 26 сентября 2015 года). Фоторепортаж с Конференции по доказательной медицине в Ереване. Фоторепортаж с семинара по биометрике в Ереване, прошедшего после конференции по доказательной медицине (24 - 26 сентября 2015 года). Отзывы слушателей семинара по биометрике в Ереване в сентябре 2015 г. Примеры "Программы по статистическому анализу", и подобных результатов статистического анализа по таким "Программам"
На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайте БИОМЕТРИКА , рекомендую перейти на файл "Поиски методов или результатов статистического анализа". Новые полезные книги... (Заказать книгу можно через издательство) Ланг Т., Сесик М. Как описывать статистику в медицине. Руководство для авторов, редакторов и рецензентов. Пер. с англ. В.П. Леонова. 2016 - 480 с. Петри А., Сэбин К. Наглядная медицинская статистика. Учебное пособие. 3-е издание. Пер. с англ. В.П. Леонова. 2015. - 216 с. Банержи А. Медицинская статистика понятным языком: вводный курс. Издательство "Практическая медицина", 2014. - 287 с. Пер. с англ. В.П. Леонова. Т. Гринхальх. Основы доказательной медицины. Издательство "ГЭОТАР-Медиа", 2015. - 336 с. 4-е издание переработанное и дополненное. Пер. с англ. Под ред. И.Н. Денисова, К.И. Сайткулова, В.П. Леонова.
Долгое прощание История науки не ограничивается
перечислением успешных исследований. Она должна сказать нам о
безуспешных исследованиях и объяснить, почему некоторые из самых
способных людей не могли найти ключа знания, и как репутация других
дала лишь большую опору ошибкам, в которые они впали. Дж.
Максвелл Для большинства читателей фамилия Лысенко ассоциируется с
августовской сессией ВАСХНИЛ 1948 г. и разгромом генетики. Однако лысенковщину нельзя сводить только к
запрету на генетику. Достигнув своего апогея в середине текущего века, и
став воистину периодом средневековья в отечественной биологии и медицине,
лысенковщина изуродовала и методологию этих наук, изгнав из них в
частности математику, и в первую очередь статистику. В новый век - с доказательной биомедициной Проценты - статистический анализ?
Или проценты - арифметический анализ? В. Леонов. Примеры "Программы по статистическому анализу", и подобных результатов статистического анализа по таким "Программам" Чтобы не допускать ошибок в использовании и описании статистики в статьях и диссертациях, следует прочитать материалы представленные в КУНСТКАМЕРЕ - коллекции диссертаций и статей по медицине и биологии, с набором статистических ошибок и нелепостей. Экспозиция 1 Экспозиция 2 НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ (ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ). В.П.Леонов. Вестник Томского государственного университета. Серия "Математика. Кибернетика. Информатика". №275. АПРЕЛЬ 2002, стр. 17-24. СТАТИСТИЧЕСКИЙ АНАЛИЗ ДАННЫХ ДЛЯ МЕДИКОВ И БИОЛОГОВ (время и опыт). Три "Почему ..." и пять принципов описания статистики в биомедицинских публикациях. Почему появилась эта
статья? Камуфляжные мемы инфоценоза научных школ // Философия математики: актуальные проблемы. Материалы Международной научной конференции 15-16 июня 2007. Москва, Изд. Саван С. А., 2007. - с. 212-216. Леонов В.П. Доклад "Почему и как надо учить медиков статистике?"
Леонов В. П. Доклад на международной конференции по доказательной медицине
в Ереване 18-20.10.2012 Зачем нужна статистика в доказательной медицине? В. Леонов. Армянский медицинский реферативный журнал, 2012, вып. 9, с. 184-193. ВОЗМОЖНОСТИ БИОМЕТРИЧЕСКОГО АНАЛИЗА ВЗАИМОСВЯЗИ СОМАТИЧЕСКИХ ПОКАЗАТЕЛЕЙ И СИСТЕМАТИКИ ПСИХИЧЕСКИХ РАССТРОЙСТВ. НАУКОМЕТРИКА СТАТИСТИЧЕСКОЙ ПАРАДИГМЫ ЭКСПЕРИМЕНТАЛЬНОЙ БИОМЕДИЦИНЫ
(ПО МАТЕРИАЛАМ ПУБЛИКАЦИЙ).Леонов В.П. Вестник Томского государственного университета. Серия "Математика. Кибернетика. Информатика", №275. АПРЕЛЬ 2002, стр. 17-24. Cамая читаемая наша статья после отправки в мае м-це с.г. более 300 писем авторам статей мед. журналов о наличии в них примитивных и ошибочных методов статистического анализа, и получаемых при этом результатах... Балакшина Н.Г., Кох Л.И., Леонов В.П. ПРОГНОЗИРОВАНИЕ ИСХОДОВ ХИРУРГИЧЕСКОГО ЛЕЧЕНИЯ ГНОЙНЫХ ВОСПАЛИТЕЛЬНЫХ ЗАБОЛЕВАНИЙ ПРИДАТКОВ МАТКИ Анализ таблиц сопряжённости
2х2 с вычислением многих статистик связи... |
На файле "Поиски методов или результатов статистического анализа" сообщается, что сейчас на сайте БИОМЕТРИКА размещено 4162 htm-файлов, 651 pdf-файлов, 152 djvu-файлов, и т.д. И там же приводятся описания групп конкретных файлов. В частности по методам статистического анализа, их отличным результатам, отзывам авторов, книгам этих методов, статистике посещаемости сайта БИОМЕТРИКА, и т.д. Далее приведено подробное пояснение поиска нужных файлов системой Google, которая там же и помещена. А после системы Google размещены популярные 341 htm-адресов и 79 адресов pdf-адресов. Итак, для оперативного выбора конкретного нужного файла на данном сайте БИОМЕТРИКА , рекомендую перейти на файл "Поиски методов или результатов статистического анализа". |
Наш адрес Сайт БИОМЕТРИКА создан в 1997 г. © Василий Леонов
Доказательная или сомнительная? Медицинская наука Кузбасса: статистические аспекты.
Пример "ПРОГРАММА РАБОТ по статистическому анализу" базы данных Исследователя
Доклад "Почему и как надо учить медиков статистике?" В. Леонов.