2 Вероятностный метод диагностики заболеваний
2.1 Применение сетей Байеса при диагностике
Медицинские экспертные системы используются для определения вероятности того, чем болен пациент по наличию или отсутствию ряда симптомов, основываясь на данных о зависимостях симптомов и заболеваний. Учитывая то, что ребенок в возрасте до одного года не может описать свое состояние, не представляется возможным перечислить и охарактеризовать все имеющиеся у него симптомы. Таким образом, задача диагностики характеризуется неполнотой входных данных. Эту проблему решает применение экспертной системы на основе сети Байеса.
Байесовские сети (БС) представляют собой графические модели событий и процессов на основе объединения некоторых результатов теории вероятностей и теории графов. БС представляют собой удобный инструмент для описания достаточно сложных процессов и событий с неопределенностями. Они оказались особенно полезными при разработке и анализе машинных алгоритмов обучения. Основной идеей построения графической модели есть понятие модульности, то есть разложение сложной системы на простые элементы. Для объединения отдельных элементов в систему используются результаты теории вероятностей [1,2].
Сеть Байеса — это вероятностная модель, представляющая собой множество переменных и их вероятностных зависимостей, применяемая в условиях неопределенности. Байесовская сеть — это направленный ациклический граф, обладающий свойствами:
— каждая вершина представляет собой событие, которое может находиться в одном из нескольких состояний и определяется случайной величиной;
— связь вершины с родительскими вершинами определяется таблицей условных вероятностей (ТУВ);
— для вершин, не имеющих родительских, вероятности их состояний являются безусловными.
Формально БС может быть представлена следующим образом:
(1)
где U — конечное упорядоченное множество случайных переменных (узлов сети, Т — множество таблиц условных вероятностей каждой переменной-потомка с переменными-предками. Если переменная не имеет предков, то используется безусловная вероятность.
Таким образом, в сети Байеса, используемой для диагностики заболеваний, узлы представляют собой симптомы и диагнозы. Каждая из вершин может находиться в одном из трех состояний, два из которых определяют наличие и отсутствие симптома. Третье состояние предусматривает случай, когда нет данных о проявлении симптома. Множество состояний обозначим a={}. Тогда — вероятность пребывания симптома i в состоянии j, при i=1...m, где m — количество имеющихся в системе диагнозов, и j=1, 2, 3. При этом , при i=1...m [14].
Дуги модели описывают вероятностные зависимости между симптомами и заболеваниями и определяются таблицами условных вероятностей [24]. ТУВ каждой вершины содержит вероятности перехода в каждое из трех состояний этой вершины при условии состояний ее родителей. В основе модели лежит теорема Байеса теории вероятностей для определения апостериорных вероятностей попарно несовместных событий по их априорным вероятностям [13]. Обозначим через qij(a ) вероятность возникновения j-того диагноза при условии пребывания i-того заболевания в состоянии a.
Вероятности болезней рассчитываются по формуле Байеса:
, (2)
где p j — вероятность того, что пациент страдает j -й болезнью; πj — доля больных болезнью j; qij(a ) — вероятность заболевания j при условии симптома i в состоянии a [12].
Если вероятность симптома при первой болезни больше вероятности признака при второй болезни (qi1 > qi2 ), то очевидно, что этот симптом более характерен для первой болезни. Формула (2) рассчитывает вероятности болезней, исходя из соотношения вероятностей распределения всех симптомов в совокупности.
При диагностике заболеваний по формуле Байеса в качестве априорной вероятности используется π j — доля больных болезнью j среди больных диагностируемыми болезнями.
Диагностические признаки заболевания (симптомы) взаимозависимы. Но выявить эти зависимости, опираясь на статистику, трудно, в основном, из-за того, что нужен огромный объем статистических данных. Поэтому используется приближение: при расчетах по формуле Байеса симптомы болезни считаются независимыми, хотя в общем случае в едином организме независимость признаков исключена.
Основное преимущество байесовских сетей при решении задач диагностики состоит в их способности одновременно выполнять как предсказательные, так и классифицирующие функции. Информация, распространяющаяся по направлению связей в БС, обладает предсказательной способностью, т.к. позволяет делать выводы о возможных последствиях каких-либо изменений в работе отдельных подсистем. С другой стороны, обратный поток информации позволяет выявить (классифицировать) причины уже появившихся (наблюдаемых) симптомов.
2.2 Обучение сети Байеса
Введение в экспертную систему новых данных осуществляет эксперт предметной области. Это приводит к возникновению процесса обучения сети, которое представляет собой распространение по байесовской сети вновь поступившего свидетельства. После завершения обучения каждому высказыванию, ассоциированному с вершинами графа, приписывается апостериорная вероятность, которая определяет степень доверия к этому высказыванию:
, (3)
где D — объединения всех поступивших в систему данных; — композиционные высказывания, составленные из элементарных, то есть множество значений составляют ; — пропозиционные переменные (то есть переменные, значениями которых являются высказывания), определяющие состояние вершин сети.
Процесс обучения основывается на пересчете вероятностей. С каждой вершиной сети ассоциирован вычислительный процесс, который получает сообщения от связанных с ним дугами процессов. Добавление новых данных приводит к нарушению условий согласованности с состояниями соседних узлов. Это инициирует процесс пересчета апостериорных вероятностей для всех возможных значений переменной который продолжается до восстановления этих условий [17].
В большинстве систем, основанных на сети Байеса используется метод noisy or gate, позволяющий существенно упростить вычислительный процесс. Суть его заключается в том, что в ряде примеров вершина Y может быть условно независима от целого ряда вершин , где r=1,2,...,n. Для того, чтобы сократить оценку вероятностей, и используется данный метод. Согласно ему вероятность Y в зависимости от n вершин оценивается как:
, (4)
что позволяет оценить только и на их основании определить оценку.
2.3 Оценка результатов расчетов вероятностей болезней
Результатом байесовской диагностики каждого пациента являются вероятности каждой болезни, рассчитанные по формуле (2). Сумма вероятностей равна единице. По рассчитанным вероятностям ставится диагноз. Если вероятность
Методы, алгоритмы и программы диагностики заболеваний тестируются на базах данных, например, на группе G больных с точно установленными заболеваниями G = {1,2,3,...,k,...,g}.
В качестве критерия эффективности диагностики часто используется процент верных диагнозов. Под верным диагнозом понимается математически (компьютерно) поставленный диагноз, совпадающий с диагнозом, поставленным данному больному врачом.
Вместе с тем, по тем же самым результатам математической диагностики можно более объективно оценить эффективность используемого метода диагностики. Пусть в результате расчета найдены вероятности болезней k-го больного из группы G: Pj(k), где j — номер болезни, n — число диагностируемых болезней. Считаем, что каждый больной болен только одной болезнью и что применяемый метод диагностики рассчитывает вероятности всех болезней, которые имеются у больных данной группы G.
Например, в группе G имеются больные двумя болезнями (n = 2) j =1 и j = 2. Тогда для k-го больного вычисляются P1(k) (т.е. вероятность первой болезни) и P2(k) (т.е. вероятность второй болезни).
Номер болезни, которой каждый пациент действительно болен, обозначим jtr(k). Вероятность (расчетная) этой болезни для k-го больного соответственно имеет обозначение Pjtr(k). Критерием эффективности предлагается выбрать величину:
(5)
где g — число больных в группе G [15].
Интересно также проанализировать, как отдельные симптомы влияют на диагноз. Диагноз — это наиболее вероятная болезнь, и ставится диагноз сравнением вероятностей рассматриваемых болезней. Расчетные вероятности болезней зависят от всех симптомов, и иногда важно выяснить, как на расчетную вероятность каждой болезни повлияло наличие каждого их них, какой вклад в повышение или уменьшение вероятности болезни внес анализируемый симптом.
Оценку влияния на вероятность можно провести множеством способов.
Приведем один из способов оценки, согласно которому кроме вероятности болезни вычисляется − вероятность болезни, рассчитанная при отсутствии i-го симптома, влияние которого анализируется. Комбинации и могут быть базой для многих оценок влияния симптома. Например, отношение:
(6)
характеризует роль i-го симптома в величине — величине вероятности j-й болезни.
Эта величина используется для анализа проведенной диагностики, для обоснования поставленного диагноза.