A STUDY OF THE INFLUENCE OF ENVIRONMENTAL FACTORS THE INCIDENCE OF KIDNEY CANCER


Cite item

Abstract

The proposed algorithm models the delayed impact of negative environmental factors on the incidence of kidney cancer in the Voronezh region.

Full Text

Несмотря на большое количество исследований, посвященных раку почки, этиология данного вида опухолей до настоящего времени в полной мере не изучена. В структуре смертности населения России от онкологических заболеваний рак почки среди мужчин составляет 2,7%, среди женщин - 2,1%. Обозначены некоторые факторы, влияющие на заболеваемость этой патологией: курение, ожирение, длительное использование диуретиков, препаратов содержащих амфетамин и др. Тот факт, что курение связывают с заболеваемостью раком почки, позволяет предположить подобное воздействие ряда канцерогенных веществ, присутствующих в окружающей среде. Все многообразие негативных факторов внешней среды можно представить в виде 3 групп - канцерогены воздуха, воды и почвы. Первостепенной задачей для проведения эпидемиологических исследований является создание методик по разработке параметров оценки связей между факторами внешней среды и частотой отдельных форм рака. Одним из методов онкоэкологического мониторинга является дискрептивный: разработка плана и программы исследования, сбор информации, ее обработка, анализ полученных данных. Используется официальная отчетная информация по заболеваемости раком почки за многолетний период, по негативным онкологическим факторам. Делаются попытки установления коррелятивных связей между значениями показателя заболеваемости и негативного агента внешней среды. Неудачи этих исследований обусловлены тем, что особую сложность представляет запаздывание эффекта воздействия во времени. При этом латентный период манифестации канцерогенного действия различных веществ внешней среды неоднороден. Проведенное нами исследование было нацелено на построение модели множественной линейной регрессии, наиболее полно описывающей влияние негативных факторов внешней среды на примере рака почки. Использовалась информация компьютерной базы данных Воронежского областного клинического онкологического диспансера по заболеваемости раком почки и службы санэпиднадзора по пробам воздуха, воды, почвы по г.Воронежу и Воронежской области за период с 1994 по 2003 годы. Для обоснования идеологии исследования изучена система множественного запаздывания воздействия негативных факторов воздушной среды на заболеваемость раком почки. Данные по пробам воздуха представляют собой набор значений среднегодовых максимальных концентраций, превышений предельно допустимых концентраций ряда веществ: марганца, оксида меди, формальдегида, сернистого ангидрида, бензапирена, окиси азота, пыли, стерола, фтористого водорода, бензола, окиси железа, сажи, толуола хлористого водорода, ксилола, окиси углерода, свинца, фенола. Выбор определенного уровня значимости, выше которого результаты отвергаются как ложные, обычно является достаточно произвольным. На практике окончательное решение зависит от того, был ли результат предсказан априори или обнаружен апостериорно в результате анализа, выполненного с множеством данных исследований. Во многих областях результат p<0.05 является приемлемой границей статистической достоверности. Однако это значение включает довольно большую вероятность ошибки (5%). Результаты p<0.01 рассматриваются как статистически значимые, а результаты с уровнем p<0.005 или p<0.001 как высоко значимые. Однако данная классификация уровней значимости достаточно произвольна и является всего лишь неформальным соглашением, принятым на основе практического опыта в той или иной области исследования. Все современные пакеты прикладных программ для анализа данных предусматривают обмен ими (как импорт, так и экспорт) в распространенных форматах - dbf, xls, txt и др. Одним из таких пакетов является STATISTICA. В работе с помощью этого пакета решались следующие основные задачи: - планирование объемов выборок (как для выдвижения, так и для проверки гипотез); - изучение структуры наблюдений, структуры признаков, визуализация данных и результатов их анализа, построение моделей явлений, проверка статистических гипотез; - проверка научных гипотез путем проверки статистических. В конечном счете создавалась система, позволяющая оценить предполагаемое влияние каждого из факторов, входящих в набор проб из представленных сред, интервал времени между появлением этого фактора и клиническим проявлением заболевания, а также исключить из системы незначимые факторы (которые предположительно не будут влиять на заболеваемость). Общий алгоритм построения модели изложен ниже. Имеется N наблюдений (Cases) и i переменных, из которых одна - зависимая. В нашем случае переменные - факторы, влияние которых предстоит оценить. Наблюдение - год, за который значения этих факторов собирались. Поскольку дискретность предоставленных данных - 1 год, нужно выявить некое смещение (запаздывание) по времени от момента воздействия до появления клинических признаков заболевания (рис. 2). На рисунке Delay - запаздывание; P0, P1, P2 - ошибка модели. Описание: D:\диск_D\Cлужbа\Сборник\архив\ПриАм_9_1\Прикладные информационные аспекты медицины (Т-9 № 1)_files\2_31.jpg Рис. 1. Идеология множественного запаздывания Первый шаг в построении нашей модели - оценка парных корреляций между зависимой переменной (заболеваемостью) и независимыми. Затем составляется таблица, в которой независимее переменные располагаются в порядке убывания коэффициента корреляции, то есть в первом столбце таблицы будет фактор с максимальным коэффициентом r. Следующий шаг - смещение результатов наблюдений в пределах первого столбца (результаты анализов за 1994 год переносим в ячейку 1995 года,1995 в 1996 и так далее).В ячейку года начала смещения вносим ноль. Проводим анализ множественной регрессии, сохраняя при этом значение p-level текущего фактора. Далее осуществляем смещение результатов проб еще на 1 год аналогично пункту 2. Повторяем процедуру до тех пор, пока номер ячейки года начала смещения не станет равным N/2+1. Затем выбираем минимальное значение p-level для текущего фактора и, если оно меньше или равно 0.05, возвращаем значения ячеек году, которому оно соответствует. При этом ячейки предыдущих годов остаются заполненными нулями в пределах столбца текущего фактора. Если же минимальный p-level больше 0.05, то столбец данного фактора удаляем, ибо статистически, в рамках нашей модели, он не оказывает влияния на зависимую переменную (в нашем случае - заболеваемость ). Повторяем шаги с 2-го по 5-й для каждого фактора. После того, как все столбцы независимых факторов пройдены, просчитывается множественная регрессия для окончательного варианта модели, оценивается влияние каждого из оставшихся факторов и сдвиг во времени, через который это влияние начинает сказываться на зависимой переменной (заболеваемости) (рис 2). Алгоритм расчета для одного фактора представлен на рис. 3. Описание: D:\диск_D\Cлужbа\Сборник\архив\ПриАм_9_1\Прикладные информационные аспекты медицины (Т-9 № 1)_files\2_32.jpg Рис. 2. Алгоритм построения модели множественного запаздывания действия канцерогенного агента. Описание: D:\диск_D\Cлужbа\Сборник\архив\ПриАм_9_1\Прикладные информационные аспекты медицины (Т-9 № 1)_files\2_33.jpg Рис. 3. Алгоритм расчета смещения для одного фактора Таким образом, предложены и обоснованы инструменты исследования факторов влияния на заболеваемость злокачественными новообразованиями. Определена целесообразность использования идеологии множественного запаздывания в онкоэкологическом мониторинге. Оценка роли экологических факторов в формировании онкоэкологической заболеваемости является одним из условий эффективной первичной профилактики этой патологии. Литература
×

About the authors

O V Firsov

Voronezh State Medical Academy

B B Kravets

Voronezh State Medical Academy

I A Roslyakov

Voronezh State Medical Academy

References

  1. Боровков А.А. Математическая статистика. - М.: Наука, 1984.
  2. Бухаркин Б.В., Давыдов М.И., Карякин О.Б., Матвеев Б.П., Матвеев В.Б., Фигурин К.М. Клиническая онкоурология - М., 2002.
  3. Кравец О.Я. Гибридные алгоритмы оптимизации моделей множественной регрессии на основе кросскорреляции. - Информационные технологии моделирования и управления, №4(22), 2005.
  4. Липаев В.В. Проектирование программных средств. - М.: Высшая школа, 1990.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies