Title: Innovaci
1Curso Tecnologías de Información Emergentes
Proyecto de Investigación SIN SIN Aplicación
de Análisis de Cluster para exploración y
detección de patrones de comportamiento en
pacientes diabéticos en centro de Salud Santa
Rosa
- Equipo de Investigación
- Responsable Ulises Román C
- Miembros
- Luís Alarcón (docente)
- Daniel Ortega (docente)
- Norberto Osorio (Alumno-UPG-FISI)
- Pablo Romero (docente)
- Colaboradores
- Roberto Calmet (docente)
- De la Cruz Melo (docente)
- Carlos Yañez (docente)
2AGENDA
- INTRODUCCION
- ANTECEDENTES Y FUNDAMENTACION DEL ESTUDIO
- JUSTIFICACION
- OBJETIVOS
- METAS ESPECIFICAS
- POSIBLE CONTRIBUCION E IMPACTO
- METODOLOGIA DEL TRABAJO
- TIPO DE INVESTIGACION
- RELACION CON OTROS ESTUDIOS
- CALENDARIO DE ACTIVIDADES
- REFERENCIAS BIBLIOGRAFICAS
3INTRODUCCION
Según la OMS 1, la diabetes ocupa el 8vo.
Lugar de enfermedades que producen muerte a nivel
mundial y el 80 en los países en vía de
desarrollo, en nuestro país afecta a casi 2
millones de personas según datos oficiales del
Ministerio de Salud (MINSA) 2. Lo grave es que
esta cifra va en aumento y se calcula que la
mitad de los afectados ignora su condición. Una
de las causas fundamentales de esta situación es
la falta de información oportuna y adecuado para
el diagnostico y pronostico utilizando técnicas
modernas de análisis y extracción de datos que
permitan la detección de patrones de
comportamiento en pacientes diabético en los
centros de salud. Actualmente existen técnicas
modernas como el cluster dentro de la Minería de
datos que permite clasificación automática de
datos3 El presente estudio permitirá lograr
Identificar los algoritmos adecuados de
clustering para uso en el comportamiento de las
enfermedades de Diabetes Generación de patrones
y tendencias de comportamiento usando técnicas de
cluster y Estimar la eficiencia de la técnica
del Cluster jerárquicos y no jerárquicos para
predecir comportamientos. En base a este técnica
los médicos podrán diagnosticar oportuna y
adecuadamente las patologías de los pacientes
diabético, lo cual contribuirá a disminuir la
tasa de mortalidad en el país. Las unidades
participantes Departamento de Medicina
Preventiva de la Fac. Medicina Humana -UNMSM,
Grupo de Investigación Bioestadística Fac.
Ciencias Matemáticas, Centro de Salud Santa Rosa
y Instituto de Investigación de la FISI.
42. ANTECEDENTES Y FUNDAMENTACION DEL ESTUDIO
- Existen diversos trabajos e investigaciones en
el campo de la Minería de Datos aplicados a la
Medicina, Bioinformática y Biología, tanto en las
Universidades , Empresas e instituciones. A
continuación mencionamos - - Aplicación de análisis de cluster para
definir grupos homogéneos desde el punto de vista
de su posición condilar Por Juan Baldeón
Granada - - "Utilización de tecnología de minería de datos
para el tratamiento de datos biomédicos". Por
Victor Maojo Grupo de - Informática Médica. Departamento de
Inteligencia Artificial.Fac.de Informática.
Univer.Politécnica de Madrid - 2004 -
- - "Aplicación de la minería de datos al estudio
de alteraciones respiratorias durante el sueño"
por Carlos Zamarrón Sanz, - Vanesa García Paz, Uxío Calvo Álvarez,
Fernanda Pichel Guerrero, José Ramón Rodríguez
Suárez. Servicio de - Neumología. Hospital Clínico Universitario de
Santiago de Compostela España. 2006. - - "El papel de la Minería de Datos en la
Detección y Diagnóstico de Cáncer" por Damian
Mora Eguiarte. Universidad de - Salamanca, España. 2001
-
- - "Extracción y Visualización de Conocimiento de
Bases de Datos Médicas" por José Hernández
Orallo, M.Carmen Juan, - Lizandra Neus, Minaya Collado, Carlos
Monserrat Aranda. México. 2002 - - "Aplicación de minería de datos para el
diagnóstico de accidentes cerebrovasculares
agudos (ACVAs). DAEDALUS - Data, Decisions and Language, S.A. 2003
53. JUSTIFICACION
La propuesta de Investigación obedece a la
necesidad de abrir una línea de investigación en
el área de Minería de Datos e Bioinformática por
su utilización y almacenamiento de grandes
cantidades de información biomédica y sus
procesos de Descubrimiento de Conocimiento
en Bases de Datos ( Knowledge Discovery
in Databases, KDD) ha crecido
espectacularmente en las ultimas decanas
6,7 Teniendo en cuenta que la diabetes es
problema epidemiológico serio porque es una
enfermedad de naturaleza común. El uso adecuado
de la técnica de cluster permitirá tener
información oportuna y de calidad, para que los
especialistas tomen decisiones para predecir
tendencia y comportamientos de dicha enfermedad,
lo que permitirá reducir los niveles de patología
de diabetes en el país. Asimismo, Importancia de
las aplicaciones de la ( MD ) en el ámbito
CLINICO resulta de ayuda para la
identificación y diagnóstico de patologías,
para el descubrimiento de posibles
interrelaciones entre diversas enfermedades, a
nivel de MEDICINA PREVENTIVA, resulta de
interés para la detección de pacientes con
factores de riesgo para sufrir una patología. A
nivel de GESTION HOSPITALARIA, se puede usar para
obtener predicciones temporales que permitiesen
optimizar los recursos disponibles y priorizar el
uso de los diversos tratamientos para una misma
patología 3,7. .
64. OBJETIVOS
- Identificar los algoritmos adecuados de
clustering para uso en el comportamiento de las - enfermedades de Diabetes.
- 2. Generación de patrones y tendencias de
comportamiento usando técnicas de cluster - 3. Estimar la eficiencia de la técnica del
Cluster jerárquicos (dendogramas) y no
jerárquicos - (k-medias y otros) para predecir
comportamientos - .
5. METAS
- 1. Detección de patrones de comportamiento
(20) usando el Análisis de Cluster - Generar un ( 01) Articulo de Investigación
- 3. Extracción de datos útiles para generar
tendencias de comportamiento (30) - 4. Selección del algoritmo optimo para análisis
de conglomerados (20) - 5.Establecer un (01) método adecuado de
distancias para medidas de similaridad
75. POSIBLE CONTRIBUCION E IMPACTO
A través de análisis de cluster se revelaran
concentraciones de datos para su agrupamiento
eficiente en conglomerados 8,9 de pacientes
diabéticos según su homogeneidad y que facilitara
a los médicos especialistas a tomar decisiones
oportunas y adecuadas en el diagnostico y su cura
correspondiente. Asimismo, el presente estudio
permitirá lograr Identificar los algoritmos
adecuados de clustering para uso en el
comportamiento de las enfermedades de Diabetes
Generación de patrones y tendencias de
comportamiento usando técnicas de cluster y
Estimar la eficiencia de la técnica del Cluster
jerárquicos y no jerárquicos para predecir
comportamientos. En base a esta técnica los
médicos y los pacientes podrán diagnosticar
oportuna y adecuadamente las patologías de
diabetes, lo cual contribuirá a disminuir la tasa
de mortalidad en el país
86. METODOLOGIA DE TRABAJO
- El presente estudio se desarrollara según los
siguientes pasos - Revisión de fuentes y proyecto de Investigación
relacionados con el tema de investigación. - Revisión y Estudio de la Técnica de Cluster y
sus algoritmos - Evaluación y selección de herramientas a usar
SPSS Clementine, Weke, RapidMiner, SQL - Server 9,10,11,12
- 4. Determinación de los mecanismos y
procedimientos para el diseño - 5. Diseño de la aplicación
- 6. Evaluación de métodos de conglomerados
- 7. Implementación y pruebas de exploración y
predicción datos médicos ( casos ) - 8. Informes técnicos y/o documentación
97. TIPO DE INVESTIGACION
Adaptativa y Aplicativa
8. RELACION CON OTROS ESTUDIOS
Estudio preliminar de un programa de estudio a
iniciarse
9. CALENDARIO DE ACTIVIDADES
El estudio comienza en Junio y termina en
Diciembre 2008
1010. REFERENCIAS BIBLIOGRAFICAS
1 OMS, datos y estadísticas, Organización
Mundial de la Salud, (24/o5/2008),
http//www.who.int/infobase/report.aspx 2.MINSA
, Estrategias sanitarias Nacionales, Ministerio
de Salud, (20/05/08), http//www.minsa.gob.pe/port
al/03esn/default2.asp 3.Cesar Pérez., Daniel
Santin, Minería de Datos Técnicas y
Herramientas. Thomson Editores, (2007)
España. 4.Cesar Pérez.,Data Mining Soluciones
con enterprise miner, Ra-Ma, (2005)
Madrid. 5.José Hernández O, José Ramírez Q,
Cesar Ferri R, Introducción a la Minería de
Datos, Pearson Prentice Hall, (2004)
España. 6Sushmita Mitra., Tinku Acharya, Data
Mining Multimedia,Soft Computing,and
Bioinformatics. Wiley-Interscience ,(2004)
USA. 7.Jiawei Han., Micheline Kamber, Data
Mining Concepts and Techniques, 2nd ed. The
Morgan Kaufmann Series in Data Management
Systems, (2006) USA. 8.SAS, Data mining with
SAS Enterprise MinerTM, SAS Institute,
(20/05/08) - http//www.sas.com/technologies/analy
tics/datamining/miner/ 9 Microsoft, Libros en
pantalla de SQL Server 2005, Microsoft Developer
Network, (26/05/08),http//msdn.microsoft.com/es-e
s/library/ms174879.aspx 10.SPSS,Software and
Solutions - Clementine,(25/05/08),
http//www.spss.com/es/ 11.Universidad de
Waikato, WEKA, (20/05/08), http//www.cs.waikato.a
c.nz/ml/weka/ 12.YALE, RapidMiner, YALE
SOLUTIONS, (26/05/08), http//rapid-i.com/
11 12MUCHAS GRACIAS .. ??