Pasar al contenido principal

¿Por qué estudiar Ingeniería Mecánica en el Perú?

Escrito por:
UTEC
15 October 2021

La industrialización es uno de los pilares sobre los que se sostiene la competitividad de todo país. La ingeniería mecánica impulsa este proceso, ya que es la rama encargada de formular, diseñar, analizar e implementar equipos, máquinas, estructuras y sistemas al interior de las empresas. Por ello, cumple un rol clave en industrias como la automotriz, aeronáutica, marítima, minera, petrolera, manufacturera, construcción, etc. 

Esta carrera también es de suma importancia para la mejora de la salud humana. Sus aplicaciones en este campo incluyen biomecánica, ingeniería del deporte y transporte de fluidos y materiales viscoelásticos como los tejidos. Todo ello implica estudios teóricos, computacionales, experimentales y clínicos.

Dominio de la tecnología

La carrera que ofrece UTEC busca formar profesionales con bases para diseñar máquinas innovadoras y sistemas industriales, capaces de responder a las necesidades y urgencias de la industria. Además, la exigencia de la malla curricular se traduce en el desarrollo de proyectos tecnológicos desde el primer hasta el último ciclo académico.

Durante los dos primeros años, el estudiante llevará cursos introductorios, como Química General, Cálculo Vectorial, Termodinámica e Ingeniería de Materiales. En los dos años siguientes, se introducirá en Mecánica de Fluidos y Materiales, Procesos de Manufactura, Transferencia de Calor, Ingeniería de Mantenimiento, entre otros. El quinto y último año se centrará en los cursos electivos de carrera y la elaboración de la tesis. 

Como resultado de esta formación, el egresado será capaz de usar diferentes materiales para el diseño, el desarrollo y el mantenimiento de diversas maquinarias que requiere la industria del país. Así, se convertirá en líder de los procesos de innovación, al plantear soluciones novedosas que resuelvan problemas reales.

 

Profesora de Bioingeniería participará en la segunda edición del Science & Cooking World Congress

Escrito por:
UTEC
20 October 2021

Alejandra Ratti, profesora de Bioingeniería de UTEC, participará en la segunda edición del Science and Cooking World Congress, un evento internacional que se celebrará en Barcelona (España) y cuyo objetivo es explorar el enorme potencial de la gastronomía científica para generar un nuevo paradigma que permita aportar en la solución de los grandes retos sociales. 

El congreso está presidido por Pere Castells y las universidades de Barcelona y Parma, la Generalitat de Catalunya, Parc a Taula y el Ajuntament de Barcelona. Entre los organizadores ejecutivos figuran Gastro Ventures y Fresh Marketing de Proximitat. Este año, y bajo el lema "Sustainability. Research, economics and health", se celebra la segunda edición del congreso, que se llevó a cabo por primera vez en 2019.

Más información sobre el congreso, aquí. 

 

Director de la carrera de Ingeniería Ambiental de UTEC publica artículo científico en prestigiosa revista New Phytologist

Escrito por:
UTEC
21 October 2021

El director de la carrera de Ingeniería Ambiental y del Centro de Investigación y Tecnología del Agua, Patrick Venail Ph.D., publicó un artículo científico en la prestigiosa revista New Phytologist, cuyo factor de impacto es superior a 10 y se encuentra ranqueada como número 7 de 235 revistas especializadas en ciencias vegetales.

 

INGENIERÍA AMBIENTAL EN UTEC, DESCUBRE AQUÍ: MALLA CURRICULAR, CONVENIOS, DOCENTES Y MÁS

 

En este estudio se recopiló información de casi 7000 comunidades de plantas en Países Bajos, las cuales se encuentran en 38 tipos de hábitats con diferentes niveles de estrés ambiental. En cada comunidad se midió su diversidad y el nivel de divergencia evolutiva entre las plantas que la componen. 

Se buscaba probar una serie de hipótesis relacionadas con la ecología y la historia evolutiva de las plantas. Los resultados, aunque bastante específicos en el área de la ecología evolutiva, nos permiten conocer mejor los procesos que determinan la composición de las comunidades vegetales. En esta publicación participaron 17 autores pertenecientes a 13 instituciones en 7 países. 

Lee el artículo completo, aquí.

 

 

Calor extremo de la erupción del volcán Vesubio convierte cerebro de hombre a vidrio

Escrito por:
UTEC
22 October 2021

 


 

 

Autor:

 

Luz Pérez Tulich

 

Laboratorio de Ingeniería de Tejidos y Biología Sintética

 

Departamento de Bioingeniería

 

lperez@utec.edu.pe

 

 


 

El Vesubio hizo erupción en el año 79, la ciudad de Herculano fue  golpeada y abrumada por avalanchas de cenizas volcánicas, que mataron a todos los habitantes debido a que  los flujos piroclásticos alcanzaron hasta 30 kilómetros al noroeste y al oeste del Vesubio. 

 

En la década de 1960, en el Collegium Augustalium de Herculano, los investigadores encontraron a una víctima humana de la avalancha tendida en un lecho de madera, enterrada por cenizas volcánicas. En el cráneo de esta víctima, se descubrió aparentes restos cerebrales que estaban vitrificados en lugar de saponificados. La saponificación se da cuando los  triglicéridos presentes en el tejido se han convierten en glicerol y sales de ácidos grasos o jabón, la vitrificación en cambio se refiere al tejido que se ha quemado a altas temperaturas y se ha convertido en vidrio o esmalte, este inusual  descubrimiento fue realizado por el Dr. Pier Paolo Petrone, profesor de osteobiología humana y antropología forense en el Hospital Universitario Federico II en Nápoles, Italia.

 

 

 

Figura 1. Víctima de la erupción (Collegium Augustalium, Herculaneum). La parte posterior del cráneo (el hueso occipital y parte de los parietales) había explotado por completo, dejando visible la parte interna. A. Fragmento de cerebro vitrificado extraído de la parte interna del cráneo; B. Fragmento de médula espinal vitrificado de la columna. 

Fuente. PLOS ONE (2020).

 

 

 

 

Figura 2. Fragmento de material negro vítreo extraído de la cavidad craneal de una víctima de la erupción volcánica de Herculano.

Fuente. The New England Journal of Medicine (2020).

 

 

Para saber la temperatura que se alcanzó al momento de la erupción, estudiaron  la madera carbonizada encontrada cerca del cuerpo, que según determinaron los investigadores pertenecieron a las especies Picea mariana (abeto negro) y Picea glauca (abeto blanco), mostrando que las temperaturas alcanzadas estuvieron en un rango de 470 °C a 520 °C. 

 

Realizaron análisis proteómico del material negro vítreo de la cavidad craneal lo que  permitió la identificación de varias proteínas altamente expresadas en diferentes partes del cerebro humano.

 

 

Los ácidos grasos adípicos y margáricos, que son  componentes de la grasa del cabello humano, fueron detectados mediante cromatografía de gases y espectrometría de masas. También se detectaron ácidos grasos esteárico, palmítico y mirístico que son típicos de los triglicéridos humanos del cerebro, aunque también se pueden encontrar en grasas vegetales y animales. Sin embargo, no se encontraron restos de plantas o animales asociados a los restos óseos en el sitio del descubrimiento de la víctima,

 

El resultado más significativo es la identificación exclusivamente en los fragmentos vidriosos del cráneo de varias proteínas expresadas en los tejidos del cerebro humano junto con Acidos grasos adípicos y ácidos grasos margáricos  atribuibles al cerebro y al cabello de la víctima, respectivamente, indicando así que  material negro vitrificado es el resultado de la exposición del cerebro  a altas temperaturas.

 

 

Bibliografía: 

 

1. Petrone, P., Pucci, P., Vergara, A., Amoresano, A., Birolo, L., Pane, F., Sirano, F., Niola, M., Buccelli, C., & Graziano, V. (2018). A hypothesis of sudden body fluid vaporization in the 79 AD victims of Vesuvius. PLoS ONE, 13(9), 1–27. https://doi.org/10.1371/journal.pone.0203210

2. Petrone, P,et al 2020. Heat-Induced Brain Vitrification from the Vesuvius Eruption in c.e. 79. January 23, 2020 N Engl J Med 2020; 382:383-384 DOI: 10.1056/NEJMc1909867

 


 CONOCE MÁS SOBRE BIOINGENIERÍA EN UTEC  Y VIVE LA INGENIERÍA  Bioingeniería  


COP26 y el rol de la juventud

Escrito por:
UTEC
26 October 2021

La Convención Marco de las Naciones Unidas sobre Cambio Climático (CMNUCC) es una de las convenciones adoptadas en la Cumbre de Rio en 1992. A través de la Convención, se reconoce que se requiere la cooperación más amplia posible de todos los países para actuar de manera efectiva y apropiada ante el cambio climático. De esta manera, desde 1995, los países firmantes de la Convención o Partes se reúnen anualmente en la denominada Conferencia de las Partes (COP).

Durante la COP, jefes de estado, ministros y equipos técnicos de las Partes se reúnen para negociar los compromisos internacionales en acción climática. En la COP21 en 2015, los países se comprometieron a limitar el calentamiento global a 2°C sobre los niveles preindustriales y apuntar a 1.5°C. Este compromiso se conoce como el Acuerdo de París y es el segundo acuerdo vinculante de la UNFCCC después del protocolo de Kyoto.

Este año, se llevará a cabo la COP26, bajo la organización de Reino Unido en colaboración con Italia, del 31 de octubre al 12 noviembre en Glasgow, Escocia. Debido a la pandemia por COVID-19, la COP26 fue postergada de su fecha inicial en noviembre del 2020. Además de su postergación, la COP26 tiene una urgencia única debido a que es decisiva para mantener la esperanza de cumplir con las metas del Acuerdo de Paris.

Antes de la COP26, todas las partes deberán presentar la actualización de sus Contribuciones Nacionalmente Determinadas (NDC), estas actualizaciones tienen la meta de ponernos de vuelta en el camino hacia la meta de 1.5°C. Además, un punto clave para el éxito de la COP26 es que los países desarrollados cumplan con su promesa de movilizar al menos USD 100 mil millones en financiamiento climático por año para el 2020.

ROL DE LA JUVENTUD

La COP26 también será un espacio para los jóvenes. El 5 de noviembre se llevará a cabo el día de la juventud, el cual forma parte de la agenda de la COP26 y tiene como objetivo destacar el poder y la participación de los jóvenes en la COP, así como demostrar el papel fundamental de la educación y la formación en la acción climática.

Este año, participaré de la COP26 como miembro de la delegación peruana en la conferencia y representando a Perú en los diferentes eventos que se realizarán durante el día de la juventud, en particular en el evento "Bridging the generational divide: Championing Youth Innovation" organizado por el SDG7 Youth Constituency en conjunto con UNIDO. Mi meta en la COP26 es defender y amplificar el mensaje de la importancia de la participación de jóvenes en el liderazgo de soluciones energéticas ante la crisis climática, particularmente en el contexto de Latinoamérica.

Alejandra Valdivia Espinoza

Estudiante de Ingeniería de la Energía

Egresado de Ingeniería Industrial de UTEC: “Hoy soy country manager en una empresa de comercio electrónico”

Escrito por:
UTEC
28 October 2021

Gianfranco Gallese, egresado de Ingeniería Industrial de UTEC, siempre tuvo claro que para poder obtener nuevas oportunidades es indispensable tener claro un norte. Desde el colegio, pensaba en crear soluciones de forma creativa y encontró en la Ingeniería Industrial un amplio campo para lograrlo.

 

INGENIERÍA INDUSTRIAL EN UTEC: MALLA CURRICULAR, EGRESADOS, DOCENTES Y MÁS

 

Hoy, Gianfranco es country manager de Ordéname, plataforma de comercio electrónico diseñada para el canal tradicional. 

 

¿Quieres conocer su experiencia laboral en esta y más empresas? 

¡Checa este video y compártelo! 

 

¿Errores informáticos? cómo se originan realmente y qué impacto tienen

Escrito por:
UTEC
28 October 2021

El 5 de diciembre del 2020, el Banco de la Nación depositó por error S/ 717,540 demás. Consideró que no se trata de un error humano, y por el contrario, lo calificó como un “error netamente informático''.  

Más allá de las acciones emprendidas para recuperar el dinero, cabe la duda, y más aún la preocupación, de que no sea clara la razón por la cual 978 personas recibieron un monto ampliamente superior al original.

Aunque los errores informáticos o también conocidos como bugs, son parte de todo sistema computacional (esta es una de las razones por la cual cada cierto tiempo nuestras aplicaciones o apps deben ser actualizadas), la mayoría de los bugs se originan por errores de quienes desarrollan el código de una aplicación o software.  

El impacto de un bug en una aplicación tiene consecuencias negativas en la imagen y reputación de una institución. Para evitarlos existen distintas metodologías, técnicas y herramientas:

Test Driven Development o Desarrollo Guiado por Pruebas es una de las metodologías de desarrollo de software orientada al desarrollo libre de fallas probando cada línea de código a través de pruebas unitarias.

“Si no se prueba, está roto” es un frase muy común en el desarrollo de software, para probar cada funcionalidad de una aplicación y asegurar que no hay nada roto, existen distintas técnicas como: pruebas de unidad, pruebas funcionales, pruebas de integración, pruebas de estrés,  etc.

Las herramientas de pruebas juegan un papel muy importante en el trabajo de probar cada funcionalidad en distintos escenarios.  Los analistas de calidad o testers prueban el software en escenarios que van  desde los más comunes hasta los menos pensados con el fin de asegurar el correcto funcionamiento y no tener comportamientos inesperados.

Finalmente, tanto la ley como la ética establecen que las personas involucradas en el proceso de desarrollo de software son responsables de crear buenos sistemas con una cantidad mínima de errores.  Un error “netamente informático” no es una conclusión razonable a estas alturas y de todas maneras debe ser coherentemente aclarado. 

 

Por: Jesús Bellido

Director de Ciencia de la Computación de UTEC

 

Ríos Danzantes: “En el CITA-UTEC, buscamos fomentar el desarrollo de investigación en el país con respecto a un recurso prioritario: el agua”

Escrito por:
UTEC
29 October 2021

El evento Ríos Danzantes se realizará este 8 y 11 de noviembre, y presentará los resultados del proyecto de investigación: Información de línea base de los ríos amazónicos.

Desde el 2018, científicos y universitarios del Centro de Investigación y Tecnología del Agua (CITA) de UTEC han venido realizando estudios para evaluar el potencial impacto ambiental que traería diversos proyectos de infraestructura en los ecosistemas de los principales ríos de la Amazonía peruana:  Ucayali, Marañón, Huallaga y Amazonas.

“En el CITA, buscamos fomentar el desarrollo de investigación en el país con respecto a un recurso prioritario: el agua. En este proyecto, nuestra finalidad es que se realice infraestructura sostenible, con un correcto diseño y evaluación de los impactos. Las hidrovías, por ejemplo, son necesarias en la Amazonía porque se requiere de una mayor conectividad. Sin embargo, para aterrizar en esa propuesta, es importante conocer y estudiar los ríos de manera adecuada, diligente y responsable, asegurando la participación de la mayoría de actores posibles”, señala el Dr. Patrick Venail, director de CITA e investigador principal del proyecto, quien brinda más detalles a continuación.

¿A qué conclusiones llegaron en cada una de las iniciativas? Indicar los beneficios sociales, medioambientales, investigativos, económicos u otros. Explicar en un lenguaje cotidiano y, si es posible, brindar cifras. Explayarse todo lo posible.

Como conclusiones se tuvo que la política y normativa peruana con respecto a sedimentos presenta grandes vacíos para la gestión de ríos andino amazónicos. 

- Beneficios medioambientales: podemos concluir que el correcto desarrollo de proyectos de infraestructura fluvial deben considerar el estudio de sedimentos, lo cual puede llevar a generar un menor impacto y mayor eficiencia ya que se proporciona una herramienta de análisis que nos dice dónde son los puntos de sedimentación y nos ayuda a predecir los cambios en las estructuras de los ríos 

- Beneficios a nivel de políticas: Estudiar, conocer, entender y monitorear los ríos en Andes Amazonía cubren los vacíos de información, crean confianza e incrementa la certidumbre en la población local que sería impactada por un proyecto de inversión en infraestructura. El aporte de todo ello, también puede prevenir potenciales conflictos socio-ambientales

- Beneficios a nivel de información: El trabajo del CITA resalta la urgente necesidad de generación y divulgación de información de carácter técnico y científico, además del desarrollo de estudios integrales que sustentan las políticas de promoción de infraestructura en ríos que conectan Andes Amazonía

- Beneficios en investigación:  Visibiliza el aporte de la comunidad académica en torno a los ríos. Integra la diversidad de enfoques para la gestión de los mismos. 

- Beneficios económicos: La influencia que tendrían estas obras de infraestructura sobre la dinámica de los ríos, ecosistemas y medios de vida generan la necesidad de evaluaciones rigurosas e integrales, lo cual a su vez puede reducir para el inversionista costos económicos no previsibles. 

¿Qué tipos de infraestructura han determinado que podría ejecutarse en la Amazonía?

Todo proyecto puede ser sostenible, si es que se evalúa de forma correcta los impactos y son bien diseñados. Las hidrovías, por ejemplo, son necesarias en Amazonía porque se requiere de una mejor y mayor conectividad, por lo tanto, hacer uso de la red fluvial es lo más adecuado. Sin embargo, para aterrizar en esa propuesta se requiere conocer y estudiar los ríos de manera adecuada, diligente y responsable. Asegurando la participación de la mayoría de actores posibles y liderado por un equipo técnico que asegure un proyecto armónico y sostenible.

Infraestructuras que integren barreras contra erosión, para evitar el desborde de las riberas. 

Ejecutar proyectos de infraestructura de manera sostenible, que alcance un marco de operación responsable. De lo contrario, no debería ejecutarse infraestructura dentro de los ríos amazónicos, puesto que los casos estudiados como la Hidrovía Amazónica, ha evidenciado serios vacíos de información.

Participa en Ríos Danzantes este 8 y 10 de noviembre en Ríos Danzantes:

- Lunes 8 de noviembre: charlas y exposiciones.

Aportes de la academia para el entendimiento de los ríos.

10:00 a. m. a 1:00 p. m.

Presentación del libro Guías Metodológicas.

5.00 p. m. a 7:00 p. m.  

- Miércoles 10 de noviembre: panel y charlas.

De la ciencia a las políticas públicas: Infraestructura fluvial en Andes Amazonía 

10:00 a. m. a 1:00 p. m.

Presentación del libro y portal Historias del Río.

5.00 p. m. a 7:00 p. m.  

Participa en Ríos Danzantes, inscribiéndote AQUÍ.

Ríos Danzantes: proyectos de infraestructura podrán planificarse de forma más sostenible considerando conclusiones de investigación científica sobre los ríos amazónicos

Escrito por:
UTEC
29 October 2021

Grandes proyectos de infraestructura fluvial como hidroeléctricas, presas, puertos e hidrovías, se vienen desarrollando y planificando en la Amazonía. Sin embargo, muchos de estos se han realizado sin un correcto entendimiento del impacto ambiental que podrían generar. Ante ello, se vuelve prioritario conocer primero la estructura y características de los ríos de la región, para poder entender mejor los posibles efectos ambientales y sociales de dichas obras creadas por el hombre.

Frente a esta problemática, desde el 2018, científicos del Centro de Investigación y Tecnología del Agua (CITA) de UTEC han venido realizado estudios en ríos de la Amazonía peruana, generando información de calidad que sirva de referencia para diversos proyectos de infraestructura fluvial como pueden ser puertos, hidrovías o centrales hidroeléctricas. Con el conocimiento generado, los tomadores de decisiones podrán evaluar el potencial impacto ambiental de  diversos proyectos de infraestructura sobre  los ríos Ucayali, Marañón, Huallaga y Amazonas.

“Cuando se quiere llevar a cabo un proyecto de infraestructura fluvial de gran escala, es indispensable contar con estudios sobre la caracterización del río, que recopilen suficiente información de forma estandarizada. Dado el poco conocimiento sobre el comportamiento de los ríos que conectan Andes y Amazonía, diversas instituciones competentes en la gestión de estos ríos requieren adquirir información de línea base para evaluar potenciales impactos ambientales de obras que alteren las características de los ríos. Es la primera vez que se realiza una iniciativa de este tipo en el Perú”, señala Patrick Venail Ph.D., director de CITA.

De este modo, el proyecto ‘Evaluación científica de la forma y el flujo del río: información de referencia para los lineamientos de infraestructura en la Amazonía peruana’ ha permitido establecer métodos para medir y caracterizar los ríos. “Si se planea hacer un proyecto de infraestructura en un río, hay que comparar las características de este a lo largo del tiempo y monitorear su comportamiento utilizando unos patrones de medición estandarizados. Esto es un requisito indispensable para desarrollar buenas prácticas medioambientales”, añade el también director de Ingeniería Ambiental de UTEC.

Para realizar estos estudios científicos se han evaluado factores como el transporte de sedimentos en distintas épocas del año, debido a que las condiciones de los ríos fluctúan y hay variaciones en el nivel del agua. Así se ha logrado entender y comprender mejor la dinámica de los ríos, información necesaria para promover iniciativas de inversión en infraestructura que sean sostenibles y, en la medida de lo posible, armónicos con las comunidades locales y la biodiversidad, generando información que contribuye a procesos transparentes y prevención de conflictos socio-ambientales. Esto, a su vez, permitirá un ahorro en las inversiones destinadas a las infraestructuras, ya que habrá una reducción de costos no previsibles.

“A lo largo de los tres años del proyecto financiado por la Fundación Gordon y Betty Moore, hemos conversado con diversas instituciones para que insistan en la necesidad de conocer y entender los ríos desde la parte física. Mensaje que esperamos se tome en cuenta, para que se reconozca la problemática y se adopten alternativas en base al eje de la sostenibilidad”, indica Venail.

La tecnología ha sido fundamental para el desarrollo de estas investigaciones. Por ejemplo, el uso de herramientas de sensoramiento remoto sirven para evaluar y caracterizar los cambios morfológicos de los ríos con el paso de los años. 

“En el CITA, buscamos fomentar el desarrollo de investigación en el país con respecto a un recurso prioritario: el agua. En este proyecto, nuestra finalidad es que se realice infraestructura sostenible, con un correcto diseño y evaluación de sus impactos. Las hidrovías, por ejemplo, son necesarias en la Amazonía porque favorecen la conectividad. Sin embargo, para hacerla sostenible, es importante conocer y estudiar los ríos de manera adecuada, diligente y responsable, asegurando la participación de la mayoría de actores posibles”, finalizó Patrick Venail, Ph.D.

Tras esta importante investigación se encuentra un equipo multidisciplinario, el cual ha permitido que las investigaciones se enriquezcan por los diversos expertise y enfoques

Participa en Ríos Danzantes este 8 y 10 de noviembre en Ríos Danzantes:

- Lunes 8 de noviembre: charlas y exposiciones.

Aportes de la academia para el entendimiento de los ríos.

10:00 a. m. a 1:00 p. m.

Presentación del libro Guías Metodológicas.

5.00 p. m. a 7:00 p. m.  

- Miércoles 10 de noviembre: panel y charlas.

De la ciencia a las políticas públicas: Infraestructura fluvial en Andes Amazonía 

10:00 a. m. a 1:00 p. m.

Presentación del libro y portal Historias del Río.

5.00 p. m. a 7:00 p. m.  

Participa en Ríos Danzantes, inscribiéndote AQUÍ.

El Algoritmo EM y la Bioingeniería Computacional

Escrito por:
UTEC
02 November 2021

 

Autor:

 

 

 

Prof. Paul Cardenas.

Departamento de Bioingeniería

pcardenas@utec.edu.pe

 


  

Los datos biológicos son información derivada de organismos vivos y sus productos y a menudo pueden ser muy complejos en comparación con otros tipos de datos. Por ejemplo, los datos biológicos incluyen datos de secuencia, estructura de proteínas, datos genómicos y aminoácidos, sitios de enlaces, y también pueden ser simplemente texto y otros datos secundarios generados por organismos vivos. Debido a su complejidad y abundancia en varias áreas de investigación se requieren modelos probabilísticos pero a menudo los datos biológicos disponibles están incompletos o sin etiquetar para poder entrenar un modelo probabilístico. Casos cotidianos son el diagnóstico médico donde los historiales de los pacientes generalmente incluyen solo resultados de una serie limitada de  examinaciones y no se cuenta con los valores completos de otras examinaciones. Similar al agrupamiento de expresión génica, los datos incompletos surgen debido a que no se conocen las asignaciones del gen a un grupo específico en el modelo probabilístico. 

 

Considere el siguiente ejemplo juguete (Fig. 1) donde se obtiene el perfil tumoral de pacientes y se requiere segmentarlos. El perfil tumoral se puede usar para ayudar a planificar el tratamiento y predecir si el cáncer regresará o se diseminará a otras partes del cuerpo. La data original (Fig. A) contiene 3 grupos de pacientes con descriptores en 2 dimensiones (X1 y X2). En la mayoría de escenarios, no se conoce a priori las etiquetas de las clases de pertenencia de cada paciente y tampoco el número de grupos dentro de la población (Fig. B). Si usamos el algoritmo EM (expectation-maximization) de forma iterativa es posible identificar los grupos a los que pertenecen los pacientes (Fig. C y D). El modelo generativo converge y es muy parecido a la data original del perfil tumoral  (Fig. A y D). Si se cambia los descriptores a más de 2, se tendrá un problema multidimensional que engloba una aplicación real.  El algoritmo EM se ha usado en problemas de biología computacional relacionados al “dogma central” de la biología molecular, el descubrimiento de motif de secuencia, alineación de secuencias de proteínas, genética de poblaciones, modelos evolutivos y análisis de datos de microarrays de expresión de ARN, etc. A continuación vamos a describir el algoritmo EM y como se usa en problemas reales biológicos.    

 

Imagen 1. Segmentación del perfil tumoral de pacientes. Fig. A muestra la data original etiquetada que tiene 3 grupos de pacientes con descriptores en 2 dimensiones (X1 y X2). Fig. B muestra la data original sin etiquetas ya que en la mayoría de escenarios no se conoce a priori las etiquetas de las clases de pertenencia de cada paciente. Segmentación de perfiles tumorales mediante el algoritmo EM (Fig. C: Estado intermedio) y (Fig. D: Estado final). El modelo generativo converge y es muy similar a la data original del perfil tumoral (Fig. A y D).

Fuente. Elaboración propia.

 

 

El algoritmo EM permite la estimación de parámetros de modelos probabilísticos con datos incompletos como el ejemplo juguete (Fig. 1). El algoritmo EM fue inicialmente introducido en el contexto de la estimación de la frecuencia génica y fue analizado de manera extensa en el contexto de cadenas ocultas de Markov donde se conoce comúnmente como el método de Baum-Welch. En las últimas dos décadas, la bioingeniería computacional ha pasado de ser una industria artesanal en pañales con un puñado de investigadores a un campo interdisciplinario atractivo, que ha captado la atención y la imaginación de muchos científicos con mentalidad cuantitativa. El algoritmo EM está jugando un rol muy importante durante esta transformación. 

 

El algoritmo EM es un método iterativo para encontrar estimaciones de maximum likelihood (MLE) o maximum a posteriori (MAP) de parámetros en modelos estadísticos, donde el modelo depende de variables latentes no observadas. El algoritmo EM alterna entre los pasos de aprender una distribución de probabilidad sobre la completación de los datos faltantes dado el modelo actual (conocido como el E-step) y luego volver a estimar los parámetros del modelo utilizando esta completación (conocido como el M-step). En el “E-step” solo se calculan las estadísticas suficientes “esperadas” sobre las completaciones ya que no es necesario obtener la distribución de probabilidad de forma explícita. En el “M-step” se realiza la re-estimación del modelo que se considera como una “maximización” de la probabilidad logarítmica esperada de los datos. 

 

Los datos observados (X) pueden ser discretos (valores en un set finito o set infinito contable) o continuos (valores en un set infinito incontable) donde cada instancia de los datos puede ser un vector de observaciones. Los valores faltantes o variables latentes (Z) son discretos, extraídos de un número fijo de valores y con una variable latente por data observada. Los parámetros (θ) son valores continuos de dos tipos: los parámetros que están asociados con todos los datos y los asociados con un valor específico de una variable latente. El algoritmo EM en el caso de que θ y Z sean desconocidos es:

 

1. Se inicializan los parámetros θ a algún valor aleatorio.

2. E-step: Se calcula la probabilidad de cada valor posible de Z, dado θ, (Z|θ)

3. M-step: Luego, se usan los valores recién calculados de Z para calcular una mejor estimación de los parámetros θ.

4. Se repiten los pasos 2 y 3 de forma iterativa hasta llegar a la convergencia de los parámetros.

 

Este algoritmo se aproxima monótonamente a un mínimo local de la función de costo y es una generalización natural de la estimación de máxima likelihood (MLE) al caso de datos incompletos. En particular, el EM intenta encontrar los parámetros que maximizan la probabilidad logarítmica de los datos observados. La optimización abordada por este algoritmo es más difícil que la optimización usada en MLE.  Esto es debido a que la función objetivo tiene múltiples máximos locales y no tiene solución de forma cerrada para el algoritmo EM en comparación al MLE. El algoritmo EM reduce el problema de optimizar el logaritmo de la probabilidad en una secuencia de subproblemas de optimización más simples, en las cuales las funciones objetivo tienen máximos globales únicos que a menudo se pueden calcular en forma cerrada. 

 

El algoritmo EM se ha usado para identificar a qué grupo es más probable que pertenezca un gen en particular. Esto es una aplicación muy importante en la expresión génica donde se proporcionan medidas de expresión génica de microarrays para miles de genes en diversas condiciones, y el objetivo es agrupar los vectores de expresión observados en distintos grupos de genes relacionados. Un enfoque es modelar el vector de medidas de expresión para cada gen como una muestra de una distribución gaussiana multivariante asociada con el grupo de ese gen. En este caso, los datos observados (X) corresponden a mediciones de microarrays, los factores latentes no observados (Z) son las asignaciones de genes a grupos, y los parámetros (θ) incluyen las medias y matrices de covarianza de las distribuciones gaussianas multivariadas que representan los patrones de expresión para cada grupo. Para el aprendizaje de parámetros, el algoritmo EM alterna entre calcular probabilidades para las asignaciones de cada gen a cada grupo (E-step) y actualizar las medias y covarianzas del grupo según el conjunto de genes que pertenecen predominantemente a ese grupo (M-step). 

 

Para encontrar la ubicación más probable de un motif en una secuencia en particular también se usa el algoritmo EM. Esta es otra aplicación que se puede responder en el contexto de búsqueda de motifs donde  se da un set de secuencias de ADN no alineadas y se pide que identifiquen un patrón de longitud W que está presente con variaciones menores en cada secuencia del set. Para aplicar el algoritmo de EM se modela la instancia del motif en cada secuencia con cada letra muestreada de forma IID (independientes e idénticamente distribuidas) de una distribución específica de posición sobre letras, y las letras restantes en cada secuencia como provenientes de una distribución fija. Los datos observados (X) consisten en las letras de las secuencias, los factores latentes no observados (Z) incluyen la posición inicial del motif en cada secuencia y los parámetros (θ) describen las frecuencias (probabilidades) de las letras específicas en la posición para el motif. El algoritmo de EM calcula la distribución de probabilidad sobre las posiciones de inicio del motif para cada secuencia (E-step) y actualiza las frecuencias de las letras del motif en función de los recuentos de las letras esperadas para cada posición en el motif (M-step). 

 

Otras aplicaciones donde se usa el algoritmo EM son el aprendizaje de dominios de proteínas y familias de ARN, el descubrimiento de módulos transcripcionales, identificación de proteínas, alineación de secuencias de proteínas. El algoritmo EM también se usa ampliamente en la reconstrucción de imágenes médicas, especialmente en tomografía por emisión de positrones, tomografía computarizada por emisión de fotón y tomografía computarizada de rayos X. 

 

En todas estas aplicaciones, el algoritmo EM proporciona una estrategia simple, fácil de implementar y eficiente para aprender los parámetros de un modelo. Una vez que se conocen estos parámetros, se puede usar la inferencia probabilística para realizar preguntas al modelo proporcionando un mecanismo sencillo para el aprendizaje y construcción de modelos. En general el EM se ha convertido en una herramienta útil para trabajar con datos faltantes y observar variables latentes y proporcionar un mecanismo para construir y entrenar modelos probabilísticos ricos para aplicaciones biológicas. Si estás interesado en aprender más acerca de este y otros algoritmos para resolver problemas reales postula a la carrera de Bioingeniería UTEC.

 

Bibliografia:

1. Xiaodan, Fan & Yuan, Yuan & Liu, Jun. (2011). Statistical Science 25.

2. Do, C.B. and Batzoglou, S. (2008), Nature Biotechnology, 26, 897

3. Ceppellini, R., Siniscalco, M. & Smith, C.A. Ann. Hum. (1955) Genet. 20, 97. 

4. Hartley, H. Biometrics (1958) 14, 174 . 

5. Baum, L.E., Petrie, T., Soules, G. & Weiss, N. Ann. (1970) Math. Stat. 41, 164. 

6. Dempster, A.P., Laird, N.M. & Rubin, D.B. J. R. (1977) Stat. Soc. Ser. B 39, 1. 

7. Do, C. B., Mahabhashyam, M. S. P., Brudno, M. and Batzoglou, S. (2005). Genome Res. 15 330–340.

8. Weeks, D. E. and Lange, K. (1989). Math. Med. Biol. 6 209–232. 

9. Chen, X. and Blanchette, M. (2007). BMC Bioinformatics.

10. Edlefsen, P. T. (2009). Conditional Baum–Welch, dynamic model surgery, and the three Poisson Dempster–Shafer models.

 


 CONOCE MÁS SOBRE BIOINGENIERÍA EN UTEC  Y VIVE LA INGENIERÍA  Bioingeniería  


 

Suscribirse a