análisis de fiabilidad de equipos industriales
Post on 13-Aug-2015
318 Views
Preview:
DESCRIPTION
TRANSCRIPT
ANÁLISIS DE
FIABILIDAD DE
EQUIPOS
2013
ANTONIO ROS MORENO
2
MANTENIMIENTO
"Cuando todo va bien, nadie recuerda que existe"
"Cuando algo va mal, dicen que no existe"
"Cuando es para gastar, se dice que no es necesario"
"Pero cuando realmente no existe, todos concuerdan en que debería existir"
A.SUTE
3
1.- TÉCNICAS ESPECÍFICAS DE MANTENIMIENTO
1.1.- Análisis de Fiabilidad de Equipos
1.1.1.- Introducción
1.1.2.- Definiciones básicas
1.1.3.- Teoría de la fiabilidad
1.1.4.- Leyes Estadísticas
1.1.5.- Modos de fallo y modelos de indisponibilidad
1.1.6.- Fiabilidad de los Sistemas
1.1.7.- Sistemas Complejos. Método del Árbol de Fallos
1.1.8.- Mantenibilidad. Disponibilidad
4
1. TÉCNICAS ESPECÍFICAS DE MANTENIMIENTO
1.1. Análisis de Fiabilidad de Equipos
1.1.1. Introducción
Las empresas buscan asegurar y mejorar su competitividad por medio de los
esfuerzos, acciones y decisiones orientadas a garantizar sistemas y equipos operando de
manera eficiente y eficaz, riesgos reducidos, cero incidentes ambiéntales y costos
óptimos. Así los propietarios, la comunidad, los empleados y los clientes se sienten en
un entorno “Confiable”.
Esto significa que para poder mostrar que se es competitivo y exitoso, es
necesario usar mediciones de factores clave como son: la calidad, la productividad, la
rentabilidad, la imagen, la seguridad y la integridad ambiental que en su conjunto
expresan el desempeño. A estos factores las empresas han agregado otro muy
importante como la “Fiabilidad”.
Muchas personas asocian la fiabilidad y la disponibilidad de los equipos en
forma directa y exclusiva con las actividades del mantenimiento, sin embargo, la
verdadera causa raíz de los problemas de disponibilidad y confiabilidad, normalmente
comienzan mucho antes de que el mantenimiento sea requerido.
En estos momentos Fiabilidad es la palabra de moda, la pregunta es ¿Los
responsables del mantenimiento conocen conscientemente las mejores prácticas y
técnicas para buscar la “Optima Fiabilidad”?.
La fiabilidad es concebida durante la etapa de diseño por el equipo o personal de
ingeniería, donde aspectos claves como la fiabilidad intrínseca de cada componente y el
mantenimiento deben ser considerados, posteriormente la fiabilidad de los equipos será
condicionada por las mejores prácticas que se hayan incorporado durante la etapa de
construcción, montaje e instalación y finalmente por la operación del equipo reflejado
en buenas prácticas de trabajo para su buen funcionamiento.
Existen empresas que han ido más allá de considerar la estadística y han
revisado sus prácticas internas, efectuando comparaciones con las que son destacadas en
dicho proceso. Estas organizaciones llegaron a la conclusión de que es imposible hablar
de fiabilidad como una cifra única, por lo tanto es necesario usar diversas mediciones
como indicadores fundamentales de entrada y salida de los procesos.
El concepto más conocido para definir que es fiabilidad es: “La probabilidad de
que un equipo o sistema opere sin fallos durante un tiempo (t) determinado, en unas
condiciones ambientales dadas”. Más sencillamente, fiabilidad es la probabilidad de
que un sistema o producto funcione.
5
Para los sistemas y productos de un solo servicio, (como un misil o los motores
de un cohete de combustible sólido), la definición se reduce a la probabilidad de
funcionar en las condiciones previstas.
La teoría de la fiabilidad es el conjunto de teorías y métodos matemáticos y
estadísticos, procedimientos y prácticas operativas que, mediante el estudio de las leyes
de ocurrencia de fallos, están dirigidos a resolver problemas de previsión, estimación y
optimización de la probabilidad de supervivencia, duración de vida media y porcentaje
de tiempo de buen funcionamiento de un sistema.
En conclusión, la planificación de la fiabilidad exige la comprensión de las
definiciones fundamentales.
1. Cuantificación de la fiabilidad en términos de probabilidad.
2. Clara definición de lo que es un buen funcionamiento.
3. Del ambiente en que el equipo ha de funcionar.
4. Del tiempo requerido de funcionamiento entre fallos.
Si no es así, la probabilidad es un número carente de significado para los
sistemas y productos destinados a funcionar a lo largo del tiempo.
La necesidad de fiabilidad en las instalaciones es tan antigua como la
humanidad, pero es innegable que la creciente importancia de los temas ambientales y
de seguridad han conducido a la necesidad de cambiar nuestra perspectiva debido a:
- Alta presión para disminuir los costos y poder competir
- Mayor número de funciones operacionales realizadas por equipos y máquinas
- Mayores dificultades para hacer intervenciones de mantenimiento, debido al
aumento en utilización de los equipos.
- Tendencias a usar componentes informáticos, electrónicos, neumáticos e
hidráulicos que tienen comportamientos diferentes de desgaste con relación a los
componentes que fallan en función de la edad.
- Legislaciones actuales cada vez más exigentes y poco tolerantes.
En la actualidad, la fiabilidad tiene sus orígenes en la aeronáutica (seguridad de
funcionamiento). Un paso significativo se dio en Alemania cuando se trabajó con el
misil V1. Von Braun consideraba erróneamente que en una cadena de componentes,
6
cuyo buen funcionamiento era esencial para el correcto funcionamiento del conjunto, la
probabilidad de fracaso dependía exclusivamente del funcionamiento del componente
más débil. Erich Pieruschka (matemático del equipo) dio vida a la fórmula de la
fiabilidad del sistema a partir de la fiabilidad de los componentes, que permite afirmar
que la fiabilidad del conjunto es siempre inferior a la de sus componentes individuales.
Posteriormente en el sector militar en EEUU, para garantizar el funcionamiento
de sistemas electrónicos y finalmente en el industrial, para garantizar la calidad de los
productos y eliminar riesgos de pérdidas valiosas, dieron el impulso definitivo para su
paulatina implantación en otros campos.
1.1.2. Definiciones básicas
Las definiciones necesarias y básicas para comenzar el estudio de fiabilidad son
las siguientes (incluida la de fiabilidad ya definida con anterioridad):
- Fallo: Es toda alteración o interrupción en el cumplimiento de la función
requerida.
- Fiabilidad (de un elemento): Es la probabilidad de que funcione sin fallos
durante un tiempo (t) determinado, en unas condiciones ambientales dadas.
- Mantenibilidad: Es la probabilidad de que, después del fallo, sea reparado en
un tiempo dado.
- Disponibilidad: Es la probabilidad de que esté en estado de funcionar (ni
averiado ni en revisión) en un tiempo dado.
Si adoptamos, para simplificar, que el esquema de vida de una máquina consiste
en una alternancia de "tiempos de buen funcionamiento" (TBF) y "tiempos de averías"
(TA):
Figura 12
7
en los que cada segmento tiene los siguientes significados:
TBF: Tiempo entre fallos
TA: Tiempo de parada
TTR: Tiempo de reparación
TO: Tiempo de operación
n: Número de fallos en el periodo considerado
podemos definir los siguientes parámetros como medidas características de dichas
probabilidades:
a) El tiempo medio entre fallos (MTBF) como medida de la Fiabilidad:
y su inversa (λ) conocida como la tasa de fallos:
b) El tiempo medio de reparación (MTTR) como medida de la Mantenibilidad:
y su inversa (μ) conocida como la tasa de reparación:
8
c) La disponibilidad (D) es una medida derivada de las anteriores:
Es decir, la disponibilidad es función de la fiabilidad y de la mantenibilidad.
Otra medida de la fiabilidad es el factor de fiabilidad:
donde:
HT: Horas totales del periodo
HMC: Horas de Mantenimiento Correctivo (Averías)
HMP: Horas de Mantenimiento Preventivo (programado)
Y otra medida de la disponibilidad es el factor de disponibilidad:
donde se pone claramente de manifiesto que la disponibilidad es menor que la
fiabilidad, puesto que al contabilizar el tiempo de buen funcionamiento, en la
9
disponibilidad se prescinde de todo tipo de causas posibles (se incluye el tiempo de
mantenimiento preventivo programado):
Sin embargo en el cálculo de la fiabilidad, al contabilizar el tiempo de buen
funcionamiento, no se incluye el tiempo de mantenimiento preventivo programado.
El esquema siguiente es un resumen de los parámetros que caracterizan la vida
de los equipos:
Figura 13
10
1.1.3. Teoría de la fiabilidad
Hemos definido antes la FIABILIDAD como la probabilidad de que un
elemento, conjunto ó sistema funcione sin fallos, durante un tiempo dado, en unas
condiciones ambientales dadas. Ello supone:
a) Definir de forma inequívoca el criterio que determina si el elemento funciona
ó no.
b) Que se definan claramente las condiciones ambientales y de utilización y se
mantengan constantes.
c) Que se defina el intervalo t durante el cual se requiere que el elemento
funcione.
-Para evaluar la fiabilidad se usan dos procedimientos:
a) Usar datos históricos. Si se dispone de muchos datos históricos de aparatos
iguales durante un largo período no se necesita elaboración estadística. Si son pocos
aparatos y poco tiempo hay que estimar el grado de confianza.
b) Usar la fiabilidad conocida de partes para calcular la fiabilidad del conjunto.
Se usa para hacer evaluaciones de fiabilidad antes de conocer los resultados reales.
-Consideramos t "tiempo hasta que el elemento falla" como variable
independiente (período al que se refiere la fiabilidad).
.Función de distribución de probabilidad: f (t)
.Probabilidad de que el elemento falle en instante t: f (t) dt
Figura 14
11
.Probabilidad de que falle en el instante t ó antes (infiabilidad):
donde F(t) es la función de distribución de probabilidad acumulada
.Fiabilidad, R(t), Probabilidad de que funcione todavía en el instante t:
.Tasa de fallos, λ(t), es la función de distribución de Probabilidad (condicional)
de un elemento que ha funcionado bien hasta el instante t, y falla en el tiempo
comprendido entre t y t+dt.
.Véase la diferencia entre f (t) y λ (t):
-f (t) dt representa la fracción de población que falla entre t y t+dt, respecto
una población sana en t=o (original).
-λ (t)dt representa la fracción de población que falla entre t y t+dt, respecto
una población sana en el momento t (es menos numerosa, ó como máximo igual a
la población original).
12
.f (t) dt es una probabilidad a priori, referida al instante inicial de
funcionamiento.
.λ (t)dt es una probabilidad a posteriori, condicionada a la información cierta de
que el aparato ha funcionado bien hasta el momento t.
Relación entre fiabilidad R(t) y tasa de fallos (t)
Prob.de que falle en período t+dt = Prob.de que funcione todavía en t x Prob.de
que falle en t+dt, estando bien en t.
.Recordando que:
Separando variables:
e integrando entre 0 y t:
→
13
ya que ln R (0)= 0 porque R (0)= 1.
La fórmula anterior que es la fiabilidad en función de la tasa de fallos, junto con
las siguientes:
constituyen tres relaciones, entre cuatro funciones [f (t), F (t), R (t), λ (t)], por lo que
conociendo una cualquiera de ellas, se conocen las otras tres.
Análisis de la función tasa de fallos (t)
.Tiene la dimensión inversa de un tiempo, por lo que puede interpretarse como
"Número de fallos en la unidad de tiempo".
-Al representarla gráficamente para una población homogénea de componentes,
a medida que crece su edad t:
Figura 15
14
resulta ser la llamada curva de la bañera, en la que se distinguen claramente tres
períodos:
A: .Período de Mortalidad Infantil
.Fallos de rodaje, ajuste o montaje
.La tasa de fallos es decreciente
.Propio de componentes de Tecnología Mecánica.
B: .Período de Fallos por azar (o aleatorios)
.Tasa de fallos constante
.Propio de materiales de Tecnología eléctrica/electrónica.
C: .Período de Fallos por Desgaste ó Vejez
.Tasa de fallos creciente
.Propio de materiales de Tecnología mecánica ó electromecánica (desgaste
progresivo).
En general, la curva λ(t) resulta de la superposición de la curva (a) asociada a los
defectos iniciales tras la puesta en servicio y la curva (b) que marca los fenómenos de
desgaste o deterioro de la función.
Figura 16
De manera que, dependiendo de la influencia de cada uno de los fenómenos
mencionados, la tasa de fallo tendrá una forma distinta. Así en los equipos mecánicos
predominan los fenómenos asociados al desgaste y su tasa de fallo crece con el tiempo:
15
Figura 17
En los últimos años ha habido una polémica considerable acerca de la exactitud
de la descripción proporcionada por la curva de la bañera. En vista de las pautas de
obsolescencia y de los nuevos resultados de las investigaciones, existen razones para
poner en duda el concepto. No obstante, como subraya la relación existente entre la
fiabilidad de los dispositivos y la forma de la función de riesgo, la idea de la curva de la
bañera proporciona un punto de partida excelente para la definición de los modelos de
distribución de probabilidades.
La estadística ha demostrado que, tras estudiar el comportamiento de los equipos
en una planta industrial, el ciclo de vida de la mayoría de los equipos no se corresponde
únicamente con la curva de bañera, sino que se diferencian 6 tipos de curvas:
Figura 18
16
Curiosamente, la mayor parte de los equipos no se comportan siguiendo la curva
A ó “curva de bañera”. Los equipos complejos se comportan siguiendo E, en el que la
probabilidad de fallo es constante a lo largo de su vida, y el modelo F, en el que tras una
etapa inicial con una mayor probabilidad de fallo infantil, la probabilidad de fallo se
estabiliza y permanece constante. Eso hace que no sea identificable un momento en el
que realizar una revisión sistemática del equipo, con la sustitución de determinadas
piezas, ante la imposibilidad de determinar cuál es el momento ideal, pues la
probabilidad de fallo permanece constante. Incluso, puede ser contraproducente si curva
de probabilidad sigue el modelo F, pues estaríamos introduciendo mayor probabilidad
de fallo infantil al sustituir determinadas piezas:
Figura 19
Por todo ello, en muchas plantas industriales es conveniente abandonar la idea
de un mantenimiento sistemático para una buena parte de los equipos que la componen,
y recurrir a las diversas técnicas de mantenimiento condicional o predictivo.
17
1.1.4. Leyes Estadísticas
Ahora vamos a ver la forma de estas funciones para cada uno de los tres aspectos
de la función λ (t): constante, creciente y decreciente.
a) λ = cte. Ley exponencial (exponencial negativa)
b) λ (t) es variable. Ley de Weibull. Ley con tres parámetros que permiten
ajustar las tasas de fallos crecientes ó decrecientes.
β: Parámetro de forma β > 0
η: Parámetro de escala η > 0
γ: Parámetro de posición -∞ < γ < +∞
Figura 21
18
Si β < 1. λ decrece. Período A
β = 1. λ constante. Período B
β > 1. λ crece. Período C
De forma simplificada:
t: variable de duración 0 < t < ∞
T: duración característica, T > 0
β: parámetro de forma
19
Si β < 1. λ decrece. Fallos infantiles
Β = 1. λ constante. Fallos aleatorios
Β > 1. λ crece. Fallos por desgaste
Para un período de tiempo t, igual a la duración característica T:
La duración característica T es la duración hasta que han fallado el 63,2% de la
población.
-Representando la función de Weibull gráficamente con escala doble logarítmica
en ordenadas y logarítmica en abscisas, R(t) adopta forma de recta de pendiente β. En
dicho gráfico es posible determinar la fiabilidad R para cualquier duración t. Sin
embargo, la aplicación de las técnicas estadísticas permiten una estimación más precisa.
-El conocimiento de las leyes de evolución de λ(t) en función del tiempo puede
ser útil para establecer la política de mantenimiento más adecuada para cada tipo de
componente de los equipos. En componentes de tasa de fallo constante un cambio de
pieza no aporta una mayor fiabilidad, es más, presentaría un valor de fiabilidad menor al
principio de su puesta en servicio, por posibles defectos de fabricación. Sin embargo, en
componentes con tasa de fallo creciente con el tiempo está perfectamente justificada la
sustitución preventiva antes de que la tasa de fallos alcance un valor inadmisible.
1.1.5. Modos de fallo y modelos de indisponibilidad
Los equipos pueden manifestar sus fallos en tres intervalos de tiempo: mientras
están en espera, cuando se demanda su actuación o cuando están en operación o
funcionamiento.
Los parámetros que a continuación se definen serán utilizados para el cálculo de
las indisponibilidades de los sucesos básicos mediante las expresiones matemáticas que
procedan para cada modo de fallo.
20
- Tasa de fallos ( ): Esta determinada por el número de fallos que ocurren en un
equipo dividido por el tiempo transcurrido.
- Tasa de fallos en operación ( o): Esta determinada por el número de fallos que
tiene un equipo cuando está en operación dividido por el tiempo de operación en el que
ocurren los fallos.
- Tasa de fallos en espera ( s): Esta determinada por el número de fallos que tiene
un equipo cuando está en espera dividido por el tiempo de espera en el que ocurren los
fallos.
- Indisponibilidad (F): Es el parámetro que en términos probabilísticos define la
no disponibilidad de un equipo en un cierto instante de tiempo.
- Indisponibilidad por demanda (Fd): Es el número de fallos que tiene un equipo
en la demanda de actuación dividido por el número de demandas efectuadas.
- Tiempo de operación (TO): Es el tiempo en que un equipo está en
funcionamiento o en operación.
- Tiempo entre pruebas (Tep): Es el intervalo de tiempo entre revisiones
periódicas de un equipo.
- Tiempo de prueba (Tp): Es el tiempo medio que dura la prueba o revisión de un
equipo.
- Tiempo de reparación (TTR): Es el tiempo medio de reparación de un equipo
que se ha detectado fallado.
La función indisponibilidad, definida por la ecuación se
particulariza para cada modo de fallo, adquiriendo expresiones matemáticas diferentes:
Fallo en espera
Se produce en componentes que están en espera para entrar en operación y
estando en este estado fallan. Ejemplos de este tipo de componentes son las válvulas de
seguridad, las bombas de refrigeración, redundantes o no, pero que no estén
refrigerando en ese periodo, los grupos electrógenos, las alarmas, etc.
Los mecanismos por los que estos componentes fallan son dependientes del
tiempo, por corrosión o suciedad, envejecimiento, etc. y la tasa de fallos se ajusta a una
distribución exponencial
21
por lo que la indisponibilidad puntual adquiere la expresión:
Estos componentes pueden ser probados periódicamente o no, siendo la
indisponibilidad media distinta en cada caso.
- Componentes en espera sometidos a pruebas periódicas: la indisponibilidad
media en el intervalo entre pruebas Tep es:
- Componentes en espera no sometidos a pruebas periódicas: la indisponibilidad
media en el tiempo que le queda al componente es:
donde Tvp y Tv son el tiempo de vida previsto del componente y el tiempo que lleva en
funcionamiento, respectivamente.
22
Indisponibilidad por pruebas
Asociada a componentes en espera que son probados o revisados periódicamente
con un intervalo Tep y en los que las revisiones les hace estar indisponibles durante el
tiempo de pruebas Tp.
Indisponibilidad por mantenimiento preventivo
Asociada a componentes a los que se realiza mantenimiento preventivo con un
ciclo de duración Tm, dejándolos indisponibles durante el tiempo de reparación TTR.
Fallo en demanda
Se da en componentes que fallan cuando se les demanda un cambio de estado,
por ejemplo cuando el componente está funcionando y se le demanda que pare o cuando
el componente está en espera y se le demanda que entre en operación, fallando en el
arranque. Se le asocia la distribución estadística binomial, ya que la demanda solo
puede tomar dos valores, éxito o fracaso:
donde x y n son el número de fallos en demanda y el número de demandas efectuadas,
respectivamente.
23
Fallo en operación
Se da en componentes que fallan durante el tiempo de operación TO. La tasa de
fallos se ajusta a la distribución exponencial:
Por lo que la probabilidad de que un componente en operación falle antes de que
finalice el tiempo de operación está determinada por:
Fallo humano
Son fallos producidos en componentes debido a un error humano en su
operación. Este modo de fallo se encuentra tratado de forma sucinta en las Notas
Técnicas de Prevención 360 (Fiabilidad humana: conceptos básicos) y 377 (Fiabilidad
humana: métodos) del Instituto Nacional de Seguridad e Higiene en el Trabajo
1.1.6. Fiabilidad de los Sistemas
Tratamos ahora de establecer la relación que liga la fiabilidad de un sistema
complejo con la de sus componentes individuales.
La fiabilidad de un sistema no es otra que la probabilidad de ocurrencia del
acontecimiento "NO HAY FALLOS", lo cual es, a su vez, resultado de una serie de
acontecimientos más simples.
Las partes componentes del sistema se pueden comportar, desde el punto de
vista de la fiabilidad de forma independiente ó no.
El funcionamiento, desde el punto de vista de la fiabilidad, de un sistema se
representa mediante esquemas de bloques adecuadamente conectados, de forma que
cada bloque representa un elemento ó subsistema.
24
Estos esquemas no corresponden con los esquemas funcionales de la instalación
(No hay correspondencia con el despiece físico), sino que representan la dependencia
lógica del acontecimiento "fallo del sistema".
a) Sistemas en serie.
El fallo de uno cualquiera de sus componentes determina el fallo del sistema
completo
Figura 22
Si λ= cte. entonces
λ1 λ2 λ3 λn
25
b) Sistemas en paralelo.
Basta que funcione un elemento
para que funcione todo el sistema.
Se llaman también sistemas
redundantes.
En este caso se simplifican los
cálculos usando la función infiabilidad
Figura 23
de manera que F(t)=F1(t) x F2(t) x...x Fn(t)
con lo que
Cuantos más elementos hay en paralelo, mejor es la fiabilidad.
λ3
λn
λ1
λ2
26
1.1.7. Sistemas Complejos. Método del Árbol de Fallos
Normalmente, en los equipos, los componentes forman un sistema complejo que
en parte son subsistemas en serie y en parte subsistemas en paralelo.
De los diversos métodos existentes para estudiar la fiabilidad de sistemas
complejos el que mejor se adapta a un tratamiento informático es el MÉTODO DEL
ÁRBOL DE FALLOS.
Consiste en descomponer, escalonadamente, la ocurrencia de un suceso en un
sistema lógico secuencial integrado por unidades (elementos) operativos
independientes, hasta alcanzar los sucesos tomados como iniciales (primarios). Cada
unidad queda identificada por su denominación y la función (operación-fallo) que se
espera de ella.
Los estados en que pueden encontrarse las unidades son dos: Operativo-Fallo.
A partir del suceso en estudio se responde a la pregunta:
é
é
27
Para la representación gráfica de los árboles de fallos y con el fin de normalizar
y universalizar la representación se han elegido ciertos símbolos que se representan en
las siguientes tablas:
28
Se comienza eligiendo el suceso final objeto del análisis. A partir de aquí se van
determinando los sucesos previos inmediatos que, por combinación lógica, pueden ser
su causa. El proceso se repite hasta alcanzar una serie de "sucesos básicos",
denominados así porque no precisan de otros anteriores a ellos para ser explicados.
También alguna rama puede terminar por alcanzar un "suceso no desarrollado" en otros,
sea por falta de información o por la poca utilidad de analizar las causas que lo
producen.
Los nudos de las diferentes puertas y los "sucesos básicos o no desarrollados"
deben estar claramente identificados.
Estos "sucesos básicos o no desarrollados" que se encuentran en la parte inferior
de las ramas del árbol se caracterizan por los siguientes aspectos:
- Son independientes entre ellos.
- Las probabilidades de que acontezcan pueden ser calculadas o estimadas.
Para ser eficaz, un análisis por árbol de fallos debe ser elaborado por personas
profundamente conocedoras de la instalación o proceso a analizar y que a su vez
conozcan el método y tengan experiencia en su aplicación; por lo que, si se precisa, se
deberán constituir equipos de trabajo pluridisciplinarios (técnico de seguridad, ingeniero
del proyecto, ingeniero de proceso, etc.) para proceder a la reflexión conjunta que el
método propicia.
Una vez desarrollado para cada suceso preestablecido, es posible determinar
cualitativa y cuantitativamente la fiabilidad del sistema.
El análisis cualitativo permite determinar los sucesos (fallos mínimos) que deban
presentarse (condición necesaria y suficiente) para que ocurra el suceso principal.
El análisis cuantitativo (mediante el álgebra de Boole) determina la fiabilidad del
sistema si se conocen la de los distintos elementos o sucesos primarios.
La modelización del sistema mediante el árbol de fallos o errores y el análisis
cualitativo y cuantitativo del mismo están tratados en la NTP-333 "Análisis
probabilístico de riesgos: Metodología del Árbol del fallos y errores", a la que se remite
al lector para su mejor comprensión.
29
Ejemplo: Fallos de una linterna eléctrica de mano para que no funcione.
30
Si Fi representa la tasa de fallo de cada evento:
F0 = F1 . F2
F2 = F3 + F4 F0 = F1 . (F3 + F5 + F6) = F1 . F3 + F1 . F5 + F1 . F6
F4 = F5 + F6
Cuando es conocida la probabilidad de cada suceso primario, es posible calcular
la del fallo principal. (Datos históricos/Datos de fabricantes).
De esta forma se determina si es aceptable ó no el fallo principal, y nos ayuda a:
- Determinar la fiabilidad de elementos, subsistemas y sistemas.
-Analizar la fiabilidad de distintos diseños (análisis comparativo).
-Identificar componentes críticos, que pueden ser causa de sucesos
indeseables.
- Analizar fallos críticos que previamente han sido identificados por un
análisis AMFE.
Como consecuencia de estos análisis podemos decir que el método del árbol de
fallos se podría utilizar para:
- Evidenciar la fiabilidad de un sistema
- Comparar con la de otros sistemas
- Proponer modificaciones en el diseño
e incluso para establecer el plan de su mantenimiento preventivo (gamas y frecuencia).
Para facilitar el análisis cuantitativo, la tasa de fallos de cada suceso se asigna, a
falta de datos precisos, utilizando valores relativos arbitrarios como la tabla de
probabilidades relativas de la Atomic Energy of Canada Ltd.:
Muy probable 10-2
Probable 10-3
No probable 10-4
Improbable 10-5
31
Muy improbable 10-6
Extremadamente improbable 10-7
En las puertas Y la probabilidad es igual al producto de las probabilidades.
Como están expresadas en forma de potencias de 10, sólo habrá que sumar exponentes:
10-3
x 10-4
= 10-7
En las puertas OR la probabilidad es igual a la suma de probabilidades. Por la
misma razón (potencias de 10) se puede simplificar tomando la mayor y despreciando el
resto:
10-4
+ 10-3
+ 10-6 ≈ 10
-3
Análisis de un sistema de refrigeración
En este apartado se presenta un caso práctico de la aplicación de los datos de
fiabilidad de componentes. La aplicación de esta metodología puede ser tanto para el
análisis de seguridad de las instalaciones, como para mejorar su mantenimiento
preventivo.
Se realiza el análisis de la disponibilidad del sistema de refrigeración de un
reactor discontinuo ("batch"), representado, esquemáticamente en la figura 1. Este
sistema, además de ser un ejemplo poco complejo y relativamente fácil de analizar,
corresponde a una instalación muy extendida en la industria química de proceso y en
particular en las PYMES del sector químico, por ejemplo en la industria de química
fina.
32
La instalación de refrigeración está formada, básicamente por dos tramos iguales
y cada tramo consta de:
- 1 bomba centrífuga para impulsar el agua (B1/B2).
- 2 válvulas de accionamiento manual para aislar la bomba (V11/V21 y V12/V22)
- 1 válvula de retención para evitar que se produzca flujo inverso (VR1/VR2).
- 1 válvula de control, gobernada por un controlador de temperatura del reactor.
Elaboración del árbol de fallos
En el análisis de fiabilidad del sistema de refrigeración se ha empleado la
metodología de árbol de fallos y errores humanos (véase NTP-333). El paso previo a la
elaboración del árbol en sí, es la identificación del suceso no deseado cuya probabilidad
se requiere obtener y los sucesos y circunstancias que deben concurrir para llegar al
mismo. Esta etapa previa puede ser realizada por medio de:
- Un análisis histórico de accidentes en instalaciones similares, aportando
experiencias similares.
- Un análisis sistemático, empleando metodologías como el análisis funcional de
operabilidad (HAZOP) (véase NTP-238), el análisis modal de fallos y efectos
(FMEA), etc.
- La experiencia del personal de la planta y del analista.
En la figura 27 se presenta el árbol de fallos utilizado para analizar la
indisponibilidad del sistema. En el presente caso la indisponibilidad estudiada es la falta
de refrigeración en el reactor (suceso no deseado o Top event).
Los sucesos intermedios que inciden directamente al TOP son: fallo en el tramo
1 y fallo en el tramo 2. Como se ha indicado anteriormente, los dos tramos son
idénticos, por lo que, sólo se comenta uno, obviamente tal duplicidad aminora
significativamente la indisponibilidad total. Los sucesos considerados para analizar el
posible fallo en el tramo son:
- Válvula manual V11 cerrada erróneamente u obstruida.
- Válvula de retención VR1 falla en la apertura.
- Válvula manual V12 cerrada erróneamente u obstruida.
33
- Fallo en la válvula de control VC1.
- Fallo en la bomba B1.
34
Los sucesos considerados por los que la válvula de control dejará de operar
correctamente son, básicamente:
- Fallo del controlador de temperatura del reactor:
.- Fallo de la señal de apertura SA.
.- Actuación de señal de cierre SC.
- Fallo a la demanda.
- Fallo en operación.
- Fallo del suministro eléctrico.
El segundo suceso y el tercero son modos de fallo de la válvula.
Los sucesos considerados por los que la bomba dejará de operar correctamente o
no estará disponible son, básicamente:
- Indisponibilidad de la bomba por pruebas o por mantenimiento.
- Fallo a la demanda.
- Fallo en operación.
- Fallo en espera.
- Fallo del suministro eléctrico.
- Fallo del controlador de temperatura del reactor:
.- Fallo de la señal de apertura SA.
.- Actuación de señal de cierre SC.
Los cuatro primeros sucesos son modos de fallo de la bomba.
El fallo del suministro eléctrico no se ha desglosado en más sucesos básicos,
recibiendo el nombre de suceso no desarrollado. A este recurso se recurre cuando no se
tiene más información para desglosar un suceso intermedio, su desarrollo no aporta más
información o sus consecuencias son despreciables. En este caso, no es objeto del
análisis y no aporta más información.
35
El suceso anterior y los sucesos básicos derivados de los fallos del controlador
de temperatura del reactor, en la metodología de árbol de fallos, se pueden considerar
como "fallos del modo común", ya que dichos fallos también son sucesos que puedan
afectar a las válvulas de control.
Análisis cualitativo y cuantitativo del árbol de fallos
El análisis cualitativo del árbol de fallos consiste en identificar las
combinaciones mínimas de sucesos básicos que hacen que se produzca el suceso no
deseado, también denominado en la terminología de árboles de fallos, conjunto mínimo
de fallos (de la nomenclatura anglosajona, minimal cut set).
Para la determinación de los mismos se aplica la lógica del álgebra de Boole,
suponiendo que los sucesos básicos son independientes.
Con el listado de los diferentes conjuntos mínimos de fallos, se tiene una
clasificación de los caminos o combinaciones de sucesos que pueden producir el suceso
no deseado. Pero si lo que se pretende es hacer una clasificación por importancia o
magnitud (de más a menos importancia) deberíamos de asignar valores a cada suceso
básico, realizando un análisis cuantitativo.
La indisponibilidad de un conjunto mínimo de fallos viene dada por el producto
de las indisponibilidades de los sucesos básicos. A su vez, la indisponibilidad total del
suceso no deseado es la suma de las indisponibilidades de los conjuntos mínimos de
fallos, como límite superior.
La indisponibilidad de cada suceso básico se calcula con las expresiones
matemáticas descritas en el apartado "Modos de fallo y modelos de indisponibilidad" y
a partir de las tasas de fallos de los componentes y de una serie de tiempos de
funcionamiento del sistema (TO, Tep, Tp, etc.).
Las tasas de fallos pueden ser extraídas de bancos de datos de fiabilidad de
reconocido prestigio internacional o de la experiencia de la planta basada en registros de
fallos o averías, en concreto para el presente caso se han empleado los valores
publicados por CCPs (Center for Chemical Process Safety) del AlChE (American
Institute of Chemical Engineers) y los tiempos, determinados en las especificaciones de
operación del sistema, se han establecido los siguientes:
- Tiempo de operación: 1,25 h (tiempo durante el cual el sistema de
refrigeración debe funcionar correctamente, para cada proceso batch)
- Tiempo entre pruebas de las bombas: 2000 h.
- Tiempo en pruebas o mantenimiento de las bombas: 5 h.
36
Realizando el análisis cualitativo y cuantitativo del presente caso (tabla 13),
siguiendo la metodología descrita en la NTP-333, se ha obtenido:
- 84 conjuntos mínimo de fallos:
.- 3 de orden 1.
.- 81 de orden 2.
Indisponibilidad total del sistema: 8,2 10-4
procesos-1
(tabla 14), esto quiere decir
que de 1220 batch (o veces que se realice la operación), probablemente en una de ellas
se producirá una falta de refrigeración del reactor.
37
Análisis de importancia
En todo análisis de seguridad, es esencial identificar aquellos equipos y modos
de fallos que tienen un mayor impacto en la seguridad del sistema analizado, es lo que
constituye un "Análisis de importancia" del sistema. Este tipo de análisis permitirá
centrar estudios posteriores en aquellos equipos o situaciones que han propiciado los
sucesos básicos más importantes, a la vez que marca las pautas a seguir para adoptar las
medidas preventivas más eficaces, que obviamente serán sobre aquellos equipos que
muestren medidas de importancia más significativas.
38
La importancia de los sucesos básicos puede calcularse a través de diferentes
medidas existentes, que realizan el análisis desde diferentes puntos de vista. En este
documento se han considerado tres de las medidas más utilizadas.
a. Medida de importancia RAW (Risk Achivement Worth): se define como
el cociente entre la suma de las probabilidades de los conjuntos mínimos de fallo donde
aparece el componente, asumiendo para éste una probabilidad de fallo de 1 (fallo
seguro), y la probabilidad total del suceso no deseado. Proporciona la degradación del
sistema en caso de ocurrir el suceso básico. La ordenación obtenida está basada en la
disposición estructural de los sucesos básicos en el árbol de fallos, sin tener en cuenta
explícitamente los valores reales de las indisponibilidades de los sucesos.
b. Medida de importancia RRW (Risk Reduction Worth): se define como el
cociente entre la probabilidad total del suceso TOP y la suma de las probabilidades de
todos los conjuntos mínimos, asumiendo para el componente una tasa de fallo nula. Esta
medida proporciona los sucesos básicos que más contribuyen al riesgo. Identifica
aquellos sucesos básicos que si fueran perfectamente fiables, con indisponibilidad nula,
conducirían a una reducción más importante del riesgo del sistema.
c. Medida de importancia de Fussell-Vesely: se define este factor respecto de
un componente, como el cociente entre la suma de las probabilidades de todos los
conjuntos mínimos que contienen a este componente y la probabilidad total (o suma de
la probabilidad de todos los conjuntos mínimos). En esta medida influye tanto la
indisponibilidad del componente como su posición estructural en el árbol de fallos.
En el caso práctico del apartado anterior, los resultados obtenidos para las tres
medidas de importancia se muestran en las tablas 15, 16 y 17 y se representan en los
gráficos 3, 4 y 5, respectivamente.
a. Medida RAW: esta medida revela la importancia de asegurar las señales
eléctricas SA y SC de actuación de las válvulas de control (VC1 y VC 2) y de las
bombas (B1 y B2), así como el suministro eléctrico.
b. Medidas RRW y Fussell-Vesely: estas medidas proporcionan la misma
ordenación de sucesos básicos y revelan la importancia de reducir la probabilidad de los
modos de fallo de las bombas (B1 y B2) en demanda y en espera.
39
40
Medidas de reducción de la indisponibilidad. Intervalo óptimo entre
pruebas
Las medidas existentes para aumentar la fiabilidad (o disminuir la
indisponibilidad) de un sistema o reducir la probabilidad de fallo, pueden ser
básicamente de dos tipos.
En primer lugar, modificar la estructura del árbol de fallos: a través de cambios
en la instalación, que fundamentalmente pueden consistir en la incorporación de
redundancias en aquellos elementos o funciones que se hayan identificado como críticas
o imprescindibles para la seguridad del sistema, como en el caso del suministro
eléctrico y señales de actuación del ejemplo anterior, que proporcionan los valores
superiores en la medida de importancia RAW.
En segundo lugar, disminuir la indisponibilidad de los sucesos básicos: tal y
como se ha visto en el punto "Modos de fallo y modelos de indisponibilidad", la
indisponibilidad de cada suceso básico se ha calculado mediante unas expresiones
matemáticas para cada modo de fallo, que tienen como variables las tasas de fallos
intrínsecas de los componentes ( s, o) y las condiciones de operación y mantenimiento
del sistema (Tep, Tp, TO, TTR).
Por ello, la reducción de las indisponibilidades de los sucesos básicos puede ser
lograda mediante la elección de componentes con tasas de fallos bajas y adoptando
adecuadas estrategias de mantenimiento preventivo.
En el caso práctico analizado, las medidas de importancia RRW y Fussell-
Vesely han revelado la importancia de reducir la indisponibilidad de las bombas
instaladas, a las cuales se les realiza pruebas periódicas.
Intervalo óptimo entre pruebas
La indisponibilidad de la bomba está determinada por:
41
El intervalo óptimo entre pruebas se puede obtener derivando la función anterior
respecto al tiempo entre pruebas e igualando la derivada a cero:
Que en el caso práctico realizado anteriormente proporciona un valor de 1.036
horas.
Para verificar este resultado se ha calculado la indisponibilidad total del suceso
no deseado para distintos tiempos entre pruebas de las bombas; los resultados se
presentan en la tabla 18 y se representan en el gráfico 6, de donde se desprende que el
mínimo valor de la indisponibilidad total se obtiene para un tiempo entre pruebas
próximo a 1.000 horas, corroborándose el cálculo matemático del tiempo óptimo
realizado anteriormente.
1.1.8. Mantenibilidad. Disponibilidad
Se trata de conceptos paralelos a la fiabilidad en tanto en cuanto son funciones
de distribución de probabilidad, de acuerdo con las definiciones dadas antes.
-La mantenibilidad, probabilidad de ser reparado en un tiempo predeterminado,
se refiere a la variabilidad de los tiempos de reparación, que es muy grande por los
numerosos factores que pueden intervenir.
42
La función de distribución de estos tiempos puede ser:
-Distribución Normal: Tareas relativamente sencillas.
-Distribución Logarítmico-Normal: La mayoría de los casos en
mantenimiento.
Función de distribución de probabilidad m (t), indica la distribución de los
tiempos de mantenimiento.
- Mantenibilidad:
- Tasa de reparación:
Si µ = cte. entonces
- Tiempo medio de reparación: MTTR
-La disponibilidad, probabilidad de desarrollar la función requerida, se refiere a
la probabilidad de que no haya tenido fallos en el tiempo t, y que caso que los tenga,
que sea reparada en un tiempo menor al máximo permitido. Es función por tanto, de la
fiabilidad y de la mantenibilidad.
En el caso de que la tasa de fallos λ (t) y la tasa de reparación μ (t) sean
constantes, es:
La disponibilidad aumenta al aumentar la fiabilidad (disminuir la tasa de fallos
λ) ó al disminuir el tiempo medio de reparación (aumentar la tasa de reparación μ).
Cartagena, marzo 2013
top related