Using pyAgrum¶

In [1]:

%matplotlib inline
from pylab import *
import matplotlib.pyplot as plt

import os

Initialisation¶

importing pyAgrum
importing pyAgrum.lib tools
loading a BN

In [2]:

import pyAgrum as gum
import pyAgrum.lib.notebook as gnb
gnb.configuration()

Library	Version
OS	posix [linux]
Python	3.10.8 (main, Nov 1 2022, 14:18:21) [GCC 12.2.0]
IPython	8.7.0
Matplotlib	3.6.2
Numpy	1.23.5
pyDot	1.4.2
pyAgrum	1.5.1

Thu Dec 22 15:37:05 2022 CET

In [3]:

bn=gum.loadBN("res/alarm.dsl")
gnb.showBN(bn,size='9')

../_images/notebooks_02-Tutorial_Tutorial2_5_0.svg

Visualisation and inspection¶

In [4]:

print(bn.variableFromName('SHUNT'))

SHUNT:Labelized({NORMAL|HIGH})

In [5]:

print(bn.cpt(bn.idFromName('SHUNT')))


             ||  SHUNT            |
PULMEM|INTUBA||NORMAL   |HIGH     |
------|------||---------|---------|
TRUE  |NORMAL|| 0.1000  | 0.9000  |
FALSE |NORMAL|| 0.9500  | 0.0500  |
TRUE  |ESOPHA|| 0.1000  | 0.9000  |
FALSE |ESOPHA|| 0.9500  | 0.0500  |
TRUE  |ONESID|| 0.0100  | 0.9900  |
FALSE |ONESID|| 0.0500  | 0.9500  |

In [6]:

gnb.showPotential(bn.cpt(bn.idFromName('SHUNT')),digits=3)

		SHUNT
INTUBATION	PULMEMBOLUS	NORMAL	HIGH
NORMAL	TRUE	0.100	0.900
NORMAL	FALSE	0.950	0.050
ESOPHAGEAL	TRUE	0.100	0.900
ESOPHAGEAL	FALSE	0.950	0.050
ONESIDED	TRUE	0.010	0.990
ONESIDED	FALSE	0.050	0.950

Results of inference¶

It is easy to look at result of inference

In [7]:

gnb.showPosterior(bn,{'SHUNT':'HIGH'},'PRESS')

../_images/notebooks_02-Tutorial_Tutorial2_11_0.svg

In [8]:

gnb.showPosterior(bn,{'MINVOLSET':'NORMAL'},'VENTALV')

../_images/notebooks_02-Tutorial_Tutorial2_12_0.svg

Overall results

In [9]:

gnb.showInference(bn,size="10")

../_images/notebooks_02-Tutorial_Tutorial2_14_0.svg

What is the impact of observed variables (SHUNT and VENTALV for instance) on another on (PRESS) ?

In [10]:

ie=gum.LazyPropagation(bn)
ie.evidenceImpact('PRESS',['SHUNT','VENTALV'])

Out[10]:

		PRESS
SHUNT	VENTALV	ZERO	LOW	NORMAL	HIGH
NORMAL	ZERO	0.0569	0.2669	0.2005	0.4757
	LOW	0.0208	0.2515	0.0553	0.6724
	NORMAL	0.0769	0.3267	0.1772	0.4192
	HIGH	0.0501	0.1633	0.2796	0.5071
HIGH	ZERO	0.0589	0.2726	0.1997	0.4688
	LOW	0.0318	0.2237	0.0521	0.6924
	NORMAL	0.1735	0.5839	0.1402	0.1024
	HIGH	0.0711	0.2347	0.2533	0.4410

Using inference as a function¶

It is also easy to use inference as a routine in more complex procedures.

In [11]:

import time
r=range(0,100,2)
xs=[x/100.0 for x in r]

tf=time.time()
ys=[gum.getPosterior(bn,{'MINVOLSET':[0,x/100.0,0.5]},'VENTALV').tolist()
        for x in r]
delta=time.time()-tf

p=plot(xs,ys)
legend(p,[bn.variableFromName('VENTALV').label(i)
          for i in range(bn.variableFromName('VENTALV').domainSize())],loc=7);
title('VENTALV (100 inferences in %d ms)'%delta);
ylabel('posterior Probability');
xlabel('Evidence on MINVOLSET : [0,x,0.5]')
plt.show()

../_images/notebooks_02-Tutorial_Tutorial2_18_0.svg

Another example : python gives access to a large set of tools. Here the value for the equality of two probabilities of a posterior is easely computed.

In [12]:

x=[p/100.0 for p in range(0,100)]

tf=time.time()
y=[gum.getPosterior(bn,{'HRBP':[1.0-p/100.0,1.0-p/100.0,p/100.0]},'TPR').tolist()
   for p in range(0,100)]
delta=time.time()-tf

p=plot(x,y)
title('HRBP (100 inferences in %d ms)'%delta);
v=bn.variableFromName('TPR');
legend([v.label(i) for i in range(v.domainSize())],loc='best');
np1=(transpose(y)[0]>transpose(y)[2]).argmin()
text(x[np1]-0.05,y[np1][0]+0.005,str(x[np1]),bbox=dict(facecolor='red', alpha=0.1))
plt.show()

../_images/notebooks_02-Tutorial_Tutorial2_20_0.svg

BN as a classifier¶

Generation of databases¶

Using the CSV format for the database:

In [13]:

gum.generateSample(bn,1000,"out/test.csv",with_labels=True)

Out[13]:

-15399.120521833791

In [14]:

with open("out/test.csv","r") as src:
    for _ in range(10):
        print(src.readline(),end="")

HISTORY,VENTLUNG,PAP,HYPOVOLEMIA,STROKEVOLUME,VENTTUBE,KINKEDTUBE,CVP,ANAPHYLAXIS,BP,HR,LVEDVOLUME,MINVOL,PULMEMBOLUS,INSUFFANESTH,HRSAT,CO,PCWP,EXPCO2,FIO2,INTUBATION,HREKG,VENTMACH,ARTCO2,MINVOLSET,SAO2,PVSAT,LVFAILURE,VENTALV,ERRCAUTER,SHUNT,CATECHOL,ERRLOWOUTPUT,DISCONNECT,HRBP,TPR,PRESS
FALSE,ZERO,NORMAL,FALSE,NORMAL,ZERO,FALSE,NORMAL,FALSE,HIGH,HIGH,NORMAL,ZERO,FALSE,FALSE,HIGH,HIGH,NORMAL,LOW,NORMAL,NORMAL,HIGH,LOW,HIGH,LOW,LOW,LOW,FALSE,ZERO,FALSE,NORMAL,HIGH,FALSE,FALSE,HIGH,NORMAL,LOW
FALSE,ZERO,NORMAL,TRUE,LOW,ZERO,FALSE,NORMAL,FALSE,LOW,HIGH,HIGH,ZERO,FALSE,FALSE,HIGH,LOW,HIGH,LOW,NORMAL,NORMAL,HIGH,ZERO,HIGH,NORMAL,LOW,LOW,FALSE,ZERO,FALSE,NORMAL,HIGH,FALSE,TRUE,HIGH,HIGH,ZERO
FALSE,ZERO,NORMAL,TRUE,LOW,LOW,FALSE,NORMAL,FALSE,LOW,HIGH,HIGH,ZERO,FALSE,FALSE,HIGH,LOW,NORMAL,LOW,NORMAL,NORMAL,HIGH,NORMAL,HIGH,NORMAL,LOW,NORMAL,FALSE,ZERO,FALSE,NORMAL,HIGH,FALSE,FALSE,HIGH,HIGH,HIGH
FALSE,ZERO,NORMAL,TRUE,LOW,LOW,FALSE,NORMAL,FALSE,LOW,HIGH,HIGH,ZERO,FALSE,FALSE,NORMAL,LOW,HIGH,LOW,NORMAL,NORMAL,LOW,NORMAL,HIGH,NORMAL,LOW,LOW,FALSE,ZERO,TRUE,HIGH,HIGH,FALSE,FALSE,HIGH,NORMAL,HIGH
TRUE,ZERO,NORMAL,TRUE,LOW,LOW,FALSE,LOW,FALSE,LOW,HIGH,LOW,ZERO,FALSE,FALSE,HIGH,NORMAL,LOW,ZERO,NORMAL,NORMAL,HIGH,NORMAL,LOW,NORMAL,NORMAL,HIGH,TRUE,HIGH,FALSE,NORMAL,HIGH,FALSE,FALSE,HIGH,LOW,HIGH
FALSE,ZERO,NORMAL,TRUE,LOW,LOW,FALSE,NORMAL,FALSE,NORMAL,HIGH,NORMAL,ZERO,FALSE,FALSE,HIGH,LOW,NORMAL,LOW,NORMAL,NORMAL,HIGH,NORMAL,HIGH,NORMAL,LOW,LOW,FALSE,ZERO,FALSE,HIGH,HIGH,FALSE,FALSE,HIGH,LOW,HIGH
FALSE,ZERO,NORMAL,FALSE,NORMAL,LOW,FALSE,HIGH,FALSE,HIGH,HIGH,HIGH,ZERO,FALSE,FALSE,HIGH,HIGH,HIGH,LOW,NORMAL,NORMAL,HIGH,NORMAL,HIGH,NORMAL,LOW,LOW,FALSE,ZERO,FALSE,NORMAL,HIGH,FALSE,FALSE,HIGH,HIGH,NORMAL
FALSE,ZERO,NORMAL,FALSE,NORMAL,LOW,FALSE,NORMAL,FALSE,NORMAL,HIGH,NORMAL,ZERO,FALSE,FALSE,HIGH,HIGH,NORMAL,HIGH,NORMAL,NORMAL,HIGH,NORMAL,HIGH,NORMAL,LOW,LOW,FALSE,ZERO,FALSE,NORMAL,HIGH,FALSE,FALSE,HIGH,HIGH,HIGH
FALSE,ZERO,NORMAL,FALSE,HIGH,LOW,FALSE,NORMAL,FALSE,NORMAL,HIGH,NORMAL,ZERO,FALSE,FALSE,HIGH,HIGH,NORMAL,LOW,NORMAL,NORMAL,HIGH,NORMAL,HIGH,NORMAL,LOW,LOW,FALSE,ZERO,FALSE,NORMAL,HIGH,FALSE,FALSE,HIGH,NORMAL,NORMAL

probabilistic classifier using BN¶

(because of the use of from-bn-generated csv files, quite good ROC curves are expected)

In [15]:

from pyAgrum.lib.bn2roc import showROC_PR

showROC_PR(bn,"out/test.csv",
        target='CATECHOL',label='HIGH',  # class and label
        show_progress=True,show_fig=True,with_labels=True)

out/test.csv: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|

../_images/notebooks_02-Tutorial_Tutorial2_26_1.svg

Out[15]:

(0.9614278242677825, 0.9300899828, 0.998169628642847, 0.4221808066)

Using another class variable

In [16]:

showROC_PR(bn,"out/test.csv",'SAO2','HIGH',show_progress=True)

out/test.csv: 100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████|

../_images/notebooks_02-Tutorial_Tutorial2_28_1.svg

Out[16]:

(0.9873225152129818, 0.0082631642, 0.7421042938210823, 0.5385017134)

Fast prototyping for BNs¶

In [17]:

bn1=gum.fastBN("a->b;a->c;b->c;c->d",3)

gnb.sideBySide(*[gnb.getInference(bn1,evs={'c':val},targets={'a','c','d'}) for val in range(3)],
              captions=[f"Inference given that $c={val}$" for val in range(3)])

Inference given that $c=0$

Inference given that $c=1$

Inference given that $c=2$

In [18]:

print(gum.getPosterior(bn1,evs={'c':0},target='c'))
print(gum.getPosterior(bn1,evs={'c':0},target='d'))

# using pyagrum.lib.notebook's helpers
gnb.flow.row(gum.getPosterior(bn1,evs={'c':0},target='c'),gum.getPosterior(bn1,evs={'c':0},target='d'))


  c                          |
0        |1        |2        |
---------|---------|---------|
 1.0000  | 0.0000  | 0.0000  |


  d                          |
0        |1        |2        |
---------|---------|---------|
 0.6638  | 0.1259  | 0.2103  |

c
0	1	2
1.0000	0.0000	0.0000

d
0	1	2
0.6638	0.1259	0.2103

Joint posterior, impact of multiple evidence¶

In [19]:

bn=gum.fastBN("a->b->c->d;b->e->d->f;g->c")
gnb.sideBySide(bn,gnb.getInference(bn))

In [20]:

ie=gum.LazyPropagation(bn)
ie.addJointTarget({"e","f","g"})
ie.makeInference()
gnb.sideBySide(ie.jointPosterior({"e","f","g"}),ie.jointPosterior({"e","g"}),
               captions=["Joint posterior $P(e,f,g)$","Joint posterior $P(e,f)$"])

		g
f	e	0	1
0	0	0.1139	0.1285
0	1	0.0374	0.0484
1	0	0.2367	0.3159
1	1	0.0529	0.0662

Joint posterior $P(e,f,g)$

	g
e	0	1
0	0.3506	0.4445
1	0.0904	0.1146

Joint posterior $P(e,f)$

In [21]:

gnb.sideBySide(ie.evidenceImpact("a",["e","f"]),ie.evidenceImpact("a",["d","e","f"]),
              captions=["$\\forall e,f, P(a|e,f)$",
                        "$\\forall d,e,f, P(a|d,e,f)=P(a|d,e)$ using d-separation"]
                        )

		a
f	e	0	1
0	0	0.4935	0.5065
0	1	0.6524	0.3476
1	0	0.5057	0.4943
1	1	0.6520	0.3480

$\forall e,f, P(a|e,f)$

		a
e	d	0	1
0	0	0.5176	0.4824
0	1	0.4789	0.5211
1	0	0.6501	0.3499
1	1	0.6526	0.3474

$\forall d,e,f, P(a|d,e,f)=P(a|d,e)$ using d-separation

In [22]:

gnb.sideBySide(ie.evidenceJointImpact(["a","b"],["e","f"]),ie.evidenceJointImpact(["a","b"],["d","e","f"]),
              captions=["$\\forall e,f, P(a,b|e,f)$",
                        "$\\forall d,e,f, P(a,b|d,e,f)=P(a,b|d,e)$ using d-separation"]
                        )

			b
f	e	a	0	1
0	0	0	0.4909	0.0027
	0	1	0.2267	0.2797
	1	0	0.6520	0.0004
	1	1	0.3011	0.0464
1	0	0	0.5032	0.0025
	0	1	0.2324	0.2618
	1	0	0.6515	0.0004
	1	1	0.3009	0.0471

$\forall e,f, P(a,b|e,f)$

			b
e	d	a	0	1
0	0	0	0.5153	0.0023
	0	1	0.2380	0.2443
	1	0	0.4760	0.0029
	1	1	0.2199	0.3012
1	0	0	0.6496	0.0005
	0	1	0.3001	0.0499
	1	0	0.6522	0.0004
	1	1	0.3012	0.0461

$\forall d,e,f, P(a,b|d,e,f)=P(a,b|d,e)$ using d-separation

In [ ]: