Intrarea romanilor in UE- studii de risc seismic
(partea III-a)
Asa cum se stie, cel mai drag
algoritm de clasificare implementat este “Microsoft Decision Trees” care , asa
cum arata si denumirea, construieste un arbore in care nodurile sunt atributele
considerate relevante pentru cantitatea de date studiata . Iata in imaginea de
mai jos arborescenta descoperita in cele 716 cladiri cu sau fara bulina din
Bucuresti.

In fiecare
nod este construita o conditie de splitare adica de spargere a seturilor de
date:
Nr.
|
Atribut
|
Conditie
de splitare
|
1
|
Root
|
|
2
|
Expert
|
Expert=”Primaria”
|
3
|
An
Constr
|
Pana in
1935 si peste 1940
|
4
|
An
Expertiza
|
Peste
1994
|
5
|
Regim
Inalt
|
S+P+2E
|
6
|
Regim
Inalt
|
S+P+2E+Ma
|
Ca sa
vedem mai exact cum s-a ajuns la aceasta configuratie priviti imaginea
construita mai jos, din mai multe

Punand
cursorul pe fiecare casuta dreptunghiulara cu valoarea atributului apare o
lista cu numarul de cazuri pentru fiecare valoare a atributului predictibil
Risc, astfel pentru “AnConstr <1935 or AnConstr >=1940” avem 288 cazuri (cladiri)
din care : 231 cu gradul I, 57 I+, 0 II si III , si nu exista cladiri cu risc
neprecizat (missing); mai mult right click pe acelasi nod apoi “Show legend” si
vedem probabilitatea ca o cladire sa aiba gradul I de risc , 77,56%, s.a.m.d;
in imagine apar toate listele de cazuri (in mod normal este afisata doar una
, cea pe care este asezat cursorul mouse-ului).
Iata cum
ajuta aceasta configuratie la activitati de predictie date. Sa spunem ca undeva
s-ar descoperi o cladire uitata de primarie si cu probleme de risc seismic, iar
expertiza e facuta de un expert oarecare : daca anul de constructie este 1920
atunci sansa sa fie in gradul I de risc ar fi 77,56 %; mai departe , cum
expertiza este facuta dupa 1994 se intra pe ramura corespunzatoare; sa zicem ca
este S+P+1E atunci sansa sa fie in gradul I de risc este 50,24% s.a.m.d., pana
se ajunge la capatul arborelui la o frunza.
Gigi
Ciubuc
Gheorghe Ciubuc,SQL Server Influencer, MCP(SQL 2000), MCTS (SQL Server 2005) , OCA(Oracle 9i), Sybase(Brainbench)