Incepusem la sfarsitul partii I o discutie despre Dependency Network construita prin Decision Trees si Naïve Bayes;
haideti sa vedem ce se intampla in Association Rules .
Sistemul a grupat dependentele intre anumite valori ale atributelor si valori ale gradului de risc in 3 seturi mari asa
cum se vede in figura urmatoare (Nodul Risc=I+ in stanga, Risc=II in dreapta si Risc=I jos):
Le vom analiza pe rand in ordinea de aparitie a legaturilor de la “tare” (adica nr. 1) catre “slab” conform a 2 criterii de evaluare:
I. Criteriul : aparitia legaturilor in fiecare din cele 3 grupuri
Iata secventele de aparitie
Risc=II: |
Risc=I |
Risc=I+ |
1.Expert=PRIMARIA
Regim Inalt=S+P+10E
An expertiza=200-2001
Denumire artera=Colentina
Sector=6
Regim Inalt=S+P+4E+Ma
Regim Inalt=S+P+7E
Regim Inalt=S+P+5E
An expertiza>=2001
Regim Inalt=S+P+5E+Ma
Regim Inalt=S+P+6E
Denum Artera=Dorobanti
Tip Artera=Soseaua
Denum Artera=Ion Campineanu
Denum Artera=S+P+9E
|
1.An expertiza < 1994
An constr <1915
Expert=SIGMA-A. SIMION
Expert=PROIECT BUC. A.SIMION
Expert=A.CONDRUT
Expert=ABRAL-L.SPOIALA
Expert=MORENA C.ARIENESCU
Denum artera=BARATIEI
Expert=ABRAL-LAURENTIU SPOIALA
Expert=I.LUNGU
Expert=IPCT-D.STANCIULESCU
Denum Artera=CA Rosetti
Expert=NEFIAN- A.NEFIAN
Expert=PROIECT BUC. E. IORDACHESCU
Regim Inalt=S+P
Denum Artera=FRANCEZA
Regim Inalt=S+P+1E+Ma
Regim Inalt=S+P+1E
Regim Inalt=S+P+2E+Pod |
1.Regim Inalt=P+5
Regim Inalt=P+7
Expert=A.PRETORIAN
Regim Inalt=P+8
Denum Artera=Calea Victoriei
Regim Inalt=P+6
Regim Inalt=P+5+M
Expert=A.TITARU
Expert=M.NAVODARU
Expert=M.URSACHESCU
Expert=G.NICULESCU
Regim Inalt=P+6+M
Expert=N>TUDOSE
Denum Artera=BD. NICOLAE BALCESCU
Expert=MARIN TEODOR
Regim Inalt=P+4+M
Expert=D.POPESCU
|
Uitativa cum arata o aglomeratie dintr-un grup :
Haideti sa vedem ce e cu aceste date : In primul rand cladirile de risc II au fost expertizate de Primarie asa cum a presupus eu,
apoi putem spune ca cladirile cu 10 etaje sigur ar fi din aceasta clasa de risc si, mai departe faptul ca o constructie are
mai mult de 4 etaje o incadreaza la II; apoi arterele “preferate” de riscul nr. 2 sunt Colentina, Dorobanti si Ion Campineanu.
Mai departe in clasa I de risc este o ingramadeala de experti care s-au ocupat cu cladirile de acest risc; se poate spune ,
de exemplu ca daca SIGMA A. SIMION se pune pe treaba sigur desemneaza o cladire intr-o clasa de acest fel; sa observam
ca anul de constructie plasat sub 1915 desemneaza cladirile in clasa I.(Nu pot sa nu remarc, in paranteza, ca cei care au intocmit
documentul au pus pe SPOIALA in 2 locuri, am descoperit deci o inconsecventa in date). Daca ne uitam la
cladirile periculoase de la I+, cele cu mai mult de 5 etaje sunt critice, iar Calea Victoriei este strada sperantei pentru o lume mai buna …,
de asemenea, Bulevardul Nicolae Balcescu din centrul Bucurestiului.
II. Criteriul : aparitia legaturilor in ansamblu
Daca va uitati pe imaginea generala a celor 3 grupuri vedeti o grila care daca se culiseza face sa apara legaturile ca niste linii intre
noduri. Imi propun sa misc grila la 25%, 50% , 75% si 100% din lungimea ei. Astfel ca :
-La 0% apare Expert=PRIMARIA la Risc=II , asa cum am spus Primaria a expertizat aceste cladiri;
-La 25% apar: 15 legaturi la Risc=I+ (iar pana in 50% apar toate);
-La 50% apar la Risc=I, 9 iar la Risc=II, 2 ;
-La 75% apar 9 la I, 1 la II ;
-La 100% restul din Risc =I si Risc=II
Ce ne poate spune asta? Ca riscul I+ este puternic determinat de atributele specificate, in timp ce celelalte atribute sunt slab legate
de Risc=I si Risc=II.
Asta ne poate sugera ca nu-i de joaca pe Calea Victoriei !
Gigi Ciubuc
Nota. Acest articol reprezinta opinii personale ale autorului, si trebuie tratat ca atare.
Gheorghe Ciubuc,SQL Server Influencer, MCP(SQL 2000), MCTS (SQL Server 2005) , OCA(Oracle 9i), Sybase(Brainbench)