Welcome to Sign in | Help
in Search

Estimated number of rows

Last post 01-13-2008, 7:45 PM by B_gd_n[ ]Sahlean. 6 replies.
Sort Posts: Previous Next
  •  01-11-2008, 2:36 PM 3753

    Estimated number of rows

    Am o tabela (tabela_mea) cu peste 2 mil inregistrari si care are un index clustered (pe o coloana identity). Mai are un index pe o coloana (coloana_x), iar densitatea e de 0,79. Am doua cazuri:

    Cazul 1:

    SELECT * FROM tabela_mea WHERE coloana_x = 1

    In cazul asta la index seek imi da estimated number of rows 1,2 ceea ce consider eu ca e ok.

    Cazul 2:

    DECLARE @val_x int

    SET @val_x = 1

    SELECT * FROM tabela_mea WHERE coloana_x = @val_x

    Aici la index seek imi da 10,75 estimated rows.

    Acum stiu ca al doilea caz e un singur batch si nu poate sa vada valoarea parametrului si imi da o valoare generala. Dar totusi de unde valoarea asta de 10,75. Eu credeam ca se uita la selectvitatea indexului (care e 1,2).

    Is deschis la orice varianta / explicatie. Smile

    Multumesc.

    Filed under:
  •  01-11-2008, 3:37 PM 3754 in reply to 3753

    Re: Estimated number of rows

    Statisticile sunt folosite.

    Selectivitatea indexului nu este 1,2 - este 1,2 pentru coloana_x=1 insa poate fi 0.01 pentru coloana_x = 3.

    Selectivitate = The fraction of rows from the input set of the predicate that satisfy the predicate.

    http://www.microsoft.com/technet/prodtechnol/sql/2005/qrystats.mspx


    Cristian Andrei Lefter, SQL Server MVP
    MCT, MCSA, MCDBA, MCAD, MCSD .NET,
    MCTS, MCITP - Database Administrator SQL Server 2005
    http://sqlserver.ro
  •  01-11-2008, 6:20 PM 3755 in reply to 3754

    Re: Estimated number of rows

    Am citit articolul si am vazut ca atunci cand valoarea parametrului e cunoscuta se foloseste de histograma ca sa dea estimated number of rows. Dar cand nu e cunoscuta valoarea (cum e cazul acestui batch), iata ce face:

    Even when local variables are used in a query, an estimate that is better than a guess is used in the case of equality predicates. Selectivity for conditions of the form "@local_variable = column_name" is estimated using the average value frequency from the histogram for column_name. So, for example, if the column column_name contains all unique values, then a selectivity estimate of 1/(number of unique values in column) will be used, which is accurate.

    Cred ca asta ma lamureste, multumesc.

  •  01-12-2008, 9:11 AM 3758 in reply to 3753

    Re: Estimated number of rows

    În cazul în care coloana este IDENTITY îţi sugerez să faci indexul respectiv cu clauza UNIQUE. Astfel, la acest gen de interogări, SQL Server ar trebui să estimeze totdeauna (corect) că numărul de rânduri returnate va fi maxim 1.

    Răzvan

  •  01-12-2008, 1:32 PM 3759 in reply to 3758

    Re: Estimated number of rows

    Sunt doua coloane diferite aparent in acest caz.
    Cristian Andrei Lefter, SQL Server MVP
    MCT, MCSA, MCDBA, MCAD, MCSD .NET,
    MCTS, MCITP - Database Administrator SQL Server 2005
    http://sqlserver.ro
  •  01-12-2008, 4:01 PM 3761 in reply to 3759

    Re: Estimated number of rows

    Într-adevăr. Am recitit acum mesajul iniţial şi am văzut că am înţeles greşit problema.

    Răzvan
  •  01-13-2008, 7:45 PM 3762 in reply to 3753

    Re: Estimated number of rows

    liviu.costea:

    Am o tabela (tabela_mea) cu peste 2 mil inregistrari si care are un index clustered (pe o coloana identity). Mai are un index pe o coloana (coloana_x), iar densitatea e de 0,79. Am doua cazuri:

    Cazul 1:

    SELECT * FROM tabela_mea WHERE coloana_x = 1

    In cazul asta la index seek imi da estimated number of rows 1,2 ceea ce consider eu ca e ok.

    Cazul 2:

    DECLARE @val_x int

    SET @val_x = 1

    SELECT * FROM tabela_mea WHERE coloana_x = @val_x

    Aici la index seek imi da 10,75 estimated rows.

    Acum stiu ca al doilea caz e un singur batch si nu poate sa vada valoarea parametrului si imi da o valoare generala. Dar totusi de unde valoarea asta de 10,75. Eu credeam ca se uita la selectvitatea indexului (care e 1,2).

    Is deschis la orice varianta / explicatie. Smile

    Multumesc.


    Ca fapt divers, dacă doreşti ca SQL Server să utilizeze în al doilea caz acelaşi plan de execuţie pentru interogarea SELECT ... WHERE coloana_x ... ca şi cel din primul caz (este foarte probabil ca planurile de execuţie în cele două cazuri să fie diferite) o soluţie simplă presupune utilizarea - începând din SQL Server 2005 - a clauzei OPTION OPTIMIZE FOR astfel:
    1
    2
    3
    4

    SELECT * 
    FROM tabela_mea
    WHERE coloana_x = @val_x
    OPTION (OPTIMIZE FOR(@val_x = 1))
    Deşi variabila @val_x poate lua diverse valori, planul de execuţie utilizat va fi cel optimizat pentru @val_x = 1.

    BOL URL: ms-help://MS.SQLCC.v9/MS.SQLSVR.v9.en/tsqlref9/html/66fb1520-dcdf-4aab-9ff1-7de8f79e5b2d.htm
    BOL URL: ms-help://MS.SQLCC.v9/MS.SQLSVR.v9.en/udb9/html/bfc97632-c14c-4768-9dc5-a9c512f6b2bd.htm

View as RSS news feed in XML
Powered by Community Server (Commercial Edition), by Telligent Systems