Якщо тупик подій обміну паралелізмом не спричиняє жертв, це проблема?


10

У нашому виробничому середовищі ми бачимо багато подібних тупіків паралельних внутрішніх запитів (SQL Server 2012 SP2 - так ... я знаю ...), однак, дивлячись на XML тупикового кута, який був зафіксований за допомогою розширених подій, список жертв порожній.

<victim-list />

Очевидно, що тупиковий замок знаходиться між 4 потоками, дві з WaitType="e_waitPipeNewRow"та двома з WaitType="e_waitPipeGetRow".

 <resource-list>
  <exchangeEvent id="Pipe13904cb620" WaitType="e_waitPipeNewRow" nodeId="19">
   <owner-list>
    <owner id="process4649868" />
   </owner-list>
   <waiter-list>
    <waiter id="process40eb498" />
   </waiter-list>
  </exchangeEvent>
  <exchangeEvent id="Pipe30670d480" WaitType="e_waitPipeNewRow" nodeId="21">
   <owner-list>
    <owner id="process368ecf8" />
   </owner-list>
   <waiter-list>
    <waiter id="process46a0cf8" />
   </waiter-list>
  </exchangeEvent>
  <exchangeEvent id="Pipe13904cb4e0" WaitType="e_waitPipeGetRow" nodeId="19">
   <owner-list>
    <owner id="process40eb498" />
   </owner-list>
   <waiter-list>
    <waiter id="process368ecf8" />
   </waiter-list>
  </exchangeEvent>
  <exchangeEvent id="Pipe4a106e060" WaitType="e_waitPipeGetRow" nodeId="21">
   <owner-list>
    <owner id="process46a0cf8" />
   </owner-list>
   <waiter-list>
    <waiter id="process4649868" />
   </waiter-list>
  </exchangeEvent>
 </resource-list>

Тому:

  1. Список жертв порожній
  2. Додаток, що виконує запит, не помиляється і завершує запит
  3. Наскільки ми бачимо, немає жодної очевидної проблеми, окрім того, що графік захоплений

Тому це щось, що турбує, крім шуму?

Редагувати: Завдяки відповіді Павла я бачу, де проблема, ймовірно, виникає, і, здається, вирішується сама при розливі tempdb. введіть тут опис зображення

Відповіді:


11

Я не був би здивований, якщо так виглядає графік тупикової ситуації, коли внутрішньозапитний паралельний тупик вирішується обмінним розливом (тому жертви, крім продуктивності, немає).

Ви можете підтвердити цю теорію, зафіксувавши обмінні розсипи та порівнявши їх (або ні) до тупикової ситуації.

Написання обмінних буферів до tempdb для вирішення тупикової ситуації не є ідеальним. Потрібно усунути послідовності операцій із збереження замовлення в плані виконання (наприклад, біржі, що зберігають замовлення, що подають паралельне з'єднання об'єднання). Якщо це не спричиняє помітної проблеми з роботою, і вам доведеться турбуватися про інші речі.

Нецікаво, чи може ця проблема посилюватися високою фрагментацією / застарілою статистикою?

Фрагментація, ні. Застаріла статистика: ні в якому конкретному сенсі я не можу придумати, ні. Звичайно, нерепрезентативна статистика - це рідко гарна річ.

Принциповим питанням є те, що паралелізм працює найкраще, коли між потоками існує якомога менше залежностей; збережене впорядкування вводить досить неприємні залежності. Речі можуть легко придушитись, і єдиний спосіб очистити лоджію - це розсипати купу рядів, що утримуються на обмінах до tempdb .


-1

Щоб відрізнити ці некритичні, «саморозв’язування за допомогою розливу» тупиків від важливіших тупиків, до структури Xdl можна застосувати деякі пошукові семантики.

Приклад Вихід

Наступний SP не вийде з поля, оскільки це залежить від ufn_ExtractSubstringsByPattern (), проте цей метод можна замінити чимось, що безпосередньо повертає окремий рахунок.

ALTER view [Common].[DeadLockRecentHistoryView]
as
/*---------------------------------------------------------------------------------------------------------------------
    Purpose:  List history of recent deadlock events

    Warning:  The XML processing may hit a recursion limit (100), suggest using "option (maxrecursion 10000)".

    Xdl File:
        The SSMS deadlock file format .XDL format (xml) has changed with later versions of SQL Server.  This version tested with 2012.

    Ring Buffer issues:
        https://connect.microsoft.com/SQLServer/feedback/details/754115/xevents-system-health-does-not-catch-all-deadlocks
        https://www.sqlskills.com/blogs/jonathan/why-i-hate-the-ring_buffer-target-in-extended-events/

    Links:
        http://www.sqlskills.com/blogs/jonathan/multi-victim-deadlocks/
        https://www.sqlskills.com/blogs/jonathan/graphically-viewing-extended-events-deadlock-graphs/
        http://www.mssqltips.com/sqlservertip/1234/capturing-sql-server-deadlock-information-in-xml-format/
        http://blogs.msdn.com/b/sqldatabasetalk/archive/2013/05/01/tracking-down-deadlocks-in-sql-database.aspx
        http://dba.stackexchange.com/questions/10644/deadlock-error-isnt-returning-the-deadlock-sql/10646#10646        

    Modified    By           Description
    ----------  -----------  ------------------------------------------------------------------------------------------
    2014.10.29  crokusek     From Internet, http://stackoverflow.com/questions/19817951
    2015.05.05  crokusek     Improve so that the output is consumable by SSMS 2012 as "Open .xdl file"                             
    2015.05.22  crokusek     Remove special character for the cast to Xml (like '&')
    2017.08.03  crokusek     Abandon ring-buffer approach and use event log files.  Filter out internal deadlocks.
    2018.07.16  crokusek     Added field(s) like ProbablyHandledBySpill to help identify non-critical deadlocks.
  ---------------------------------------------------------------------------------------------------------------------*/
with XmlDeadlockReports as
(
  select convert(xml, event_data) as EventData         
    from sys.fn_xe_file_target_read_file(N'system_health*.xel', NULL, NULL, NULL)      
   where substring(event_data, 1, 50) like '%"xml_deadlock_report"%'       
)
select top 10000
       EventData.value('(event/@timestamp)[1]', 'datetime2(7)') as CreatedUtc,
       --(select TimePst from Common.ufn_ConvertUtcToPst(EventData.value('(event/@timestamp)[1]', 'datetime2(7)'))) as CreatedPst,
       DistinctSpidCount,       
       HasExchangeEvent,
       IsVictimless,                  
       --
       -- If the deadlock contains Exchange Events and lists no victims, it probably occurred
       -- during execution of a single query that contained parallellism but got stuck due to 
       -- ordering issues.   /dba/197779
       -- 
       -- These will not raise an exception to the caller and will complete by spilling to tempdb
       -- however they may run much slower than they would without the spill(s).
       --
       convert(bit, iif(DistinctSpidCount = 1 and HasExchangeEvent = 1 and IsVictimless = 1, 1, 0)) as ProbablyHandledBySpill,
       len(et.XdlFileText) as LenXdlFile,
       eddl.XdlFile as XdlFile
  from XmlDeadlockReports
 cross apply 
     ( 
       select eventData.query('event/data/value/deadlock') as XdlFile 
     ) eddl
 cross apply 
     ( 
        select convert(nvarchar(max), eddl.XdlFile) as XdlFileText 
     ) as et
 cross apply 
     (
       select count(distinct Match) as DistinctSpidCount
         from common.ufn_ExtractSubstringsByPattern(et.XdlFileText, 'spid="%%"')
     ) spids
 cross apply
     (
       select convert(bit, iif(charindex('<exchangeEvent', et.XdlFileText) > 0, 1, 0)) as HasExchangeEvent,
              --
              convert(bit, iif(     charindex('<victim-list>', et.XdlFileText) = 0
                                and charindex('<victim-list/>', et.XdlFileText) > 0, 1, 0)) as IsVictimless
     ) as flags        
 order by CreatedUtc desc
GO
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.