Миф: как IBM победил БЭСМ

zVlad
Уже с Приветом
Posts: 15420
Joined: 30 Apr 2003 16:43
Has thanked: 1 time

Re: Миф: как IBM победил БЭСМ

Post by zVlad »

Dmitry67 wrote:Извините, Влад, я уже давно не видел отчетов, где пытались все уместить в 80 позиций )

Но к делу. 666 чтений в секунду? А сколько записей?
Дима, там много чисел и 666 не просматривается среди них. Называйте строку колонку или копи/пасте всю строку. Вот кстати свежие данные:

Code: Select all

>                          THREAD HISTORY BY REPORT INTERVAL
 HARP
+ Report Interval:   5 mins                     Start:   10/27 12:45:00.000000
+ Report Filtered:       NO                       End:   10/27 13:44:59.999999
+
+                                  Dlk/  In-DB2  In-DB2  In-DB2           GetP/
+   Time  Thrds Commit Abort DML   TOut  Elap Tm CPU Tm  Wait Tm  Getpage RIO
+   ----- ----- ------ ----- ----- ----  ------- ------- -------  ------- -----
: _ 13:40  5328   5428   207 1771K    4   1434.6  393.24   831.8   19678K  .1K
: _ 13:35  4817   4913   175 1570K    1   1570.0  389.64   985.0   19856K 88.7
: _ 13:30  4953   5070   165 1723K    0   2150.3  429.35  1480.4   20923K 74.3
: _ 13:25  4848   4892   209 1927K    1   2095.0  496.10  1229.3   24956K  .1K
: _ 13:20  5303   5322   238 2025K    2   2253.7  494.91  1417.2   24429K  .1K
: _ 13:15  5586   5554   292 1981K    2   2456.2  482.28  1479.9   23714K  .1K
: _ 13:10  5284   5337   202 1930K    0   2386.6  496.02  1392.9   25014K  .1K
: _ 13:05  4966   5021   193 1711K    2   2258.6  454.76  1503.3   23304K  .1K
: _ 13:00  4393   4437   203 1757K    0   2519.0  482.01  1464.2   24522K  .2K
: _ 12:55  4110   4125   184 1613K    0   2071.0  470.16  1366.0   22497K 64.6
: _ 12:50  4144   4204   175 1893K    1   2123.0  524.09  1273.4   27779K  .1K
: _ 12:45  3611   3676   181 1581K    0   1505.8  387.98   903.2   20484K  .1K
zVlad
Уже с Приветом
Posts: 15420
Joined: 30 Apr 2003 16:43
Has thanked: 1 time

Re: Миф: как IBM победил БЭСМ

Post by zVlad »

Для тех кому кажется что в 80 колонках не возможно расместить информацию вот пример детального отчета об одном Buffer Pool: BP1 за трех секундый интервал и с последнего recycle DB2 (Saturday morning):

Code: Select all

>                            BUFFER POOL DETAIL

 BP    1
+ Collection Interval:  REALTIME                         Start:  10/27 14:05:58
+ Report Interval:       3 sec                             End:  10/27 14:06:01
+
+ Virtual Buffer Pool Size=    300000
+ VPOOL Buffers Allocated =    300000
+ VPOOL Buffers in Use    =      2482
+ VPOOL Buffers to be Del =         0
+ Use Count               =      2444
+ VP Sequential Thresh    =       80%
+ Deferred Write Thresh   =       30%    Vert Deferred Write Thresh  =      5%
+ VP Parallel Seq Thresh  =       50%    Sysplex Parallel Thresh     =      0%
+
+ Getpages per Sync I/O   =      9.40    Pages Written per Write I/O =    5.39
+ Prefetch per I/O        =     35.29    Pages Read per Prefetch     =     .93
+ Seq Prefetch per I/O    =      1.69    Pages Read per Seq Prefetch =   52.12
+ List Prefetch per I/O   =      2.03    Pages Read per List Prefetch=     .95
+ Dyn Prefetch per I/O    =     65.73    Pages Read per Dyn Prefetch =     .37
+ Max Concur Prefetch     =         5    Workfile Maximum            =       0
+ BP Hit % - Random       =     86.7%    Virtual Page Steal Method   = LRU
+ BP Hit % - Sequential   =     66.6%
+
+                                    TOTAL  INTERVAL  /SECOND  /THREAD  /COMMIT
+                                 QUANTITY  QUANTITY  (    3)  (   47)  (   54)
+                                 --------  --------  -------  -------  -------
+ Getpage Requests                3552036K    117093   39.03K  2491.34  2168.38
+ Getpage Requests - Sequential    696062K     29982  9994.00   637.91   555.22
+ Getpage Requests - Random       2855974K     87111   29.04K  1853.42  1613.16
+ Getpage Failed - VPOOL Full            0         0      .00      .00      .00
+ Getpage Failed - Cond Request          0         0      .00      .00      .00
+ Getpage Failed - Cond SeqReq           0         0      .00      .00      .00
+
+ Sync Read I/O Operations         377991K       159    53.00     3.38     2.94
+ Sync Read I/Os - Sequential       273515         2      .66      .04      .03
+ Sync Read I/Os - Random          377717K       157    52.33     3.34     2.90
+ Page-in Required for Read I/O     299990         0      .00      .00      .00
+ Pages Read via Seq Prefetch      139026K         0      .00      .00      .00
+ Seq Prefetch I/O Operations      1575688         0      .00      .00      .00
+ Sequential Prefetch Requests     2667218         0      .00      .00      .00
+ Pages Read via List Prefetch     3433078         5     1.66      .10      .09
+ List Prefetch I/O Operations     1785169         2      .66      .04      .03
+ List Prefetch Requests           3620820        74    24.66     1.57     1.37
+ Pages Read via Dyn Prefetch     89586970        53    17.66     1.12      .98
+ Dyn Prefetch I/O Operations      3690037         2      .66      .04      .03
+ Dyn Prefetch Requests            242539K      9302  3100.66   197.91   172.25
+ Prefetch Failed - No Buffer            0         0      .00      .00      .00
+ Prefetch Failed - No Engine            0         0      .00      .00      .00
+
+ Parallel Group Requests                3         0      .00      .00      .00
+ Prefetch I/O Streams Reduced           0         0      .00      .00      .00
+ Parallelism Downgraded                 0         0      .00      .00      .00
+ Prefetch Quan Reduced to 1/2           0         0      .00      .00      .00
+ Prefetch Quan Reduced to 1/4           0         0      .00      .00      .00
+
+ Pages Updated                   19699508       625   208.33    13.29    11.57
+ Pages Written                    5532237       139    46.33     2.95     2.57
+ Page-in Required for Write I/O         0         0      .00      .00      .00
+ Write I/O Operations              969967        74    24.66     1.57     1.37
+ Immediate (Sync) Writes            56740         0      .00      .00      .00
+ Write Engine Not Available             0         0      .00      .00      .00
+
+ Vert Defer Wrt Thresh Reached       1338         0      .00      .00      .00
+ Deferred Write Thresh Reached        420         0      .00      .00      .00
+ Data Manager Thresh Reached            0         0      .00      .00      .00
+
+ Successful VPOOL Expand/Contr          0         0      .00      .00      .00
+ VPOOL or HPOOL Expand Failed           0         0      .00      .00      .00
+
+ Successful Dataset Opens            2461         0      .00      .00      .00
+ DFHSM Recall                           0         0      .00      .00      .00
+ DFHSM Recall Timeouts                  0         0      .00      .00      .00
+
+ Sort Merge Passes                      0         0      .00      .00      .00
+ Sort/Merge Workfile Requests           0         0      .00      .00      .00
+ Sort/Merge Workfile Req Denied         0         0      .00      .00      .00
+ Sort Merge Pass - Buff Short           0         0      .00      .00      .00
+ Workfile Prefetch Disabled             0         0      .00      .00      .00
+ Workfile Create Failed-No Buff         0         0      .00      .00      .00
+ Destructive Read Requests              0         0      .00      .00      .00
+ Destructive Read Page Dequeue          0         0      .00      .00      .00
Вот суммары обo всех Buffer Polls (примерно 2 секунды интервал):

Code: Select all

+  Current Number Open Datasets         =    6928
+  High Water Mark Open Datasets        =    6928
+  Maximum Number Open Datasets Allowed =   10000
+  Open Dataset Count In Active Pools   =    6940
+
+ *
+ Pool   VP              Pages   Pages   Getp      Read      Prefetch  Write
+ ID     Size            Alloc   In Use  Rate      I/O Rate  Req Rate  I/O Rate
+ ------ ------          ------  ------  --------  --------  --------  --------
+ BP0      5000            5000     359     389.33       .00      4.33       .00
+ BP1    300000          300000    6337   85538.00    408.33   6980.66     29.33
+ BP2    150000          150000    2973    6264.00    523.33    125.00     10.00
+ BP3      2000            2000      11      36.33       .00      2.66       .00
+ BP4      2000            2000       0       1.00       .00       .00       .00
+ BP5      8000            8000     268      96.66       .00       .00       .00
+ BP7     50000           50000   25850      87.00       .00       .00       .00
+ BP11   200000          200000     186     374.66       .00     19.66       .00
+ BP13    50000           50000      20       5.33      3.33       .00       .00
+ BP14     5000            5000      44        .00       .00       .00       .00
+ BP15    10000           10000      21      18.33       .33       .00       .00
+ BP32K   10000           10000     156      18.33       .00      2.00       .00
+ BP32K7  50000           50000   14755       8.00       .00       .00       .00
+ BP8K0    1000            1000      14     529.33    182.33     39.33       .00
+ BP16K0    500             500       0      46.33       .00       .00       .00
Last edited by zVlad on 27 Oct 2014 19:17, edited 2 times in total.
User avatar
Dmitry67
Уже с Приветом
Posts: 28294
Joined: 29 Aug 2000 09:01
Location: SPB --> Gloucester, MA, US --> SPB --> Paris

Re: Миф: как IBM победил БЭСМ

Post by Dmitry67 »

Господи, как же вам приходится разжевывать
zVlad wrote:получится примерно 200 000 реальных 4К pages прочитанных за интервал.
Это ваши слова?
200 000 pages за 5 минут = 200000/5/60 = 666.6666666 в секунду
Зарегистрированный нацпредатель, удостоверение N 19719876044787 от 22.09.2014
StrangerR
Уже с Приветом
Posts: 38016
Joined: 14 Dec 2006 20:13
Location: USA

Re: Миф: как IBM победил БЭСМ

Post by StrangerR »

Dmitry67 wrote:А, понятно, то есть это вам показывает очень хорошее cache hits ratio.
Действительно хорошее

Тем не менее следует заметить что 97K/5 минут это не просто мало... Это НИЧТО
Поэтому у вас и нет проблем с репликацией при таком ничтожном трафике
Проблемы с репликациями в реальном времени выглядят не так. Я их проходил несколько раз.

Обычно - сначала ВСЕ работает. Прекрасно работает.

неделю. Две. Все успокаиваются и довольны.

Потом БАЦ. В выходные все отстало на 3 дня. Почему, отчего... аллах ведает.. выясняется что вот в выходной PS-ы загрузили 100 тыс полисей из батч файла который теперь раз в месяц будет приходить по sftp. И... и усе, репликация сдохла... Нужно заново ресинхронизовать потому что прокачать эффект этого импорта в базу данных (учитывая кучу созданных временных файлов и таблиц) система не смогла.

И так пару раз. Аналогично, когда на оракле игрались с Logical Standby. Работает.. работает.. работает.. бац и сдох... импорт случился.
StrangerR
Уже с Приветом
Posts: 38016
Joined: 14 Dec 2006 20:13
Location: USA

Re: Миф: как IBM победил БЭСМ

Post by StrangerR »

20 мегабайт за 5 минут - 4 мегабайта в минуту - это ничтожно мало. Я гляжу на одну из баз - средний темп чтения 4 MB/sec, максимальный в пиках 200MB/sec, записи 5 MB/sec. При этом что любопытно, на стендбае средний темп записи 800KB/sec, то есть если я буду диски реплицировать то мне нужно будет 50Mbit полосы до компрессии а если я буду логи пересылать то нужно будет только 8Mbit. (я пересылаю скомпрессированные лог бэкапы так что даже еще меньше использую).

Так это по нынешним меркам небольшое приложение. Размер базы всего то 800GB. Всего то 200 транзакций в секунду прямо сейчас, 1500 тыс было в пике за последний час. За 5 минут будет 200 x 60 x 5 = 200 x 300 = 60,000. Приложение при том не фига не транзакционное. Там 2 сервера базы данных каждый стоимостью на сегодня примерно $5K если не меньше (никак не соберемся поменять на что нибудь поновее).

(Да, кэша там 50 GB, на том сервере базы данных - на всей Vmware 96, базе отвели 80, она на кэш отвела 50).

(ну хорошо, у Влада 600 x 4K = 2400K/sec = 2.4 MB/sec средний темп чтения. При кэше в 4 гига. У меня на довольно средненькой базе на весьма древних серверах DELL R710 / Vmware 4.1 / MS SQL 2008 - средний темп чтения прямо сейчас 5 MB/sec. А в пиковое время при месячной обработке он около 100 MB/sec. И это без всяких там мейнфреймов и при буферах в 10 раз больше.)
zVlad
Уже с Приветом
Posts: 15420
Joined: 30 Apr 2003 16:43
Has thanked: 1 time

Re: Миф: как IBM победил БЭСМ

Post by zVlad »

Dmitry67 wrote:Господи, как же вам приходится разжевывать
zVlad wrote:получится примерно 200 000 реальных 4К pages прочитанных за интервал.
Это ваши слова?
200 000 pages за 5 минут = 200000/5/60 = 666.6666666 в секунду
Это Вам Дима приходится все разжовывать. Я написал все что нужно чтобы понять не задавая вопросы, тем более некорректно.

Вы спрашиваете сколько записей. Тут наверху написано - 4K pages, поскольку это страницы многих разных таблиц вопрос о количестве записей звучит совершенно неуместно и глупо.

Опять мне пришлось Вам разжовывать, Дима.

Дима, скажите честно: чего Вы уцепились за этот последний столбец с, тем более, относительной величиной в нем ни о чем не говорящей. Вот мы сегодня решили увеличит Buffer Pools раза в два. После этого величина в этом столбце раза в два уменьшится, а если бы мы не увеличили а наоборот уменьшили размер BP's то та величина бы увеличилась. И что из этого?
iDesperado
Уже с Приветом
Posts: 1349
Joined: 28 Nov 2008 17:50

Re: Миф: как IBM победил БЭСМ

Post by iDesperado »

zVlad wrote:

Code: Select all

+  Current Number Open Datasets         =    6928
+  High Water Mark Open Datasets        =    6928
+  Maximum Number Open Datasets Allowed =   10000
+  Open Dataset Count In Active Pools   =    6940
+
+ *
+ Pool   VP              Pages   Pages   Getp      Read      Prefetch  Write
+ ID     Size            Alloc   In Use  Rate      I/O Rate  Req Rate  I/O Rate
+ ------ ------          ------  ------  --------  --------  --------  --------
+ BP0      5000            5000     359     389.33       .00      4.33       .00
+ BP1    300000          300000    6337   85538.00    408.33   6980.66     29.33
+ BP2    150000          150000    2973    6264.00    523.33    125.00     10.00
+ BP3      2000            2000      11      36.33       .00      2.66       .00
+ BP4      2000            2000       0       1.00       .00       .00       .00
+ BP5      8000            8000     268      96.66       .00       .00       .00
+ BP7     50000           50000   25850      87.00       .00       .00       .00
+ BP11   200000          200000     186     374.66       .00     19.66       .00
+ BP13    50000           50000      20       5.33      3.33       .00       .00
+ BP14     5000            5000      44        .00       .00       .00       .00
+ BP15    10000           10000      21      18.33       .33       .00       .00
+ BP32K   10000           10000     156      18.33       .00      2.00       .00
+ BP32K7  50000           50000   14755       8.00       .00       .00       .00
+ BP8K0    1000            1000      14     529.33    182.33     39.33       .00
+ BP16K0    500             500       0      46.33       .00       .00       .00
судя по документации последняя колонка это "The number of Write I/Os per second.", это какие-то read only базы ? почему писанины в базы не видно ?
StrangerR
Уже с Приветом
Posts: 38016
Joined: 14 Dec 2006 20:13
Location: USA

Re: Миф: как IBM победил БЭСМ

Post by StrangerR »

Да какая разница? Видно что по нагрузке все это примерно эквивалентно половине или четверти современного Intel сервера и базы данных на нем. Если не меньше. При цене оного около 10 тыс и цене мейнфрейма около 5 миллионов. ВОт и ответ, почему МФ-ы вымирают.

(Причем я беру только 2U серверы, с 2 сокетами, как наиболее эффективные по Price / Performance. А можно и 4 процессорный поставить если уж прижмет. Тогда МФ вообще ничего светить не будет, в принципе).
zVlad
Уже с Приветом
Posts: 15420
Joined: 30 Apr 2003 16:43
Has thanked: 1 time

Re: Миф: как IBM победил БЭСМ

Post by zVlad »

StrangerR wrote:....
Потом БАЦ. В выходные все отстало на 3 дня. Почему, отчего... аллах ведает.. выясняется что вот в выходной PS-ы загрузили 100 тыс полисей из батч файла который теперь раз в месяц будет приходить по sftp. И... и усе, репликация сдохла... Нужно заново ресинхронизовать потому что прокачать эффект этого импорта в базу данных (учитывая кучу созданных временных файлов и таблиц) система не смогла.

И так пару раз. Аналогично, когда на оракле игрались с Logical Standby. Работает.. работает.. работает.. бац и сдох... импорт случился.
Сегодня DB2 DBA показывала мне как создается новый subscription из DB2 v MS SQL. На примере ее тестовой таблички с 6+ млн. записей. Минут 5 шел initial refresh.

P.S. У нас в дата центре есть монитор replication latency. Если больше 15 минут latency, то операторы начинают вытаскивать аналистов. Это уже alert.
zVlad
Уже с Приветом
Posts: 15420
Joined: 30 Apr 2003 16:43
Has thanked: 1 time

Re: Миф: как IBM победил БЭСМ

Post by zVlad »

iDesperado wrote:
zVlad wrote:

Code: Select all

+  Current Number Open Datasets         =    6928
+  High Water Mark Open Datasets        =    6928
+  Maximum Number Open Datasets Allowed =   10000
+  Open Dataset Count In Active Pools   =    6940
+
+ *
+ Pool   VP              Pages   Pages   Getp      Read      Prefetch  Write
+ ID     Size            Alloc   In Use  Rate      I/O Rate  Req Rate  I/O Rate
+ ------ ------          ------  ------  --------  --------  --------  --------
+ BP0      5000            5000     359     389.33       .00      4.33       .00
+ BP1    300000          300000    6337   85538.00    408.33   6980.66     29.33
+ BP2    150000          150000    2973    6264.00    523.33    125.00     10.00
.......
судя по документации последняя колонка это "The number of Write I/Os per second.", это какие-то read only базы ? почему писанины в базы не видно ?
Дело в том что эта панелька показыет данные между нажатиями на "Enter", я понажинал довольно часто вот и получись такие маленькие числа. Можно и все нули увидеть если стучать по "Enter" непрерывно. А в данном случае это было пару секунд интервал.

Я приятно удивлен что Вы читаете доки на Omegamon. Я мог бы и сам ответить на любой вопрос.
zVlad
Уже с Приветом
Posts: 15420
Joined: 30 Apr 2003 16:43
Has thanked: 1 time

Re: Миф: как IBM победил БЭСМ

Post by zVlad »

StrangerR wrote:20 мегабайт за 5 минут - 4 мегабайта в минуту - это ничтожно мало. ....
20 000 000 GetPages, которые Вы видимо приняли за 20 MB это на самом деле 20 000 000 * 4K = 80 GB. Ето столько за пять минут было запрошено данных выполнявшимися за 5 минут запросами. Данных в виде страниц БД. Не все эти страницы были взяты с дисков, примерно только каждая сотая судя по величинам GetPages/RIO, многие из них уже находились в памяти, в Buffer Pools.

Сама же БД несколько TB. Небольшая.
zVlad
Уже с Приветом
Posts: 15420
Joined: 30 Apr 2003 16:43
Has thanked: 1 time

Re: Миф: как IBM победил БЭСМ

Post by zVlad »

StrangerR wrote:....

(ну хорошо, у Влада 600 x 4K = 2400K/sec = 2.4 MB/sec средний темп чтения. При кэше в 4 гига. У меня на довольно средненькой базе на весьма древних серверах DELL R710 / Vmware 4.1 / MS SQL 2008 - средний темп чтения прямо сейчас 5 MB/sec. А в пиковое время при месячной обработке он около 100 MB/sec. И это без всяких там мейнфреймов и при буферах в 10 раз больше.)
Данные, которые я показал взяты с бухты-барахты. Обстановка на самом деле все время меняется и числа могут запросто поползти вверх. Я не подбирал интервал специально чтобы что-либо доказывать. Ночью у нас вообще тишина.
У меня нет никакго сомнения что наш МФ недогружен, но попытки убедить добавить workload, например s Intel серверов успехом не увенчались. Не идут на это наши капитаны (песчанных, блин, карьеров).

Ввод-вывод ДБ2, который мы тут рассмативаем внимательно радуясь что он не велик, это не весь ввод-вывод на этом МФ. Там еще, не забывайте, стоят все тестовые БД и Апп сервера, и там тоже есть ввод-вывод. Тем не менее я повторюсь работу можно добавлять и добавлять.

Вот проект переноса хыдротермал статионс завершится к концу года и к нам на МФ придет шорклоад с нескольких северов на Интел и/или Ыникс, а МФ при этом останется таким как есть. 3500 новых юзеров хотят добавить к имеющимся 10000.
User avatar
Dmitry67
Уже с Приветом
Posts: 28294
Joined: 29 Aug 2000 09:01
Location: SPB --> Gloucester, MA, US --> SPB --> Paris

Re: Миф: как IBM победил БЭСМ

Post by Dmitry67 »

Разумеется то что из кеша за IO не считается )
80Gb/100 = 800Mb за пять минут ("примерно только каждая сотая" (c) zVlad)
2.6Mb/sec
Зарегистрированный нацпредатель, удостоверение N 19719876044787 от 22.09.2014
iDesperado
Уже с Приветом
Posts: 1349
Joined: 28 Nov 2008 17:50

Re: Миф: как IBM победил БЭСМ

Post by iDesperado »

zVlad wrote: Данные, которые я показал взяты с бухты-барахты. Обстановка на самом деле все время меняется и числа могут запросто поползти вверх. Я не подбирал интервал специально чтобы что-либо доказывать. Ночью у нас вообще тишина.
ну давайте вы подберете момент с хоть какой-то нагрузкой. то, что вы показали не нагрузка в мире PC. если проссумировать ваши BPs выйдет всего 843500
страниц по 4к, т.е. 3.3Gb. при столь крошечных даже по меркам моего ноутбука буферах у вас не самое плохое попадание в них, как минимум у BP1
BP Hit % - Random = 86.7%
BP Hit % - Sequential = 66.6%

т.е. по этим данным выглядит, что у вас приложение работает с крошечным объемом активных данных 66-86% которых уместились в 3.3Gb, а остальные терабайты лежат никому ненужным архивом.
StrangerR
Уже с Приветом
Posts: 38016
Joined: 14 Dec 2006 20:13
Location: USA

Re: Миф: как IBM победил БЭСМ

Post by StrangerR »

Да нет, ну чего там подбирать... Вполне возможно он и найдет момент когда там высокий IO. Но ... это ОДНА железка и хоть ты тресни хоть лопни но с небольшими по нынешним меркам ресурсами. Со всеми такими проектами случилось одно и то же - пришли _менее качественные но в 100 раз дешевле_ решения и убили _красивую, цельную, бранд нейм операционку_. С ценами на ресурсы МФ уже все ясно - разница раз так в 20 с современными. Поэтому дальше ДБ 2 может сколько хочешь и что хочешь оптимизировать, но 20 она никакими силами не обеспечит. Берется 4 современных интел сервера, с SSD и SAS дисками, и кроют всю эту МФ как бык стадо коров...

(А если там еще и инфибанд окажется... то вообще. Можно еще бодать МФ с Оракле Екзадата и DB машинами но и то навряд ли, цена памяти и процессоров то у Оракла такая же как и у любого интела, вся стоимость там в лицензиях...)

Чудес не бывает. $1500 за 1 гиг операционки... и все.. можно сушить сухари потому что у соседа за такие же деньги будет 128 гигов... И он наймет 10 быдлокодеров и они напишут 10 тыс строк быдлокода но из за 128 гигов этот быдлокод будет работать, и все в целом будет дешевле чем на МФ раз так в 20. И все... и сдулась МФ.
Last edited by StrangerR on 27 Oct 2014 23:41, edited 1 time in total.

Return to “Вопросы и новости IT”