Там все алгоритмы придуманы десятки лет назад. Если кто не заметил, то весь текущий хайп преимущественно вокруг работы с изображениями. Что касается использования, DS в банках, страховании и медицине, то там все эти алгоритмы являлись основой бизнесов с самого начала. Страхование, как бизнес, невозможно без понимания статистики, так как риск — это просто мат ожидание.
Проблема с применением всего этого зоопарка в бизнесе состоит в том, что требуется умение сформулировать проблему бизнеса в какой-либо канонической форме, которая может быть решена математически. Соль в том, что на рынке крошечный процент людей, кто способен это делать. И проблема эта остро стоит уже около трёх тысяч лет, со времени возникновения алгебры.
Посмотрите на ту же Yandex Data Factory — количество нанимаемых математиков не приводит к появлению новых решений. А в тех случаях когда приводит, например в задачах прогнозирования оттока клиентов, то выясняется, что в результате получено полностью бесполезное знание за достаточно большие деньги. Просто математика, как правило, не способна ответить на вопрос какие выводы нужно извлечь и как их удержать.
Прикольная история
-
- Уже с Приветом
- Posts: 345
- Joined: 27 Nov 2007 05:33
Re: Прикольная история
Я бы всё-таки ещё добавил NLP в этот список. В этой области очень большой прогресс в последние пару лет в связи с появлением трансформеров.tessob wrote: 31 Jan 2020 05:36 Там все алгоритмы придуманы десятки лет назад. Если кто не заметил, то весь текущий хайп преимущественно вокруг работы с изображениями.
-
- Уже с Приветом
- Posts: 34164
- Joined: 03 Dec 2000 10:01
- Location: Vladivostok->San Francisco->Los Angeles->San Francisco
Re: Прикольная история
На самом деле к примеру я тут вовлечен в одно решение довольно известное со времен видимо появление письменности (очевидно еще до алгебраическая эпохаtessob wrote: 31 Jan 2020 05:36 Проблема с применением всего этого зоопарка в бизнесе состоит в том, что требуется умение сформулировать проблему бизнеса в какой-либо канонической форме, которая может быть решена математически. Соль в том, что на рынке крошечный процент людей, кто способен это делать. И проблема эта остро стоит уже около трёх тысяч лет, со времени возникновения алгебры.
![Mr. Green :mrgreen:](./images/smilies/icon_mrgreen.gif)
Формулировка вполне так старозаветная и решается вполне так кондовым методом временных рядов по каждой позиции на складе + видимо еще что-то дополнительное, но пока не об этом. Собственно вот это решение
https://c3.ai/products/c3-predictive-maintenance/
Сейчас нашей конторе используют решение на базе SAP, но вроде как оно не оптимальное если вообще это можно назвать решением в контексте дискуссии.
Занятно наблюдать чем дело кончится
![Crazy :crazy:](./images/smilies/crazy.gif)
"A patriot must always be ready to defend his country against his government." Edward Abbey
-
- Уже с Приветом
- Posts: 549
- Joined: 07 Jan 2016 13:04
Re: Прикольная история
Sergunka, это наверное один из тех немногих случаев когда я могу предсказывать Вам будущее. Я просто работаю с SAP со времен мезозоя. И все то, о чем Вы написали, я уже когда-то делал. ))
Видимо, Вы не в курсе, но временные ряды в SAP есть уже лет 30 как. Модели вроде ARiMA/SARiMA там уже давно реализованы в компоненте MRP. Когда стало понятно, что это провал, SAP запилил отдельный продукт – APO-DP, где модель была расширена возможностью корректировать временной ряд в Excel и сбоку был прикручен IBM ILOG CPLEX. Когда стало понятно, что и это не полетит, то SAP запилил очередной продукт – IBP, который тоже, как выяснилось, летать не умеет.
Проблема с временными рядами в том, что это авторегрессионная модель, которая будет работать только при условии, что ваши данные имеют исключительно циклическую природу. Однако, в случае safety-stock, это не так... увы… даже если вы производите мороженое. Далее у вас есть сменяемость ассортимента, маркетинговые акции, rump-up в конце кварталов и куча всего еще, что вообще никак не укладывается в подобные модели. Короче говоря, меня терзают смутные сомненья, что точность вашей модели будет лучше чем “удручающая”.
Мне кажется, что ваши дата-сатанисты прикладывают математику не той стороной и не к тому месту. Просто, для рассчета safety-stock, ваша модель должна учитывать волатильность (дисперсию случайной величины), так как это именно то от чего сток и зависит. Соответственно тогда, при нулевой дисперсии, ваш сток будет равен мат ожиданию. При ненулевой садятся и пилят модель случайного процесса, дифференцируемого по времени, и формулируют задачу как “вероятность получить OOS (out of stock) для заданных параметров”. Просто воспроизвести временной ряд через вероятностную модель возможно, а наоборот не очень. Ну и вместо временного ряда гораздо веселее иметь какую-то функцию плотности, являющуюся частным случаем гамма-распределения.
Вопрос к Вам, раз уж Вы упомянули SAP – каким образом вы интегрируетесь и каков у вас RPM (requests per minute)?
-
- Уже с Приветом
- Posts: 34164
- Joined: 03 Dec 2000 10:01
- Location: Vladivostok->San Francisco->Los Angeles->San Francisco
Re: Прикольная история
Спасибо, за очень качественное заяснение в постановке задачи. Я что-то собственно такое и подразумевал в особенности в этой части "Просто воспроизвести временной ряд через вероятностную модель возможно, а наоборот не очень."tessob wrote: 01 Feb 2020 09:20Sergunka, это наверное один из тех немногих случаев когда я могу предсказывать Вам будущее. Я просто работаю с SAP со времен мезозоя. И все то, о чем Вы написали, я уже когда-то делал. ))
Видимо, Вы не в курсе, но временные ряды в SAP есть уже лет 30 как. Модели вроде ARiMA/SARiMA там уже давно реализованы в компоненте MRP. Когда стало понятно, что это провал, SAP запилил отдельный продукт – APO-DP, где модель была расширена возможностью корректировать временной ряд в Excel и сбоку был прикручен IBM ILOG CPLEX. Когда стало понятно, что и это не полетит, то SAP запилил очередной продукт – IBP, который тоже, как выяснилось, летать не умеет.
Проблема с временными рядами в том, что это авторегрессионная модель, которая будет работать только при условии, что ваши данные имеют исключительно циклическую природу. Однако, в случае safety-stock, это не так... увы… даже если вы производите мороженое. Далее у вас есть сменяемость ассортимента, маркетинговые акции, rump-up в конце кварталов и куча всего еще, что вообще никак не укладывается в подобные модели. Короче говоря, меня терзают смутные сомненья, что точность вашей модели будет лучше чем “удручающая”.
Мне кажется, что ваши дата-сатанисты прикладывают математику не той стороной и не к тому месту. Просто, для рассчета safety-stock, ваша модель должна учитывать волатильность (дисперсию случайной величины), так как это именно то от чего сток и зависит. Соответственно тогда, при нулевой дисперсии, ваш сток будет равен мат ожиданию. При ненулевой садятся и пилят модель случайного процесса, дифференцируемого по времени, и формулируют задачу как “вероятность получить OOS (out of stock) для заданных параметров”. Просто воспроизвести временной ряд через вероятностную модель возможно, а наоборот не очень. Ну и вместо временного ряда гораздо веселее иметь какую-то функцию плотности, являющуюся частным случаем гамма-распределения.
Вопрос к Вам, раз уж Вы упомянули SAP – каким образом вы интегрируетесь и каков у вас RPM (requests per minute)?
Моя задача в этом проекте была очень скромная приехать посмотреть на вменяемость команды
![sad & cry :sadcry:](./images/smilies/cry.gif)
![angry :angry:](./images/smilies/angry.gif)
![Mr. Green :mrgreen:](./images/smilies/icon_mrgreen.gif)
![love :love:](./images/smilies/flowers.gif)
Задача вцелом мне понравилась так как для крупных компаний навроде нашей она действительно должна давать экономию по safety-stock... очевидно, что перфоманс сильно просядет когда попытаются сопряч с САП-ом, но это задачи будущих лет типо
![Very Happy :D](./images/smilies/biggrin.gif)
![Radio :radio%:](./images/smilies/radio.gif)
"A patriot must always be ready to defend his country against his government." Edward Abbey
-
- Уже с Приветом
- Posts: 549
- Joined: 07 Jan 2016 13:04
Re: Прикольная история
Походу, все самое интересное у вас еще впереди... внизу. Я не просто так спросил. ))Sergunka wrote: 01 Feb 2020 19:41очевидно, что перфоманс сильно просядет когда попытаются сопряч с САП-ом, но это задачи будущих лет типокорп мыслит на пятилетку минимум (привет СССР
)
Дело в том, что SAP был написан в доинтернетную эпоху и интеграция – это просто писец какая проблема. Без шуток! Вот например партнерское решение Amazon, которое в хорошую погоду даст вам… возможность интеграции как таковую, но с RPM меньше единицы. Я не шучу. Посмотрите видео по моей ссылке, корзины S3 используются как продолжение идеи FTP серверов… чтоб было куда выгрузить CSV файлики.
Есть еще решение вендора – SAP Cloud Platform Integration, которое дает 5-6 RPM, стоит 1’100 баксов в месяц за каждый API-endpoint, и работает только в одну сторону (uni-directional). Документации на это нет в принципе, даже жаба доков нет и дешевых разработчиков на рынке тоже нет. Прикрутить это можно только к продуктивным серверам, так что про тестирование придется забыть – сразу в продакшен. И про VPN/HTTPS придется тоже забыть - криптография для лохов. В техническом плане там просто Apache Camel под капотом, но TCO (total cost of ownership)... в общем вы поймете, что FTP сервера с CSV файликами и 0.001 RPM – это не так уж и плохо.
Нормальная интеграция возможна тоже. У меня, например, свой собственный велосипед который дает по 8’000-10’000 RPM в каждую сторону на одном application server и я без проблем могу даже Kafka Streams поставить в середине. Только, чтобы это получить мне пришлось реверс-инженерить проприетарный TCP протокол и отлавливать баги на протяжении 15 лет. Зато сейчас для меня вопрос интеграции вообще не стоит и я могу развернуть обычный REST/RPC ко всем данным логистики в реальном времени дня за 3-4.
Короче, на каждое успешное скрещивание DS & SAP на сегодня приходится, пожалуй, несколько сотен историй, когда просто не удалось найти приемлемого способа интеграции и проекты банально рассыпались. То есть, даже если у вас и получится выдающаяся математическая модель, очень высока вероятность того, что проект в итоге провалится по технической причине.
![HBZ :pain1:](./images/smilies/pain25.gif)
-
- Уже с Приветом
- Posts: 34164
- Joined: 03 Dec 2000 10:01
- Location: Vladivostok->San Francisco->Los Angeles->San Francisco
Re: Прикольная история
О, это тот как раз случайtessob wrote: 02 Feb 2020 00:21Походу, все самое интересное у вас еще впереди... внизу. Я не просто так спросил. ))Sergunka wrote: 01 Feb 2020 19:41очевидно, что перфоманс сильно просядет когда попытаются сопряч с САП-ом, но это задачи будущих лет типокорп мыслит на пятилетку минимум (привет СССР
)
Дело в том, что SAP был написан в доинтернетную эпоху и интеграция – это просто писец какая проблема. Без шуток! Вот например партнерское решение Amazon, которое в хорошую погоду даст вам… возможность интеграции как таковую, но с RPM меньше единицы. Я не шучу. Посмотрите видео по моей ссылке, корзины S3 используются как продолжение идеи FTP серверов… чтоб было куда выгрузить CSV файлики.
![Very Happy :D](./images/smilies/biggrin.gif)
![Rolling Eyes :roll:](./images/smilies/rolleyes.gif)
Нам пора уже законектиться хотя бы в линкидине вот мой профайл если, что я хотя бы сошлюсь, что есть приемлемое решение на рынке. (если понятно Вы разрешаете). Если у Вас есть описание или статья в открытом доступе то тоже было неплохо для меня иметь под рукой. Вполне возможно, что понадобится в ближайшие полгода когда начнет верстаться очередной бюджетtessob wrote: 02 Feb 2020 00:21 Есть еще решение вендора – SAP Cloud Platform Integration, которое дает 5-6 RPM, стоит 1’100 баксов в месяц за каждый API-endpoint, и работает только в одну сторону (uni-directional). Документации на это нет в принципе, даже жаба доков нет и дешевых разработчиков на рынке тоже нет. Прикрутить это можно только к продуктивным серверам, так что про тестирование придется забыть – сразу в продакшен. И про VPN/HTTPS придется тоже забыть - криптография для лохов. В техническом плане там просто Apache Camel под капотом, но TCO (total cost of ownership)... в общем вы поймете, что FTP сервера с CSV файликами и 0.001 RPM – это не так уж и плохо.
Нормальная интеграция возможна тоже. У меня, например, свой собственный велосипед который дает по 8’000-10’000 RPM в каждую сторону на одном application server и я без проблем могу даже Kafka Streams поставить в середине. Только, чтобы это получить мне пришлось реверс-инженерить проприетарный TCP протокол и отлавливать баги на протяжении 15 лет. Зато сейчас для меня вопрос интеграции вообще не стоит и я могу развернуть обычный REST/RPC ко всем данным логистики в реальном времени дня за 3-4.
Короче, на каждое успешное скрещивание DS & SAP на сегодня приходится, пожалуй, несколько сотен историй, когда просто не удалось найти приемлемого способа интеграции и проекты банально рассыпались. То есть, даже если у вас и получится выдающаяся математическая модель, очень высока вероятность того, что проект в итоге провалится по технической причине.
![]()
![Good :good:](./images/smilies/good.gif)
"A patriot must always be ready to defend his country against his government." Edward Abbey
-
- Уже с Приветом
- Posts: 549
- Joined: 07 Jan 2016 13:04