3.1Kпросмотров
23 мая 2025 г.
📷 ФотоScore: 3.4K
Доменная экспертиза для DSов в промышленности 🔵Одним из требований (или одной из составлящих) профессии датасайентиста является экспертиза в доменной области. В промышленности это требование имеет еще большую важность из-за большой ответственности (промышленные объекты являются опасными или объектами промышленного риска), сложности технологических процессов и пересечения с разными смежными науками (физика, химия, механика и тд). К тому же уровень экспертизы прямо влияет на успешность проекта, писал здесь:
Я пойду дальше и скажу, что умение разбираться в технологическом процессе даже важнее, чем навыки DS. Недавно обсуждали с Head of DS крупной промышленной корпорации, что выше вероятность сделать проект и принести эффект у “технолога с небольшими навыками DS”, чем у “DSа с небольшими знаниями технологии”. 🔵Погружение в доменную область обычно является частью этапов PoC, пресейла, предпроектного обследования, но продолжается обычно на протяжении всего проекта. Более того не нужно думать, что, узнав процесс на одном производстве, вы теперь знаете все подобные производства. Конечно, физика и химия в обогащении меди или золота не меняется от фабрики к фабрике, но "дьявол кроется в мелочах". Поэтому готовьтесь проходить процесс погружения (пусть и в укороченном виде) на каждом проекте и каждом производстве отдельно. Бесспорно: с опытом становится легче и многие нюансы повторяются. Как нарабатывать экспертизу?
Оптимальным планом я считаю следующий:
1️⃣Короткое погружение в теорию (2 дня-2 недели):
• Начать с видео на ютубе, типа такого или такого. А вот (часть 1, часть 2) хороший пример простых материалов по процессу с золотом.
• Можно начинать изучение тех регламента, инструкций, схем цепей и механизмов и тд.
• Стоит перерисовать схему производственного процесса в упрощенном и понятном виде, нанося релевантную информацию: точки измерений, узкие места, длительность операций, количество отказов, управляющие воздействия (можно прямо в терминах MV, CV, DV), последовательность операций, движение продукции, потоки. Можно даже потоки данных, но лучше как-то схемы разделять. Пример такой PFD диаграммы на картинке.
2️⃣Практическое знакомство с производством (1-2 недели):
• Экскурсия, вопросы по итогам теоретического погружения
• Инсайты от производственников из "курилки"
• На этом этапе уже важно иметь глоссарий аббревиатур, терминов и жаргонизмов
3️⃣Комплексное глубокое изучение (от 2 недель и до конца проекта):
• Теория процессов и технологии (учебники, статьи, аналитические материалы)
• Практика производства (консультации с производственниками, повторные командировки)
• Анализ данных и референсы (EDA и изучение данных, дозапросы данных и уточнение инсайтов, анализ опыта решения задач коллегами в отрасли из аналитических отчетов, публичных материалов, референс визиты в другие компании и общение с коллегами) Лучше опыта работы, нахождения на производстве, общения с персоналом ничего нет. Но, чтобы не раздражать персонал глупыми вопросами, базовые теоретические знания стоит получить до общения. ➕Хорошо дополнит пост слайд "Изучение контекста задачи" с конкретными шагами на старте проекта от Вячеслава Козицина из Еврохима. Как сохранять экспертизу?
Важно сохранять знания и артефакты в какую-то базу знаний (wiki, confluence). Это важно не только для данного проекта, но и для подобных проектов в будущем. К тому же это важно не только для себя, но и для команды проекта, например, на этапе предпроектного обследования 1 человек погружается и готовит материалы, а на старте проекта уже вся команда погружается, используя подготовленные материалы. Какие артефакты:
• Глоссарий терминов
• (если возможно) Фото и видео оборудования, тех процесса
• Краткое описание и характеристики оборудования, процесса
• Схемы тех процессов в понятном/упрощенном виде с комментариями и актуальными расположениями элементов (они регулярно меняются и могут отличаться от тех инструкций)
• EDA с комментариями, гипотезами и инсайтами