D
DataUnderControl
@dataundercontrol942 подп.
391просмотров
41.5%от подписчиков
5 февраля 2026 г.
📷 ФотоScore: 430
🎓 Научный подход к бизнесу. Делюсь нашими результатами последних исследований. Помимо основной профессиональной деятельности, я также веду научно-исследовательскую работу и преподаю в двух ведущих вузах нашей страны. ⚡️Для меня важно, чтобы практические решения, о которых мы говорим, имели прочный научный фундамент и признание в науйчном сообществе. Недавно вышли две наших публикации, на стыке теории и практики применения LLM в реальных бизнес-задачах: 🔬 Автоматизация сопоставления номенклатур в FoodTech В журнале Proceedings of the Institute for System Programming of the RAS говорим о сопоставлении номенклатур поставщиков и заказчиков ресторанов с помощью LLM. Мы разработали и протестировали методологию и прототип, которые позволяют на 90% автоматизировать изнурительный ручной процесс сопоставления товаров из списка поставщиков со списком требуемой к закупу продукции. Это прямая экономия сотен человеко-часов и снижение ошибок - человеческого фактора. Зачем это вам: Если в вашем бизнесе есть проблема сопоставления списков из разных источников с разными названиями, но одинаковым смыслом, то статья может быть полезна. Читать статью: https://doi.org/10.15514/ISPRAS-2025-37(6)-43 🧠 Преодоление семантического разрыва в управлении метаданными - автогенерация описаний. На международной конференции SUMMA 2025 мы представили исследование о том, как с помощью LLM автоматически генерировать описания таблиц и атрибутов на основе их имен. В нашем исследовании мы предложили подход, использующий LLM-модели для автоматической генерации удобочитаемых описаний таблиц и атрибутов на основе их имен, типов данных и выборочных значений. Мы провели эксперименты с различными моделями и оценили их влияние на качество метаданных, полноту каталога и эффективность поиска данных. Результаты исследования: - Метаданные стали более полными и согласованными. - Время обслуживания сократилось с часов до минут. - Поиск по таблицам ускорился с 7 минут до 1–2 минут. - Пользователи осуществляют поиск по бизнес-значению, а не по кодам столбцов. - Полностью интегрировано в OpenMetadata. - Результаты подтверждены как экспертами, так и другой LLM-моделью, выступающей в качестве судьи. Читать статью: https://doi.org/10.1109/SUMMA68668.2025.11302314 🤔 Какие выводы? Использование LLM-моделей позволило ускорить обслуживание метаданных более чем в пятнадцать раз. Пользователям больше не нужно обращаться к владельцам данных за разъяснениями, а роль человека сводится к минимальной проверке вместо ручного написания описаний. А вы используете LLM-модели для подобной работы по гармонизации данных или генерации описаний таблиц и атрибутов? 👍/👎 #ЗаполнениеМетаданныхСLLM #АвтогенерацияОписанийТаблиц #СопоставлениеНоменклатур #LLMDataCatalog #ГармонизацияДанных
391
просмотров
2775
символов
Да
эмодзи
Да
медиа

Другие посты @dataundercontrol

Все посты канала →