+search
Search, Apache Lucene, Apache Solr, Elasticsearch, OpenSearch, Vespa, Qdrant, etc discuss https://t.me/+-2h4V8vi-eYwZTcy
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
16 из 16Documents conversion at Yandex Cloud Serverless Containers https://vk.com/@mkhl_spb-komandy-v-yandex-cloud-serverless-containers
Made one shot benchmark of parsing 64 pages PDF with text and images on small CPU instance: - Apache Tika (since 2007!!) - Docling opensourced by IBM recently 9 sec vs 6 minutes. Quality is on par. The technological singularity which we deserve. same here
Давно заметил что #архитектура создаваемых решений сама собой структурируетcя в конвейер-пайплайн,... https://telegra.ph/How-often-do-you-think-about-Roman-Empire-12-13
совестливо и гадливо на душе
Так, без удовольствия позапускал контейнеры за API-Gateway @ #Yandex #Cloud https://vk.com/@mkhl_spb-zapusk-nebolshih-demoprilozhenii-v-yandex-cloud Картинки приложил отдельно, для тех кто не логинится в вк.
#yandexcloud #functions: топовый вопрос: скачать код cloud functions по-бырому накиданный в модном редакторе. Шэйм он ю. ok. вот вам rescue toolkit. Только ключи не выкладывйте!
Всем привет! У меня вышла книжка про поиск в екоме https://www.testmysearch.com/
На хабре появился пост от Антона Пилькевича про самое большое улучшение текстового поиска в Озоне за последние 4 года. Что сделали: query prediction — внедрили обратный индекс на основе предсказанных для документов токенов запроса (с помощью DL, разумеется). Ссылочка: https://habr.com/ru/companies/ozontech/articles/990180/. Пост супер крутой! Много отсылок на литературу, подробные объяснения всяких базовых концептов, даже отсылка на канал Миши и пост про GPU Retrieval есть :) В общем, всем интер...