Занимаюсь машинным обучением в А О Гринатом, специализируюсь на задачах OCR и Document Intelligence.
1. Краткий обзор рынка OCR/Document Intelligence решений в России. Что хотят заказчики и что понимают под «распознаванием»?
2. Подходы к OCR сегодня и какие проблемы возникают. Почему недостаточно только уметь распознавать текст документа и какие дополнительные задачи возникают в процессе работы с документами.
3. Как решать возникающие проблемы. Средства и методы извлечения данных.
4. Как построить систему шаблонизации документов. Можно ли обойтись без LLM?
5. Быстродействие и ресурсы. Сколько времени мы тратим на распознавание на самом деле?
Есть ли жизнь между Tesseract’ом и VLLM? Как начать обрабатывать документы и не разочароваться
АО Гринатом, Калининград
Ведущий инженер по машинному обучению