OCR и извлечение полей
Документы, формы, накладные и сканы часто выгоднее обрабатывать связкой OCR + маленькая модель для нормализации, чем тащить большой end-to-end стек.
Практика
Небольшие модели хорошо работают там, где важны предсказуемость, короткий ответ и невысокая стоимость владения. Ниже несколько типовых сценариев, в которых не нужен тяжёлый вычислительный контур.
Документы, формы, накладные и сканы часто выгоднее обрабатывать связкой OCR + маленькая модель для нормализации, чем тащить большой end-to-end стек.
Для внутреннего справочника или документации обычно хватает компактной retrieval-схемы и краткого генеративного слоя поверх неё.
Разбор тикетов, писем и заявок хорошо живёт на небольших моделях, если заранее зафиксировать классы и формат ответа.
Набор сценариев
Внутренний чат на узком наборе инструкций, где нужен не свободный диалог, а быстрые подсказки по шаблонам и короткие резюме обращений.
После ASR можно использовать маленькую модель или простой классификатор для распознавания намерений и маршрутизации действий.
Модель собирает краткий отчёт из событий, логов или тикетов, не пытаясь заменить полноценную аналитическую систему.
Небольшие модели проще держать в формате JSON, списков полей или заранее заданных категорий, что особенно полезно для автоматизации.
Вывод
Чем уже предметная область и чем лучше задан формат ответа, тем меньше смысла переплачивать за крупную модель и сложную инфраструктуру. Для многих рабочих сценариев достаточно компактной схемы, которая легко живёт на VPS.