zero markup · API-first · BYOK · фикс $50$30/мес

Извлечение данных из любых документов

Распаковываем архивы, читаем 30+ форматов и извлекаем поля в соответствии с JSON-схемой. Не нужно разворачивать собственную инфру и переплачивать за токены.

Входящая первичка· Прайс-листы· Заявки· Тендерная документация· Резюме· Сверка документов· Онбординг клиентов· Транспортные документы· Входящие обращения· Карточки товаров· Распознавание документов· Входящая первичка· Прайс-листы· Заявки· Тендерная документация· Резюме· Сверка документов· Онбординг клиентов· Транспортные документы· Входящие обращения· Карточки товаров· Распознавание документов·

Попробуй прямо сейчас — без регистрации.

Сгенерируй временный API-ключ и отправь до 10 тестовых запросов бесплатно. Без регистрации и привязки карты.

Если возникли вопросы? написать нам
curl -X POST https://api.hotdoc.io/v1/process \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@invoice.pdf" \
  -F 'prompt=Extract from this invoice:
- invoice_number
- date (ISO 8601)
- vendor_name
- total_amount (number, no currency)
- line_items: description, qty, unit_price, total

Return null for missing fields.' \
  -F 'schema={
    "invoice_number": "string",
    "date": "string",
    "vendor_name": "string",
    "total_amount": "number",
    "line_items": [{
      "description": "string",
      "qty": "number",
      "unit_price": "number",
      "total": "number"
    }]
  }'

Пайплайн от импорта файлов
до JSON за один API-запрос.

Hotdoc — это слой оркестрации над OSS-библиотеками: мы берём на себя обработку архивов и документов 30+ форматов, extraction и enrichment по схеме. Ты передаёшь ссылку на документы и промпт со схемой. Остальное на нашей стороне.

Ты платишь за оркестратор, надёжность (ретраи, фолбэки, восстановление), инфраструктуру, поддержку и выверенные пайплайны под проблемные кейсы. Никаких наценок за OCR и токены.

01

Первичная обработка

Распаковываем архивы, читаем 30+ форматов нативно, а сканы и изображения обрабатываем через Vision OCR.

ZIP / RAR 30+ форматов Vision OCR
02

Извлечение данных

Извлекаем поля по твоей JSON-схеме. Промпт и модель ты определяешь самостоятельно в рамках запроса.

JSON schema BYOK
03

Обогащение данных

Обогащаем данные на ходу: каждый следующий документ дополняет и уточняет уже извлечённый результат.

04

Структурированный результат

Возвращаем JSON, CSV или MD без ограничений по объёму в рамках одной сессии.

JSON CSV MD

Нужна классификация, чанкинг или свой кастомный флоу?

Напишите нам

Не OSS.
Не enterprise API.
Нечто другое.

OSS
Funded API
hotdoc
Полноценный флоу обработки
Zero-ops (не деплоить)
Контроль используемых инструментов
BYOK
Отсутствие переплат за токены
Поддержка
Скорость интеграции недели дни часы

Между «собери сам» и «переплати за токены» мы предлагаем третий вариант: готовый инструмент без наценки.

Hotdoc vs OSS (Docling, Marker и др.) Парсинг без extraction по схеме, enrichment и оркестрации. Разворачивать и держать GPU нужно самим. Затраты могут превышать $1000 ещё до первого результата. Мы предоставляем готовую инфраструктуру и проверенные решения без необходимости заниматься первичной обработкой документов.

Hotdoc vs funded API (Reducto, Unstructured и др.) Монетизация большинства продуктов строится на наценке на токены. Чем больше вы тратите — тем больше комиссий вы платите. Мы берём фиксированную стоимость за использование инструментов, а вы используете собственные API-ключи и не переплачиваете за токены.

Архитектура и
методы обработки

Детерминированный оркестратор и точечный AI. Каждый шаг управляем, каждая ошибка обрабатывается, каждый результат воспроизводим.

BYOK: твой ключ используется в runtime и не хранится на стороне Hotdoc.

Мульти-LLM оркестрацияOpenRouter + прямые интеграции, автофолбэк между моделями
Vision-распознаваниеточнее классического OCR на любом макете и языке
Кросс-документный контекстданные из всех файлов обогащают общий результат
Мультиэтапный пайплайнпоследовательные шаги с обработкой ошибок и памятью состояния
Fault-tolerant выполнениеретраи, чекпоинты, восстановление сессий
BYOK на уровне ключейтвой ключ и реальная цена провайдера без наценки
OpenRouter Mistral OpenAI Anthropic xAI Deepseek Xiaomi Hybrid AI Architecture Vision Extraction Stateful Orchestration Multi-step Pipelines Fault-tolerant Execution

Популярные сценарии

Частые задачи, которые закрываются «из коробки». Нестандартное — настроим флоу.

invoice-extraction

Invoice Extraction API

Инвойсы и счета любых форматов — в структурированный JSON по твоей схеме. Пакеты из почты или S3 за один вызов.

input →PDF / scan / ZIP
output →vendor, amount, line_items, date, etc.
resume-parser

Resume / CV Parser API

Поток CV на любом языке — в унифицированные карточки кандидатов со скорингом по твоим критериям.

input →DOCX / PDF / HTML
output →personal data, skills, experience, contact, score, etc.
bank-statement

Bank Statement Extraction

Выписки из разных банков — в единый формат транзакций. Работает с PDF и Excel-экспортами.

input →PDF / XLSX
output →date, description, amount, balance
batch-processing

Batch / Archive Processing

ZIP с сотнями файлов разных форматов — один запрос, один JSON. Статус каждого файла в батче.

input →ZIP / RAR (30+ форматов внутри)
output →results[], errors[], stats

Нестандартная задача? Настроим флоу.

написать нам
$30
$50 −40%
в месяц · полный функционал

Требуются большие объёмы, self-hosted
или выделенная инфраструктура?

пиши на hello@hotdoc.io

Что входит

Инструмент и оркестратор ✓ включено
архивы и 30+ форматов ✓ включено
мультифайловая обработка ✓ включено
Fault-tolerant выполнение ✓ включено
Ongoing development ✓ включено
Email-поддержка ✓ включено
Vision OCR и AI → BYOK без комиссий
BYOK: подключаешь свой ключ для Mistral, OpenAI, Anthropic или любого OpenRouter-провайдера. За расход токенов и OCR платишь провайдеру напрямую по его цене без наценок и скрытых комиссий.

Токены не дорогие сами по себе дорогими их делают те, кто стоит между тобой и провайдером.

Funded-компании берут твои файлы, прогоняют через Claude или GPT и выставляют $10+ за тысячу страниц. На этом строится их маржа. Чем больше объёмы, тем больше переплата за токены.

Мы решили сделать иначе: подключаешь свой ключ, платишь провайдеру напрямую, а нам фиксированную стоимость за готовое решение. Не потому что мы не хотим заработать больше. А потому что согласно нашей картине мира так правильнее.

Документы не хранятся

Обрабатываются в runtime, не сохраняются после обработки (по умолчанию).

Шифрование на всех уровнях

TLS при передаче, шифрование at-rest. Доступ только по API-ключу.

BYOK — ключи не у нас

Твой ключ провайдера используется в runtime и не хранится на нашей стороне.

On-prem / VPC по запросу

Полная изоляция для Enterprise и self-host.

FAQ. Частые вопросы

Остались вопросы? Напишите на hello@hotdoc.io — ответим быстро.

Document Processing API. Передаёшь файл (или архив) и промпт с JSON-схемой полей. Остальное на нашей стороне: распаковка, конвертация, OCR, AI-extraction по схеме, enrichment, структурированный ответ. Нестандартное — строим кастомный флоу.
Bring Your Own Key. Ты подключаешь собственный API-ключ от Mistral, OpenAI, Anthropic или любого OpenRouter-провайдера. Токены и OCR ты платишь провайдеру напрямую по его прайсу. Мы не стоим между тобой и провайдером и не делаем наценку — это принцип, не дешёвка.
За сам инструмент: оркестратор, надёжность (ретраи, фолбэки, восстановление сессий), 30+ форматов, батчи, ongoing development и поддержку. Токены и OCR оплачиваются напрямую провайдеру через твой ключ.
Точность зависит от качества исходников, сложности схемы, промпта и используемых моделей. На уровне флоу мы выжимаем максимум, а также даём рекомендации по использованию моделей. Лучший способ оценить результат — прогнать свои файлы с использованием тестового ключа без регистрации. Если потребуется помощь с настройкой — напиши на hello@hotdoc.io
Да. Генерируй временный API-ключ прямо на сайте и отправляй до 10 тестовых запросов бесплатно. Никакой регистрации, никакой карточки.
Нет. Self-serve: регистрируешься, оплачиваешь подписку, отменяешь в любой момент. Никаких договоров, звонков менеджеру или постоплаты.
Нет. Документы обрабатываются в runtime и не сохраняются после обработки (по умолчанию). С BYOK твой API-ключ провайдера также не хранится на нашей стороне.
30+ форматов: PDF, DOCX, XLSX, RTF, HTML, MSG, PNG, JPG, сканы, архивы ZIP/RAR и другие (всего >30 форматов). Если твоего формата нет — напиши на hello@hotdoc.io, добавим по запросу.
Есть мягкий потолок для защиты сервиса — это не монетизация, а контроль capacity. Для большинства задач он незаметен. Нужен большой объём — напиши на hello@hotdoc.io, обсудим.
Да, есть one-time license. Если интересно — напиши на hello@hotdoc.io.

Есть вопрос или предложение?

написать