Microsoft Azure

Self-hosted OCR
na Azure

Self-hosted OCR
on Azure

Hardparse na Twojej infrastrukturze Azure. Dokumenty nie opuszczaja Twojej sieci. Pelna kontrola nad danymi, zgodnosc z RODO i tajemnica adwokacka.

Hardparse on your Azure infrastructure. Documents never leave your network. Full data control, GDPR compliance and attorney-client privilege.


Prosta, bezpieczna infrastruktura

Simple, secure infrastructure

Dedykowana VM z GPU
Dedicated GPU VM
Azure VNet
NC4as_T4_v3
T4 16 GB | 4 vCPU | 28 GB RAM
Hardparse
FastAPI + PaddleOCR-VL
Nginx + TLS
Reverse proxy
Reverse proxy
NSG + Private Endpoint
Brak publicznego IP, tylko ruch z Twojej sieci
No public IP, only traffic from your network

Dane nigdy nie opuszczaja Twojej sieci

Data never leaves your network

V
Azure VNet
VM bez publicznego IP. Caly ruch przez VPN lub Azure ExpressRoute. NSG blokuje dostep z zewnatrz.
VM without public IP. All traffic via VPN or Azure ExpressRoute. NSG blocks external access.
R
RODO / GDPR
Przetwarzanie danych wylacznie na infrastrukturze klienta. Brak transferu do stron trzecich. Pelna kontrola retencji.
Data processing exclusively on client infrastructure. No third-party transfers. Full retention control.
T
Tajemnica adwokacka
Attorney-client privilege
Dokumenty klientow przetwarzane lokalnie. Zadne dane nie sa wysylane do zewnetrznych API ani serwisow chmurowych.
Client documents processed locally. No data sent to external APIs or cloud services.

Koszty infrastruktury

Infrastructure costs

Dedykowana VM (rekomendowana dla self-hosted) Dedicated VM (recommended for self-hosted)

VM GPU VRAM WariantPlan MiesiecznieMonthly
NC4as_T4_v3 T4 16 GB Spot ~1 036 PLN
NC4as_T4_v3 T4 16 GB On-demand ~1 920 PLN
VM dziala 24/7, brak cold startow. Bez limitu stron. Przy typowym uzyciu kancelarii (1-2 strony na raz, dokumenty w ciagu dnia) to jedyna sensowna opcja self-hosted — natychmiastowa odpowiedz bez overhead. VM runs 24/7, no cold starts. Unlimited pages. For typical firm usage (1-2 pages at a time, documents throughout the day) this is the only sensible self-hosted option — instant response, no overhead.
Dlaczego VM a nie serverless? Kancelarie wysylaja 1-2 strony na raz w losowych momentach dnia. Serverless GPU (Azure Container Apps) nalicza ~360s overhead na kazda sesje (60s cold start + 5 min idle). Przy 10 000 stron po 1-2 na raz to ~670-1 330 PLN/msc — tyle samo co VM, ale z 60-sekundowym opoznieniem. VM jest tansze i szybsze. Why VM, not serverless? Firms send 1-2 pages at a time at random moments throughout the day. Serverless GPU (Azure Container Apps) charges ~360s overhead per session (60s cold start + 5 min idle). At 10,000 pages sent 1-2 at a time that's ~670-1,330 PLN/month — same as a VM, but with 60-second delay. VM is cheaper and faster.

Porownanie opcji Options comparison

Hardparse Pro API
199 PLN/msc
10 000 stron/mscpages/mo
  • Bez infrastruktury, zero konfiguracji
  • No infrastructure, zero config
  • Natychmiastowa odpowiedz
  • Instant response
  • Najtansze dla <50k stron/msc
  • Cheapest for <50k pages/mo
Dedykowana VM na Azure
Dedicated VM on Azure
~1 360 PLN/msc
Bez limitu stron
Unlimited pages
  • Dane na Twoim Azure (RODO)
  • Data on your Azure (GDPR)
  • Natychmiastowa odpowiedz, 24/7
  • Instant response, 24/7
  • Oplaca sie od ~50k stron/msc
  • Cost-effective from ~50k pages/mo
Rekomendacja: Zacznij od Pro API (199 PLN/msc) — zero infrastruktury, natychmiastowy start. Jesli RODO lub tajemnica adwokacka wymagaja on-premise, wybierz VM Reserved 1Y (~1 360 PLN/msc, bez limitu stron). Recommendation: Start with Pro API (199 PLN/mo) — zero infrastructure, instant start. If GDPR or attorney-client privilege requires on-premise, choose VM Reserved 1Y (~1,360 PLN/mo, unlimited pages).

Proces wdrozenia

Deployment process

1
Provisioning infrastruktury
Infrastructure provisioning
Tworzymy VM z GPU, VNet, NSG i dysk na Twoim Azure subscription. Terraform lub Bicep — infrastruktura jako kod.
We provision GPU VM, VNet, NSG and disk on your Azure subscription. Terraform or Bicep — infrastructure as code.
# Terraform resource "azurerm_linux_virtual_machine" "hardparse" { size = "Standard_NC4as_T4_v3" admin_username = "hardparse" resource_group_name = azurerm_resource_group.rg.name network_interface_ids = [azurerm_network_interface.nic.id] }
2
Instalacja Hardparse
Hardparse installation
Docker image z modelem OCR i serwerem API. Jedno polecenie — server startuje, model laduje sie w ~10 sekund.
Docker image with OCR model and API server. Single command — server starts, model loads in ~10 seconds.
# Na VM docker compose up -d # Weryfikacja curl http://localhost:8000/health {"status": "ok", "model": "PaddleOCR-VL-1.5"}
3
Konfiguracja sieci
Network configuration
Nginx reverse proxy z certyfikatem TLS. NSG: tylko ruch z Twojej sieci wewnetrznej. Opcjonalnie: Azure Private Endpoint.
Nginx reverse proxy with TLS certificate. NSG: only traffic from your internal network. Optional: Azure Private Endpoint.
4
Integracja z systemem kancelaryjnym
Case system integration
REST API identyczne jak Hardparse Pro. Zmiana base URL w Twoim kodzie — gotowe.
REST API identical to Hardparse Pro. Change base URL in your code — done.
# Zamien base URL — reszta kodu bez zmian # Before: BASE = "https://hardparse.com" # After: BASE = "https://ocr.twoja-kancelaria.pl" curl -X POST https://ocr.twoja-kancelaria.pl/api/ocr \ -F "file=@akta_medyczne.pdf"

Bezplatny benchmark na Twoich dokumentach

Free benchmark on your documents

Przeslij swoje dokumenty — przetestujemy je na Hardparse i porownamy z Twoim obecnym narzedziem. Bez zobowiazan.

Send us your documents — we'll test them on Hardparse and compare with your current tool. No commitment.