Директор юридичної фірми у Відні питає: "Ми хочемо self-hosted AI — що купити і де розмістити?" Більшість статей на це питання або надто технічні або написані для розробників. Цей гайд — для керівника який приймає рішення але не хоче розбиратись у специфікаціях GPU. Тут є все що потрібно знати: яких провайдерів обирати, скільки платити і що запитати у підрядника перед підписанням контракту.
⚡ Коротко для тих хто поспішає
- 🏠 Власний сервер потрібен коли дані не можуть покидати вашу інфраструктуру — медицина, юристи, HR, фінанси
- 🚫 AWS і Azure Germany не вирішують GDPR — це американські компанії під CLOUD Act незалежно від розташування серверів
- ✅ Безпечні провайдери для ЄС: Hetzner (Нюрнберг/Фінляндія), OVH (Страсбург), Contabo (Мюнхен)
- 💻 CPU чи GPU: CPU — для внутрішніх інструментів де 30–90 сек прийнятно. GPU — для публічного чату або якщо потрібно <10 сек
- 💰 Реальна вартість: від €4–8/міс (CPU, малий бізнес) до €184/міс (GPU для продакшн AI)
- 🤝 Після запуску: підрядник налаштовує, ви або ваш адміністратор керує. Або підрядник бере підтримку на себе
📚 Зміст
Навіщо взагалі потрібен власний сервер
Власний сервер — не самоціль. Це наслідок конкретної вимоги: ваші дані не можуть оброблятись на чужій інфраструктурі. Якщо такої вимоги немає — хмарний AI може бути дешевшим і простішим варіантом.
Більшість наших клієнтів у AskYourDocs приходять з конкретним питанням — не "хочу власний сервер" а "чи можемо ми законно використовувати хмарний AI?" Відповідь визначає чи потрібен сервер взагалі.
Три причини обирати власний сервер
Причина 1: Юридична вимога. Медичні дані, адвокатська таємниця, фінансові записи клієнтів — все це регулюється так що передача стороннім AI-провайдерам або неможлива або вимагає окремої дозвільної роботи вартістю тисячі євро. Власний сервер вирішує це технічно: дані фізично не покидають вашу інфраструктуру.
Причина 2: Передбачувана вартість. Хмарний AI коштує "за запит" — ви не знаєте наперед рахунок наступного місяця. Власний сервер: фіксований рахунок незалежно від кількості запитів. При 500+ запитів на день власний сервер стає дешевшим ніж хмарний API.
Причина 3: Незалежність. OpenAI може змінити ціни, умови або взагалі відкликати доступ. Ваша модель на вашому сервері: не змінюється без вашого відома, не залежить від рішень американської компанії і працює навіть якщо провайдер AI виходить з ладу.
Коли власний сервер НЕ потрібен: якщо ви тільки починаєте, документи не містять персональних даних і навантаження менше 200 запитів на день — почніть з хмарного API і перейдіть на власний сервер коли вирішите що цінність підтверджена. Ми завжди рекомендуємо стартувати з того варіанту який дозволяє швидко перевірити гіпотезу.
Чому AWS і Azure Germany не вирішують GDPR-проблему
Найпоширеніша помилка яку ми бачимо: компанія вибирає "EU region" у AWS або Azure і вважає що GDPR-проблема вирішена. Це не так. Фізичне розташування сервера і юридична юрисдикція над даними — різні речі.
Це розділ який ми вважаємо найважливішим у цій статті — і який більшість гайдів про AI-сервери ігнорують. Тому пояснимо детально і просто.
Що таке CLOUD Act і чому він стосується вашого бізнесу
У 2018 році США прийняли Clarifying Lawful Overseas Use of Data Act (CLOUD Act). Цей закон дозволяє американським правоохоронним органам вимагати від американських компаній надати доступ до будь-яких даних їхніх клієнтів — незалежно від того де фізично знаходяться сервери.
Простою мовою: уявіть що ви орендуєте сейф у банку у Франкфурті. Але цей банк — американський. Американські федеральні агенти мають право звернутись до банку в США з вимогою відкрити ваш сейф у Франкфурті — і банк зобов'язаний виконати, не повідомляючи вас. Саме так працює CLOUD Act щодо AWS, Azure і Google Cloud.
AWS EU-Central-1 (Франкфурт), Azure Germany West Central, Google Cloud Europe-West — всі ці опції розташовані фізично в ЄС, але управляються американськими компаніями. CLOUD Act застосовується до них повністю.
Чому це критично для бізнесу в Австрії і Німеччині
Австрійський регулятор DSB у справі Google Analytics (2022) встановив найсуворіший стандарт в ЄС: недостатньо стверджувати що "ймовірність доступу американських спецслужб до ваших даних низька". Потрібна технічна неможливість такого доступу. Жоден американський хмарний провайдер не може надати таку гарантію — по визначенню.
Для медичних центрів і юридичних фірм в Австрії і Німеччині це означає: AWS і Azure Germany не є прийнятним рішенням незалежно від ціни і якості продукту. Потрібен провайдер під юрисдикцією ЄС.
| Провайдер |
Фізична локація |
Юрисдикція |
CLOUD Act |
Підходить для EU/AT/DE? |
| AWS EU-Central-1 |
Франкфурт, DE |
🇺🇸 США |
✅ Застосовується |
❌ Ні |
| Azure Germany West Central |
Франкфурт, DE |
🇺🇸 США |
✅ Застосовується |
❌ Ні |
| Google Cloud Europe-West |
Бельгія/Нідерланди |
🇺🇸 США |
✅ Застосовується |
❌ Ні |
| Hetzner |
Нюрнберг/Фальенштайн DE, Гельсінкі FI |
🇩🇪 Німеччина |
❌ Не застосовується |
✅ Так |
| OVHcloud |
Страсбург FR, Варшава PL |
🇫🇷 Франція |
❌ Не застосовується |
✅ Так |
| Contabo |
Мюнхен DE, Нюрнберг DE |
🇩🇪 Німеччина |
❌ Не застосовується |
✅ Так |
Який регіон і провайдер обрати: Hetzner, OVH, Contabo
Для більшості бізнесів в AT/DE ми рекомендуємо Hetzner як перший вибір — найкраще співвідношення ціна/якість/GDPR-відповідність серед EU-провайдерів. OVH і Contabo — гідні альтернативи залежно від задачі.
Важливе оновлення: Hetzner підвищив ціни 1 квітня 2026 на 30–37% через зростання вартості серверної пам'яті (HBM для GPU). Навіть після підвищення Hetzner залишається у 2.5–3.3 рази дешевшим за AWS/GCP для еквівалентних конфігурацій.
Hetzner Online — наш вибір за замовчуванням
Hetzner Online GmbH — приватна компанія зі штаб-квартирою в Гунценхаузені, Баварія. Дата-центри в Нюрнберзі, Фальенштайні (Саксонія) і Гельсінкі. ISO 27001 сертифікований. Flat-rate тарифікація без прихованих рахунків за трафік (до 20 TB включено в EU-регіонах). Технічна підтримка — в основному через тікет-систему, без цілодобового телефону.
Ідеально для: більшості МСБ які хочуть максимум продуктивності за мінімальну ціну з гарантованою EU-юрисдикцією. Наш вибір для 90% клієнтів.
OVHcloud — французька альтернатива
OVH SAS — французька компанія (група Iliad), один з найбільших хостинг-провайдерів ЄС. Дата-центри в Страсбурзі, Рубе, Варшаві. Ширший спектр managed-послуг ніж у Hetzner. Ціни трохи вищі але є managed-рівні для тих хто не хоче керувати сервером самостійно.
Ідеально для: компаній яким потрібна більша підтримка або додаткові managed-послуги (бази даних, балансувальники навантаження). Хороша альтернатива якщо Hetzner не підходить з технічних причин.
Contabo — найдешевший CPU-варіант
Contabo GmbH — мюнхенська компанія з 2003 року, найбільша кількість CPU-ресурсів за найменшу ціну на ринку. 4 vCPU / 8 GB RAM від €4.50/місяць — це рекорд на EU-ринку. ISO 27001. Підтримка через тікети.
Важливо про GPU у Contabo: їхні GPU-сервери орієнтовані на enterprise-сегмент (NVIDIA H100, L40S) і починаються від $790/місяць — не підходять для МСБ AI-задач. Для GPU-сервера обирайте Hetzner або Scaleway.
Ідеально для: CPU-only розгортання малого бізнесу де ціна критична і GPU не потрібен.
| Провайдер |
CPU VPS від |
GPU сервер від |
Локація |
Підтримка |
Найкраще для |
| Hetzner ⭐ |
€3.49/міс |
€184/міс (RTX 4000 Ada 20 GB) |
DE, FI |
Тікет |
Більшість проектів — CPU і GPU |
| OVHcloud |
€3.99/міс |
від €100/міс |
FR, PL |
Тікет + телефон |
Managed-послуги, більша підтримка |
| Contabo |
€4.50/міс |
від $790/міс (H100) |
DE |
Тікет |
CPU-only, максимальна дешевизна |
| Scaleway |
€3.99/міс |
від €150/міс |
FR |
Тікет |
Альтернатива для GPU у Франції |
CPU чи GPU: що насправді важливо і коли GPU необхідний
GPU — це не "краще" чи "потужніше". GPU означає "швидше". CPU означає "повільніше але дешевше". Питання в тому чи прийнятна для вашого сценарію відповідь за 30–90 секунд замість 5–10 секунд. Для більшості внутрішніх інструментів — прийнятна.
Це питання яке ми пояснюємо на кожній першій зустрічі з клієнтом. Більшість керівників думають що GPU потрібен обов'язково. Насправді — залежить від того хто чекає відповіді і скільки готовий чекати.
Проста аналогія
CPU — це досвідчений старший юрист: думає методично, дає точну відповідь, але потребує більше часу. GPU — це ціла команда паралельних асистентів: відповідають майже одночасно завдяки масовому паралелізму. Для документа де відповідь однакова в обох випадках — питання тільки в часі очікування.
Коли CPU достатньо
- Внутрішній інструмент для співробітників: менеджер задає питання і займається іншою справою поки чекає відповідь. 30–60 секунд — прийнятно. Порівняйте з 20 хвилинами ручного пошуку в документах
- Нічна або фонова обробка документів: звіти, аналіз, резюме без реального часу — CPU ідеальний
- Моделі до 14B параметрів: Llama 3.2 8B або Qwen3 14B на CPU дають 5–15 токенів/сек — відповідь за 30–90 секунд
- Бюджет обмежений і хочете протестувати: почніть з CPU, перейдіть на GPU коли цінність підтверджена
Коли GPU обов'язковий
- Публічний чат на сайті — клієнти або пацієнти: людина чекає відповідь в реальному часі. 30 секунд очікування = покинутий чат. Потрібно менше 10 секунд — потрібен GPU
- Telegram або WhatsApp бот з зовнішньою аудиторією: аналогічно — очікування має бути комфортним
- Модель 22B+ параметрів: Mistral Small 3 (24B) або Gemma 4 26B без GPU — 60–120 секунд. З GPU 16 GB — 5–10 секунд
- Більше 10 одночасних користувачів: CPU обробляє запити послідовно, GPU — паралельно
| Сценарій |
CPU достатньо? |
Рекомендація |
| Внутрішній FAQ для 5–10 співробітників |
✅ Так |
CPU-сервер, Llama 3.2 8B або Qwen3 14B |
| Публічний чат на сайті клініки |
❌ Ні |
GPU 16 GB, Gemma 4 26B або Mistral Small 3 |
| Telegram-бот для внутрішньої команди |
✅ Так (якщо відповідь за 60 сек ок) |
CPU або GPU залежно від терпимості до очікування |
| Юридична фірма, пошук по договорах |
✅ Так для внутрішнього |
CPU для початку, GPU якщо хочете Llama 3.3 70B |
| Медичний центр, відповіді пацієнтам |
❌ Ні |
GPU обов'язковий — пацієнт чекає в реальному часі |
Яка конфігурація сервера підходить для вашого масштабу
Три параметри визначають потрібну конфігурацію: скільки документів у системі, скільки запитів на день і яка модель потрібна для якості відповідей. Решта — наслідки цих трьох.
Ми не рекомендуємо "мінімальні вимоги" без контексту — це безглуздо. Натомість ось чотири типових сценарії які ми бачимо у клієнтів.
| Сценарій |
Документів |
Запитів/день |
Конфігурація |
Модель |
Провайдер |
Старт / тест Малий офіс, внутрішній FAQ |
до 200 |
до 50 |
CPU-only 4 vCPU / 16 GB RAM / 100 GB SSD |
Llama 3.2 8B або Qwen3 14B |
Contabo або Hetzner CX |
Продакшн без GPU Внутрішній інструмент компанії |
200–1000 |
50–200 |
CPU-only 8 vCPU / 32 GB RAM / 200 GB SSD |
Qwen3 14B або Llama 3.3 70B (повільно) |
Hetzner CPX або Contabo VPS XL |
Продакшн з GPU Публічний чат, клієнти/пацієнти |
500–5000 |
200–500 |
GPU 16–20 GB 32–64 GB RAM / 500 GB SSD |
Gemma 4 26B або Mistral Small 3 |
Hetzner GEX44 (€184/міс) |
Висока якість Юрфірма, медичний центр, максимальна точність |
1000+ |
200–500 |
GPU 48 GB або 2×GPU 128 GB RAM / 1 TB SSD |
Llama 3.3 70B Q4 |
Hetzner Dedicated або власний сервер |
Наша порада для старту: починайте з CPU-only конфігурації і реальним навантаженням 2–4 тижні. Якщо швидкість не влаштовує — перехід на GPU займає 1 день і документи вже в системі. Переплачувати за GPU відразу без підтвердження потреби — невиправдано.
Окремо про RAM і диск
RAM: модель повністю завантажується в пам'ять. Llama 3.2 8B потребує ~6 GB, Gemma 4 26B — ~15 GB, Llama 3.3 70B — ~43 GB. Завжди беріть RAM з запасом ~30% для операційної системи і бази даних. Мало RAM = модель частково на диску = дуже повільно.
Диск: самі моделі займають від 5 до 43 GB. Ваші документи — зазвичай 1–10 GB навіть для великих архівів (текст дуже компактний). Векторна база (pgvector) — ще кілька GB. 200 GB SSD — достатньо для більшості МСБ.
Скільки коштує сервер щомісяця реально
"Скільки коштує сервер?" — питання без відповіді без контексту. Правильне питання: "Скільки коштує сервер для моїх задач порівняно з хмарним AI?" Ось чесне порівняння.
Ціни актуальні на червень 2026. Hetzner підвищив ціни 1 квітня 2026 на 30–37% — але залишається найдешевшим GDPR-відповідним EU-провайдером для AI-задач.
Актуальні ціни Hetzner (після підвищення квітень 2026)
| Конфігурація |
Specs |
Ціна/міс |
Підходить для |
| CX23 (CPU) |
2 vCPU / 4 GB RAM / 40 GB SSD |
€3.49 |
Тільки тести, мінімальне навантаження |
| CX33 (CPU) |
4 vCPU / 8 GB RAM / 80 GB SSD |
€7.99 |
Маленька модель, до 20 запитів/день |
| CX43 (CPU) |
8 vCPU / 16 GB RAM / 160 GB SSD |
~€18 |
Qwen3 14B, до 50 запитів/день |
| CPX51 (CPU) |
16 vCPU / 32 GB RAM / 360 GB SSD |
~€45 |
Qwen3 14B швидко або Llama 70B повільно |
| GEX44 (GPU) ⭐ |
Intel Core i5 / 64 GB RAM / NVIDIA RTX 4000 Ada 20 GB |
€184 |
Gemma 4 26B або Mistral Small 3, до 500 запитів/день |
Порівняння з хмарними альтернативами
| Варіант |
Вартість на місяць |
GDPR |
Примітки |
| OpenAI GPT-4o mini API (500 запитів/день) |
~$12–24 |
⚠️ Ризик |
Дешево але дані в США |
| OpenAI GPT-4o API (500 запитів/день) |
~$100–200 |
⚠️ Ризик |
Дорого і дані в США |
| Hetzner CPU + Llama 3.2 8B |
€7–18 |
✅ Повна |
Повільно (~60 сек), але безпечно і дешево |
| Hetzner GPU GEX44 + Gemma 4 26B |
€184 |
✅ Повна |
5–8 сек відповідь, необмежена кількість запитів |
| AWS/Azure GPU еквівалент |
$400–600 |
❌ CLOUD Act |
2.5–3x дорожче за Hetzner |
Приховані витрати яких не видно в рекламі
- IPv4 адреса: Hetzner додатково €0.50/міс. Необхідна якщо є Telegram-бот або публічний веб-чат
- Резервне копіювання: +20% від ціни сервера у Hetzner (наприклад +€37/міс для GEX44). Ми завжди рекомендуємо увімкнути
- Вхідний трафік: безкоштовний у всіх EU-провайдерів. Вихідний — до 20 TB безкоштовно у Hetzner (практично необмежено для AI-чату)
- Розгортання підрядником: разовий платіж за налаштування (зазвичай €300–800 залежно від складності)
Хто відповідає за сервер після запуску — і що це вам коштує
Найчастіше питання після демо: "А хто потім це все обслуговує?" Відповідь проста: або ваш адміністратор після навчання, або підрядник за щомісячну плату. Третього не дано.
"Сервер" звучить страшно для нетехнічного керівника. На практиці — після правильного налаштування AI-асистент на сервері вимагає набагато менше уваги ніж більшість думає.
Що взагалі потрібно "обслуговувати" після запуску
Є чотири речі які потребують уваги:
- Оновлення документів: хтось з вашої команди завантажує нові або оновлені документи через адмін-панель. Drag-and-drop, займає хвилину. IT-знань не потрібно — справляється адміністратор або секретар
- Перезапуск при збої: Hetzner перезапускає сервер автоматично при апаратному збої. Docker-контейнери з AI запускаються автоматично при перезавантаженні. На практиці — 2–3 хвилини downtime раз на кілька місяців
- Оновлення ПЗ і безпека: оновлення Ubuntu, Docker, залежностей. Потрібно раз на місяць. Або ваш IT або підрядник
- Моніторинг: чи відповідає система на запити. Базовий моніторинг Hetzner включений, розширений — додаткові інструменти
Два варіанти після передачі системи
Варіант А: ваш адміністратор керує самостійно. Після передачі проекту ми навчаємо одну людину з вашої команди — зазвичай 2–3 години. Вона може: завантажувати документи, перезапускати сервіс при потребі, відповідати на питання команди. Для більш складних задач (оновлення, налаштування нового інтерфейсу) — можна звернутись до нас разово.
Варіант Б: підрядник на щомісячній підтримці. Ми або інший підрядник повністю берете технічну відповідальність: моніторинг, оновлення, реагування на збої, консультації. Коштує від $50 до $200/місяць залежно від обсягу. Підходить якщо в компанії немає IT-спеціаліста.
|
Варіант А: самостійно |
Варіант Б: підрядник |
| Вартість |
$0/міс (тільки час адміністратора) |
$50–200/міс |
| Хто потрібен |
1 людина з базовим розумінням IT |
Нікого — підрядник сам |
| Час реакції при збої |
Як швидко адміністратор відповість |
SLA — зазвичай 2–4 години в робочий час |
| Підходить для |
Компанії з IT-спеціалістом або активним адміністратором |
Компанії без IT або з критичними вимогами до uptime |
Наша рекомендація: для більшості МСБ Варіант А після короткого навчання — цілком достатній. Варіант Б виправданий для публічних сервісів (чат на сайті клініки) де downtime напряму впливає на клієнтський досвід.
Що запитати у підрядника перед підписанням контракту
Більшість керівників не знають що запитати у підрядника — і підписують контракт не розуміючи ключових речей. Ці вісім питань захистять вас від неприємних сюрпризів після запуску.
Цей розділ — для тих хто збирається підписати контракт на впровадження AI-асистента. Незалежно від того чи це ми в AskYourDocs чи інший підрядник — запитайте це до підписання.
1. Який провайдер сервера і де фізично знаходяться дані?
Правильна відповідь: конкретна назва EU-провайдера (Hetzner, OVH, Contabo) і конкретний дата-центр. "Сервери в ЄС" без деталей — недостатньо. "AWS Frankfurt" — неправильна відповідь для GDPR-чутливих даних.
2. Яка модель буде встановлена і чому саме вона?
Правильна відповідь: конкретна назва (наприклад "Gemma 4 26B через Ollama") з поясненням чому ця модель підходить для вашої задачі. Якщо підрядник не може пояснити вибір моделі — він не розуміє архітектуру.
3. Хто має доступ до сервера після передачі?
Правильна відповідь: після передачі — тільки ваші адміністратори. Підрядник не повинен мати постійного доступу без вашого запиту. Підрядник що залишає собі "бекдор" для підтримки без вашого відома — юридична проблема.
4. Що відбувається з даними якщо ви припините співпрацю?
Правильна відповідь: оскільки сервер ваш або орендований на ваше ім'я — ви просто продовжуєте платити хостинг-провайдеру і система працює. Якщо сервер орендований на ім'я підрядника — вимагайте перенесення до підписання контракту.
5. Яка гарантована якість відповідей і як перевіряється?
Правильна відповідь: підрядник повинен описати процес acceptance-тестування — конкретні питання, критерії якості відповіді, що відбувається якщо якість не досягнута. Гарантії "відповідатиме добре" без метрики — порожні слова.
6. Скільки коштує оновлення документів після запуску?
Правильна відповідь: оновлення документів через адмін-панель має бути простим і безкоштовним для вас. Якщо підрядник стягує плату за кожне завантаження нового документа — це або погана архітектура або маніпуляція.
7. Що включено в ціну розгортання і що коштує додатково?
Правильна відповідь: чіткий перелік: сервер, встановлення ПЗ, завантаження документів, налаштування інтерфейсу, навчання адміністратора — що включено, а що оплачується окремо. Важливо уточнити: чи входить в ціну налаштування Telegram-бота, WhatsApp або тільки веб-чат.
8. Чи є у підрядника досвід саме з локальними LLM і GDPR?
Правильна відповідь: конкретні кейси або посилання на реальних клієнтів (навіть анонімізованих). Підрядник що "перший раз" впроваджує Ollama і при цьому обіцяє GDPR-відповідність — ризик для вашого бізнесу. Це не сфера де вчаться на вашому проекті.
Висновки
- 🏠 Власний сервер потрібен коли дані регульовані (медицина, юристи, HR, фінанси) або коли хмарний AI стає дорожчим при вашому навантаженні
- 🚫 AWS і Azure Germany — не GDPR-рішення. CLOUD Act дозволяє американським органам вимагати доступ до даних незалежно від локації серверів
- ✅ Hetzner — наш вибір за замовчуванням: EU-юрисдикція, ISO 27001, найкраще ціна/якість. Після підвищення квітень 2026 — все ще у 2.5–3x дешевше за AWS/GCP
- 💻 CPU чи GPU: CPU — якщо 30–90 секунд очікування прийнятне для внутрішнього інструменту. GPU — якщо публічний чат або більша модель з відповіддю до 10 секунд
- 💰 Реальні ціни: від €4–8/міс (CPU, Contabo/Hetzner) до €184/міс (Hetzner GEX44 GPU). Плюс €0–200/міс підтримка залежно від вибраного варіанту
- 🤝 Після запуску: ваш адміністратор або підрядник на щомісячній підтримці. Система працює автономно — документи оновлюються drag-and-drop
- ❓ 8 питань підряднику захистять від неприємних сюрпризів — особливо питання про доступ, власність сервера і acceptance-тестування
Хочете обговорити конфігурацію для вашої задачі? За 30 хвилин ми визначимо який сервер, яка модель і скільки це коштуватиме у вашому конкретному сценарії — без зайвого технічного жаргону.
Написати в Telegram →
Читайте також
⸻
Джерела: Hetzner Cloud for AI Projects 2026 · Hetzner Cloud Review 2026 · EDPB — European Data Protection Board · DSB — Datenschutzbehörde Austria · GDPR Local — EU AI Act Summary