Безпека даних — AI без витоків

Як обрати сервер для AI-асистента: гайд для нетехнічного керівника 2026

Переглядів: 16 Опубліковано: 14.06.2026
🇺🇦 UK 🇺🇸 EN 🇩🇪 DE 🇪🇸 ES
Як обрати сервер для AI-асистента: гайд для нетехнічного  керівника 2026

Директор юридичної фірми у Відні питає: "Ми хочемо self-hosted AI — що купити і де розмістити?" Більшість статей на це питання або надто технічні або написані для розробників. Цей гайд — для керівника який приймає рішення але не хоче розбиратись у специфікаціях GPU. Тут є все що потрібно знати: яких провайдерів обирати, скільки платити і що запитати у підрядника перед підписанням контракту.

⚡ Коротко для тих хто поспішає

  • 🏠 Власний сервер потрібен коли дані не можуть покидати вашу інфраструктуру — медицина, юристи, HR, фінанси
  • 🚫 AWS і Azure Germany не вирішують GDPR — це американські компанії під CLOUD Act незалежно від розташування серверів
  • Безпечні провайдери для ЄС: Hetzner (Нюрнберг/Фінляндія), OVH (Страсбург), Contabo (Мюнхен)
  • 💻 CPU чи GPU: CPU — для внутрішніх інструментів де 30–90 сек прийнятно. GPU — для публічного чату або якщо потрібно <10 сек
  • 💰 Реальна вартість: від €4–8/міс (CPU, малий бізнес) до €184/міс (GPU для продакшн AI)
  • 🤝 Після запуску: підрядник налаштовує, ви або ваш адміністратор керує. Або підрядник бере підтримку на себе

📚 Зміст

Навіщо взагалі потрібен власний сервер

Власний сервер — не самоціль. Це наслідок конкретної вимоги: ваші дані не можуть оброблятись на чужій інфраструктурі. Якщо такої вимоги немає — хмарний AI може бути дешевшим і простішим варіантом.

Більшість наших клієнтів у AskYourDocs приходять з конкретним питанням — не "хочу власний сервер" а "чи можемо ми законно використовувати хмарний AI?" Відповідь визначає чи потрібен сервер взагалі.

Три причини обирати власний сервер

Причина 1: Юридична вимога. Медичні дані, адвокатська таємниця, фінансові записи клієнтів — все це регулюється так що передача стороннім AI-провайдерам або неможлива або вимагає окремої дозвільної роботи вартістю тисячі євро. Власний сервер вирішує це технічно: дані фізично не покидають вашу інфраструктуру.

Причина 2: Передбачувана вартість. Хмарний AI коштує "за запит" — ви не знаєте наперед рахунок наступного місяця. Власний сервер: фіксований рахунок незалежно від кількості запитів. При 500+ запитів на день власний сервер стає дешевшим ніж хмарний API.

Причина 3: Незалежність. OpenAI може змінити ціни, умови або взагалі відкликати доступ. Ваша модель на вашому сервері: не змінюється без вашого відома, не залежить від рішень американської компанії і працює навіть якщо провайдер AI виходить з ладу.

Коли власний сервер НЕ потрібен: якщо ви тільки починаєте, документи не містять персональних даних і навантаження менше 200 запитів на день — почніть з хмарного API і перейдіть на власний сервер коли вирішите що цінність підтверджена. Ми завжди рекомендуємо стартувати з того варіанту який дозволяє швидко перевірити гіпотезу.

Чому AWS і Azure Germany не вирішують GDPR-проблему

Найпоширеніша помилка яку ми бачимо: компанія вибирає "EU region" у AWS або Azure і вважає що GDPR-проблема вирішена. Це не так. Фізичне розташування сервера і юридична юрисдикція над даними — різні речі.

Це розділ який ми вважаємо найважливішим у цій статті — і який більшість гайдів про AI-сервери ігнорують. Тому пояснимо детально і просто.

Що таке CLOUD Act і чому він стосується вашого бізнесу

У 2018 році США прийняли Clarifying Lawful Overseas Use of Data Act (CLOUD Act). Цей закон дозволяє американським правоохоронним органам вимагати від американських компаній надати доступ до будь-яких даних їхніх клієнтів — незалежно від того де фізично знаходяться сервери.

Простою мовою: уявіть що ви орендуєте сейф у банку у Франкфурті. Але цей банк — американський. Американські федеральні агенти мають право звернутись до банку в США з вимогою відкрити ваш сейф у Франкфурті — і банк зобов'язаний виконати, не повідомляючи вас. Саме так працює CLOUD Act щодо AWS, Azure і Google Cloud.

AWS EU-Central-1 (Франкфурт), Azure Germany West Central, Google Cloud Europe-West — всі ці опції розташовані фізично в ЄС, але управляються американськими компаніями. CLOUD Act застосовується до них повністю.

Чому це критично для бізнесу в Австрії і Німеччині

Австрійський регулятор DSB у справі Google Analytics (2022) встановив найсуворіший стандарт в ЄС: недостатньо стверджувати що "ймовірність доступу американських спецслужб до ваших даних низька". Потрібна технічна неможливість такого доступу. Жоден американський хмарний провайдер не може надати таку гарантію — по визначенню.

Для медичних центрів і юридичних фірм в Австрії і Німеччині це означає: AWS і Azure Germany не є прийнятним рішенням незалежно від ціни і якості продукту. Потрібен провайдер під юрисдикцією ЄС.

Провайдер Фізична локація Юрисдикція CLOUD Act Підходить для EU/AT/DE?
AWS EU-Central-1 Франкфурт, DE 🇺🇸 США ✅ Застосовується ❌ Ні
Azure Germany West Central Франкфурт, DE 🇺🇸 США ✅ Застосовується ❌ Ні
Google Cloud Europe-West Бельгія/Нідерланди 🇺🇸 США ✅ Застосовується ❌ Ні
Hetzner Нюрнберг/Фальенштайн DE, Гельсінкі FI 🇩🇪 Німеччина ❌ Не застосовується ✅ Так
OVHcloud Страсбург FR, Варшава PL 🇫🇷 Франція ❌ Не застосовується ✅ Так
Contabo Мюнхен DE, Нюрнберг DE 🇩🇪 Німеччина ❌ Не застосовується ✅ Так

Який регіон і провайдер обрати: Hetzner, OVH, Contabo

Для більшості бізнесів в AT/DE ми рекомендуємо Hetzner як перший вибір — найкраще співвідношення ціна/якість/GDPR-відповідність серед EU-провайдерів. OVH і Contabo — гідні альтернативи залежно від задачі.

Важливе оновлення: Hetzner підвищив ціни 1 квітня 2026 на 30–37% через зростання вартості серверної пам'яті (HBM для GPU). Навіть після підвищення Hetzner залишається у 2.5–3.3 рази дешевшим за AWS/GCP для еквівалентних конфігурацій.

Hetzner Online — наш вибір за замовчуванням

Hetzner Online GmbH — приватна компанія зі штаб-квартирою в Гунценхаузені, Баварія. Дата-центри в Нюрнберзі, Фальенштайні (Саксонія) і Гельсінкі. ISO 27001 сертифікований. Flat-rate тарифікація без прихованих рахунків за трафік (до 20 TB включено в EU-регіонах). Технічна підтримка — в основному через тікет-систему, без цілодобового телефону.

Ідеально для: більшості МСБ які хочуть максимум продуктивності за мінімальну ціну з гарантованою EU-юрисдикцією. Наш вибір для 90% клієнтів.

OVHcloud — французька альтернатива

OVH SAS — французька компанія (група Iliad), один з найбільших хостинг-провайдерів ЄС. Дата-центри в Страсбурзі, Рубе, Варшаві. Ширший спектр managed-послуг ніж у Hetzner. Ціни трохи вищі але є managed-рівні для тих хто не хоче керувати сервером самостійно.

Ідеально для: компаній яким потрібна більша підтримка або додаткові managed-послуги (бази даних, балансувальники навантаження). Хороша альтернатива якщо Hetzner не підходить з технічних причин.

Contabo — найдешевший CPU-варіант

Contabo GmbH — мюнхенська компанія з 2003 року, найбільша кількість CPU-ресурсів за найменшу ціну на ринку. 4 vCPU / 8 GB RAM від €4.50/місяць — це рекорд на EU-ринку. ISO 27001. Підтримка через тікети.

Важливо про GPU у Contabo: їхні GPU-сервери орієнтовані на enterprise-сегмент (NVIDIA H100, L40S) і починаються від $790/місяць — не підходять для МСБ AI-задач. Для GPU-сервера обирайте Hetzner або Scaleway.

Ідеально для: CPU-only розгортання малого бізнесу де ціна критична і GPU не потрібен.

Провайдер CPU VPS від GPU сервер від Локація Підтримка Найкраще для
Hetzner ⭐ €3.49/міс €184/міс (RTX 4000 Ada 20 GB) DE, FI Тікет Більшість проектів — CPU і GPU
OVHcloud €3.99/міс від €100/міс FR, PL Тікет + телефон Managed-послуги, більша підтримка
Contabo €4.50/міс від $790/міс (H100) DE Тікет CPU-only, максимальна дешевизна
Scaleway €3.99/міс від €150/міс FR Тікет Альтернатива для GPU у Франції

CPU чи GPU: що насправді важливо і коли GPU необхідний

GPU — це не "краще" чи "потужніше". GPU означає "швидше". CPU означає "повільніше але дешевше". Питання в тому чи прийнятна для вашого сценарію відповідь за 30–90 секунд замість 5–10 секунд. Для більшості внутрішніх інструментів — прийнятна.

Це питання яке ми пояснюємо на кожній першій зустрічі з клієнтом. Більшість керівників думають що GPU потрібен обов'язково. Насправді — залежить від того хто чекає відповіді і скільки готовий чекати.

Проста аналогія

CPU — це досвідчений старший юрист: думає методично, дає точну відповідь, але потребує більше часу. GPU — це ціла команда паралельних асистентів: відповідають майже одночасно завдяки масовому паралелізму. Для документа де відповідь однакова в обох випадках — питання тільки в часі очікування.

Коли CPU достатньо

Коли GPU обов'язковий

Сценарій CPU достатньо? Рекомендація
Внутрішній FAQ для 5–10 співробітників ✅ Так CPU-сервер, Llama 3.2 8B або Qwen3 14B
Публічний чат на сайті клініки ❌ Ні GPU 16 GB, Gemma 4 26B або Mistral Small 3
Telegram-бот для внутрішньої команди ✅ Так (якщо відповідь за 60 сек ок) CPU або GPU залежно від терпимості до очікування
Юридична фірма, пошук по договорах ✅ Так для внутрішнього CPU для початку, GPU якщо хочете Llama 3.3 70B
Медичний центр, відповіді пацієнтам ❌ Ні GPU обов'язковий — пацієнт чекає в реальному часі

Яка конфігурація сервера підходить для вашого масштабу

Три параметри визначають потрібну конфігурацію: скільки документів у системі, скільки запитів на день і яка модель потрібна для якості відповідей. Решта — наслідки цих трьох.

Ми не рекомендуємо "мінімальні вимоги" без контексту — це безглуздо. Натомість ось чотири типових сценарії які ми бачимо у клієнтів.

Сценарій Документів Запитів/день Конфігурація Модель Провайдер
Старт / тест
Малий офіс, внутрішній FAQ
до 200 до 50 CPU-only
4 vCPU / 16 GB RAM / 100 GB SSD
Llama 3.2 8B або Qwen3 14B Contabo або Hetzner CX
Продакшн без GPU
Внутрішній інструмент компанії
200–1000 50–200 CPU-only
8 vCPU / 32 GB RAM / 200 GB SSD
Qwen3 14B або Llama 3.3 70B (повільно) Hetzner CPX або Contabo VPS XL
Продакшн з GPU
Публічний чат, клієнти/пацієнти
500–5000 200–500 GPU 16–20 GB
32–64 GB RAM / 500 GB SSD
Gemma 4 26B або Mistral Small 3 Hetzner GEX44 (€184/міс)
Висока якість
Юрфірма, медичний центр, максимальна точність
1000+ 200–500 GPU 48 GB або 2×GPU
128 GB RAM / 1 TB SSD
Llama 3.3 70B Q4 Hetzner Dedicated або власний сервер

Наша порада для старту: починайте з CPU-only конфігурації і реальним навантаженням 2–4 тижні. Якщо швидкість не влаштовує — перехід на GPU займає 1 день і документи вже в системі. Переплачувати за GPU відразу без підтвердження потреби — невиправдано.

Окремо про RAM і диск

RAM: модель повністю завантажується в пам'ять. Llama 3.2 8B потребує ~6 GB, Gemma 4 26B — ~15 GB, Llama 3.3 70B — ~43 GB. Завжди беріть RAM з запасом ~30% для операційної системи і бази даних. Мало RAM = модель частково на диску = дуже повільно.

Диск: самі моделі займають від 5 до 43 GB. Ваші документи — зазвичай 1–10 GB навіть для великих архівів (текст дуже компактний). Векторна база (pgvector) — ще кілька GB. 200 GB SSD — достатньо для більшості МСБ.

Скільки коштує сервер щомісяця реально

"Скільки коштує сервер?" — питання без відповіді без контексту. Правильне питання: "Скільки коштує сервер для моїх задач порівняно з хмарним AI?" Ось чесне порівняння.

Ціни актуальні на червень 2026. Hetzner підвищив ціни 1 квітня 2026 на 30–37% — але залишається найдешевшим GDPR-відповідним EU-провайдером для AI-задач.

Актуальні ціни Hetzner (після підвищення квітень 2026)

Конфігурація Specs Ціна/міс Підходить для
CX23 (CPU) 2 vCPU / 4 GB RAM / 40 GB SSD €3.49 Тільки тести, мінімальне навантаження
CX33 (CPU) 4 vCPU / 8 GB RAM / 80 GB SSD €7.99 Маленька модель, до 20 запитів/день
CX43 (CPU) 8 vCPU / 16 GB RAM / 160 GB SSD ~€18 Qwen3 14B, до 50 запитів/день
CPX51 (CPU) 16 vCPU / 32 GB RAM / 360 GB SSD ~€45 Qwen3 14B швидко або Llama 70B повільно
GEX44 (GPU) ⭐ Intel Core i5 / 64 GB RAM / NVIDIA RTX 4000 Ada 20 GB €184 Gemma 4 26B або Mistral Small 3, до 500 запитів/день

Порівняння з хмарними альтернативами

Варіант Вартість на місяць GDPR Примітки
OpenAI GPT-4o mini API (500 запитів/день) ~$12–24 ⚠️ Ризик Дешево але дані в США
OpenAI GPT-4o API (500 запитів/день) ~$100–200 ⚠️ Ризик Дорого і дані в США
Hetzner CPU + Llama 3.2 8B €7–18 ✅ Повна Повільно (~60 сек), але безпечно і дешево
Hetzner GPU GEX44 + Gemma 4 26B €184 ✅ Повна 5–8 сек відповідь, необмежена кількість запитів
AWS/Azure GPU еквівалент $400–600 ❌ CLOUD Act 2.5–3x дорожче за Hetzner

Приховані витрати яких не видно в рекламі


Хто відповідає за сервер після запуску — і що це вам коштує

Найчастіше питання після демо: "А хто потім це все обслуговує?" Відповідь проста: або ваш адміністратор після навчання, або підрядник за щомісячну плату. Третього не дано.

"Сервер" звучить страшно для нетехнічного керівника. На практиці — після правильного налаштування AI-асистент на сервері вимагає набагато менше уваги ніж більшість думає.

Що взагалі потрібно "обслуговувати" після запуску

Є чотири речі які потребують уваги:

Два варіанти після передачі системи

Варіант А: ваш адміністратор керує самостійно. Після передачі проекту ми навчаємо одну людину з вашої команди — зазвичай 2–3 години. Вона може: завантажувати документи, перезапускати сервіс при потребі, відповідати на питання команди. Для більш складних задач (оновлення, налаштування нового інтерфейсу) — можна звернутись до нас разово.

Варіант Б: підрядник на щомісячній підтримці. Ми або інший підрядник повністю берете технічну відповідальність: моніторинг, оновлення, реагування на збої, консультації. Коштує від $50 до $200/місяць залежно від обсягу. Підходить якщо в компанії немає IT-спеціаліста.

Варіант А: самостійно Варіант Б: підрядник
Вартість $0/міс (тільки час адміністратора) $50–200/міс
Хто потрібен 1 людина з базовим розумінням IT Нікого — підрядник сам
Час реакції при збої Як швидко адміністратор відповість SLA — зазвичай 2–4 години в робочий час
Підходить для Компанії з IT-спеціалістом або активним адміністратором Компанії без IT або з критичними вимогами до uptime

Наша рекомендація: для більшості МСБ Варіант А після короткого навчання — цілком достатній. Варіант Б виправданий для публічних сервісів (чат на сайті клініки) де downtime напряму впливає на клієнтський досвід.

Що запитати у підрядника перед підписанням контракту

Більшість керівників не знають що запитати у підрядника — і підписують контракт не розуміючи ключових речей. Ці вісім питань захистять вас від неприємних сюрпризів після запуску.

Цей розділ — для тих хто збирається підписати контракт на впровадження AI-асистента. Незалежно від того чи це ми в AskYourDocs чи інший підрядник — запитайте це до підписання.

1. Який провайдер сервера і де фізично знаходяться дані?

Правильна відповідь: конкретна назва EU-провайдера (Hetzner, OVH, Contabo) і конкретний дата-центр. "Сервери в ЄС" без деталей — недостатньо. "AWS Frankfurt" — неправильна відповідь для GDPR-чутливих даних.

2. Яка модель буде встановлена і чому саме вона?

Правильна відповідь: конкретна назва (наприклад "Gemma 4 26B через Ollama") з поясненням чому ця модель підходить для вашої задачі. Якщо підрядник не може пояснити вибір моделі — він не розуміє архітектуру.

3. Хто має доступ до сервера після передачі?

Правильна відповідь: після передачі — тільки ваші адміністратори. Підрядник не повинен мати постійного доступу без вашого запиту. Підрядник що залишає собі "бекдор" для підтримки без вашого відома — юридична проблема.

4. Що відбувається з даними якщо ви припините співпрацю?

Правильна відповідь: оскільки сервер ваш або орендований на ваше ім'я — ви просто продовжуєте платити хостинг-провайдеру і система працює. Якщо сервер орендований на ім'я підрядника — вимагайте перенесення до підписання контракту.

5. Яка гарантована якість відповідей і як перевіряється?

Правильна відповідь: підрядник повинен описати процес acceptance-тестування — конкретні питання, критерії якості відповіді, що відбувається якщо якість не досягнута. Гарантії "відповідатиме добре" без метрики — порожні слова.

6. Скільки коштує оновлення документів після запуску?

Правильна відповідь: оновлення документів через адмін-панель має бути простим і безкоштовним для вас. Якщо підрядник стягує плату за кожне завантаження нового документа — це або погана архітектура або маніпуляція.

7. Що включено в ціну розгортання і що коштує додатково?

Правильна відповідь: чіткий перелік: сервер, встановлення ПЗ, завантаження документів, налаштування інтерфейсу, навчання адміністратора — що включено, а що оплачується окремо. Важливо уточнити: чи входить в ціну налаштування Telegram-бота, WhatsApp або тільки веб-чат.

8. Чи є у підрядника досвід саме з локальними LLM і GDPR?

Правильна відповідь: конкретні кейси або посилання на реальних клієнтів (навіть анонімізованих). Підрядник що "перший раз" впроваджує Ollama і при цьому обіцяє GDPR-відповідність — ризик для вашого бізнесу. Це не сфера де вчаться на вашому проекті.

Висновки

Хочете обговорити конфігурацію для вашої задачі? За 30 хвилин ми визначимо який сервер, яка модель і скільки це коштуватиме у вашому конкретному сценарії — без зайвого технічного жаргону.

Написати в Telegram →

Читайте також

Джерела: Hetzner Cloud for AI Projects 2026 · Hetzner Cloud Review 2026 · EDPB — European Data Protection Board · DSB — Datenschutzbehörde Austria · GDPR Local — EU AI Act Summary