Ollama - ithelper.pro

Огляд

Ollama — це інструмент для запуску локальних LLM-моделей. Підтримує багато форматів моделей і дозволяє легко керувати ними через CLI або вбудований інтерактивний інтерфейс.

Команда	Назва	Опис
`ollama`	Інтерактивне меню	Запускає інтерактивний інтерфейс Ollama в терміналі. Дозволяє швидко запускати моделі, відбирати інтеграції і відкривати додаткові інструменти без ручного введення команд. Підтримує навігацію клавішами ↑ ↓ Enter. Приклад: `ollama`
`ollama serve`	Запуск сервера	Запускає Ollama як API-сервіс. Після запуску API стає доступним за адресою `localhost:11434`. Використовується для інтеграції з програмами і бібліотеками. Приклад: `ollama serve` Додатково: `ollama serve --debug` — запуск у режимі відладки, `ollama serve --port <port>` — запуск на вказаному порту

Запуск моделей

Команда	Назва	Опис
Завантаження і запуск моделей
`ollama run <model>`	Запуск моделі	Завантажує і запускає модель у інтерактивному режимі. Якщо моделі немає локально, Ollama автоматично завантажить її. Використовується для діалогів, тестування моделей і локальної роботи з LLM. Приклад: `ollama run llama3.2`
`ollama pull <model>`	Завантаження моделі	Завантажує модель з реєстру Ollama у локальне сховище без її запуску. Зручно для попереднього завантаження. Перевірка завантаження: `ollama list`. Під час завантаження Ollama автоматично оновлюється до актуальної версії. Приклад: `ollama pull gemma3`
`ollama pull <model> --cloud`	Завантаження з хмари	Завантажує модель з Ollama Cloud. Доступно після авторизації або для безкоштовних моделей. Під час завантаження показується прогрес і використовується проксі-сервер для прискорення. Приклад: `ollama pull mistral:7b --cloud`
`ollama list`	Список моделей	Показує всі моделі, встановлені локально. Зручно для перегляду доступних моделей і їх версій. Приклад: `ollama list`
`ollama ps`	Активні процеси	Показує моделі, які зараз завантажені в пам'яті, а також використання CPU/GPU і обсяг ресурсів. Корисно для діагностики продуктивності. Приклад: `ollama ps`
`ollama show <model>`	Перегляд інформації про модель	Виводить інформацію про модель: параметри, шаблон, системний промпт і інші дані. Корисно для аналізу конфігурації. Приклад: `ollama show llama3.2`
Запуск інтеграцій
`ollama launch`	Запуск інтеграцій	Відкриває меню налаштування і запуску зовнішніх програм, які працюють через Ollama. Використовується для підключення IDE і AI-інструментів. Приклад: `ollama launch`
`ollama launch <integration>`	Запуск конкретної інтеграції	Запускає визначену інтеграцію безпосередньо без меню вибору. Підходить для швидкого запуску середовища розробки або AI-інструменту. Приклад: `ollama launch codex`
`ollama launch <integration> --model <model>`	Запуск інтеграції з моделлю	Дозволяє вказати конкретну модель для зовнішнього програми. Корисно, якщо використовуються кілька моделей з різними задачами. Приклад: `ollama launch codex --model llama3.2`
`ollama cp <source> <destination>`	Копіювання моделі	Створює копію існуючої моделі під новим ім'ям. Зручно перед зміною конфігурації або експериментів. Приклад: `ollama cp llama3.2 llama3.2-custom`
`ollama rm <model>`	Видалення моделі	Видаляє модель з локального сховища і звільняє місце на диску. Приклад: `ollama rm llama3.2`
`ollama create <name> -f <Modelfile>`	Створення моделі	Створює нову модель на основі `Modelfile`. Дозволяє змінювати системні інструкції, параметри, шаблони і підключати адаптери. Приклад: `ollama create mario-ai -f ./Modelfile`
`ollama pull <model> --latest`	Оновлення моделі	Оновлює локальну модель до останньої версії в реєстрі. Корисно для отримання безпекових патчів і покращень. Під час оновлення Ollama перевіряє доступність нової версії і показує різницю в розмірах. Приклад: `ollama pull llama3.2 --latest`

Інтеграції

Ollama підтримує різні IDE і інструменти для роботи з моделями.

Команда	Назва	Опис
`ollama launch`	Меню інтеграцій	Відкриває інтерактивне меню для вибору і запуску зовнішніх програм. Дозволяє легко підключати IDE (VS Code, Vim), редактори і AI-інструменти без складної конфігурації. Використовується вперше після встановлення Ollama. Приклад: `ollama launch`
`ollama launch codex`	Запуск у VS Code	Запускає інтеграцію з VS Code, відкриваючи плагін Ollama. Після запуску можна використовувати вбудовані chat-вікна, автодоповнення коду і аналіз коду з допомогою моделей. Приклад: `ollama launch codex`
`ollama launch <integration> --model <model>`	Запуск з конкретною моделлю	Запускає інтеграцію з вказанням конкретної моделі. Корисно при використанні кількох моделей з різними задачами (кодінг, чат, аналіз). Приклад: `ollama launch codex --model qwen2.5:7b`

Робота з хмарою

Команда	Назва	Опис
`ollama signin`	Авторизація в хмарі	Виконує вхід у обліковий запис Ollama Cloud. Вимагається для використання хмарних моделей і доступу до платного контенту в реєстрі. Після авторизації можна завантажувати пропрієтарні моделі і використовувати API. Приклад: `ollama signin`
`ollama push <model>`	Публікація моделі	Надає локальну модель або кастомну збірку до віддаленого реєстру. Зазвичай застосовується при поширенні власних моделей. Вимагає авторизації для публікації. Приклад: `ollama push my-assistant`

Вбудовані команди

Увага: Деякі команди можуть залежати від версії Ollama і активної інтеграції. Команди /set think працюють тільки з моделями, що підтримують reasoning/think режим. Вбудовані команди доступні тільки всередині ollama run, а не в звичайному CLI.

Команда	Назва	Опис
Допомога і документування
`/?`	Список команд	Показує список доступних вбудованих команд поточної інтерактивної сесії. Зручно використовувати як вбудовану допомогу. Приклад: `/?`
`/help`	Допомога	Аналог `/?`. Відображає детальну інформацію по вбудованих командах і параметрах. Приклад: `/help`
Керування сесією
`/bye`	Вихід із сесії	Завершує поточний чат з моделлю і виходить з інтерактивного режиму. Приклад: `/bye`
`/clear`	Очистка контексту	Повністю скидає поточний діалог і історію контексту. Після виконання модель починає новий розмову без попередніх повідомлень. Приклад: `/clear`
Інформація про модель
`/show info`	Інформація про модель	Відображає дані про поточну модель: ім'я, розмір, архітектуру, параметри і використовувані налаштування. Приклад: `/show info`
`/show modelfile`	Показ Modelfile	Виводить повний Modelfile активної моделі. Корисно для аналізу системних інструкцій, шаблонів і параметрів моделі. Приклад: `/show modelfile`
`/show parameters`	Параметри моделі	Показує поточні параметри генерації і налаштування виконання. Приклад: `/show parameters`
`/show system`	Системний промпт	Показує системну інструкцію (system prompt), яку використовує поточна модель. Приклад: `/show system`
`/show template`	Шаблон запитів	Відображає використовуваний шаблон формування повідомлень між користувачем і моделлю. Приклад: `/show template`
Форматування відповідей
`/set format json`	JSON-режим	Змушує модель генерувати відповіді в JSON-форматі. Корисно для API і автоматичної обробки даних. Приклад: `/set format json`
`/set noformat`	Вимкнення форматування	Повертає звичайний текстовий режим відповіді. Приклад: `/set noformat`
Статистика і режими
`/set verbose`	Підсвітка	Вмикає відображення технічної інформації: швидкість генерації, число токенов, час обробки і статистику роботи моделі. Приклад: `/set verbose`
`/set quiet`	Тихий режим	Вимикає додаткову статистику і залишає тільки відповіді моделі. Приклад: `/set quiet`
`/set history`	Увімкнути історію	Активує збереження історії введених команд і повідомлень. Приклад: `/set history`
`/set nohistory`	Вимкнути історію	Вимикає збереження історії команд поточної сесії. Приклад: `/set nohistory`
`/set wordwrap`	Перенос рядків	Вмикає автоматичний перенос довгих рядків у терміналі. Приклад: `/set wordwrap`
`/set nowordwrap`	Вимкнути перенос	Вимикає автоматичний перенос тексту. Корисно для логів і JSON. Приклад: `/set nowordwrap`
Режим роздумів
`/set think`	Режим роздумів	Вмикає режим додаткового внутрішнього аналізу моделі (якщо модель підтримує reasoning). Можливі рівні: low, medium, high. Приклад: `/set think high`
`/set nothink`	Вимкнення роздумів	Вимикає режим розширеного аналізу. Приклад: `/set nothink`
Параметри генерації
`/set parameter temperature <value>`	Температура генерації	Змінює температуру генерації в режимі реального часу без перезавантаження моделі. Меньші значення роблять відповіді більш передбачуваними, більші — більш креативними. Приклад: `/set parameter temperature 0.7`
`/set parameter num_ctx <value>`	Розмір контексту	Змінює розмір контекстного вікна моделі. Збільшення дозволяє використовувати більше тексту, але збільшує споживання пам'яті. Приклад: `/set parameter num_ctx 8192`
Перемикання моделей
`/load <model>`	Перемикання моделі	Завантажує іншу модель напряму під час поточної сесії без виходу з інтерактивного режиму. Приклад: `/load qwen3:8b`
`Ctrl+C`	Зупинка генерації	Немедленно перериває поточну генерацію відповіді моделі. Приклад: Ctrl+C
`Ctrl+D`	Завершення введення/вихід	Завершує введення багаторядкового повідомлення або завершує поточну інтерактивну сесію. Приклад: Ctrl+D

Інтерактивний режим

Команда	Назва	Опис
Інтерактивне меню
`ollama`	Інтерактивний інтерфейс	Запускає інтерактивний режим з графічним меню і списком моделей. Дозволяє відбирати моделі, запускати їх і використовувати вбудовані команди без знання CLI. Навігація: ↑ ↓ Enter. Приклад: `ollama`
`ollama <model>`	Запуск моделі через меню	Запускає конкретну модель через інтерактивне меню Ollama. Меню автоматично показує всі локально встановлені моделі. Приклад: `ollama llama3.2`
Інструменти
`ollama launch`	Меню інтеграцій	Відкриває меню для запуску зовнішніх програм і IDE. Приклад: `ollama launch`

CLI і допомога

Команда	Назва	Опис
`ollama help`	Допомога	Показує список доступних команд і їх параметри. Можна використовувати як загальну допомогу або для окремої команди. Приклад: `ollama help run`
`ollama --help`	Загальна допомога	Показує загальну відомісну інформацію і перелік команд. Приклад: `ollama --help`
`ollama --version`	Версія	Виводить встановлену версію Ollama. Використовується для перевірки сумісності і діагностики. Приклад: `ollama --version`

Сервер

Команда	Назва	Опис
`ollama serve`	Запуск сервера	Запускає Ollama як API-сервіс. Після запуску API стає доступним за адресою `localhost:11434`. Використовується для інтеграції з програмами і бібліотеками. Приклад: `ollama serve`
`ollama serve --debug`	Запуск у режимі відладки	Запускає сервер з відомісними повідомленнями в консолі. Корисно для діагностики проблем з моделями і інтеграціями. Приклад: `ollama serve --debug`
`ollama serve --port <port>`	Запуск на вказаному порту	Запускає сервер на вказаному порту замість стандартного 11434. Корисно при роботі з кількома інстансами Ollama. Приклад: `ollama serve --port 11435`