Огляд
Ollama — це інструмент для запуску локальних LLM-моделей. Підтримує багато форматів моделей і дозволяє легко керувати ними через CLI або вбудований інтерактивний інтерфейс.
| Команда | Назва | Опис |
|---|---|---|
ollama |
Інтерактивне меню | Запускає інтерактивний інтерфейс Ollama в терміналі. Дозволяє швидко запускати моделі, відбирати інтеграції і відкривати додаткові інструменти без ручного введення команд. Підтримує навігацію клавішами ↑ ↓ Enter. Приклад: ollama |
ollama serve |
Запуск сервера | Запускає Ollama як API-сервіс. Після запуску API стає доступним за адресою localhost:11434. Використовується для інтеграції з програмами і бібліотеками. Приклад: ollama serve
Додатково: ollama serve --debug — запуск у режимі відладки, ollama serve --port <port> — запуск на вказаному порту |
Запуск моделей
| Команда | Назва | Опис |
|---|---|---|
| Завантаження і запуск моделей | ||
ollama run <model> |
Запуск моделі | Завантажує і запускає модель у інтерактивному режимі. Якщо моделі немає локально, Ollama автоматично завантажить її. Використовується для діалогів, тестування моделей і локальної роботи з LLM. Приклад: ollama run llama3.2 |
ollama pull <model> |
Завантаження моделі | Завантажує модель з реєстру Ollama у локальне сховище без її запуску. Зручно для попереднього завантаження. Перевірка завантаження: ollama list. Під час завантаження Ollama автоматично оновлюється до актуальної версії. Приклад: ollama pull gemma3 |
ollama pull <model> --cloud |
Завантаження з хмари | Завантажує модель з Ollama Cloud. Доступно після авторизації або для безкоштовних моделей. Під час завантаження показується прогрес і використовується проксі-сервер для прискорення. Приклад: ollama pull mistral:7b --cloud |
ollama list |
Список моделей | Показує всі моделі, встановлені локально. Зручно для перегляду доступних моделей і їх версій. Приклад: ollama list |
ollama ps |
Активні процеси | Показує моделі, які зараз завантажені в пам'яті, а також використання CPU/GPU і обсяг ресурсів. Корисно для діагностики продуктивності. Приклад: ollama ps |
ollama show <model> |
Перегляд інформації про модель | Виводить інформацію про модель: параметри, шаблон, системний промпт і інші дані. Корисно для аналізу конфігурації. Приклад: ollama show llama3.2 |
| Запуск інтеграцій | ||
ollama launch |
Запуск інтеграцій | Відкриває меню налаштування і запуску зовнішніх програм, які працюють через Ollama. Використовується для підключення IDE і AI-інструментів. Приклад: ollama launch |
ollama launch <integration> |
Запуск конкретної інтеграції | Запускає визначену інтеграцію безпосередньо без меню вибору. Підходить для швидкого запуску середовища розробки або AI-інструменту. Приклад: ollama launch codex |
ollama launch <integration> --model <model> |
Запуск інтеграції з моделлю | Дозволяє вказати конкретну модель для зовнішнього програми. Корисно, якщо використовуються кілька моделей з різними задачами. Приклад: ollama launch codex --model llama3.2 |
ollama cp <source> <destination> |
Копіювання моделі | Створює копію існуючої моделі під новим ім'ям. Зручно перед зміною конфігурації або експериментів. Приклад: ollama cp llama3.2 llama3.2-custom |
ollama rm <model> |
Видалення моделі | Видаляє модель з локального сховища і звільняє місце на диску. Приклад: ollama rm llama3.2 |
ollama create <name> -f <Modelfile> |
Створення моделі | Створює нову модель на основі Modelfile. Дозволяє змінювати системні інструкції, параметри, шаблони і підключати адаптери. Приклад: ollama create mario-ai -f ./Modelfile |
ollama pull <model> --latest |
Оновлення моделі | Оновлює локальну модель до останньої версії в реєстрі. Корисно для отримання безпекових патчів і покращень. Під час оновлення Ollama перевіряє доступність нової версії і показує різницю в розмірах. Приклад: ollama pull llama3.2 --latest |
Інтеграції
Ollama підтримує різні IDE і інструменти для роботи з моделями.
| Команда | Назва | Опис |
|---|---|---|
ollama launch |
Меню інтеграцій | Відкриває інтерактивне меню для вибору і запуску зовнішніх програм. Дозволяє легко підключати IDE (VS Code, Vim), редактори і AI-інструменти без складної конфігурації. Використовується вперше після встановлення Ollama. Приклад: ollama launch |
ollama launch codex |
Запуск у VS Code | Запускає інтеграцію з VS Code, відкриваючи плагін Ollama. Після запуску можна використовувати вбудовані chat-вікна, автодоповнення коду і аналіз коду з допомогою моделей. Приклад: ollama launch codex |
ollama launch <integration> --model <model> |
Запуск з конкретною моделлю | Запускає інтеграцію з вказанням конкретної моделі. Корисно при використанні кількох моделей з різними задачами (кодінг, чат, аналіз). Приклад: ollama launch codex --model qwen2.5:7b |
Робота з хмарою
| Команда | Назва | Опис |
|---|---|---|
ollama signin |
Авторизація в хмарі | Виконує вхід у обліковий запис Ollama Cloud. Вимагається для використання хмарних моделей і доступу до платного контенту в реєстрі. Після авторизації можна завантажувати пропрієтарні моделі і використовувати API. Приклад: ollama signin |
ollama push <model> |
Публікація моделі | Надає локальну модель або кастомну збірку до віддаленого реєстру. Зазвичай застосовується при поширенні власних моделей. Вимагає авторизації для публікації. Приклад: ollama push my-assistant |
Вбудовані команди
Увага: Деякі команди можуть залежати від версії Ollama і активної інтеграції. Команди /set think працюють тільки з моделями, що підтримують reasoning/think режим. Вбудовані команди доступні тільки всередині ollama run, а не в звичайному CLI.
| Команда | Назва | Опис |
|---|---|---|
| Допомога і документування | ||
/? |
Список команд | Показує список доступних вбудованих команд поточної інтерактивної сесії. Зручно використовувати як вбудовану допомогу. Приклад: /? |
/help |
Допомога | Аналог /?. Відображає детальну інформацію по вбудованих командах і параметрах. Приклад: /help |
| Керування сесією | ||
/bye |
Вихід із сесії | Завершує поточний чат з моделлю і виходить з інтерактивного режиму. Приклад: /bye |
/clear |
Очистка контексту | Повністю скидає поточний діалог і історію контексту. Після виконання модель починає новий розмову без попередніх повідомлень. Приклад: /clear |
| Інформація про модель | ||
/show info |
Інформація про модель | Відображає дані про поточну модель: ім'я, розмір, архітектуру, параметри і використовувані налаштування. Приклад: /show info |
/show modelfile |
Показ Modelfile | Виводить повний Modelfile активної моделі. Корисно для аналізу системних інструкцій, шаблонів і параметрів моделі. Приклад: /show modelfile |
/show parameters |
Параметри моделі | Показує поточні параметри генерації і налаштування виконання. Приклад: /show parameters |
/show system |
Системний промпт | Показує системну інструкцію (system prompt), яку використовує поточна модель. Приклад: /show system |
/show template |
Шаблон запитів | Відображає використовуваний шаблон формування повідомлень між користувачем і моделлю. Приклад: /show template |
| Форматування відповідей | ||
/set format json |
JSON-режим | Змушує модель генерувати відповіді в JSON-форматі. Корисно для API і автоматичної обробки даних. Приклад: /set format json |
/set noformat |
Вимкнення форматування | Повертає звичайний текстовий режим відповіді. Приклад: /set noformat |
| Статистика і режими | ||
/set verbose |
Підсвітка | Вмикає відображення технічної інформації: швидкість генерації, число токенов, час обробки і статистику роботи моделі. Приклад: /set verbose |
/set quiet |
Тихий режим | Вимикає додаткову статистику і залишає тільки відповіді моделі. Приклад: /set quiet |
/set history |
Увімкнути історію | Активує збереження історії введених команд і повідомлень. Приклад: /set history |
/set nohistory |
Вимкнути історію | Вимикає збереження історії команд поточної сесії. Приклад: /set nohistory |
/set wordwrap |
Перенос рядків | Вмикає автоматичний перенос довгих рядків у терміналі. Приклад: /set wordwrap |
/set nowordwrap |
Вимкнути перенос | Вимикає автоматичний перенос тексту. Корисно для логів і JSON. Приклад: /set nowordwrap |
| Режим роздумів | ||
/set think |
Режим роздумів | Вмикає режим додаткового внутрішнього аналізу моделі (якщо модель підтримує reasoning). Можливі рівні: low, medium, high. Приклад: /set think high |
/set nothink |
Вимкнення роздумів | Вимикає режим розширеного аналізу. Приклад: /set nothink |
| Параметри генерації | ||
/set parameter temperature <value> |
Температура генерації | Змінює температуру генерації в режимі реального часу без перезавантаження моделі. Меньші значення роблять відповіді більш передбачуваними, більші — більш креативними. Приклад: /set parameter temperature 0.7 |
/set parameter num_ctx <value> |
Розмір контексту | Змінює розмір контекстного вікна моделі. Збільшення дозволяє використовувати більше тексту, але збільшує споживання пам'яті. Приклад: /set parameter num_ctx 8192 |
| Перемикання моделей | ||
/load <model> |
Перемикання моделі | Завантажує іншу модель напряму під час поточної сесії без виходу з інтерактивного режиму. Приклад: /load qwen3:8b |
Ctrl+C |
Зупинка генерації | Немедленно перериває поточну генерацію відповіді моделі. Приклад: Ctrl+C |
Ctrl+D |
Завершення введення/вихід | Завершує введення багаторядкового повідомлення або завершує поточну інтерактивну сесію. Приклад: Ctrl+D |
Інтерактивний режим
| Команда | Назва | Опис |
|---|---|---|
| Інтерактивне меню | ||
ollama |
Інтерактивний інтерфейс | Запускає інтерактивний режим з графічним меню і списком моделей. Дозволяє відбирати моделі, запускати їх і використовувати вбудовані команди без знання CLI. Навігація: ↑ ↓ Enter. Приклад: ollama |
ollama <model> |
Запуск моделі через меню | Запускає конкретну модель через інтерактивне меню Ollama. Меню автоматично показує всі локально встановлені моделі. Приклад: ollama llama3.2 |
| Інструменти | ||
ollama launch |
Меню інтеграцій | Відкриває меню для запуску зовнішніх програм і IDE. Приклад: ollama launch |
CLI і допомога
| Команда | Назва | Опис |
|---|---|---|
ollama help |
Допомога | Показує список доступних команд і їх параметри. Можна використовувати як загальну допомогу або для окремої команди. Приклад: ollama help run |
ollama --help |
Загальна допомога | Показує загальну відомісну інформацію і перелік команд. Приклад: ollama --help |
ollama --version |
Версія | Виводить встановлену версію Ollama. Використовується для перевірки сумісності і діагностики. Приклад: ollama --version |
Сервер
| Команда | Назва | Опис |
|---|---|---|
ollama serve |
Запуск сервера | Запускає Ollama як API-сервіс. Після запуску API стає доступним за адресою localhost:11434. Використовується для інтеграції з програмами і бібліотеками. Приклад: ollama serve |
ollama serve --debug |
Запуск у режимі відладки | Запускає сервер з відомісними повідомленнями в консолі. Корисно для діагностики проблем з моделями і інтеграціями. Приклад: ollama serve --debug |
ollama serve --port <port> |
Запуск на вказаному порту | Запускає сервер на вказаному порту замість стандартного 11434. Корисно при роботі з кількома інстансами Ollama. Приклад: ollama serve --port 11435 |