Ollama

Огляд

Ollama — це інструмент для запуску локальних LLM-моделей. Підтримує багато форматів моделей і дозволяє легко керувати ними через CLI або вбудований інтерактивний інтерфейс.

Команда Назва Опис
ollama Інтерактивне меню Запускає інтерактивний інтерфейс Ollama в терміналі. Дозволяє швидко запускати моделі, відбирати інтеграції і відкривати додаткові інструменти без ручного введення команд. Підтримує навігацію клавішами ↑ ↓ Enter. Приклад: ollama
ollama serve Запуск сервера Запускає Ollama як API-сервіс. Після запуску API стає доступним за адресою localhost:11434. Використовується для інтеграції з програмами і бібліотеками. Приклад: ollama serve Додатково: ollama serve --debug — запуск у режимі відладки, ollama serve --port <port> — запуск на вказаному порту

Запуск моделей

Команда Назва Опис
Завантаження і запуск моделей
ollama run <model> Запуск моделі Завантажує і запускає модель у інтерактивному режимі. Якщо моделі немає локально, Ollama автоматично завантажить її. Використовується для діалогів, тестування моделей і локальної роботи з LLM. Приклад: ollama run llama3.2
ollama pull <model> Завантаження моделі Завантажує модель з реєстру Ollama у локальне сховище без її запуску. Зручно для попереднього завантаження. Перевірка завантаження: ollama list. Під час завантаження Ollama автоматично оновлюється до актуальної версії. Приклад: ollama pull gemma3
ollama pull <model> --cloud Завантаження з хмари Завантажує модель з Ollama Cloud. Доступно після авторизації або для безкоштовних моделей. Під час завантаження показується прогрес і використовується проксі-сервер для прискорення. Приклад: ollama pull mistral:7b --cloud
ollama list Список моделей Показує всі моделі, встановлені локально. Зручно для перегляду доступних моделей і їх версій. Приклад: ollama list
ollama ps Активні процеси Показує моделі, які зараз завантажені в пам'яті, а також використання CPU/GPU і обсяг ресурсів. Корисно для діагностики продуктивності. Приклад: ollama ps
ollama show <model> Перегляд інформації про модель Виводить інформацію про модель: параметри, шаблон, системний промпт і інші дані. Корисно для аналізу конфігурації. Приклад: ollama show llama3.2
Запуск інтеграцій
ollama launch Запуск інтеграцій Відкриває меню налаштування і запуску зовнішніх програм, які працюють через Ollama. Використовується для підключення IDE і AI-інструментів. Приклад: ollama launch
ollama launch <integration> Запуск конкретної інтеграції Запускає визначену інтеграцію безпосередньо без меню вибору. Підходить для швидкого запуску середовища розробки або AI-інструменту. Приклад: ollama launch codex
ollama launch <integration> --model <model> Запуск інтеграції з моделлю Дозволяє вказати конкретну модель для зовнішнього програми. Корисно, якщо використовуються кілька моделей з різними задачами. Приклад: ollama launch codex --model llama3.2
ollama cp <source> <destination> Копіювання моделі Створює копію існуючої моделі під новим ім'ям. Зручно перед зміною конфігурації або експериментів. Приклад: ollama cp llama3.2 llama3.2-custom
ollama rm <model> Видалення моделі Видаляє модель з локального сховища і звільняє місце на диску. Приклад: ollama rm llama3.2
ollama create <name> -f <Modelfile> Створення моделі Створює нову модель на основі Modelfile. Дозволяє змінювати системні інструкції, параметри, шаблони і підключати адаптери. Приклад: ollama create mario-ai -f ./Modelfile
ollama pull <model> --latest Оновлення моделі Оновлює локальну модель до останньої версії в реєстрі. Корисно для отримання безпекових патчів і покращень. Під час оновлення Ollama перевіряє доступність нової версії і показує різницю в розмірах. Приклад: ollama pull llama3.2 --latest

Інтеграції

Ollama підтримує різні IDE і інструменти для роботи з моделями.

Команда Назва Опис
ollama launch Меню інтеграцій Відкриває інтерактивне меню для вибору і запуску зовнішніх програм. Дозволяє легко підключати IDE (VS Code, Vim), редактори і AI-інструменти без складної конфігурації. Використовується вперше після встановлення Ollama. Приклад: ollama launch
ollama launch codex Запуск у VS Code Запускає інтеграцію з VS Code, відкриваючи плагін Ollama. Після запуску можна використовувати вбудовані chat-вікна, автодоповнення коду і аналіз коду з допомогою моделей. Приклад: ollama launch codex
ollama launch <integration> --model <model> Запуск з конкретною моделлю Запускає інтеграцію з вказанням конкретної моделі. Корисно при використанні кількох моделей з різними задачами (кодінг, чат, аналіз). Приклад: ollama launch codex --model qwen2.5:7b

Робота з хмарою

Команда Назва Опис
ollama signin Авторизація в хмарі Виконує вхід у обліковий запис Ollama Cloud. Вимагається для використання хмарних моделей і доступу до платного контенту в реєстрі. Після авторизації можна завантажувати пропрієтарні моделі і використовувати API. Приклад: ollama signin
ollama push <model> Публікація моделі Надає локальну модель або кастомну збірку до віддаленого реєстру. Зазвичай застосовується при поширенні власних моделей. Вимагає авторизації для публікації. Приклад: ollama push my-assistant

Вбудовані команди

Увага: Деякі команди можуть залежати від версії Ollama і активної інтеграції. Команди /set think працюють тільки з моделями, що підтримують reasoning/think режим. Вбудовані команди доступні тільки всередині ollama run, а не в звичайному CLI.

Команда Назва Опис
Допомога і документування
/? Список команд Показує список доступних вбудованих команд поточної інтерактивної сесії. Зручно використовувати як вбудовану допомогу. Приклад: /?
/help Допомога Аналог /?. Відображає детальну інформацію по вбудованих командах і параметрах. Приклад: /help
Керування сесією
/bye Вихід із сесії Завершує поточний чат з моделлю і виходить з інтерактивного режиму. Приклад: /bye
/clear Очистка контексту Повністю скидає поточний діалог і історію контексту. Після виконання модель починає новий розмову без попередніх повідомлень. Приклад: /clear
Інформація про модель
/show info Інформація про модель Відображає дані про поточну модель: ім'я, розмір, архітектуру, параметри і використовувані налаштування. Приклад: /show info
/show modelfile Показ Modelfile Виводить повний Modelfile активної моделі. Корисно для аналізу системних інструкцій, шаблонів і параметрів моделі. Приклад: /show modelfile
/show parameters Параметри моделі Показує поточні параметри генерації і налаштування виконання. Приклад: /show parameters
/show system Системний промпт Показує системну інструкцію (system prompt), яку використовує поточна модель. Приклад: /show system
/show template Шаблон запитів Відображає використовуваний шаблон формування повідомлень між користувачем і моделлю. Приклад: /show template
Форматування відповідей
/set format json JSON-режим Змушує модель генерувати відповіді в JSON-форматі. Корисно для API і автоматичної обробки даних. Приклад: /set format json
/set noformat Вимкнення форматування Повертає звичайний текстовий режим відповіді. Приклад: /set noformat
Статистика і режими
/set verbose Підсвітка Вмикає відображення технічної інформації: швидкість генерації, число токенов, час обробки і статистику роботи моделі. Приклад: /set verbose
/set quiet Тихий режим Вимикає додаткову статистику і залишає тільки відповіді моделі. Приклад: /set quiet
/set history Увімкнути історію Активує збереження історії введених команд і повідомлень. Приклад: /set history
/set nohistory Вимкнути історію Вимикає збереження історії команд поточної сесії. Приклад: /set nohistory
/set wordwrap Перенос рядків Вмикає автоматичний перенос довгих рядків у терміналі. Приклад: /set wordwrap
/set nowordwrap Вимкнути перенос Вимикає автоматичний перенос тексту. Корисно для логів і JSON. Приклад: /set nowordwrap
Режим роздумів
/set think Режим роздумів Вмикає режим додаткового внутрішнього аналізу моделі (якщо модель підтримує reasoning). Можливі рівні: low, medium, high. Приклад: /set think high
/set nothink Вимкнення роздумів Вимикає режим розширеного аналізу. Приклад: /set nothink
Параметри генерації
/set parameter temperature <value> Температура генерації Змінює температуру генерації в режимі реального часу без перезавантаження моделі. Меньші значення роблять відповіді більш передбачуваними, більші — більш креативними. Приклад: /set parameter temperature 0.7
/set parameter num_ctx <value> Розмір контексту Змінює розмір контекстного вікна моделі. Збільшення дозволяє використовувати більше тексту, але збільшує споживання пам'яті. Приклад: /set parameter num_ctx 8192
Перемикання моделей
/load <model> Перемикання моделі Завантажує іншу модель напряму під час поточної сесії без виходу з інтерактивного режиму. Приклад: /load qwen3:8b
Ctrl+C Зупинка генерації Немедленно перериває поточну генерацію відповіді моделі. Приклад: Ctrl+C
Ctrl+D Завершення введення/вихід Завершує введення багаторядкового повідомлення або завершує поточну інтерактивну сесію. Приклад: Ctrl+D

Інтерактивний режим

Команда Назва Опис
Інтерактивне меню
ollama Інтерактивний інтерфейс Запускає інтерактивний режим з графічним меню і списком моделей. Дозволяє відбирати моделі, запускати їх і використовувати вбудовані команди без знання CLI. Навігація: ↑ ↓ Enter. Приклад: ollama
ollama <model> Запуск моделі через меню Запускає конкретну модель через інтерактивне меню Ollama. Меню автоматично показує всі локально встановлені моделі. Приклад: ollama llama3.2
Інструменти
ollama launch Меню інтеграцій Відкриває меню для запуску зовнішніх програм і IDE. Приклад: ollama launch

CLI і допомога

Команда Назва Опис
ollama help Допомога Показує список доступних команд і їх параметри. Можна використовувати як загальну допомогу або для окремої команди. Приклад: ollama help run
ollama --help Загальна допомога Показує загальну відомісну інформацію і перелік команд. Приклад: ollama --help
ollama --version Версія Виводить встановлену версію Ollama. Використовується для перевірки сумісності і діагностики. Приклад: ollama --version

Сервер

Команда Назва Опис
ollama serve Запуск сервера Запускає Ollama як API-сервіс. Після запуску API стає доступним за адресою localhost:11434. Використовується для інтеграції з програмами і бібліотеками. Приклад: ollama serve
ollama serve --debug Запуск у режимі відладки Запускає сервер з відомісними повідомленнями в консолі. Корисно для діагностики проблем з моделями і інтеграціями. Приклад: ollama serve --debug
ollama serve --port <port> Запуск на вказаному порту Запускає сервер на вказаному порту замість стандартного 11434. Корисно при роботі з кількома інстансами Ollama. Приклад: ollama serve --port 11435