Обзор
Ollama — это инструмент для запуска локальных LLM-моделей. Поддерживает множество форматов моделей и позволяет легко управлять ими через CLI или встроенный интерактивный интерфейс.
| Команда | Название | Описание |
|---|---|---|
ollama |
Интерактивное меню | Запускает интерактивный интерфейс Ollama в терминале. Позволяет быстро запускать модели, выбирать интеграции и открывать дополнительные инструменты без ручного ввода команд. Поддерживает навигацию клавишами ↑ ↓ Enter. Пример: ollama |
ollama serve |
Запуск сервера | Запускает Ollama как API-сервис. После запуска API становится доступным по адресу localhost:11434. Используется для интеграции с приложениями и библиотеками. Пример: ollama serve
Дополнительно: ollama serve --debug — запуск в отладочном режиме, ollama serve --port <port> — запуск на указанном порту |
Запуск моделей
| Команда | Название | Описание |
|---|---|---|
| Загрузка и запуск моделей | ||
ollama run <model> |
Запуск модели | Загружает и запускает модель в интерактивном режиме. Если модели нет локально, Ollama автоматически скачает её. Используется для диалогов, тестирования моделей и локальной работы с LLM. Пример: ollama run llama3.2 |
ollama pull <model> |
Загрузка модели | Скачивает модель из реестра Ollama в локальное хранилище без её запуска. Удобно для предварительной загрузки. Проверка скачивания: ollama list. При скачивании Ollama автоматически обновляется до актуальной версии. Пример: ollama pull gemma3 |
ollama pull <model> --cloud |
Загрузка из облака | Скачивает модель из Ollama Cloud. Доступно после авторизации или для бесплатных моделей. При скачивании показывается прогресс и используется прокси-сервер для ускорения. Пример: ollama pull mistral:7b --cloud |
ollama list |
Список моделей | Показывает все модели, установленные локально. Удобно для просмотра доступных моделей и их версий. Пример: ollama list |
ollama ps |
Активные процессы | Показывает модели, которые сейчас загружены в памяти, а также использование CPU/GPU и объём ресурсов. Полезно для диагностики производительности. Пример: ollama ps |
ollama show <model> |
Просмотр информации о модели | Выводит информацию о модели: параметры, шаблон, системный prompt и другие данные. Полезно для анализа конфигурации. Пример: ollama show llama3.2 |
| Запуск интеграций | ||
ollama launch |
Запуск интеграций | Открывает меню настройки и запуска внешних приложений, работающих через Ollama. Используется для подключения IDE и AI-инструментов. Пример: ollama launch |
ollama launch <integration> |
Запуск конкретной интеграции | Запускает определённую интеграцию напрямую без меню выбора. Подходит для быстрого старта среды разработки или AI-инструмента. Пример: ollama launch codex |
ollama launch <integration> --model <model> |
Запуск интеграции с моделью | Позволяет указать конкретную модель для внешнего приложения. Полезно, если используется несколько моделей с разными задачами. Пример: ollama launch codex --model llama3.2 |
ollama cp <source> <destination> |
Копирование модели | Создаёт копию существующей модели под новым именем. Удобно перед изменением конфигурации или экспериментов. Пример: ollama cp llama3.2 llama3.2-custom |
ollama rm <model> |
Удаление модели | Удаляет модель из локального хранилища и освобождает место на диске. Пример: ollama rm llama3.2 |
ollama create <name> -f <Modelfile> |
Создание модели | Создаёт новую модель на основе Modelfile. Позволяет изменять системные инструкции, параметры, шаблоны и подключать адаптеры. Пример: ollama create mario-ai -f ./Modelfile |
ollama pull <model> --latest |
Обновление модели | Обновляет локальную модель до последней версии в реестре. Полезно для получения патчей безопасности и улучшений. При обновлении Ollama проверяет доступность новой версии и показывает разницу в размерах. Пример: ollama pull llama3.2 --latest |
Интеграции
Ollama поддерживает различные IDE и инструменты для работы с моделями.
| Команда | Название | Описание |
|---|---|---|
ollama launch |
Меню интеграций | Открывает интерактивное меню для выбора и запуска внешних приложений. Позволяет легко подключать IDE (VS Code, Vim), редакторы и AI-инструменты без сложной конфигурации. Используется в первый раз после установки Ollama. Пример: ollama launch |
ollama launch codex |
Запуск в VS Code | Запускает интеграцию с VS Code, открывая плагин Ollama. После запуска можно использовать встроенные chat-окна, автодополнение кода и анализ кода с помощью моделей. Пример: ollama launch codex |
ollama launch <integration> --model <model> |
Запуск с конкретной моделью | Запускает интеграцию с указанием конкретной модели. Полезно при использовании нескольких моделей с разными задачами (кодирование, чат, анализ). Пример: ollama launch codex --model qwen2.5:7b |
Работа с облаком
| Команда | Название | Описание |
|---|---|---|
ollama signin |
Авторизация в облаке | Выполняет вход в учётную запись Ollama Cloud. Требуется для использования облачных моделей и доступа к платному контенту в реестре. После авторизации можно загружать проприетарные модели и использовать API. Пример: ollama signin |
ollama push <model> |
Публикация модели | Отправляет локальную модель или кастомную сборку в удалённый реестр. Обычно применяется при распространении собственных моделей. Требует авторизации для публикации. Пример: ollama push my-assistant |
Встроенные команды
Внимание: Некоторые команды могут зависеть от версии Ollama и активной интеграции. Команды /set think работают только с моделями, поддерживающими reasoning/think режим. Встроенные команды доступны только внутри ollama run, а не в обычном CLI.
| Команда | Название | Описание |
|---|---|---|
| Помощь и справка | ||
/? |
Список команд | Показывает список доступных встроенных команд текущей интерактивной сессии. Удобно использовать как встроенную справку. Пример: /? |
/help |
Помощь | Аналог /?. Отображает подробную информацию по встроенным командам и параметрам. Пример: /help |
| Управление сессией | ||
/bye |
Выход из сессии | Завершает текущий чат с моделью и выходит из интерактивного режима. Пример: /bye |
/clear |
Очистка контекста | Полностью сбрасывает текущий диалог и историю контекста. После выполнения модель начинает новый разговор без предыдущих сообщений. Пример: /clear |
| Информация о модели | ||
/show info |
Информация о модели | Отображает сведения о текущей модели: имя, размер, архитектуру, параметры и используемые настройки. Пример: /show info |
/show modelfile |
Показ Modelfile | Выводит полный Modelfile активной модели. Полезно для анализа системных инструкций, шаблонов и параметров модели. Пример: /show modelfile |
/show parameters |
Параметры модели | Показывает текущие параметры генерации и настройки выполнения. Пример: /show parameters |
/show system |
Системный prompt | Показывает системную инструкцию (system prompt), используемую текущей моделью. Пример: /show system |
/show template |
Шаблон запросов | Отображает используемый шаблон формирования сообщений между пользователем и моделью. Пример: /show template |
| Форматирование ответов | ||
/set format json |
JSON-режим | Заставляет модель генерировать ответы в JSON-формате. Полезно для API и автоматической обработки данных. Пример: /set format json |
/set noformat |
Отключение форматирования | Возвращает обычный текстовый режим ответа. Пример: /set noformat |
| Статистика и режимы | ||
/set verbose |
Подробный режим | Включает отображение технической информации: скорость генерации, число токенов, время обработки и статистику работы модели. Пример: /set verbose |
/set quiet |
Тихий режим | Отключает дополнительную статистику и оставляет только ответы модели. Пример: /set quiet |
/set history |
Включить историю | Активирует сохранение истории введённых команд и сообщений. Пример: /set history |
/set nohistory |
Отключить историю | Отключает сохранение истории команд текущей сессии. Пример: /set nohistory |
/set wordwrap |
Перенос строк | Включает автоматический перенос длинных строк в терминале. Пример: /set wordwrap |
/set nowordwrap |
Отключение переноса | Отключает автоматический перенос текста. Полезно для логов и JSON. Пример: /set nowordwrap |
| Режим рассуждений | ||
/set think |
Режим рассуждений | Включает режим дополнительного внутреннего анализа модели (если модель поддерживает reasoning). Возможны уровни: low, medium, high. Пример: /set think high |
/set nothink |
Отключение рассуждений | Отключает режим расширенного анализа. Пример: /set nothink |
| Параметры генерации | ||
/set parameter temperature <value> |
Температура генерации | Изменяет температуру генерации в реальном времени без перезапуска модели. Меньшие значения делают ответы более предсказуемыми, большие — более креативными. Пример: /set parameter temperature 0.7 |
/set parameter num_ctx <value> |
Размер контекста | Изменяет размер контекстного окна модели. Увеличение позволяет использовать больше текста, но повышает потребление памяти. Пример: /set parameter num_ctx 8192 |
| Переключение моделей | ||
/load <model> |
Переключение модели | Загружает другую модель прямо во время текущей сессии без выхода из интерактивного режима. Пример: /load qwen3:8b |
Ctrl+C |
Остановка генерации | Немедленно прерывает текущую генерацию ответа модели. Пример: Ctrl+C |
Ctrl+D |
Завершение ввода/выход | Завершает ввод многострочного сообщения либо завершает текущую интерактивную сессию. Пример: Ctrl+D |
Интерактивный режим
| Команда | Название | Описание |
|---|---|---|
| Интерактивное меню | ||
ollama |
Интерактивный интерфейс | Запускает интерактивный режим с графическим меню и списком моделей. Позволяет выбирать модели, запускать их и использовать встроенные команды без знания CLI. Навигация: ↑ ↓ Enter. Пример: ollama |
ollama <model> |
Запуск модели через меню | Запускает конкретную модель через интерактивное меню Ollama. Меню автоматически показывает все локально установленные модели. Пример: ollama llama3.2 |
| Инструменты | ||
ollama launch |
Меню интеграций | Открывает меню для запуска внешних приложений и IDE. Пример: ollama launch |
CLI и помощь
| Команда | Название | Описание |
|---|---|---|
ollama help |
Справка | Показывает список доступных команд и их параметры. Можно использовать как общую справку или для отдельной команды. Пример: ollama help run |
ollama --help |
Общая помощь | Показывает общую справочную информацию и перечень команд. Пример: ollama --help |
ollama --version |
Версия | Выводит установленную версию Ollama. Используется для проверки совместимости и диагностики. Пример: ollama --version |
Сервер
| Команда | Название | Описание |
|---|---|---|
ollama serve |
Запуск сервера | Запускает Ollama как API-сервис. После запуска API становится доступным по адресу localhost:11434. Используется для интеграции с приложениями и библиотеками. Пример: ollama serve |
ollama serve --debug |
Запуск в отладочном режиме | Запускает сервер с отладочными сообщениями в консоль. Полезно для диагностики проблем с моделями и интеграциями. Пример: ollama serve --debug |
ollama serve --port <port> |
Запуск на указанном порту | Запускает сервер на указанном порту вместо стандартного 11434. Полезно при работе с несколькими инстансами Ollama. Пример: ollama serve --port 11435 |