Anaconda Toolbox – это расширение для Jupyter Notebook и JupyterLab, которое позволяет синхронизировать проекты с облаком Anaconda, сохранять сниппеты кода и использовать уже готовые среды. Также через это расширение вы получаете доступ к ИИ-помощнику Anaconda Assistant.
Для полноценной работы с этим инструментом требуется регистрация, поэтому если вы не зарегистрировались на этапе установки Anaconda, то вы можете сделать это сейчас на официальном сайте.
Установить Anaconda Toolbox можно через Anaconda Navigator. Для этого просто найдите его в списке приложений на вкладке Home и нажмите кнопку Install.
Также его можно установить через менеджер conda:
conda install anaconda-toolbox
Использование командной строки – это более быстрый и гибкий способ управления средами по сравнению с графическим интерфейсом. Все операции, которые мы выполняли в Anaconda Navigator, можно сделать с помощью conda в обычном терминале или в Anaconda Prompt (Windows), который при запуске автоматически активирует базовую среду Anaconda, что позволяет сразу же использовать команды conda.
Также вы можете использовать команды conda в Jupyter-ноутбуках, добавляя перед ними символ восклицательного знака.
По умолчанию команда conda info отображает полную информацию о вашем менеджере conda, включая пути к компонентам и версии программного обеспечения:
Но обычно нас больше интересует флаг --envs, позволяющий отобразить только все созданные среды:
conda info --envs
Управление средами и пакетами в Anaconda осуществляется двумя способами: в приложении с графическим интерфейсом Anaconda Navigator или в командной строке с помощью менеджера conda.
Anaconda Navigator создан на основе conda и позволяет управлять пакетами и средами через графический пользовательский интерфейс, что особенно удобно, если вы не очень хорошо знакомы с командной строкой.
Для запуска Anaconda Navigator найдите это приложение на компьютере или запустите anaconda-navigator из терминала, если вы используете Linux.
После запуска вы увидите главное окно, на котором открыта вкладка Home. Если вы зарегистрировались в Anaconda, то с помощью кнопки Connect вы можете войти или выйти из аккаунта. Также здесь отображаются приложения, которые вы можете запустить, обновить или установить. Их можно отфильтровать с помощью выпадающего меню и выбрать, например, только установленные приложения или наоборот.
Если вы уже имеете опыт программирования на Python, то наверняка знаете, насколько важна правильная настройка рабочего окружения. Установка интерпретатора, управление версиями пакетов, создание виртуальных сред – рутинные, но обязательные задачи. Разработчикам, занимающимся анализом данных или машинным обучением, на помощь в этом приходит Anaconda.
Anaconda – это не просто менеджер пакетов, а целая экосистема, в которую входят:
- Интерпретатор Python.
- Более чем 300 автоматически устанавливаемых пакетов, включая самые популярные для работы с данными, такие как
numpy, pandas, scipy, matplotlib и многие другие.
- Доступ к публичному репозиторию Anaconda, содержащему более 8000 библиотек для анализа данных и машинного обучения с открытым исходным кодом.
- Менеджер пакетов и среды
conda.
- Коллекция приложений, включая популярные IDE и редакторы, например, Jupyter Notebook, JupyterLab и Spyder.
Модуль os (от англ. Operating System – операционная система) является одним из наиболее часто используемых модулей в Python. Он предоставляет программам возможность взаимодействовать с операционной системой (ОС), на которой они запущены.
Это означает, что с помощью модуля os вы можете выполнять те же операции, которые обычно делаете через командную строку или Проводник, но программно, прямо из вашего кода Python.
Главное преимущество модуля os заключается в его кроссплатформенности: он скрывает различия между операционными системами. Например, функция os.remove() удалит файл как в Windows, так и в Linux, хотя базовая системная команда для этого на этих ОС разная. Это позволяет писать код один раз, и он будет работать везде, где установлен Python.
Текстовые форматы, например, CSV и JSON могут сериализовать (преобразовать в текст) только базовые типы: строки, числа, списки и словари, однако они не позволят сохранить данные более сложных типов, например, экземпляры классов.
Модуль pickle был создан специально для решения этой проблемы. С английского слово «pickle» переводится как «соленья», что является метафорой для «консервирования» данных.
Ключевой особенностью модуля pickle является использование двоичного формата хранения данных. Он не пытается быть читаемым человеком, а сосредоточен на сохранении внутренней структуры объекта. По этой причине файлы, созданные с помощью pickle, всегда открываются в двоичном режиме (с буквой «b» в конце, например, "rb" или "wb").
Формат JSON (от англ. JavaScript Object Notation – нотация объектов JavaScript) – это текстовый формат, который чаще всего используется для обмена данными в современных информационных системах.
JSON был создан как способ представления структур данных в JavaScript, но быстро стал популярным благодаря своей простоте, читаемости и лёгкой интеграции практически с любым языком программирования.
JSON оперирует двумя основными структурами, которые напрямую соответствуют основным коллекциям Python: объектами и массивами.
Объекты (англ. objects) представляют собой неупорядоченный набор пар «ключ: значение» и соответствуют словарям в Python.
В большинстве реальных приложений недостаточно просто обрабатывать данные в оперативной памяти, так как часто требуется сохранять информацию между запусками программы или загружать ее из внешних источников. Для этого используется работа с файлами на диске.
По способу хранения информации все файлы делятся на текстовые и бинарные (двоичные).
Байты внутри текстового файла представляют символы (с учётом используемой кодировки), которые мы можем прочитать и увидеть на экране. Такие файлы удобны для хранения текстовой информации.
В бинарных файлах байты не соответствуют символам напрямую, а представляют собой различные структуры данных: машинные инструкции, пиксели изображений, аудиоданные и другие элементы, в зависимости от формата файла. Поэтому бинарные файлы не предназначены для непосредственного чтения человеком.
Хотя стандартная библиотека Python содержит сотни модулей и является отличной базой, она не решает абсолютно все возможные задачи. Программисту могут требоваться более специализированные инструменты, например, для создания веб-приложений, работы с графикой или машинного обучения. Именно здесь на помощь приходят сторонние пакеты или библиотеки, созданные сообществом Python.
Однако сторонние библиотеки могут развиваться и функции, которые были в одной версии, могут отсутствовать или работать абсолютно иначе в другой.
Например, в одном проекте вы работаете с данными с помощью библиотеки pandas версии 2.0.1, а ваш новый проект требует более современной версии 2.3.3. Если вы обновите pandas глобально на компьютере, то можете сломать ваш первый проект. Поэтому каждый проект должен иметь своё виртуальное окружение – изолированную папку, которая содержит собственную копию интерпретатора Python и уникальный набор установленных библиотек. Тогда инструменты, установленные для одного проекта, будут невидимы для другого, и вы всегда можете точно определить, какие именно библиотеки и каких версий нужны для запуска проекта.
Многие программы должны учитывать дату и время, например, при регистрации нового пользователя, создании заказа в интернет-магазине или планировании каких-то событий.
Модуль datetime в Python является основным инструментом для работы с датой и временем. Он предоставляет классы, которые позволяют хранить и манипулировать датой и временем. Для этого в нём определены четыре основных класса:
date – дата
time – время
datetime – дата и время
timedelta – временной промежуток
Для использования этих классов их следует импортировать из модуля datetime:
from datetime import date, time, datetime, timedelta