Maintainable Python

В доме, который построил Джек

2020-08-06T00:00:00+00:00

Предупреждение: Данный пост пропах субъективной оценкой и холиварными суждениями.

Вы часто задумывались про пакеты и их именование? А про именование модулей?

Или может вы все складываете в модуль utils - “и так сойдет”?

А вишенкой на торте - в один модуль запихнуть с десяток классов, процедур и методов.

Давайте вместе подумаем как сделать лучше, проще и удобней.

Для начала давайте перестать все хранить в utils.

Допустим, у нас есть в utils 3 модуля:

date_operations.py (как-то преобразовываем даты)
currency_operations.py (преобразовываем валюты)
service_code_converter.py (а тут какие-нибудь системные коды преобразуем в человеко-читаемое нечто)

Что можно с ними сделать? Для начала давайте разобъем на гипотетические классы, с учетом ухода от абстракций к реальным сущностям. Получим:

DateClass
CurrencyClass
ServiceCodesClass

Почему добавляется Class - объясню позже.

Отлично, теперь мы получили набор гипотетических классов, которые надо правильно разложить по пакетам и модулям.

для DateClass формируем пакет date
для CurrencyClass формируем пакет currency
для ServiceCodesClass формируем пакет service_codes

Теперь, импортируя эти классы, будем получать что-то вроде:

from currency import CurrencyClass

Отлично, осталось разложить по правильным пакетам. Но как это сделать? Давайте попробуем пакет назвать по названию модуля. Получим что-то вроде:

from currency.currency import CurrencyClass

Выглядит как в песне “В доме, который построил Джек”. В целом - не очень. Но что же делать в таком случае?

А в таком случае - устанвливайте принадлежность данных модулей.

Вот, например, ServiceCodesClass - скорее всего принадлежит обработке какого-нибудь ответа от смежного сервиса.

А точнее результату его парсинга.

Отлично, тогда можно сделать так:

from message.response.service_codes import ServiceCodesClass

CurrencyClass, впрочем как и DateClass - скорее всего будут относиться к преобразованию данных в запросах/ответах:

from message.currency import CurrencyClass
from message.date import DateClass

Итого мы получили следующее:

from message.currency import CurrencyClass
from message.date import DateClass
from message.response.service_codes import ServiceCodesClass

И сравним с предыдущим вариантом:

from utils import date_operations, currency_operations, service_codes_operations

Что же нам это дало?

1) мы теперь четко знаем принадлежность конкретного класса к задаче 2) мы четко видим структуру приложения 3) мы не можем накидать абстрактных методов и процедур в utils, как в помойку

Итого, новый разработчик, придя на проект - сразу будет понимать 3 основных вещи:

Что это?
Зачем это?
Откуда это?

Более того, через полгода вам не придется шариться по utils, выискивая ту самую процедуру get_id или format_all.

Да, я забыл рассказать почему название класса DateClass, а не Date.

По хорошему - вы не должны возвращать примитивы, такие как bool или int. Вы должны возвращать объекты. В будущем вам будет проще добавить еще одно свойство, чем поменять примитив.

Допустим была у вас функция, которая возвращала True или False. Но тут, вам понадобилось третье состояние! А давайте быстро заменим на циферки, будет возвращать 0, 1, -1. Почему бы и нет, можем же!

Вы спешно поменяли, сделали рефактор силами idea или сами полазили по коду, нашли все использования этой функции и поменяли обработчики. Довольные выкатили на какой-нибудь слой для теста ииии…. Все сломалось. Колесо кармы дало новый оборот.

Если вы будете возвращать объект - вы можете изменить количество его аттрибутов, сделать наследника класса, формирующий объект, заоверрайдить его методы.

В итоге рядом с DateClass будет лежать DateResponse.

Да, это нарушит конракт. Но при этом вы сохраните обратную совместимость. Ну и это не является аксиомой. Но именование должно быть унифицировано для всего проекта. А лучше для всей команды.

Впрочем. это тема для отдельного разговора.

Вот такие мысли сегодня ночью.

Надеюсь подискутируем в этот раз в комментариях.

Parser или NewParser - вот в чем вопрос

2020-07-29T00:00:00+00:00

Предупреждение: Данный пост пропах субъективной оценкой и холиварными суждениями.

Давайте поговорим про именование классов!

Делая код-ревью или просматривая чужой код я часто натыкаюсь на всевозможные классы с именами типа Parser, Decoder, Encoder.

Еще хлеще, когда в таком коде множество статических методов.

Как Вы думаете, насколько это валидно?

Лично у меня всегда возникает вопрос - “Почему колесо не называется катало?”

Хочется подискутировать на этот момент.

Вот проектируете вы новый супер-сервис, который парсит входящее откуда-то сообщение, расшифровывает его и складывает в БД, например.

Так, ну тут у нас будет определенно какой-то хендлер, куда сообщение это валится, из которого мы сначала прогоним это сообщение через Decoder, а затем Parser и остаток сложим в БД.

Логично? Ну все, пишем код.

Но не все так просто, как кажется.

Может измениться тип шифрования? Может. Сегодня тебе присылают сообщение в base64, завтра с битовым сдвигом и контрольной суммой.

И что будем делать в таком случае? Писать еще один метод в классе Decoder. Или создадим новый класс, например NewDecoder.

Может измениться структура сообщения? Может. Сегодня тебе шлют XML, завтра Yaml. Что делаем? Конечно же YamlParser.

А еще бывало такое, ну признайтесь себе, когда в какой-нибудь Parser было желание засунуть еще и валидатор и математику какую-нибудь. Бывало ведь?)

В итоге такой класс начинает и парсить, и валидировать, и за кофеём бегать и штаны гладить.

Вот таким образом мы заимеем кучу сущностей, не передающих намерения разработчика, но в которую, как в коробку скидывают всё подряд и засовывают под стол или в дальний шкаф.

Так как же быть? Связывайте классы с реальными вещами и называйте классы тем, чем они являются. Parser - не очень реальная сущность, а что-то абстрактное, что умеет парсить сообщение. А сообщение - это конкретный объект.

Валится вам на вход какое-то сообщение - назовите класс Message, задекларируйте методы - decode_base64/encode_base64/parse_to_dict.

Если сообщение XML - сделайте класс XmlMessage, в котором отнаследуетесь от Message и перезагрузите нужные методы. Может и нового добавите.

Если Yaml - YamlMessage.

“Но ведь ничего не изменилось? Мы также плодим кучу классов и сколько хотим методов - столько и пишем!”.

Еще как изменилось. Давайте приведу пример с классом Parser:

decoded_message = Decoder(msg).decode_message()

parsed_message = Parser(msg).parse_xml()

save_to_db(parsed_message)

А теперь приведу пример с классом Message:

message = XmlMessage(msg)

message.decode()

message.parse()

message.save_to_db()

Какие различия мы видим?

Во первых это интуитивно-понятное взаимодействие с классом.

Во вторых мы инкапсулируем логику - нам не нужно знать что парсить и как парсить.

А в третьих, это еще и красивей выглядит :)

То есть мы говорим “Колесо - катись. Колесо - остановись.”, вместо “О силы трения качения, используя свою великую мощь - дайте мне катящееся колесо”.

Давайте подискутируем про это.

Может я в корне не прав и надо плодить парсеры с декодерами, а колесо называть каталом?

Вам не нужно 100%-е покрытие юнит-тестами

2020-07-24T00:00:00+00:00

Сразу оговорюсь, что при прочтении могут возникнуть мысли о капитанстве, наравне с полыханием пятой точки.

Извините уж за это, но я не могу удержаться.

Я часто встречаю позицию такого рода - “Нужно сделать покрытие 100% юнит-тестами, тогда и заживем”. Нет, не заживете.

А почему? А потому что скорость изменения бизнеса не будет вам позволять покрыть код 100% юнит-тестами, если это не замороженный проект.

Даже если вы соберетесь командой N человек и одним геройским рывком покроете функционал юнит-тестами, то где гарантия, что близжайшая бизнес задача не сделает негодными часть тестов?

И что в итоге? Вы снова собираетесь командой N-человек и правите юнит-тесты.

Также, наверняка 100% тестов не получится делать, из-за того, что вы будете уходить “в насыщение”.

То есть вы будете бесконечно приближаться к числу 100, но не будете достигать его.

98%, 99%, 99.9%… Всегда останется строчка кода, которую не покрыть юнит-тестами.

Ну и человеческий фактор. Юнит-тесты пишутся людьми, как и код. И никто не застрахован от “подгонов тестов”.

Возникает закономерный вопрос - “Как же быть?”.

А быть просто - не покрывайте код 100% юнит-тестами.

Установите планку, например 80%

“Но тогда часть функционала будет непроверена!” - скажете вы. Да, юнит-тестами она покрыта не будет.

Но! Но есть еще множество замечательных инструментов, позволяющих установить метрики качества кода, проверить его.

Давайте по порядку:

pre-commit hooks

Прекрасная вещь, которая проверяет ваш код перед совершением git-коммита.

И в случае несоответствия его каким-то правилам - отклонит коммит.

А может даже и поправит ваш код. Мощь этого инструмента воистину поражает.

Тут и проверка на pep8 (которым грешат многие разработчики любого уровня, кстати), проверка всяких yamlов-tomlов и т.д.

А самое главное, вы можете создавать свои скрипты, для проверки кода.

Например я, относительно недавно написал набор скриптов, которые проверяют python код на соответствие парадигме элегантных объектов (https://github.com/roch1990/peon).

Подробней узнать о инструменте вы можете тут - https://pre-commit.com/ .

Mutual тестирование

Производится изменение вашего кода с последующей проверкой на “изменилось ли что-то в выполнении кода или нет”.

Например у вас есть вычисление return 2 + 2. Соответственно вы ожидаете 4 где-то далее в вашем ПО.

Тут заходит злобный Mutual-демон и меняет этот кусок кода на return 2-2.

Все, выполнение программы ломается. Или нет?

Если не сломается, то возможно что-то у вас в коде сделано не так.

Из минусов такого тестирования могу лишь указать на затраты на производительность - мне удалось положить гитлаб раннер запускам этих тестов.

Проверить это вы можете (не ухайдакивание раннера :), например воспользуясь библиотекой mutmut для python3 (https://pypi.org/project/mutmut/)

Интеграционное тестирование

Казалось бы - “Да ладно, мы все знаем про интеграционное тестирование!”. Но все ли его делают? И делают ли правильно?

В интеграционном тестировании вы не должны проверять просто тыкая метод палочкой “Ой, отправлю запрос, что-то прилетело в ответ - отлично”.

Постарайтесь охватить большинство бизнес-процессов. Верные ответы, ошибки. Пусть у вас не будет весь возможный перебор входных параметров запросов (вдруг у вас есть какие-то опциональные).

Не стремайтесь писать отдельное ПО для проведения интеграционного тестирования, вместо написания отдельных модулей, чтобы они содержались в вашем ПО “из-коробки”.

Пусть это будет bash-скрипт/perl-скрипт, хоть ПО на С++. Главное, чтобы проверка производилась (ну и не вставали волосы дыбом у команды от выбранной реализации).

Security тесты

Это очень редкий зверь в современном мире, что очень зря. Сколько сейчас новостей о утечках информации из-за обычных простых ошибок в коде.

Посмотрите любую ленту новостей, за ближайшие неделю-месяц вы обязательно найдете такую новость.

Чтобы избежать этого - добрые люди придумали программные пакеты, которые проверяют ваш код на common security issues.

Удобно, не правда ли? Добавляете одну строчку в вашу сборку и смотрите отчет, никаких лишних телодвижений.

И в будущем у вас будет меньше проблем с безопасностью.

Проверить свой код на python можно, используя библиотеку bandit.

Статический анализ

В современном мире это уже чуть ли не обязательный инструмент, который нужно использовать для вашего кода.

И технический долг посчитает, и надежность кода, и укажет на уязвимости.

Вообщем выбираете себе подходящий инструмент (благо их сейчас вагон и маленькая тележка, например sonarqube и вперед за приключениями.

Таким образом, кроме одного этапа тестирования, у вас будет, как минимум 5.

Пусть это не покроет весь функционал (останется какая-то гадость, наверняка), но вероятность достать белый шарик из коробки, с 5 попыток гораздо выше, чем с 1й попытки.

В данной статье я целенаправленно не затронул такие вещи как:

performance testing
ci/cd
документация
мониторинг
code review

Хотя они тоже привносят свой посильный вклад в качество кода.

Но это тема для отдельного разговора.

Данная статья не претендует на научность (пока), но её цель - чтобы хотя-бы у одного разработчика что-то зашевелилось в голове и он решил попробовать разнообразить проверки своего кода.

Если тема понравилась и интересно почитать что-то подобное еще, либо раскрыть что-то поподробнее - пишите комментарии, ставьте лайк.

Всем мир и огнетушителей. Я не тролль :)

P.S.: Ах да, забыл привести вам моё вдохновение.