Чистые функции

  • Рубрика записи:Чистый код

Функции – это первый уровень структурирования кода в программе, независимо от того, пишете вы на Java, C++, Python или Kotlin. Их грамотная запись неоценимо облегчает понимание, разработку и доработку программы. Благодаря красивому написанию функций вы сможете подходить к написанию кода как к искусству, а не разбирать непроходимые дебри. Приступим!

Размер имеет значение

Рассмотрим одну функцию из моего старого проекта. Спустя какое-то время я нашла достаточно большую и запутанную функцию. Проблемы этой функции не только в длине. Попробуйте разобраться в том, что в ней творится.

Даже пробовать не хочется, правда? Вроде как происходит написание чего-то в какой-то параграф. А ещё есть словарь со значениями неких полей. Остальное – загадка. Хотя функция, казалось бы, умещается в один экран. Типа – не громадная. Однако в функции много непонятного кода, есть отдельные сегменты, которые отвечают сразу за несколько операций.

Как насчёт выделения нескольких методов, переименований и небольшой реструктуризации, чтобы повысить читаемость этого кода? Посмотрим, насколько проще вам будет разобраться в коде после рефакторинга.

Уже лучше, но можно сделать ещё меньше.

Отлично, теперь становится понятно, что функция writeFieldsToParagraph() получает список расположений переменных (список VariableLocation), а затем в цикле добавляет обычный и стилизованный текст к параграфу, в конце каждой итерации обновляя текущий индекс в строке (currentStrIndex).

Да, эта функция и класс, в которой она лежит, далеко не идеальны. В коде имеется достаточно недочётов, таких, как передача множества параметров в функции, а также то, что повсюду передаётся параграф (как будто пора бы уже создать отдельную сущность для этого). Однако в этих условиях, в рамках архитектуры этого приложения (какой бы она ни была кривой) рефакторинг функции дал свои плоды. Чтение функции позволяет быстро понять, что там происходит. Нам необязательно разбираться в деталях, как всё это работает. Но что делает функция, алгоритм её действий – мы видим.

Запомните: функции должны быть маленькими. Их должно быть можно быстро и безболезненно прочесть. Чтение исходного варианта функции у меня вызвало чуть ли не физическую боль, а мозги вовсю сопротивлялись. Чтение полученного варианта после рефакторинга – прошло легко.

Соответственно, блоки в командах if, else, for, while и т.д. должны состоять не более, чем из парочки строк. Это делает более понятным, что именно происходит в условии или цикле, поскольку не нужно читать 10, 20 строк, входящих в блок. Плюс ко всему – за счёт названий методов можно без комментариев понять намерения программиста.

Одна функция – одна операция

Не поспорить, что изначальный вариант функции writeTo() выполняет множество операций. Она в цикле проверяет текущий индекс относительно индекса в VariableLocation, создаёт отрывок текста в параграфе для обычного текста, создаёт и стилизует обычный текст, изменяет текущий индекс в соответствии с VariableLocation, получает TextField по имени, создаёт отрывок текста в параграфе для стилизованного текста, создаёт и стилизует стилизованный текст…

С другой стороны, в итоговом варианте функция writeFieldsToParagraph() в соответствии с полученными расположениями переменных в цикле добавляет в параграф обычный и стилизованный текст.

Функция должна выполнять только одну операцию. Она должна выполнять её хорошо. И ничего другого она делать не должна.

На словах просто, но на деле бывает трудно определить, что же считать “одной операцией”. В итоговом варианте функции writeFieldsToParagraph() выполняется одна операция? Можно возразить, что это не так, и операций на самом деле больше:

  1. Происходит формирование списка VariableLocation.
  2. Цикл for:
    1. Нахождение и добавление в параграф обычного текста.
    2. Нахождение и добавление в параграф стилизованного текста.

Так сколько операций выполняет функция? Одну или больше? Прошу обратить внимание, что все пункты списка, все этапы работы функции находятся на одном уровне абстракции под объявленным именем функции. То есть они все логичным образом соотносятся с названием функцииwriteFieldsToParagraph(). К примеру, findAndAddSimpleTextToParagraph(). “Найти и добавить обычный текст в параграф” вполне соотносится с “записать в параграф”. А вот какая-нибудь операция из исходного кода функции writeTo() с её названием бы не сумела соотнестись. Например:

Исходя из таких мелочей реализации, как сверка текущего индекса с каким-то индексом в местоположении переменной, становится понятно, что функция выполняет больше одной операции. Она контролирует слишком много деталей. В конце концов, функции пишутся прежде всего для разложения более крупной концепции на последовательность действий на следующем уровне абстракции.

Получается, чтобы понять, что функция слишком много на себя берёт и выполняет больше одной операции, попробуйте извлечь из неё другую функцию. Причём чтобы извлечённая функция не была просто переформулированной реализацией.

Ещё один хороший показатель того, что функция выполняет больше одной операции – это если она разделена на отдельные участки, секции. Если функция выполняет только одну операцию, её не получится адекватно разбить на отдельные составляющие. Посмотрите на пример:

Чётко видно 4 секции в функции:

  1. Создание списка заданий.
  2. Расчёт цены за все задания
  3. Расчёт количества блоков.
  4. Создание списка блоков.

Очевидно, функция выполняет эти самые 4 операции. А не одну, как следует.

Один уровень абстракции

Уровень абстракции показывает, является ли операция в функции важной концепцией или же второстепенной подробностью. Уровень абстракции может быть высоким, средним, низким. Это примерные уровни.

Пример высокого уровня абстракции:

Средний уровень абстракции:

Низкий уровень абстракции:

Чем ниже уровень абстракции, тем больше конкретных деталей и подробностей.

В итоге, в одной функции не следует смешивать разные уровни абстракции, поскольку это создаёт путаницу и код читается гораздо сложнее. Читателю трудно определить, является ли выражение важным или второстепенным. В итоговом варианте функции writeFieldsToParagraph() абстракция выдерживается примерно на одном уровне. Но если вернуть определение индекса по конкретной формуле, оно будет выбиваться:

Выражения findVariableLocations(), findAndAddSimpleTextToParagraph(), findAndAddStyledTextToParagraph() – это абстрактные выражения без детализации. В свою очередь, varLocation.getIndexEnd() + 1 – это уже детали вычисления индекса.

Содержательные имена

Изначальную функцию writeTo() я переименовала в writeFieldsToParagraph(), поскольку это название немного более точно описывает, что она делает. Плюс проще отследить порядок двух параметров функции. К тому же, все приватные методы были наделены содержательными именамиfindVariableLocations(), findSimpleTextOrNull(), addSimpleTextToParagraph() и так далее. Причём, если функция маленькая и выполняет одну операцию, для неё проще подобрать удобное и содержательное имя.

Не осторожничайте с длинными именами. Лучше длинное и понятное имя, чем короткое и непонятное. Также не осторожничайте с временем, которое вы затрачиваете на придумывание хорошего имени. Это время окупится с лихвой. Можете попробовать несколько разных вариантов и проверить, насколько легко читается код с каждым из вариантов.

Дублирование

Принцип DRY Don’t Repeat Yourself – один из основополагающих принципов в написании кода. Как циклы позволяют не прописывать 10 итераций друг за другом, так и функции позволяют выполнять однотипные операции с разными настройками с помощью передачи разных параметров.

Посмотрим на часть метода, который из строки конфигурации создаёт объект задачи (TaskTextString). Из массива строковых параметров он достаёт значения курсива, жирности и подчёркнутости текста.

Здесь аж в трёх местах производится операция equals(“1”). Вынести это в отдельный метод нужно даже не для приведения функции createFromConfig() к маленькому размеру. Здесь нужно исключить нарушение принципа DRY. Потому что если вы захотите изменить логику проверки параметра на истинность, вам придётся менять её в 3 местах. Если же вы вынесете эту проверку в отдельный метод, то в 1 месте. Бонусом будет то, что название метода сразу сообщит о том, зачем проверять на равенство единице:

Метод isParameterOn() выносит логику проверки параметра в другое место, абстрагируясь от конкретных деталей. Более того, благодаря названию этого метода сразу становится ясно, для чего осуществляется проверка.

Однако повторение часто приобретает масштабы побольше, чем повторяющийся однострочный equals(). Не всегда оно настолько очевидно, но бывает и режущее глаз повторение, которое просится в отдельную функцию, как здесь:

Функция getHexRgbString() возвращает строку из 6 символов, которая значения 0-255 по каналам RGB конвертирует в строку вроде “FF07A1”. Итак, как же убрать повторения? Вот так:

Аргументы функции

Аргументов функции должно быть как можно меньше. Аргументы значительно усложняют функции. Они лишают их мощи концепций и идей. Функцию с 3 и более аргументов понимать сильно сложнее. Когда вы пишете 3 и более аргументов у функции, это с большой вероятностью означает, что где-то подвела структура вашего класса.

В идеале – у функции должно быть 0 аргументов. “Как так?” – скажете вы. “Мы же получаем возможность настраивать работу функции при помощи параметров”. А вы вспомните, что в Java нет функций, которые гуляют сами по себе. Все функции являются заключёнными в классы методами. Находясь внутри класса, функция имеет доступ ко всем его переменным (если она не статическая, конечно). Получается, вызов функции f() у объекта o вы можете интерпретировать и как o.f(), и как f(o). Идея минимизации количества аргументов как раз может быть реализована за счёт сведения f(o) к o.f():

Вот такая логика: зачем передавать управление сбором книг из BookCase кому-то другому, если можно организовать это внутри самого BookCase?

В общем говоря, 0 аргументовидеальный случай. 1хороший. 2терпимый. 3подозрительный. Больше – точно что-то не так.

Если вы каждый раз передаёте одни и те же аргументы вместе в методы, стоит задуматься об объединении их в одну концепцию с собственным именем – в один класс. Например, вместо передачи x и y в методы работы с плоскими фигурами, можно объединить их в класс Point:

Вместо 4 аргументов мы имеем 2. Воспринимается лучше и работать удобнее.

Не передавайте boolean как аргумент в функцию. Логический аргумент громко кричит о том, что функция выполняет больше одной задачи. Почему? Потому что при true она делает одно, а при false – другое. Например, в классе Author есть метод, формирующий его описание:

Вместо этого можно создать 2 метода, которые будут выполнять по одной операции – формировать описание без книг и с книгами:

Конечно, бывает, что вы пользуетесь сторонним API, куда нужно передавать аргумент типа boolean. Поэтому вы решили его получать как аргумент в свою функцию. Тут уже дело ваше. Но аргументы-флаги некрасивы и сбивают с толку.

Кстати, порой становится полезно кодировать названия аргументов в названии самой функции. Да, можно навести мышку на метод и увидеть порядок аргументов и что они значат. Но это время и это силы. Если операция проверки аргументов частая, то можно много на ней сэкономить. Например, как это было с функцией writeTo(), когда ключевые слова аргументов fields и paragraph проникли в название функции:

Или вот примеры попроще для восприятия:

Побочные эффекты

Если ваша функция пообещала сделать что-то одно, она не должна делать чего-то другого, скрытого от разработчика. Она не должна вносить внезапные поправки в переменных своего класса или в глобальных переменных. Она не должна неожиданным образом выполнять какие-либо другие операции, которые не подразумеваются её названием и назначением. Ведь это приводит к побочным эффектам, которые приводят к повышению сложности разработки и к ошибкам.

Посмотрите на следующую функцию. Она обещает только получить переменную по ключу.

Да, но не тут-то было! В комментарии сказано, что если ключа нету ни в global, ни в story, то он создаётся в story. Но разве по названию функции getVariable() можно такое предположить? Разработчик может ожидать, что после вызова getVariable() при отсутствии такого ключа он выполнит свои, другие действия. Он не подозревает о том, что функция подпольно создаёт такой ключ. И причём именно в story!

Выходные аргументы

Аргументы входные данные функции. То, что вы передаёте в скобках, не должно быть возвращаемым значением. Оно не должно ждать изменений, которые вы потом будете использовать как результат работы функции.

Если вы столкнётесь в коде с этим:

Вы станете думать: эта функция присоединяет s к чему-то? Или же что-то присоединяется к s? То есть s – это входной или выходной аргумент? Вы можете проверить объявление функции и увидеть следующее:

И тогда всё станет ясно. Но опять же – когда вы идёте проверять в среде разработки, какова сигнатура метода – вы тратите время. Последовательное и эффективное чтение кода нарушается.

Раньше, когда объектно-ориентированные языки ещё были только во снах, порой без выходных аргументов обойтись было непросто. Но теперь вы лучше просто сделайте так:

Пускай уж функция будет изменять состояние своего объекта, чем состояние аргумента.

Исключения вместо кодов ошибок

Коды ошибок неудобны по той причине, что создают большие уровни вложенности. Везде нужно добавлять проверки и бизнес-логика смешивается с обработкой ошибки. Ведь после возникновения ошибки нужно её обработать. Особенно если есть разбиение функций на подфункции (то есть хороший тон). В итоге мы имеем эти джунгли:

В свою очередь, исключения с блоками try-catch позволяют изолировать логику нормального выполнения от логики обработки ошибок. Код упрощается:

В целом, обработка ошибок уже является одной операцией. Поэтому следует три функции из блока try поместить в один метод. А в этом оставить только операцию обработки ошибок, если в методе pingClient() что-то пойдёт не так:

Написание красивых программ похоже на написание статьи или книги. Когда вы излагаете свои мысли, вы их структурируете, разбиваете на логические части, а также причёсываете, пока они не будут хорошо читаться. Первая наработка может быть черновой, однако с неё вы можете начать “причёсывание”. Постепенно вы доведёте ваш текст до ума.

Так же и с функциями и кодом в целом. Программа – система, которая имеет свою историю. Разбивая эту систему на классы, а классы – на функции, вы идёте от общего к частному. Вы рассказываете историю и идеи этой системы. Пишите код так, чтобы он читался как литературное произведение.

Добавить комментарий