Лекция 5. Списки и массивы
В этой лекции описываются скалярные операции языка Perl, для удобства разделенные на группы. Рассматриваются их особенности, правила записи и порядок вычислений в выражениях.
Цель лекции: познакомиться с богатым набором операций языка Perl, узнать их особенности и научиться правильно применять их при составлении выражений.
Операции (также называемые операторами) в Perl многочисленны и разнообразны, с их помощью образуются арифметические, логические, строковые и другие выражения - конструкции, вычисляющие некоторый результат, хотя он не всегда может использоваться. Элементы выражения, над которыми производится операция, называются операндами. Результат операции в Perl может зависеть от контекста, в котором она выполняется. Но часто и сама операция устанавливает определенный контекст, влияющий на преобразование операндов. Конкретные правила вычисления выражений будут изложены при подробном рассказе о каждой из операций.
Конечно же, в Perl, как и в других языках программирования, есть традиционные арифметические операции:
* умножение (например, 2 * 2 будет 4)
/ деление (например, 11 / 2 будет 5.5)
+ сложение (например, 111 + "999" будет 1110)
- вычитание (например, '26' - 1 будет 25)
Обратите внимание на особенность арифметических операций в Perl - в них могут участвовать и строки. При этом, попадая в числовой контекст, строковое представление числа автоматически преобразуется к соответствующему числовому значению. Это очень удобно, но нужно быть внимательным при преобразовании к числам строк, содержащих не-цифровые символы. Символ, не применяемый для записи десятичного числа, прерывает преобразование строки в число, например:
' +.25x7' + 1 будет 1.25 (то есть ' +0.25' + 1 или 0.25 + 1)
'x.25+7' + 1 будет 1 (то есть '' + 1 или 0 + 1)
'10_000' + 1 будет 11 (то есть '10' + 1 или 10 + 1)
В Perl есть еще две очень удобные арифметические операции, которые имеются не во всех языках программирования:
** возведение в степень (например, 2 ** 5 будет 32)
% деление по модулю или остаток от деления (например, 11 % 3 будет 2)
Из языка программирования C заимствованы операции увеличения и уменьшения на единицу, или автоинкремента и автодекремента соответственно. В отличие от перечисленных выше бинарных операций, имеющих два операнда, это унарные операции с одним операндом, применяемые к переменным. Эти операции изменяют значение своего операнда, чем отличаются от большинства других операций, не изменяющих значения операндов. Они могут записываться как в префиксной форме, когда знак операции стоит перед именем переменной, так и в постфиксной форме (также называемой суффиксной), когда знак операции стоит после переменной:
++ автоинкремент или увеличение на 1 (например, $n++ или ++$n)
-- автодекремент или уменьшение на 1 (например, $n-- или --$n)
В префиксной форме значением выражения будет значение операнда после изменения, а в постфиксной - значение операнда до изменения. Особенности применения префиксной и постфиксной форм можно показать на таком простом примере:
$n = 25; # начальное значение переменной $n
$x1 = $n++; # в $x1 сохранено 25, затем в $n стало 26
$x2 = ++$n; # в $n стало 27 и оно сохранено в $x2
$x3 = --$n; # в $n стало 26 и оно сохранено в $x3
$x4 = $n--; # в $x4 сохранено 26, затем в $n стало 25
--$n; # и наконец $n уменьшилось до 24
Хотя выражение с операцией автоинкремента или автодекремента возвращает значение, часто оно отбрасывается, а сама операция применяется только для изменения значения переменной, что является побочным эффектом ее выполнения. Например:
++$done_count; # увеличиваем счетчик обработанных строк
$left_count--; # уменьшаем счетчик оставшихся строк
В отличие от других языков, в Perl эти операции могут применяться не только к целочисленным, но и к дробным значениям переменных:
$f = 2.5; # начальное значение переменной $f
$f++; # теперь в $f стало 3.5
Операции автоинкремента и автодекремента более естественны, чем используемые в других языках эквивалентные выражения наподобие $n = $n + 1 (которые так шокируют математиков). К тому же они обычно и более эффективно реализованы.
В Perl есть операции унарный минус и унарный плюс, применяемые к числовым и строковым значениям. Например, если в переменной $n содержится число, в $s - строка, а в $x - любое значение, то унарные знаки подействуют так:
- унарный минус ($n = -$n; сменит знак числа в $n на противоположный)
- унарный минус ($s = -$s; добавит перед строкой в $s символ '-')
+ унарный плюс ($x = +$x; не изменит значения любой переменной)
Поскольку унарный плюс не изменяет значения выражения, он может применяться в ситуации, когда синтаксис требует наличия разделителя, а пробел использовать нежелательно. Например, при указании выражения для вычисления Рerl в командной строке.
К унарным операциям также относится операция вызова функции. Многие встроенные функции языка Perl, которые будут рассмотрены в последующих лекциях, в действительности являются именованными унарными операциями. Они могут записываться в традиционном для функций виде с круглыми скобками или как унарные операции без скобок: sin($x) или sin $x. В таблице 3.1 приведены математические функции и встроенные функции работы со временем.
Таблица 3.1.
Функция Описание Пример использования Результат (округленный) abs $x абсолютное значение $x abs -25 25 atan2 $y, $x арктангенс y/x в интервале от -р до + р atan2 25,5 1.37340077 cos $x косинус $x cos 25 0.99120281 exp $x возвращает e в степени $x exp 0.25 1.28402542 int $x целая часть от $x int 25.25 25 log $x натуральный логарифм $x log 25 3.21887582 rand случайное дробное число от 0 до 1 rand 0.97265625 rand $x случайное число от 0 до $x rand 25 23.0430603 srand начинает новую случайную последовательность для rand srand 1 sin $x синус $x sin 25 -0.1323518 sqrt $x квадратный корень из $x sqrt 25 5 time число секунд с начала отсчета (обычно с 01.01.1970) time 1139738006 localtime текущая или указанная дата и время localtime Sun Feb 12 14:55:25 2006Наверное, одной из самых популярных встроенных функций можно назвать функцию print, выводящую список своих операндов в стандартный поток вывода (обычно на консоль), например:
print "Версия Perl=$]"; # вывести номер версии Perl
print 2474.918 / 381.65; # печатать частное от деления
print "Укажите количество чисел: "; # напечатать запрос
Подробно об операциях ввода-вывода будет рассказано в лекции 9, где также будут изучены операции проверки файлов - другая разновидность именованных операций.
В Perl нет специальных литералов для обозначения истинного и ложного значения, подобно true и false в других языках программирования. Необходимость вычислить истинность или ложность выражения определяется логическим контекстом. Логический (или булев) контекст является разновидностью скалярного строкового, поэтому значение выражения преобразуется к строке. Если после преобразования выражения получается пустая строка (не содержащая ни одного символа) либо строка, состоящая из одного символа '0' (цифры "нуль"), то значение выражения считается ложным. Значения всех других выражений считаются истинными. Иногда результат вычисления истинности или ложности выражения может показаться немного непривычным, например:
'' или "" пустая строка, поэтому - "ложь"
0 или 0.0 0 преобразуется в '0', поэтому - "ложь"
+0 или -0 0 преобразуется в '0', поэтому - "ложь"
5-(3+2) равно 0, который преобразуется в '0', поэтому - "ложь"
undef неопределенное значение дает в результате '', поэтому - "ложь"
'1' или 'false' не пустая строка и не '0', поэтому - "истина"
'00' или '0.0' не пустая строка и не '0', поэтому - "истина"
'-0' или '+0' не пустая строка и не '0', поэтому - "истина"
'0 but true' не пустая строка, значит - "истина"
Истинность или ложность значения выражения вычисляется для логических операций и операций сравнения.
В Perl есть отдельные наборы операций для сравнения чисел и строк. Обозначения операций сравнения чисел совпадают с обозначениями операций в других языках, основанных на синтаксисе языка C. В следующих примерах предположим, что в переменной $n хранится значение 25:
== равно (не путайте с присваиванием (=), например, $n == 4 ложно)
!= не равно (например, $n != 8*2 истинно)
< меньше, чем (например, $n < '16.08' ложно)
> больше, чем (например, $n > 9 истинно)
≤ меньше или равно (например, $n <= 26 истинно)
≥ больше или равно (например, $n >= 24 истинно)
<=> числовое сравнение (например, $n <=> 64 вернет -1)
Последняя операция числового сравнения <=> (называемая на программистском жаргоне spaceship - "космический корабль, челнок"), возвращает значение -1, 0 или 1, если первый операнд операции соответственно меньше, равен или больше второго. Все эти операции создают числовой контекст, и строковые операнды этих операций перед сравнением преобразуются к числам. Например, сравнения 123 == ' 123' или '+123' == '123x' преобразуются к 123 == 123. Поэтому пустая строка считается равной нулю.
Обозначения операций сравнения строк похожи на обозначения сравнений в языке программирования Fortran. Они применяются, когда сравниваемые величины нужно рассматривать как строки. При сравнении строковых значений учитывается их положение в кодовой таблице символов: чем ближе к началу таблицы, тем меньше значение. В следующих примерах предположим, что в переменной $s хранится 'a':
eq равно (например, $s eq 'a' истинно)
ne не равно (например, $s ne 'Y' истинно)
lt меньше, чем (например, $s lt 'z' истинно)
gt больше, чем (например, $s gt '9' истинно)
le меньше или равно (например, $s le 'b' истинно)
ge больше или равно (например, $s ge 'Z' истинно)
cmp строковое сравнение (например, $s cmp 'Z' вернет результат 1)
Последняя операция строкового сравнения cmp, так же, как операция числового сравнения <=>, возвращает одно из значений: -1, 0 или 1, если первый операнд операции соответственно меньше, равен или больше второго. При сравнении строк имеет значение их длина и содержащиеся в них пробелы: равными считаются посимвольно совпадающие строки одинаковой длины. Операции сравнения строк устанавливают строковый контекст, поэтому их числовые операнды преобразуются к строкам. При этом строковое сравнение чисел дает своеобразный результат, например, '20' больше '100', поскольку '2' находится в таблице символьных кодов позже, чем '1'. Проверка на частичное совпадение строк, которая часто требуется при обработке текста, выполняется с помощью регулярных выражений, которые будут рассмотрены в лекции 8.
Логические операции создают логический контекст выражения, поэтому эти операции возвращают строку '1' при истинном значении выражения и пустую строку (''), если оно ложное. Обозначение традиционных логических операций в Perl также заимствованы из языка C:
! логическое НЕ (например, ! undef($x) )
&& логическое И (например, $d >= 1 && $d <= 31 )
|| логическое ИЛИ (например, $m eq 'Dec' || $m eq 'Jan')
Результат операции логическое И будет истинным лишь тогда, когда истинны оба операнда, причем второй операнд вычисляется только тогда, когда первый операнд истинный). Операция логическое ИЛИ возвращает истинный результат, если один из операндов истинный, при этом второй операнд вычисляется только тогда, когда первый операнд ложный. Операция логическое НЕ (или логическое отрицание) меняет значение своего операнда на противоположное. Особенности вычисления логических операций часто применяются в Perl для выполнения действий в зависимости от условия. Например, вывести на печать результат при условии, если он положителен, можно так:
$result > 0 && print $result;
В языке Perl есть еще один набор логических операций, так называемых логических операций с низким приоритетом. Они эквивалентны упомянутым выше логическим операциям, но имеют почти самый низкий приоритет по сравнению с другими операциями.
not логическое НЕ (например, not undef($x))
and логическое И (например, $d >= 1 and $d <= 31)
or логическое ИЛИ (например, $m eq 'D' or $m eq 'J' or $m eq 'F')
xor логическое ИСКЛЮЧАЮЩЕЕ ИЛИ (например, $d==1 xor $m eq 'J')
Операция логическое ИСКЛЮЧАЮЩЕЕ ИЛИ возвращает истинный результат, если операнды имеют различное значение, а когда оба операнда имеют одинаковое значение (истинное или ложное), то эта операция возвращает "ложь". Низкоприоритетные логические операции тоже применяются для условного выполнения действий.
Побитовые операции (bitwise operators) выполняются над двоичными разрядами операндов. Унарная операция побитовое НЕ (или побитовое отрицание, или побитовое дополнение) меняет каждый разряд операнда на противоположный. Бинарные операции побитовое И, побитовое ИЛИ и побитовое ИСКЛЮЧАЮЩЕЕ ИЛИ выполняют соответствующую двоичную операцию поразрядно над левым и правым операндами. Если операнды числовые, то они преобразуются в целые числа, имеющие гарантированную длину не менее 32 разрядов.
~ побитовое НЕ (~ 0b1101 даст результат 0b0010)
& побитовое И (0b1010 & 0b0110 даст результат 0b0010)
| побитовое ИЛИ (0b1010 | 0b0110 даст результат 0b1110)
^ побитовое ИСКЛЮЧАЮЩЕЕ ИЛИ (0b1010 ^ 0b0110 даст 0b1100)
Эти операции могут выполняться над строками. При этом выполняются поразрядные операции над соответствующими битами двух строк, и считается, что более короткая строка дополняется в конце нулевыми разрядами до размера длинной.
Бинарные побитовые операции сдвига выполняются над двоичными разрядами целого числа: значение левого операнда поразрядно сдвигается влево или вправо на число разрядов, указанное правым операндом. При этом освобождающиеся двоичные разряды заполняются нулями.
<< побитовый сдвиг влево (0b1010 << 2 даст результат 0b101000)
>> побитовый сдвиг вправо (0b1010 >> 3 даст результат 0b000001)
В Perl есть бинарные операции, применяемые только к строкам: конкатенация (или сцепление) двух строк, обозначаемая символом "точка", и репликация (или повторение), обозначаемая латинской строчной буквой "x", поскольку в результате этой операции строка "умножается" указанное число раз.
. конкатенация (например, 'X' . '=' . '25' даст строку 'X=25')
x репликация (например, 'Дa!' x 3 даст в результате строку 'Дa!Дa!Дa!')
Операция сцепления создает строковый контекст. Поэтому если ее операнды - числа, то они преобразуются в строки, например:
'100' . '3' даст в результате строку '1003'
100 . 3 тоже даст в результате строку '1003'
В левой части операции повторения ожидается строка, а в правой - число повторений. Если в правой части операции повторения стоит строка, то она преобразуется к числу. Причем, если правый операнд операции повторения - дробный, то берется его целое значение, а если он отрицательный или равен нулю, то результатом повторения будет пустая строка:
100 x 3 даст в результате строку '100100100'
100 x 3.9 даст в результате строку '100100100'
100 x 0 или 100 x .1 или 100 x 'x3' даст в результате пустую строку ''
100 x -20 даст в результате пустую строку ''
Рассмотренная ранее операция автоинкремента может особым образом применяться к строкам, состоящим только из латинских букв и цифр. Для таких строк выполняется увеличение значения каждого символа, начиная с правого, с переносом разрядов влево, как у чисел. При этом символ 'a' становится 'b', 'b' становится 'c' и так далее, а 'z' становится 'a' с увеличением значения символа слева. Следующие примеры поясняют сказанное:
$s = 'xzz'; $s++; даст в результате строку 'yaa'
$s = 'XZZ'; $s++; даст в результате строку 'YAA'
$s = 'xy9'; $s++; даст в результате строку 'xz0'
При этом операция автодекремента, примененная к символьным строкам, не обладает "магическим" действием: буквенная строка, как обычно, преобразуется к нулю, который уменьшается на единицу.
В Perl присваивание является бинарной операцией. Ее левым операндом может быть переменная или другая конструкция языка, в которой можно хранить значение. Такая конструкция называется Lvalue ("L-значение", от английского left value), то есть "стоящая в левой части присваивания". Правым операндом может быть любое выражение, а значением выражения присваивания будет значение левого операнда. Например:
$num = 5 * 5
$str = 'Happy New Year!'
Поскольку присваивание - это обычная операция, она может участвовать в выражении не один раз, при этом вычисление происходит справа налево:
$n1 = $n2 = 25; # иначе говоря: $n2 = 25; $n1 = $n2;
Подобно языку C, в Perl имеются составные операции присваивания, совмещающие вычисление результата операции над левым и правым операндами с присваиванием этого результата левому операнду. То есть обычную запись присваивания результата операции переменной
переменная = переменная операция выражение
можно записать в сокращенной форме с использованием составного присваивания:
переменная операция= выражение
В записи составных операций между знаком операции и знаком равенства не должно быть пробела. Вот список допустимых составных операций присваивания с примерами использования:
**= присвоить результат возведения в степень ($n **= 3)
*= увеличить в ($n *= 4 значит увеличить $n в 4 раза)
/= уменьшить в ($n /= 5 значит уменьшить $n в 5 раз)
%= присвоить остаток от деления на ($n %= 6)
+= увеличить на (например, $n += 7 значит прибавить к $n число 7)
-= уменьшить на (например, $n -= 8 значит вычесть из $n число 8)
&&= И с присваиванием ($n &&= 2 значит присвоить $n=2, если $n истинно)
||= ИЛИ с присваиванием ($n ||= 2 т.е. присвоить $n=2, если $n ложно)
&= И с присваиванием ($n &= 2 значит выполнить над $n операцию &2)
|= ИЛИ с присваиванием ($n |= 2 т. е. выполнить над $n операцию |2)
^= ИСКЛЮЧАЮЩЕЕ ИЛИ с присваиванием ($n ^= 2 т. е. $n =$n ^ 2)
<<= сдвинуть влево и присвоить ($n<<=2 значит сдвинуть $n на 2 разряда влево)
>>= сдвинуть вправо и присвоить ($n>>=2 т. е. сдвинуть $n на 2 разряда вправо)
.= сцепить и присвоить ($n .= '2' значит сцепить $n с '2')
x= повторить и присвоить ($n x= 2 значит сцепить $n с собой 1 раз)
Составные операции присваивания привлекают программистов компактной формой записи и тем, что они часто выполняются более эффективно.
Кроме логических операций, управляющих вычислением выражений, в Perl есть другие операции, которые управляют вычислением нескольких выражений. Это операция "запятая", (или операция вычисления последовательности выражений) которая вычисляет сначала свой левый, а затем правый операнд. При этом значением выражения с этой операцией будет значение правого операнда, хотя это значение часто просто отбрасывается. Операция "запятая" применяется там, где по правилам языка должно быть одно выражение, но при этом нужно выполнить несколько вычислений. Например:
$row++, $col++ # увеличить значения двух счетчиков
$a = rand 5, $b = int $a # присвоить $a случайное число
$x+=1, $y=5, $z=$x/$y # то же, что ($x+=1, $y=5), $z=$x/$y
Операция выбора (или условная операция) - это единственная в Perl тернарная операция, в которой участвуют три операнда. Первый операнд - условное выражение, определяющее результат операции: если первый операнд истинный, то результатом будет значение второго операнда, иначе - значение третьего операнда. После первого операнда ставится знак вопроса, а после второго - двоеточие. Например:
($n < 0) ? 0 : --$n
$temperature < 20 ? 'холодно' : 'тепло'
Перечень операций в языке Perl не ограничивается рассмотренными в этой лекции. По мере изучения других разделов будут описаны другие, более специализированные операции. Например, нам наверняка понадобится операция чтения строки из стандартного входного потока (обычно связанного с системной консолью). Она обозначается символами <> и по- английски называется diamond, что на русский лучше всего перевести как "кристалл" (хотя встречается русское название "ромб"). Эта операция считывает очередную строку и возвращает ее значение:
$line = <> # считать в $line строку из стандартного ввода
В следующих лекциях продолжится разговор об особенностях применения уже изученных и новых операций при работе в разных ситуациях и с другими структурами данных.
Очередность выполнения операций в выражении определяется их приоритетами и ассоциативностью, но она может быть изменена с помощью скобок. Приоритет определяет порядок вычисления операций в выражении: операции с более высоким приоритетом вычисляются раньше. Например, приоритет у операций умножения и деления выше, чем у сложения и вычитания. Ассоциативность определяет порядок вычислений, если в выражении используются операции с одинаковыми приоритетами. Операции с ассоциативностью слева вычисляются обычным образом, слева направо. Но из двух операций, имеющих ассоциативность справа, первой вычисляется стоящая справа. Например:
$a ** $b ** $c # ассоциативность справа, т.е. $a**($b**$c)
$a * $b / $c # ассоциативность слева, т.е. ($a * $b) / $c
$a && $b && $c # ассоциативность слева, т.е. ($a && $b) && $c
$a = $b = $c # ассоциативность справа, т.е. $a = ($b = $c)
$a | $b ^ $c # ассоциативность слева, т.е. ($a | $b) ^ $c
В таблице 3.2 приводится полный список операций, перечисленных в порядке убывания приоритетов, с указанием их ассоциативности. В этой таблице даны все операции языка Perl, в том числе и не рассмотренные в этой лекции. Многие из них будут изучены в следующих лекциях.
Таблица 3.2. Ассоциативность и приоритет операций (от высокого к низкому).
Ассоциативность Приоритет Операция Слева 24 термы и операции над списками (справа налево) Слева 24 -> (вызов метода, разыменование) Не ассоциативные 22 ++ -- (автоинкремент, автодекремент) Справа 21 ** (возведение в степень) Справа 20 ! ~ + - (логическое НЕ, побитовое отрицание, операция ссылки, унарный плюс, унарный минус) Слева 19 =~ !~ (привязка к шаблону: совпадение, несовпадение) Слева 18 * / % х (умножение, деление, деление по модулю, повторение строки) Слева 17 + - . (сложение, вычитание, конкатенация строк) Слева 16 << >> (побитовый сдвиг влево или вправо) Не ассоциативные 15 именованные унарные операции и операции над файлами Не ассоциативные 14 < > ≤ ≤ lt gt le ge (меньше, больше, меньше или равно, больше или равно и их строковые эквиваленты) Не ассоциативные 13 == != <=> eq ne cmp (равно, не равно, сравнение и их строковые эквиваленты) Слева 12 & (побитовое И) Слева 11 | ^ (побитовое ИЛИ, побитовое исключающее ИЛИ) Слева 10 && (логическое И) Слева 9 || (логическое ИЛИ) Не ассоциативные 8 .. ... (не включающие или включающие граничные значения диапазоны) Справа 7 ?: (операция выбора или условная операция) Справа 6 = += -= *= и т. д. (присваивание и присваивание с вычислением) Слева 5 , => (запятая и запятая-стрелка) Не ассоциативные 4 операции над списками (слева направо) Справа 3 not (логическое НЕ) Слева 2 and (логическое И) Слева 1 or xor (логическое ИЛИ, логическое исключающее ИЛИ)В Perl имеется большое количество операций, в том числе и весьма экзотических. Поэтому, если возникает сомнение в порядке их вычислений, то всегда можно использовать скобки для управления очередностью вычислений в выражении.
Понимание изложенного в этой лекции материала о скалярных операциях совершенно необходимо для разработки программ на Perl, хотя запоминать все приведенные здесь операции совершенно излишне. Операции и выражения являются основой для освоения материала о синтаксических правилах языка Perl, о которых пойдет речь в следующей лекции.