2.1.9. Передача данных при использовании UDP
2.1.9. Передача данных при использовании UDP
Мы наконец-то добрались до изучения того, ради чего сокеты и создавались: как передавать и получать с их помощью данные. По традиции начнем рассмотрение с более простого протокола UDP. Функции, которые рассматриваются в этом разделе, могут работать и с другими протоколами, и от этого их поведение может меняться. Мы здесь описываем только их поведение при использовании UDP.
Для передачи данных удалённому сокету предусмотрена функция sendto, описанная следующим образом:
function sendto(s: TSocket; var Buf; len, flags: Integer; var addrto: TSockAddr; tolen: Integer): Integer;
Первый параметр данной функции задаёт сокет, который служит для передачи данных. Здесь нужно указать значение, полученное ранее от функции socket. Параметр Buf задаёт буфер, в котором хранятся данные для отправки, а параметр len — размер этих данных в байтах. Параметр flags позволяет указать некоторые дополнительные опции, которых мы здесь касаться не будем, т. к. в большинстве случаев они не нужны. Пока следует запомнить, что параметр flags в функции sendto, а также в других функциях, где он встречается, должен быть равен нулю. Параметр addrto задает адрес (состоящий из IP-адреса и порта) удаленного сокета, который должен получить эти данные. Значение параметра addrto должно формироваться по тем же правилам, что значение аналогичного параметра функции bind, за исключением того, что IP-адрес и порт должны быть заданы явно (т. е. не допускаются значения INADDR_ANY и нулевой номера порта). Параметр tolen задает длину буфера, отведенного для адреса, и должен быть равен SizeOf(TSockAddr). Один вызов функции sendto приводит к отправке одной дейтаграммы. Данные, переданные в sendto, никогда не разбиваются на несколько дейтаграмм, и данные, переданные последовательными вызовами sendto, никогда не объединяются в одну дейтаграмму.
Функцию sendto можно использовать с сокетами, не привязанными к адресу. В этом случае внутри библиотеки сокетов будет неявно вызвана функция bind для привязки сокета к адресу INADDR_ANY и нулевому порту (т. е. адрес и порт будут выбраны системой).
Если выходной буфер сокета имеет ненулевой размер, sendto помещает данные в этот буфер и сразу возвращает управление программе, а собственно отправка данных осуществляется библиотекой сокетов в фоновом режиме. Поэтому успешное завершение sendto гарантирует только то, что данные скопированы в буфер и что на момент их копирования не обнаружено никаких проблем, которые делали бы невозможной их отправку. Но такие проблемы могут возникнуть позже, поэтому даже в случае успешного завершения sendto отправитель не получает гарантии, что данные посланы. Если в выходном буфере сокета не хватает места для новой порции данных, sendto не возвращает управление программе (т. е. блокирует ее) до тех пор, пока в буфере за счет фоновой отправки не появится достаточно места или не будет обнаружена ошибка.
Если размер выходного буфера сокета равен нулю, функция sendto копирует данные сразу в сеть, без промежуточной буферизации. Когда функция вернет управление программе, программа может быть уверена, что информация уже успешно передана в сеть. Однако даже в этом случае успешное завершение sendto не гарантирует доставку информации: дейтаграмма может потеряться по дороге.
В случае успешного завершения функция sendto возвращает количество байтов, скопированных в буфер (или переданных напрямую в сеть, если буфера нет). Для протокола UDP это значение может быть равно только значению параметра len, хотя для некоторых других протоколов (например, TCP) возможны ситуации, когда в буфер сокета копируется только часть данных, переданных программой, и тогда sendto возвращает значение в диапазоне от 1 до len. Если при выполнении sendto возникает ошибка, она возвращает значение SOCKET_ERROR (эта константа имеет отрицательное значение).
Для получения данных, присланных сокету, предназначена функция recvfrom, имеющая следующий прототип:
function recvfrom(s: TSocket; var Buf; len, flags: Integer; var from: TSockAddr; var fromlen: Integer): Integer;
Параметр s задает сокет, из входного буфера которого будут извлекаться данные, Buf — буфер, в который эти данные будут копироваться, а len — размер этого буфера. Параметр flags задает дополнительные опции и в большинстве случаев должен быть равен нулю. Параметр from выходной: в него помещается адрес, с которого была послана дейтаграмма. Параметр fromlen задает размер в байтах буфера для адреса отправителя. При вызове функции значение переменной, подставляемой в качестве фактического параметра, должно быть равно SizeOf(TSockAddr). Функция меняет это значение на ту длину, которая реально потребовалась для хранения адреса отправителя (в случае UDP это значение также будет равно SizeOf(TSockAddr).
В оригинале параметры from и fromlen передаются как указатели, и программа может использовать вместо них нулевые указатели, если ее не интересует адрес отправителя. Разработчики модуля WinSock заменили указатели параметрами-переменными, что в большинстве случаев удобнее. Но для передачи нулевых указателей приходится в качестве фактических параметров подставлять неуклюжие конструкции PSockAddr(nil)^ и PInteger(nil)^.
Функция reсvfrom всегда читает только одну дейтаграмму, даже если размер переданного ей буфера достаточен для чтения нескольких дейтаграмм. Если на момент вызова recvfrom дейтаграммы во входном буфере сокета отсутствуют, функция будет ждать, пока они там появятся, и до этого момента не вернет управление вызвавшей её программе. Если в буфере находится несколько дейтаграмм, то они читаются в порядке очередности поступления в буфер. Напомним, что дейтаграммы могут поступать в буфер не в том порядке, в котором они были отправлены. Кроме того, в очень редких случаях буфер может содержать несколько копий одной дейтаграммы, каждую из которых нужно извлекать отдельно.
Значение, возвращаемое функцией recvfrom, равно длине прочитанной дейтаграммы. Это значение может быть равно нулю, т. к. UDP позволяет отправлять дейтаграммы нулевой длины (для этого при вызове sendto нужно задать параметр len равным нулю). Если обнаружена какая-то ошибка, возвращается значение SOCKET_ERROR.
Если размер буфера, определяемого параметром Buf, меньше, чем первая находящаяся во входном буфере сокета дейтаграмма, то копируется только часть дейтаграммы, помещающаяся в буфере, a recvfrom завершается с ошибкой (WSAGetLastError при этом вернет ошибку WSAEMSGSSIZE). Оставшаяся часть дейтаграммы при этом безвозвратно теряется, при следующем вызове recvfrom будет прочитана следующая дейтаграмма. Этой проблемы легко избежать, т. к. длина дейтаграммы в UDP не может превышать 65 507 байтов. Достаточно подготовить буфер соответствующей длины, и и в него гарантированно поместится любая дейтаграмма.
Другой способ избежать подобной проблемы — использовать флаг MSG_PEEK. В этом случае дейтаграмма не удаляется из входного буфера сокета, а значение, возвращаемое функцией recvfrom, равно длине дейтаграммы. При этом в буфер, заданный параметром Buf, копируется та часть дейтаграммы, которая в нем помещается. Программа может действовать следующим образом: вызвать recvfrom с флагом MSG_PEEK, выделить память, требуемую для хранения дейтаграммы, вызвать recvfrom без флага MSG_PEEK, чтобы прочитать дейтаграмму целиком и удалить ее из входного буфера сокета. Этот метод сложнее, а 65 507 байтов — не очень большая по нынешним меркам память, поэтому легче все-таки заранее приготовить буфер фиксированной длины. Функция recvfrom непригодна для тех сокетов, которые еще не привязаны к адресу, поэтому перед вызовом этой функции должна быть вызвана либо функция bind, либо функция, которая осуществляет неявную привязку сокета к адресу (например, sendto).
Протокол UDP не поддерживает соединения в том смысле, в котором их поддерживает TCP, но библиотека сокетов позволяет частично имитировать такие соединения, Для этого служит функция connect, имеющая следующий прототип:
function connect(s: TSocket; var name: TSockAddr; namelen: Integer): Integer;
Параметр s задает сокет, который должен быть "соединен" с удаленным адресом. Адрес задается параметром name аналогично тому, как он задаётся в параметре addr функции sendto. Параметр namelen содержит длину структуры, описывающей адрес, и должен быть равен SizeOf(TSockAddr). Функция возвращает ноль при успешном завершении и SOCKET_ERROR — в случае ошибки. Вызов функции connect в случае UDP устанавливает фильтр для входящих дейтаграмм. Дейтаграммы, адрес отправителя которых не совпадает с адресом, заданным в функции connect, игнорируются: новые дейтаграммы не помещаются во входной буфер сокета, а те, которые находились там на момент вызова connect, удаляются из него. Функция connect не проверяет, существует ли адрес, с которым сокет "соединяется", и может успешно завершиться, даже если узла с таким IP-адресом нет.
Программа может вызывать connect неограниченное число раз с разными адресами. Если параметр name задает IP-адрес INADDR_ANY и нулевой порт, то сокет "отсоединяется", т. е. все фильтры для него снимаются, и он ведет себя так же, как сокет, для которого не была вызвана функция connect. Для сокетов, не привязанных к адресу, connect неявно вызывает bind.
После вызова connect для отправки данных можно использовать функцию send со следующим прототипом:
function send(s: TSocket; var Buf; len, flags: Integer): Integer;
От функции sendto она отличается отсутствием параметров addrto и tolen. При использовании send дейтаграмма отправляется по адресу, заданному при вызове connect. В остальном эти функции ведут себя одинаково, функция sendto при работе с "соединенным" сокетом ведет себя так же, как с несоединенным, т. е. отправляет дейтаграмму по адресу, определяемому параметром addrlen, а не по адресу, заданному при вызове connect.
Получение данных через "соединенные" сокеты может также осуществляться с помощью функции reсv, имеющей следующий прототип:
function recv(s: TSocket; var Buf; len, flags: Integer): Integer;
От своего аналога recvfrom она отличается только отсутствием параметров from и fromlen, через которые передается адрес отправителя дейтаграммы.
Рис. 2.1. Последовательность действий программы при обмене данными с помощью UDP
Строго говоря, функцию recv можно использовать и для несоединенных сокетов, но при этом программе остается неизвестным адрес отправителя. В случае же "соединенных" сокетов адрес отправителя заранее известен — это адрес, заданный в функции connect, а дейтаграммы всех других отправителей будут отбрасываться. Функция recvfrom также пригодна для "соединенных" сокетов, но адрес отправителя, который она возвращает, в данном случае может быть только тот, который определен в функции connect.
Таким образом, функция connect в случае протокола UDP позволяет, во-первых, выполнить фильтрацию входящих дейтаграмм по адресу средствами самой библиотеки сокетов, а во-вторых, использовать более лаконичные альтернативы recvfrom и sendto — recv и send.
Возможные последовательности действий программы для протокола UDP показаны на рис. 2.1.
Данный текст является ознакомительным фрагментом.