4.3. Потоковые данные
4.3. Потоковые данные
В отличие от процессов, все потоки программы делят общее адресное пространство. Это означает, что если один поток модифицирует ячейку памяти (например, глобальную переменную), то это изменение отразится на всех остальных потоках. Таким образом, потоки могут работать с одними и теми же данными, не используя механизмы межзадачного взаимодействия (рассматриваются в главе 5, "Взаимодействие процессов").
Тем не менее у каждого потока — свой собственный стек вызова. Это позволяет всем потокам выполнять разный код, а также вызывать функции традиционным способом. При каждом вызове функции в любом потоке создается отдельный набор локальных переменных, которые сохраняются в стеке этого потока.
Иногда все же требуется продублировать определенную переменную, чтобы у каждого потока была ее собственная копия. С этой целью операционная система Linux предоставляет потокам область потоковых данных. Переменные, сохраняемые в этой области, дублируются для каждого потока, что позволяет потокам свободно работать с ними, не мешая друг другу. Доступ к потоковым данным нельзя получить с помощью ссылок на обычные переменные, ведь у потоков общее адресное пространство. В Linux имеются специальные функции для чтения и записи значений, хранящихся в области потоковых данных.
Можно создать сколько угодно потоковых переменных, при этом все они должны иметь тип void*. Ссылка на каждую переменную осуществляется по ключу. Для создания нового ключа, т.е. новой переменной, предназначена функция pthread_key_create(). Первым ее аргументом является указатель на переменную типа pthread_key_t. В нее будет записано значение ключа, посредством которого любой поток сможет обращаться к своей копии данных. Второй аргумент — это указатель на функцию очистки ключа. Она будет автоматически вызываться при уничтожении потока; ей передается значение ключа, соответствующее данному потоку. Это очень удобно, так как функция очистки вызывается даже в случае отмены потока в произвольной точке. Если потоковая переменная равна NULL, функция очистки не вызывается. Если же такая функция не нужна, задайте в качестве второго параметра функции pthread_key_create() значение NULL.
После того как ключ создан, каждый поток может назначать ему собственное значение, вызывая функцию pthread_setspecific(). Ее первый аргумент — это ключ, а второй — требуемое значение типа void*. Для чтения потоковых переменных предназначена функция pthread_getspecific(), единственным аргументом которой является ключ.
Предположим, имеется приложение, распределяющее задачу между несколькими потоками. В целях аудита за каждым потоком закреплен отдельный журнальный файл, куда записываются сообщения о ходе выполнения поставленной задачи. Область потоковых данных — удобное место для хранения указателя на журнальный файл каждого потока.
В листинге 4.7 показано, как осуществить задуманное. Для хранения файлового указателя в функции main() создается ключ, запоминаемый в переменной thread_log_key. Эта переменная является глобальной, поэтому она доступна всем потокам. Когда поток начинает выполнять свою потоковую функцию, он открывает журнальный файл и сохраняет указатель на него в своем ключе. Позднее любой поток может вызвать функцию write_to_thread_log(), чтобы записать сообщение в свой журнальный файл. Эта функция извлекает из области потоковых данных указатель на журнальный файл и помещает в файл требуемое сообщение.
Листинг 4.7. (tsd.c) Создание отдельного журнального файла для каждого потока с помощью области потоковых данных
#include <malloc.h>
#include <pthread.h>
#include <stdio.h>
/* Ключ, связывающий указатель журнального файла с каждым
потоком. */
static pthread_key_t thread_log_key;
/* Запись параметра MESSAGE в журнальный файл текущего потока. */
void write_to_thread_log(const char* message) {
FILE* thread_log =
(FILE*)pthread_getspecific(thread_log_key);
fprintf(thread_log, "%s ", message);
}
/* Закрытие журнального файла, на который указывает параметр
THREAD_LOG. */
void close_thread_log(void* thread_log) {
fclose((FILE*)thread_log);
}
void* thread_function(void* args) {
char thread_log_filename[20];
FILE* thread_log;
/* Создание имени журнального файла для текущего потока. */
sprintf(thread_log_filename, "thread%d.log",
(int)pthread_self());
/* Открытие журнального файла. */
thread_log = fopen(thread_log_filename, "w");
/* Сохранение указателя файла в области потоковых данных,
под ключом thread_log_key. */
pthread_setspecific(thread_log_key, thread_log);
write_to_thread_log("Thread starting.");
/* Далее идет основное тело потока... */
return NULL;
}
int main() {
int i;
pthread_t threads[5];
/* Создание ключа, который будет связывать указатели
журнальных файлов с областью потоковых данных. Функция
close_thread_log() закрывает все файлы. */
pthread_key_create(&thread_log_key, close_thread_log);
/* Создание потоков. */
for (i = 0; i < 5; ++i)
pthread_create(&(threads[i]), NULL, thread_function, NULL);
/* Ожидание завершения всех потоков. */
for (i = 0; i < 5; ++i)
pthread_join(threads[i], NULL);
return 0;
}
Обратите внимание на то, что в функции thread_function() не нужно закрывать журнальный файл. Просто когда создавался ключ, функция close_thread_log() была назначена функцией очистки данного ключа. Когда бы поток ни завершился, операционная система Linux вызовет эту функцию, передав ей значение ключа, соответствующее данному потоку. В функции close_thread_log() и происходит закрытие файла.