3.2.3.2. Анализ лексического состава текста
3.2.3.2. Анализ лексического состава текста
Программа ЛЕКС1
Программа подсчитывает, сколько раз в тексте (области) употребляется то или иное слово. Программа формирует полный список всех различных слов текста с указанием частот их встречаемости. Можно задать диапазон частот (например, от 10 до 20 вхождений или ровно 15 вхождений) и сформировать список слов, количество употреблений которых лежит в границах этого диапазона. Если диапазон не задан, формируется полный частотный словарь текста.
Программа ЛЕКС2
Программа формирует список слов, обладающих указанными лексико-грамматическими характеристиками, например, находит все существительные, все причастия или все аббревиатуры, встретившиеся в тексте (области). Слова упорядочиваются по алфавиту, для каждого слова подсчитывается число его вхождений в исследуемый текст. Программа предназначена для анализа словарного состава текста.
Программа ЛЕКС3
Программа находит все вхождения в исследуемый текст (область) любых форм указанного (ключевого) слова и для каждого вхождения выдает контекст установленной длины - цепочку слов, находящихся от ключевого слова на расстоянии, не превышающем заданную длину. Программа удобна для анализа лексического состава текста и контроля используемых терминов и терминологических словосочетаний.
Программа ЛЕКС4
Программа находит в исследуемой области текста все слова, не входящие в формируемый в начале очередного сеанса словарь системы ЛИНАР, - т.е. слова, не знакомые очередному адресату. Для исправления текста следует либо заменить обнаруженные слова синонимами, либо расширить словарь системы. Возможно, что некоторые из обнаруженных слов являются известными системе словами, введенными с ошибками.
Программа ЛЕКС5
Программа осуществляет поиск каждой из обнаруживаемых в тексте (области) аббревиатур последовательно в трех списках: N 3 - списке аббревиатур, вводимых непосредственно в тексте (этот список формируется динамически самой программой ЛЕКС5);
N 2 - формируемом в начале работы с текстом на основе перечня используемых сокращений;
N 1 - словаре общепринятых сокращений.
В списке N 1 поиск ведется в последнюю очередь так как он, во-первых, самый большой, и во-вторых, если, например, в списках N 3 и N 1 присутствует одно и то же сокращение, но с различными расшифровками, то приоритет имеет сокращение из списка N 3. Результатом работы является список используемых в тексте аббревиатур с указанием их локализации в тексте и типа аббревиатуры.
Программа ЛЕКС6
Программа осуществляет контроль за переопределением известных системе аббревиатур. Если, например, в разделе 1.2. встретилась аббревиатура СВП (с расшифровкой в тексте - "схема внешних прерываний"), а в списке N 2 аббревиатура СВП сопоставлена термину "субкомплекс внешней памяти", фиксируется ошибка: недопустимое переопределение аббревиатуры из перечня.
Программа ЛЕКС7
Программа проверяет правильность расшифровки, то есть тот факт, что аббревиатура читается в расшифровке по началам слов, причем некоторые слова расшифровки могут не участвовать в образовании аббревиатуры. Пример работы программы:
Эта организация - центр переводов (ВЦП).
НЕСООТВЕТСТВИЕ АББРЕВИАТУРЫ И РАСШИФРОВКИ:
ВЦП - центр переводов
Программа ЛЕКС8
Программа ЛЕКС8 (без параметров) проверяет правильность оформления списка используемых в тексте аббревиатур (для отчета по НИР - это "Перечень условных обозначений, символов, единиц и терминов"). Предполагается, что каждая пара "аббревиатура - расшифровка" в перечне представлена одной строкой. В процессе обработки перечня заполняется список замечаний. Пример работы программы:
ОБРАБАТЫВАЕТСЯ ПЕРЕЧЕНЬ АББРЕВИАТУР:
БНК - бортовой нейрокомпьютер
БНФ - бекусовская нормальная форма
КПД - канал прямого доступа
ОЗУ
МПК - микропрограммируемый контроллер
ОРЗ - общий регистр записи
ПНП - перейти в неустойчивое положение
СВП - субкомплекс внешней памяти
СПТ - субкомплекс рабочего таймера
ЗАМЕЧАНИЯ:
4 : ОЗУ * НЕТ РАСШИФРОВКИ
5 : МПК * НАРУШЕНИЕ АЛФ. ПОРЯДКА
7 : ПНП * РАСШИФРОВКА НЕ ЯВЛЯЕТСЯ ГРУППОЙ СУЩЕСТВИТЕЛЬНОГО
9 : СПТ * НЕСООТВ: АББР.-РАСШ.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
Свойства текста
Свойства текста text-decorationЗадает специальное оформление текста: подчеркнутый, зачеркнутый и т.п.text-decoration: none|underline|overline|line-through|blink;Поддерживается IE начиная с 3.02 для текстовых элементов страницы и начиная с 4.0 для нетекстовых.Поддерживается NN начиная с 4.0text-underline-positionЗадает
Псевдостили текста
Псевдостили текста Псевдостили применяются некоторым элементам текстовых абзацев, например, к первой строке абзаца или первой букве первой строки.first-letterПрименяется к первой букве первой строки абзаца. Может использоваться для создания буквиц.{Задание стиля
Пересмотр лексического анализа
Пересмотр лексического анализа Введение У меня есть хорошие и плохие новости. Плохие новости – эта глава не та, которую я вам обещал последний раз. Более того, и следующая глава также.Хорошие новости в причине появления этой главы: я нашел способ упростить и
Верстка текста
Верстка текста Первой задачей по верстке станет назначение стилей импортированному тексту. Следует также удалить лишние пустые строки (которыми обычно отбиваются в наборе заголовки и врезки), оставив только пустую строку между текстом врезки и последующим обычным
Урок № 96. Анализ счета и анализ субконто
Урок № 96. Анализ счета и анализ субконто Анализ счета также относится к числу популярных отчетов программы "1С". Чтобы сформировать этот отчет, нужно выполнить команду главного меню Отчеты | Анализ счета, затем в открывшемся окне указать отчетный период, счет и
Изменение состава установленных приложений и компонентов
Изменение состава установленных приложений и компонентов Тип установки Выборочная имеет свои преимущества, однако в некоторых случаях может стать причиной проблем, особенно если такой вариант выбирают неопытные пользователи. Например, указывая компоненты для
Совет 6. Остерегайтесь странностей лексического разбора С++
Совет 6. Остерегайтесь странностей лексического разбора С++ Предположим, у вас имеется файл, в который записаны числа типа int, и вы хотите скопировать эти числа в контейнер list. На первый взгляд следующее решение выглядит вполне разумно:ifstream dataFile("ints.dat");list<int>
17.2. Отрисовка текста
17.2. Отрисовка текста Постановка задачи Требуется рисовать текст на экране устройства с
Оформление текста
Оформление текста После того как мы рассмотрели операции, общие для помещаемых в титр объектов, остановимся более подробно на оформлении объектов каждого из упомянутых типов (кроме кнопок меню, которые рассмотрены в гл. 11).Начнем с рассмотрения средств, предназначенных
§ 1. Выбор структуры и состава технических средств ГИС
§ 1. Выбор структуры и состава технических средств ГИС При создании ГИС различного назначения в обеспечивающих подсистемах, кроме информационного обеспечения, важное значение имеют математическое, лингвистическое и техническое обеспечения.Разработка технического
5.3. Определение состава и характеристик оборудования персонального компьютера
5.3. Определение состава и характеристик оборудования персонального компьютера При решении ряда практических задач, связанных с использованием определенных программных средств, возникает необходимость в определении и уточнении состава и характеристик оборудования ПК,
3. ОПРЕДЕЛЕНИЕ СОСТАВА ЗАЩИЩАЕМОЙ ИНФОРМАЦИИ
3. ОПРЕДЕЛЕНИЕ СОСТАВА ЗАЩИЩАЕМОЙ ИНФОРМАЦИИ 3.1. Методика определения состава защищаемой информацииОпределение состава защищаемой информации — это первый шаг на пути построения системы защиты. От Того, насколько он будет точно выполнен, зависит результат
13.6. Форматирование текста
13.6. Форматирование текста Настало время поговорить о форматировании текста. Это процесс выбора гарнитуры шрифта, его размера и начертания, установки выравнивания. Все это позволяет украсить документ и выделить его из числа прочих. Для форматирования текста используется
Задание состава публикации Итак, мы выбрали форматы, в которых будем
Задание состава публикации Итак, мы выбрали форматы, в которых будем распространять наш фильм и изображение-замену. Теперь можно приступать к собственно публикации.Выберем в меню File пункт Publish Settings или нажмем комбинацию клавиш <Ctrl>+<Shift>+<F12>. На экране появится
2.4. АНАЛИЗ ТРЕБОВАНИЙ К СИСТЕМЕ (СИСТЕМНЫЙ АНАЛИЗ) И ФОРМУЛИРОВКА ЦЕЛЕЙ
2.4. АНАЛИЗ ТРЕБОВАНИЙ К СИСТЕМЕ (СИСТЕМНЫЙ АНАЛИЗ) И ФОРМУЛИРОВКА ЦЕЛЕЙ Задача оптимизации разработки программ состоит в достижении целей при минимально возможной затрате ресурсов.Системный анализ в отличие от предварительного системного исследования — это
Набор текста
Набор текста Печатать текст – это, наверное, самое нудное и трудоемкое занятие при работе на компьютере. Отформатировать (придать лоск), выровнять по краям, выделить заголовки, сделать переносы и т. д. вам поможет любой знаток компьютера. А вот набирать текст, во всяком