Сетевое издание
Международный студенческий научный вестник
ISSN 2409-529X

КОМПРЕССИЯ ТЕКСТА КАК ВСПОМОГАТЕЛЬНОЕ СРЕДСТВО В ИНФОРМАЦИОННОЙ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА

Буравцова А.Н. 1 Чопорова Е.И. 1
1 Воронежский институт МВД России
1. Дридзе Т.М. Текстовая деятельность в структуре социальной коммуникации. Проблемы семисоциопсихологии: монография. – М.: Наука, 1984. – 232с.
2. Уланович О.И. Текст и его понимание // Вестник МГЛУ. Серия 2. Психология, педагогика, методика преподавания иностранных языков. – № 3. – Минск: МГЛУ, 2001. – С. 22 – 30.
3. Жеребило Т. В. Словарь лингвистических терминов. – Изд. 5-е, испр. и доп. – Назрань: ООО «Пилигрим», 2010. – 486 с.
4. Валгина Н.С. Теория текста: учебное пособие. – Москва: изд-во МГУП «Мир книги», 1998. – 210 с.
5. Беленький А. Извлечение информации из неструктурированных текстов [Текст] / А. Беленький // КомпьютерПресс, 2008. – №2. – С. 74-79.

В современный век научно-информационных технологий специалистам приходится работать с большим количеством сведений, данных, получаемых из окружающего мира. Большие потоки информации требуют глубокого понимания наряду с минимальными затратами времени.

Ученым представляется достаточно сложным установить значение категории понимание, так это явление относится скорее к неосознаваемым или частично осознаваемым процессам деятельности человека, чем к формально-логическим [1].

Понимание представляет собой креативную, целенаправленную деятельность, серию взаимозависимых творческих актов, осуществляющихся на протяжении всей “встречи” читателя с художественным или научным произведением. При этом успешность построения некоторого мыслительного образа безусловно зависит от уровня социального развития личности, от степени полноты картины мира, которая присутствует в сознании индивида, а также от степени развитости коммуникативной и языковой компетенций читающего, от уровня сформированности его чувства языка или языковой догадки [2].

В результате понимания происходит последовательное изменение структуры текста в сознании читателя и процесс мысленного перемещения от одного элемента текста к другому, то есть происходит логическое перестроение и переработки структуры текста.

Одним из основных видов переработки текста является компрессия – сжатое изложение его корпусного строения. Работа над компрессией текста в свою очередь способствует его более глубокому пониманию: текст можно считать по настоящему осмысленным, если читатель способен представить основное содержание прочитанного в сколь угодно сжатой форме.

Компрессия позволяет совершенствовать навыки и умения чтения, понимания, анализа научного текста и написания аннотации, реферата, рецензии, реферативного обзора, курсовой работы и основывается на раскрытии смысловой структуры первоисточника.

Информационная компрессия – это сжатие плана означающего при сохранении плана означаемого. Для определения предела сжатия существует понятие текстовой нормы: в разных текстах она будет разной, однако у этой нормы есть и общий показатель: речевая единица не должна утрачивать своей сообщающей функции.

В «Словаре лингвистических терминов» дается следующее определение текстовой нормы – «гармоничное соответствие элементов текста, его формы и содержания авторской интенции и ориентации на адресата. Форма взаимодействия между компонентами, которая является наиболее благоприятной для получения запрограммированного результата» [3].

Вопрос о текстовой норме особенно жестко стоит в деловой и справочной литературе, а также во вторичной научной литературе (реферат, аннотация, тезисы).

Среди мотивов, обусловливающих компрессию информации, называют следующие [4]:

• требования языковой прагматики;

• эстетические требования и требования жанра;

• стилистические требования.

Языковая прагматика подразумевает использование терминов, дающих максимальное свертывание информации; жанровые установки текста также диктуют особые условия применительно к сжатию оригинального текста; стилистические требования подразумевают употребление определенных стилистических приемов, таких как, умышленное умолчание, недоговоренность и т. д.

Существуют семиотические и коммуникативные способы информационной компрессии.

К семиотическим (знаковым, языковым) относятся: лексическая компрессия, синтаксическая компрессия и формирование речевых стереотипов.

К коммуникативным (собственно текстовым) относятся: свертывание информации и применение повторной номинации.

Идеальным примером лексической компрессии считается употребление термина без его определения, так как термин номинирует понятие в предельно свернутом виде.

Синтаксическая компрессия предусматривает сжатие знаковой структуры путем эллиптирования, грамматической неполноты, бессоюзия, синтаксической асимметрии (пропуска логических звеньев высказывания).

Речевой стереотип, как правило, рождается в связи с его частым употреблением в определенной ситуации [4].

Необходимо выделить три основные правила компрессии текста, которые состоят в следующем:

1. Внимательное чтение текста и выделение ключевых слов и предложений, т.е. слов и предложений, содержащих основной смысл высказывания. При этом для нахождения ключевого элемента текста необходимо знать строение абзаца, так как любой абзац содержит зачин и комментирующую часть, в которой раскрывается утверждение главной абзацной фразы, и где находятся ключевые слова. Как правило, абзац завершается выводом.

2. Написание вторичного текста. Для выявления своих позиций, автор вторичного текста по отношению к первоисточнику, использует специальные стандартные клише, называемые transitional expressions в западной практике, выбор которых раскрывает и отражает структуру текста-первоисточника. Например: В статье обосновывается принцип…, статья представляет собой обзор…, в работе анализируются различные подходы …, в статье обобщается опыт…, в диссертации использованы следующие методы исследования.

3. В планах, тезисах, аннотации и при реферировании для называния основных положений текста используются ключевые слова и словосочетания, или слова с обобщенно-конкретным значением для краткой передачи основного содержания абзацев или частей текста, которые необходимо определять самостоятельно.

В настоящее время существуют достаточно простые программы, опирающиеся на статистический анализ отдельных терминов в текстах, такие как WordStat, а также сложнейшие приложения Aerotext и Businessobjects Text Analysis.

С развитием Интернета становится достаточно популярным анализ, базирующийся на технологиях текстомайнинга, т.е. способности специальных компьютерных программ находить слова с заданными значениями в неструктурированных текстовых массивах. Процесс может реализовываться не только посредством внедряемых в организации приложений, но и в виде онлайнового сервиса. В последнее время текстомайнинговый анализ множественных открытых источников информации становится доступным для коммерческих, политических и других организаций за счет появления именно таких онлайновых служб. Одна из подобных простых программ – Galaktika-ZOOM («Галактика») [5].

«Галактика ZOOM» – это технология динамического контент-анализа, позволяющая строить информационные портреты объектов по любой текстовой информации, в частности по сообщениям СМИ. Такой портрет состоит из статистически значимых слов и выражений, сопровождающих упоминание объекта.

«Галактика ZOOM» обеспечивает поиск в информационных массивах с применением языка запросов, а также контекстный или тематический поиск информации с учетом морфологии.

Уникальной особенностью системы «Галактика ZOOM» является умение выявлять значимые слова и словосочетания документа, отражающие его смысл. Программа позволяет уточнить запрос, выбрав слово/словосочетание для включения (колонка «И») или исключения (колонка «И НЕ») [5].

Таким образом, практика подтверждает необходимость компрессии при реферативном переводе и выявляет три её вида. Первый: сокращение только языкового кода, не влекущее ни уменьшения информации, ни её потерь. Среди основных методов здесь можно назвать: устранение повторов, вставных конструкций, более короткий перифраз, использование аббревиатур и композитов, синтаксический эллипсис. Ко второму виду компрессии относится одновременное сокращение языкового кода и объёма семантической информации с возможностью полного восстановления семантического наполнения текста. Третий вид компрессии – это одновременное сокращение языкового кода и объёма семантической информации (компрессия информации) без возможности восстановления информации полностью без обращения к первичному тексту.


Библиографическая ссылка

Буравцова А.Н., Чопорова Е.И. КОМПРЕССИЯ ТЕКСТА КАК ВСПОМОГАТЕЛЬНОЕ СРЕДСТВО В ИНФОРМАЦИОННОЙ ДЕЯТЕЛЬНОСТИ ЧЕЛОВЕКА // Международный студенческий научный вестник. – 2015. – № 5-1. ;
URL: https://eduherald.ru/ru/article/view?id=12797 (дата обращения: 17.04.2024).

Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»
(Высокий импакт-фактор РИНЦ, тематика журналов охватывает все научные направления)

«Фундаментальные исследования» список ВАК ИФ РИНЦ = 1,674